小米(01810)今天(30日)宣布,推出首個(gè)「為推理而生」的開源大模型Xiaomi MiMo,聯(lián)動(dòng)預(yù)訓(xùn)練到後訓(xùn)練,全面提升推理能力。小米股價(jià)造好,曾升5.37%至50元,隨後升幅收窄,半日?qǐng)?bào)49.7元,升4.74%。
內(nèi)媒報(bào)道,MiMo為全新成立不久的小米大模型Core團(tuán)隊(duì)初步嘗試。該模型著重於提升推理能力,以70億參數(shù)規(guī)模,在數(shù)學(xué)推理和代碼競(jìng)賽評(píng)量中超越OpenAI的o1-mini,以及阿里巴巴(09988)Qwen-32B-Preview等模型。
人工智能(AI)技術(shù)不斷推陳出新,阿里巴巴昨日(29日)亦推出新一代通義千問模型Qwen 3,聲稱在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,與DeepSeek-R1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級(jí)模型相比極具競(jìng)爭(zhēng)力,並支持119種語(yǔ)言和方言。
阿里發(fā)布Qwen 3後,全球首富馬斯克隨即宣布,旗下xAI將在下周發(fā)布Grok 3.5的早期測(cè)試版,讓SuperGrok訂戶率先試用。
另外,百度(09888)上周發(fā)布文心大模型4.5 Turbo和X1 Turbo。其中X1 Turbo具備更先進(jìn)的思維鏈整體效果領(lǐng)先DeepSeek-R1、V3最新版;每百萬token輸入價(jià)格1元人民幣(下同),輸出價(jià)格4元,僅為DeepSeek-R1的25%。