今年以來,騰訊混元大模型持續(xù)快速迭代,推出了深度思考模型T1 Preview和快思考模型TurboS,並已廣泛應用於騰訊元寶、ima、騰訊文檔、微信讀書、搜狗輸入法、QQ瀏覽器等多款內(nèi)部產(chǎn)品。
3月21日深夜,騰訊發(fā)布重大AI戰(zhàn)略升級,推出自研深度思考模型混元T1正式版,目前已上線騰訊雲(yún)官網(wǎng),並即將在騰訊元寶灰度上線。據(jù)悉,該模型是以騰訊於2月底發(fā)布的新一代快思考模型混元Turbo S為基座打造,是一款能秒回、吐字快、擅長超長文處理的強推理模型,性能保持業(yè)界領先。
全面擁抱開源 騰訊AI戰(zhàn)略開啟重投入期
據(jù)騰訊2024年四季度及年度財報顯示,2024年研發(fā)投入創(chuàng)下歷史新高,達到707億元,自2018年研發(fā)投入以來,累計總額已達3403億元。這表明,騰訊AI戰(zhàn)略開啟重投入期。
騰訊混元自上線以來全面擁抱開源,開源模型已覆蓋文本、圖像、視頻和3D生成等多個模態(tài),GitHub上總Star數(shù)量超2.3萬,多次登頂趨勢榜。期間,通過大規(guī)模強化學習,並結合數(shù)學、邏輯推理、科學和代碼等理科難題的專項優(yōu)化,混元T1正式版進一步提升了推理能力。
在體現(xiàn)推理模型基礎能力的常見benchmark上,如大語言模型評估增強數(shù)據(jù)集MMLU-PRO中,混元T1取得87.2分,僅次於o1。在CEval、AIME、Zebra Logic等中英文知識及競賽級數(shù)學、邏輯推理的公開基準測試中,混元T1的成績也達到業(yè)界領先推理模型的水平。此外,T1還在多項對齊任務、指令跟隨任務和工具利用任務中展現(xiàn)出了非常強的適應性。
據(jù)知情人士透露,混元T1正式版沿用了混元Turbo S的創(chuàng)新架構,採用Hybrid-Mamba-Transformer融合模式。這是工業(yè)界首次將混合Mamba架構無損應用於超大型推理模型。這一架構有效降低了傳統(tǒng)Transformer結構的計算複雜度,減少了KV-Cache的內(nèi)存佔用,從而顯著降低了訓練和推理成本,讓混元T1實現(xiàn)首字秒出,吐字速度達到最快80 tokens/s。
混元T1在超長文本推理領域也展現(xiàn)出獨特優(yōu)勢?;冻錾拈L文捕捉能力,混元T1能有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。同時,混合Mamba架構針對長序列處理進行了專項優(yōu)化,通過高效的計算方式,在確保長文本信息捕捉能力的同時大幅降低資源消耗,在相近的激活參數(shù)量下,實現(xiàn)了解碼速度提升2倍。目前,混元T1正式版已在騰訊雲(yún)官網(wǎng)上線,輸入價格為每百萬tokens 1元,輸出價格為每百萬tokens 4元。
騰訊混元積極擁抱開源,其開源模型全面覆蓋文本、圖像、視頻和3D生成等多個模態(tài),GitHub上總Star數(shù)超2.6萬,多次登頂Hugging Face趨勢榜。日前,騰訊混元再次宣布推出圖生視頻模型及5個全新3D生成模型,並全部開源,持續(xù)推動AI技術的開放共享與行業(yè)發(fā)展。
巨頭競逐AI開源 國產(chǎn)AI應用或已進入加速期
隨著2025年我國進入科技突破大年,各大互聯(lián)網(wǎng)巨頭持續(xù)加大AI領域的投入。不僅是騰訊混元,近期,字節(jié)跳動豆包大模型團隊官宣開源一項針對MoE架構的關鍵優(yōu)化技術;阿里近日宣布推出AI旗艦應用——新夸克,將「深度思考」能力融入AI搜索;百度日前連發(fā)兩款免費新模型,分別是文心大模型4.5和文心大模型X1,國產(chǎn)大模型開源步伐持續(xù)加速。
有業(yè)內(nèi)人士分析認為,在技術創(chuàng)新與商業(yè)應用的雙輪驅(qū)動下,AI有望在互聯(lián)網(wǎng)等數(shù)字原生領域率先形成規(guī)模化落地。
全國人大代表、香港人工智能資助計劃委員會主席、互聯(lián)網(wǎng)專業(yè)協(xié)會會長冼漢廸表示,混元T1正式版的發(fā)布展示了騰訊在技術研發(fā)上的實力,行業(yè)正在經(jīng)歷著前所未有的技術革新浪潮,騰訊這類大廠的布局更為全面,在AI的多個領域都取得了不錯的成果。騰訊並不只靠自己的技術,還選擇接入DeepSeek-R1模型,這個開源模型在性能上甚至超越了部分大廠自研模型,元寶通過混元和DeepSeek的「雙引擎」策略,既保證了技術的多樣性,又提升了用戶體驗。他認為騰訊的邏輯是,用戶不關心技術是誰的,他們只關心用起來好不好。這種模式會是多數(shù)企業(yè)未來選擇的路徑。
華富人工智能ETF基金經(jīng)理郜哲表示,結合騰訊財報和近期互聯(lián)網(wǎng)巨頭競逐AI的情況來看,我國AIGC應用或已進入加速期。隨著AI在各行業(yè)深入滲透,有望誕生更多AI創(chuàng)新模式與高質(zhì)量產(chǎn)品,進一步推動人工智能產(chǎn)業(yè)鏈向更加現(xiàn)實、業(yè)績可落地的方向發(fā)展。
騰訊董事會主席兼行政總裁馬化騰表示:「數(shù)月前,我們重組了AI團隊以聚焦於快速的產(chǎn)品創(chuàng)新及深度的模型研發(fā)、增加了AI相關的資本開支、並加大了我們對原生AI產(chǎn)品的研發(fā)和營銷力度。我們相信這些加碼的投資,會通過提升廣告業(yè)務的效率及遊戲的生命周期而帶來持續(xù)的回報,並隨著我們個人AI應用的加速普及和更多企業(yè)採用我們的AI服務,創(chuàng)造更長遠的價值?!梗ㄓ浾?沛菡)