國產(chǎn)人工智能(AI)大模型DeepSeek近日震驚環(huán)球市場,阿里巴巴(9988)旗下阿里雲(yún)於新春期間發(fā)布全新通義千問Qwen 2.5-Max超大規(guī)模MoE(Mixture of Experts, 混合專家)模型,聲稱其表現(xiàn)超越DeepSeek V3。
阿里雲(yún)稱,通義千問 Qwen 2.5-Max採用逾20萬億token的預(yù)訓(xùn)練數(shù)據(jù),並搭配定制化後訓(xùn)練方案。在Arena-Hard、LiveBench、LiveCodeBench及GPQA-Diamond等國際通用基準(zhǔn)測試中,Qwen2.5-Ma的表現(xiàn)均超越DeepSeek V3,同時在MMLU-Pro等專業(yè)領(lǐng)域評估體系中展現(xiàn)出極具競爭力的成績。
阿里雲(yún)稱,相信Qwen2.5-Max隨著訓(xùn)練技術(shù)不斷進(jìn)步,下一個版本將達(dá)到更高水平。用戶可以在 Qwen Chat中直接調(diào)用Qwen2.5-Max,或者使用 artifacts、搜索等功能。Qwen2.5-Max 的 API(模型名稱:qwen-max-2025-01-25)已開放使用。用戶可先註冊阿里雲(yún)賬號並開通阿里雲(yún)大模型服務(wù)平臺,即可於控制臺創(chuàng)建API密鑰。由於其接口採用OpenAI兼容協(xié)議,用戶可以直接沿用OpenAI API的常規(guī)方式進(jìn)行調(diào)用。
港股美國預(yù)託證券(ADR)方面,阿里巴巴ADR在美東時間1月28日收市比本港同日收市價升5.89%,港元計折合收報93.5元。(記者 黃兆琦 / 阿里雲(yún)圖片)