![]()
“訓(xùn)練全程由國產(chǎn)算力集群完成,動(dòng)用5-6萬張算力卡。”
作者:蘇打
編輯:tuya
出品:財(cái)經(jīng)涂鴉
公司情報(bào)專家《財(cái)經(jīng)涂鴉》獲悉,4月24日,DeepSeek宣布全新系列模型 DeepSeek-V4的預(yù)覽版本正式上線并同步開源,引發(fā)廣泛關(guān)注。該版本擁有百萬字超長上下文,在 Agent 能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。
當(dāng)天,有消息稱美團(tuán)新一代基礎(chǔ)大模型LongCat-2.0-Preview亦已開放測試,該模型總參數(shù)規(guī)模突破萬億,量級(jí)躋身全球頂尖大模型行列。
據(jù)知情人士透露,DeepSeek同日發(fā)布的新一代V4大模型,總參數(shù)量和激活參數(shù)量與美團(tuán)LongCat-2.0-Preview基本一致。
總參數(shù)量決定了大模型的知識(shí)容量上限及存儲(chǔ)成本。據(jù)悉,LongCat-2.0-Preview和DeepSeek V4,均支持1M上下文窗口,可在單次推理中處理數(shù)百萬字的輸入,其處理量級(jí)等同于新發(fā)布的GPT-5.5。
此外,新的LongCat模型還面向Agent應(yīng)用場景進(jìn)行了深度優(yōu)化,可有效適配代碼生成、復(fù)雜任務(wù)規(guī)劃、企業(yè)自動(dòng)化等生產(chǎn)場景。
除參數(shù)規(guī)模外,美團(tuán)新一代基礎(chǔ)大模型的更大突破在于,其訓(xùn)練推理全程依托國產(chǎn)算力集群完成。
據(jù)上述人士透露,美團(tuán)本次訓(xùn)練階段動(dòng)用的算力卡數(shù)量在5萬至6萬之間,這也是迄今為止,在國產(chǎn)算力上完成的規(guī)模最大的大模型訓(xùn)練任務(wù)。“這不僅是對(duì)國產(chǎn)算力生態(tài)成熟度的一次有效驗(yàn)證,也標(biāo)志著國產(chǎn)自主算力上邁出了關(guān)鍵一步。”該人士表示。
一年多前,美團(tuán)CEO王興曾表示:“在AI領(lǐng)域,美團(tuán)唯一的策略是進(jìn)攻”。在近期的財(cái)報(bào)電話會(huì)上,他強(qiáng)調(diào),要"爭取把美團(tuán)App率先升級(jí)成為AI-Powered App"。
公開報(bào)道顯示,美團(tuán)是中國不包含云業(yè)務(wù)的公司中,在AI領(lǐng)域投入規(guī)模最大的企業(yè)。去年以來,美團(tuán)先后發(fā)布了多款A(yù)I應(yīng)用和自研大模型。
除自研外,美團(tuán)還先后投資了摩爾線程、沐曦股份、紫光展銳、愛芯元智等多家算力及半導(dǎo)體公司,以及智譜AI、月之暗面等領(lǐng)先的大模型企業(yè)。
24日下午,美團(tuán)已開放新模型測試,用戶可通過其官網(wǎng)longcat.ai申請(qǐng)領(lǐng)取免費(fèi)測試名額。
官網(wǎng)介紹顯示,測試期間,LongCat-2.0-Preview每天會(huì)給用戶提供1000萬免費(fèi)Token的額度。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.