網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

與DeepSeek同日「上新」：美團(tuán)萬億級(jí)參數(shù)大模型開放測試

2026-04-26 01:17:16　來源: 財(cái)經(jīng)涂鴉

廣東舉報(bào)

分享至

“訓(xùn)練全程由國產(chǎn)算力集群完成，動(dòng)用5-6萬張算力卡。”

作者：蘇打

編輯：tuya

出品：財(cái)經(jīng)涂鴉

公司情報(bào)專家《財(cái)經(jīng)涂鴉》獲悉，4月24日，DeepSeek宣布全新系列模型 DeepSeek-V4的預(yù)覽版本正式上線并同步開源，引發(fā)廣泛關(guān)注。該版本擁有百萬字超長上下文，在 Agent 能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國內(nèi)與開源領(lǐng)域的領(lǐng)先。

當(dāng)天，有消息稱美團(tuán)新一代基礎(chǔ)大模型LongCat-2.0-Preview亦已開放測試，該模型總參數(shù)規(guī)模突破萬億，量級(jí)躋身全球頂尖大模型行列。

據(jù)知情人士透露，DeepSeek同日發(fā)布的新一代V4大模型，總參數(shù)量和激活參數(shù)量與美團(tuán)LongCat-2.0-Preview基本一致。

總參數(shù)量決定了大模型的知識(shí)容量上限及存儲(chǔ)成本。據(jù)悉，LongCat-2.0-Preview和DeepSeek V4，均支持1M上下文窗口，可在單次推理中處理數(shù)百萬字的輸入，其處理量級(jí)等同于新發(fā)布的GPT-5.5。

此外，新的LongCat模型還面向Agent應(yīng)用場景進(jìn)行了深度優(yōu)化，可有效適配代碼生成、復(fù)雜任務(wù)規(guī)劃、企業(yè)自動(dòng)化等生產(chǎn)場景。

除參數(shù)規(guī)模外，美團(tuán)新一代基礎(chǔ)大模型的更大突破在于，其訓(xùn)練推理全程依托國產(chǎn)算力集群完成。

據(jù)上述人士透露，美團(tuán)本次訓(xùn)練階段動(dòng)用的算力卡數(shù)量在5萬至6萬之間，這也是迄今為止，在國產(chǎn)算力上完成的規(guī)模最大的大模型訓(xùn)練任務(wù)。“這不僅是對(duì)國產(chǎn)算力生態(tài)成熟度的一次有效驗(yàn)證，也標(biāo)志著國產(chǎn)自主算力上邁出了關(guān)鍵一步。”該人士表示。

一年多前，美團(tuán)CEO王興曾表示：“在AI領(lǐng)域，美團(tuán)唯一的策略是進(jìn)攻”。在近期的財(cái)報(bào)電話會(huì)上，他強(qiáng)調(diào)，要"爭取把美團(tuán)App率先升級(jí)成為AI-Powered App"。

公開報(bào)道顯示，美團(tuán)是中國不包含云業(yè)務(wù)的公司中，在AI領(lǐng)域投入規(guī)模最大的企業(yè)。去年以來，美團(tuán)先后發(fā)布了多款A(yù)I應(yīng)用和自研大模型。

除自研外，美團(tuán)還先后投資了摩爾線程、沐曦股份、紫光展銳、愛芯元智等多家算力及半導(dǎo)體公司，以及智譜AI、月之暗面等領(lǐng)先的大模型企業(yè)。

24日下午，美團(tuán)已開放新模型測試，用戶可通過其官網(wǎng)longcat.ai申請(qǐng)領(lǐng)取免費(fèi)測試名額。

官網(wǎng)介紹顯示，測試期間，LongCat-2.0-Preview每天會(huì)給用戶提供1000萬免費(fèi)Token的額度。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.