網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

DeepSeek，V4歸來，掌聲稀落，昔日王者面臨新挑戰(zhàn)

2026-04-30 04:58:43　來源: 走過海棠

四川舉報(bào)

分享至

Scmp報(bào)道，DeepSeek 帶著久違的旗艦新品V4回來了，只是這一次，外界的掌聲沒有當(dāng)年R1橫空出世時(shí)那么響亮。

根據(jù)獨(dú)立基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis于4月25日發(fā)布的最新評(píng)測(cè)，DeepSeek V4 Pro在全球開源模型智能指數(shù)榜單中排名第二，得分52分，僅次于北京月之暗面（Moonshot AI）旗下的Kimi K2.6（54分）。GLM-5.1（51分）緊隨其后，差距不足一步。

這個(gè)結(jié)果，與DeepSeek今年年初憑借R1系列一鳴驚人、令硅谷側(cè)目的輝煌相比，多少顯得有些"中規(guī)中矩"。但數(shù)字背后，卻有不少值得細(xì)看的東西。

V4 Pro相比前代V3.2的提升幅度實(shí)際相當(dāng)顯著，在Artificial Analysis智能指數(shù)上從42分躍升至52分，整整進(jìn)步了10分。架構(gòu)也完成了一次大刀闊斧的升級(jí)：V4 Pro采用全新混合專家架構(gòu)（MoE），總參數(shù)量達(dá)1.6萬(wàn)億，激活參數(shù)為490億，相比V3家族的6710億總參數(shù)、370億激活參數(shù)，是一次質(zhì)的擴(kuò)張。

在代理任務(wù)（Agentic Tasks）這一近年來業(yè)界最看重的實(shí)戰(zhàn)能力賽道上，V4 Pro的表現(xiàn)尤為突出。在GDPval-AA代理基準(zhǔn)測(cè)試中，V4 Pro以1554分高居開源模型榜首，超越Kimi K2.6（1484分）和GLM-5.1（1535分）。

V4 Pro并非沒有軟肋。最讓研究者皺眉的，是其極高的幻覺率，V4 Pro和V4 Flash的幻覺率分別高達(dá)94%和96%，意思是當(dāng)模型不知道答案時(shí)，它幾乎必然會(huì)"編"一個(gè)出來，而不是坦承不知。這對(duì)需要高可靠性輸出的商業(yè)應(yīng)用場(chǎng)景來說，是個(gè)不小的隱患。

在成本端，V4 Pro的定價(jià)策略也顯得頗為矛盾。每百萬(wàn)輸入/輸出token定價(jià)為1.74美元/3.48美元，雖然比Claude Opus 4.7便宜四倍以上，但相較于其他開源競(jìng)品，例如Kimi K2.6（948美元/次評(píng)測(cè)）和GLM-5.1（544美元/次評(píng)測(cè)），V4 Pro的綜合運(yùn)行成本高達(dá)1071美元，價(jià)格優(yōu)勢(shì)并不明顯。這背后的原因在于，V4 Pro的輸出token消耗量極高，單次評(píng)測(cè)消耗高達(dá)1.9億個(gè)輸出token，"燒錢"速度遠(yuǎn)超同級(jí)別對(duì)手。

在眾包用戶偏好平臺(tái)Chatbot Arena上，V4 Pro的表現(xiàn)也低于預(yù)期，用戶主觀感受評(píng)分落后于官方基準(zhǔn)測(cè)試所呈現(xiàn)的水準(zhǔn)，說明模型在真實(shí)使用體驗(yàn)上仍有距離要追。

一年前，DeepSeek R1橫空出世，讓美國(guó)科技界為之震驚，英偉達(dá)股價(jià)應(yīng)聲大跌，關(guān)于中國(guó)AI能力的討論一夜之間占據(jù)全球頭條。但這一次，開源AI賽場(chǎng)的格局已大不相同。

中國(guó)本土的競(jìng)爭(zhēng)者——月之暗面、智譜AI、MiniMax，乃至傳聞中小米將公開權(quán)重的MiMo-V2.5-Pro，都在奮力追趕甚至局部超越DeepSeek。OpenAI、Google、Anthropic的閉源旗艦?zāi)Ｐ鸵廊辉诳偘裆线b遙領(lǐng)先，V4 Pro尚未觸及那條線。

DeepSeek此次同步推出的輕量版V4 Flash（284B總參數(shù)，130億激活參數(shù)）表現(xiàn)也值得關(guān)注，智能指數(shù)得分47分，超越前代V3.2，且在模型尺寸與性能的性價(jià)比曲線上位置優(yōu)越，定價(jià)僅為0.14美元/0.28美元每百萬(wàn)token，適合對(duì)成本敏感的中小型應(yīng)用場(chǎng)景。

V4的發(fā)布還有一個(gè)外界容易忽略的信號(hào)——DeepSeek官方宣布，V4完全支持華為昇騰芯片，這在美國(guó)持續(xù)收緊芯片出口管制的背景下，折射出中國(guó)AI產(chǎn)業(yè)鏈尋求自主化路徑的戰(zhàn)略意圖。

DeepSeek V4沒有創(chuàng)造新的奇跡，但它證明了這家公司仍然是全球開源AI格局中不可忽視的力量。問題是，下一個(gè)真正的"驚喜時(shí)刻"，還在不在它手中。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.