![]()
Scmp報(bào)道,DeepSeek 帶著久違的旗艦新品V4回來了,只是這一次,外界的掌聲沒有當(dāng)年R1橫空出世時(shí)那么響亮。
根據(jù)獨(dú)立基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis于4月25日發(fā)布的最新評(píng)測(cè),DeepSeek V4 Pro在全球開源模型智能指數(shù)榜單中排名第二,得分52分,僅次于北京月之暗面(Moonshot AI)旗下的Kimi K2.6(54分)。GLM-5.1(51分)緊隨其后,差距不足一步。
這個(gè)結(jié)果,與DeepSeek今年年初憑借R1系列一鳴驚人、令硅谷側(cè)目的輝煌相比,多少顯得有些"中規(guī)中矩"。但數(shù)字背后,卻有不少值得細(xì)看的東西。
V4 Pro相比前代V3.2的提升幅度實(shí)際相當(dāng)顯著,在Artificial Analysis智能指數(shù)上從42分躍升至52分,整整進(jìn)步了10分。架構(gòu)也完成了一次大刀闊斧的升級(jí):V4 Pro采用全新混合專家架構(gòu)(MoE),總參數(shù)量達(dá)1.6萬(wàn)億,激活參數(shù)為490億,相比V3家族的6710億總參數(shù)、370億激活參數(shù),是一次質(zhì)的擴(kuò)張。
在代理任務(wù)(Agentic Tasks)這一近年來業(yè)界最看重的實(shí)戰(zhàn)能力賽道上,V4 Pro的表現(xiàn)尤為突出。在GDPval-AA代理基準(zhǔn)測(cè)試中,V4 Pro以1554分高居開源模型榜首,超越Kimi K2.6(1484分)和GLM-5.1(1535分)。
V4 Pro并非沒有軟肋。最讓研究者皺眉的,是其極高的幻覺率,V4 Pro和V4 Flash的幻覺率分別高達(dá)94%和96%,意思是當(dāng)模型不知道答案時(shí),它幾乎必然會(huì)"編"一個(gè)出來,而不是坦承不知。這對(duì)需要高可靠性輸出的商業(yè)應(yīng)用場(chǎng)景來說,是個(gè)不小的隱患。
在成本端,V4 Pro的定價(jià)策略也顯得頗為矛盾。每百萬(wàn)輸入/輸出token定價(jià)為1.74美元/3.48美元,雖然比Claude Opus 4.7便宜四倍以上,但相較于其他開源競(jìng)品,例如Kimi K2.6(948美元/次評(píng)測(cè))和GLM-5.1(544美元/次評(píng)測(cè)),V4 Pro的綜合運(yùn)行成本高達(dá)1071美元,價(jià)格優(yōu)勢(shì)并不明顯。這背后的原因在于,V4 Pro的輸出token消耗量極高,單次評(píng)測(cè)消耗高達(dá)1.9億個(gè)輸出token,"燒錢"速度遠(yuǎn)超同級(jí)別對(duì)手。
在眾包用戶偏好平臺(tái)Chatbot Arena上,V4 Pro的表現(xiàn)也低于預(yù)期,用戶主觀感受評(píng)分落后于官方基準(zhǔn)測(cè)試所呈現(xiàn)的水準(zhǔn),說明模型在真實(shí)使用體驗(yàn)上仍有距離要追。
一年前,DeepSeek R1橫空出世,讓美國(guó)科技界為之震驚,英偉達(dá)股價(jià)應(yīng)聲大跌,關(guān)于中國(guó)AI能力的討論一夜之間占據(jù)全球頭條。但這一次,開源AI賽場(chǎng)的格局已大不相同。
中國(guó)本土的競(jìng)爭(zhēng)者——月之暗面、智譜AI、MiniMax,乃至傳聞中小米將公開權(quán)重的MiMo-V2.5-Pro,都在奮力追趕甚至局部超越DeepSeek。OpenAI、Google、Anthropic的閉源旗艦?zāi)P鸵廊辉诳偘裆线b遙領(lǐng)先,V4 Pro尚未觸及那條線。
DeepSeek此次同步推出的輕量版V4 Flash(284B總參數(shù),130億激活參數(shù))表現(xiàn)也值得關(guān)注,智能指數(shù)得分47分,超越前代V3.2,且在模型尺寸與性能的性價(jià)比曲線上位置優(yōu)越,定價(jià)僅為0.14美元/0.28美元每百萬(wàn)token,適合對(duì)成本敏感的中小型應(yīng)用場(chǎng)景。
V4的發(fā)布還有一個(gè)外界容易忽略的信號(hào)——DeepSeek官方宣布,V4完全支持華為昇騰芯片,這在美國(guó)持續(xù)收緊芯片出口管制的背景下,折射出中國(guó)AI產(chǎn)業(yè)鏈尋求自主化路徑的戰(zhàn)略意圖。
DeepSeek V4沒有創(chuàng)造新的奇跡,但它證明了這家公司仍然是全球開源AI格局中不可忽視的力量。問題是,下一個(gè)真正的"驚喜時(shí)刻",還在不在它手中。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.