一直以來DeepSeek都很低調,近日DeepSeek宣布推出V4推理模型,距其2025年1月發布的R1已經過去一年多,所以業界對新版本格外關注。
外媒MIT Technology Review撰文指出,在過去一年多時間里,DeepSeek經歷一系列波折,比如核心員工離職、模型發布延遲、美國加強審查。相比R1,V4的“震撼程度”可能有所不及,但本次更新依然很重要,背后蘊含三重意義。
![]()
第一重:塑造開源模型新局面
和之前的R1一樣,DeepSeek聲稱V4的性能可與最佳模型媲美,但價格便宜很多。對于開發者和企業來說,這是一個好消息,意味著他們可以快速獲得前沿AI能力,不必擔心成本飆升。
DeepSeek V4有兩個版本,一個是V4-Pro,它的規模更大,專為編程、復雜智能體構建;另一個是V4-Flash,規模較小,旨在運行得更快、更便宜。
兩個版本都提供推理模式,在這種模式下,模型可以仔細解析提示詞,并在解決問題時展示每一個步驟。
就定價而言,V4-Pro的收費為每百萬輸入詞元(Input Tokens)1.74美元,每百萬輸出詞元(Output Tokens)3.48美元,只相當于OpenAI和Anthropic的一小部分。
V4-Flash更便宜,每百萬輸入詞元約0.14美元,每百萬輸出詞元約0.28美元。
至于大眾關注的性能,V4相比R1有了巨大飛躍。按照DeepSeek的描述,V4-Pro可以與領先的閉源大模型競爭,和Claude-Opus-4.6、GPT-5.4、Gemini-3.1相當。
與開源模型Qwen-3.5、GLM-5.1相比,DeepSeek V4在編程、數學和STEM(科學、技術、工程和數學)問題上有所超越,它是有史以來最強的開源模型之一。
在智能體編程任務中,V4-Pro也是最強開源模型之一,其寫作能力和世界知識也處于領先地位。
DeepSeek表示,他們已針對Claude Code、OpenClaw和CodeBuddy等流行智能體框架進行了專門優化。
第二重:用新方法對內存效率進行優化
擁有長上下文窗口(Context Window)是V4的關鍵創新之一,也就是說,模型可以一次處理更長的文本。
兩個版本都能處理100萬個詞元(Tokens)。DeepSeek稱,這樣的上下文窗口是所有服務的默認配置,與Gemini和Claude的尖端版本相當。
DeepSeek是如何做到的?這點更重要。它對模型進行了架構調整,格外重視“注意力機制(Attention Mechanism)”,這一機制是模型理解提示詞各部分與其他部分關聯的重要變量。當提示詞變長,注意力機制成為長上下文模型的主要瓶頸之一。
DeepSeek通過創新技術,讓模型對關注的內容有了更強的選擇性。V4不會將文本看得同等重要,而是壓縮舊信息,專注當前時刻最可能重要的部分,同時保留附近文檔,避免遺漏重要細節。
在100萬個詞元的上下文中,V4-Pro使用的算力只有V3.2的27%,內存使用量也削減至10%。V4-Flash的降幅更大,僅使用10%的計算能力和7%的內存。
AI模型如何“記憶”信息是DeepSeek的研究重點,它在過去一年發表一系列論文,嘗試通過壓縮和數學技術擴展AI模型實際能處理的內容。
第三重:擺脫英偉達
V4針對華為昇騰(Ascend)等國產芯片進行了優化,之前沒有過,這是一次檢驗,檢查DeepSeek能否擺脫對英偉達芯片的依賴。
The Information報道稱,在新模型發布前,通常會向英偉達、AMD提前開放權限,方便芯片商支持,但這一次DeepSeek沒有這樣做,而是給了中國芯片制造商早期訪問權限。
華為表示,基于昇騰950系列的昇騰超節點產品將支持DeepSeek V4。也就是說,如果企業和個人想運行修改版DeepSeek V4,可以使用華為芯片。
不難看出,AI全面國產化已經提速,從芯片到軟件框架再到數據中心,必須全面國產化,刻不容緩。
擺脫英偉達體系并不簡單,主要是受到軟件生態系統的制約。轉向華為體系,意味著要調整模型代碼、重建工具,要證明系統足夠穩定,可以投入使用。
從現有信息看,DeepSeek似乎并沒有完全擺脫英偉達,它只將V4訓練過程的一部分適配了中國芯片。一些人認為,V4可能仍然是在英偉達芯片上訓練的。
中國芯片仍有差距,仍需要追趕,目前國產芯片更適合推理而非訓練。V4的未來成本將與華為芯片聯系起來。DeepSeek宣稱,華為昇騰950超節點于今年下半年開始大規模出貨后,屆時V4-Pro的價格可能會大幅下降。如果能奏效,V4可能表明中國正在成功構建新AI基礎設施。
分析師怎么看?
除了媒體解讀,業界分析師也對DeepSeek V4的推出發表了各自的看法。
金融服務公司晨星(MorningStar)的高級股票分析師蘇偉(Ivan Su)說:“R1震驚了美國市場,因為沒人料到中國模型能達到如此高的水平。V4只是這一趨勢的延續,而趨勢不會像沖擊那樣成為頭條新聞。”
中國模型比美國模型便宜,這已經是公認事實,美國股市早將這一因素考慮在內,所以這次美國股市并沒有暴跌。
Counterpoint Research首席分析師孫偉(Wei Sun)認為:“R1是在英偉達硬件上訓練的,V4不一樣,它在華為和寒武紀芯片上運行。也就是說,中國AI系統的構建和部署不再依賴英偉達,因此,V4可能比R1帶來的影響更大,它將加速國內采購,促進全球AI更快發展。”
DeepSeek在聲明中表示,V4在開源模型中擁有最好的智能體編程能力,并實現了“世界級”的推理能力。在廣泛的世界知識方面,V4的表現優于其他開源模型,只是不及Gemini。
據估計,美國AI初創公司內部約有80%都在使用中國開源模型,亞馬遜、微軟、谷歌的云平臺也提供中國模型。
一項分析發現,中國模型的運行成本僅為美國競爭對手的六分之一到四分之一,價格戰是中國模型的一大優勢,也是搶占市場的關鍵。
有趣的是,V4模型剛剛發布,DeepSeek便宣布降價打折,全系API的輸入緩存命中價格永久降至原有的1/10,DeepSeek-V4-Pro模型的API限時享受2.5折優惠,該優惠活動將持續至2026年5月5日。
有觀點認為,DeepSeek以如此快的速度重拳出擊,優惠力度如此之大,絕非偶然或者隨意為之。在美國模型的壓力下,中國AI的競爭力沒有被削弱,反而一直在增強。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.