網易首頁 > 網易號 > 正文申請入駐

外媒：DeepSeek V4的三重意義

2026-04-28 09:06:04　來源: 極客網

上海舉報

分享至

一直以來DeepSeek都很低調，近日DeepSeek宣布推出V4推理模型，距其2025年1月發布的R1已經過去一年多，所以業界對新版本格外關注。

外媒MIT Technology Review撰文指出，在過去一年多時間里，DeepSeek經歷一系列波折，比如核心員工離職、模型發布延遲、美國加強審查。相比R1，V4的“震撼程度”可能有所不及，但本次更新依然很重要，背后蘊含三重意義。

第一重：塑造開源模型新局面

和之前的R1一樣，DeepSeek聲稱V4的性能可與最佳模型媲美，但價格便宜很多。對于開發者和企業來說，這是一個好消息，意味著他們可以快速獲得前沿AI能力，不必擔心成本飆升。

DeepSeek V4有兩個版本，一個是V4-Pro，它的規模更大，專為編程、復雜智能體構建；另一個是V4-Flash，規模較小，旨在運行得更快、更便宜。

兩個版本都提供推理模式，在這種模式下，模型可以仔細解析提示詞，并在解決問題時展示每一個步驟。

就定價而言，V4-Pro的收費為每百萬輸入詞元（Input Tokens）1.74美元，每百萬輸出詞元（Output Tokens）3.48美元，只相當于OpenAI和Anthropic的一小部分。

V4-Flash更便宜，每百萬輸入詞元約0.14美元，每百萬輸出詞元約0.28美元。

至于大眾關注的性能，V4相比R1有了巨大飛躍。按照DeepSeek的描述，V4-Pro可以與領先的閉源大模型競爭，和Claude-Opus-4.6、GPT-5.4、Gemini-3.1相當。

與開源模型Qwen-3.5、GLM-5.1相比，DeepSeek V4在編程、數學和STEM（科學、技術、工程和數學）問題上有所超越，它是有史以來最強的開源模型之一。

在智能體編程任務中，V4-Pro也是最強開源模型之一，其寫作能力和世界知識也處于領先地位。

DeepSeek表示，他們已針對Claude Code、OpenClaw和CodeBuddy等流行智能體框架進行了專門優化。

第二重：用新方法對內存效率進行優化

擁有長上下文窗口（Context Window）是V4的關鍵創新之一，也就是說，模型可以一次處理更長的文本。

兩個版本都能處理100萬個詞元（Tokens）。DeepSeek稱，這樣的上下文窗口是所有服務的默認配置，與Gemini和Claude的尖端版本相當。

DeepSeek是如何做到的？這點更重要。它對模型進行了架構調整，格外重視“注意力機制（Attention Mechanism）”，這一機制是模型理解提示詞各部分與其他部分關聯的重要變量。當提示詞變長，注意力機制成為長上下文模型的主要瓶頸之一。

DeepSeek通過創新技術，讓模型對關注的內容有了更強的選擇性。V4不會將文本看得同等重要，而是壓縮舊信息，專注當前時刻最可能重要的部分，同時保留附近文檔，避免遺漏重要細節。

在100萬個詞元的上下文中，V4-Pro使用的算力只有V3.2的27%，內存使用量也削減至10%。V4-Flash的降幅更大，僅使用10%的計算能力和7%的內存。

AI模型如何“記憶”信息是DeepSeek的研究重點，它在過去一年發表一系列論文，嘗試通過壓縮和數學技術擴展AI模型實際能處理的內容。

第三重：擺脫英偉達

V4針對華為昇騰（Ascend）等國產芯片進行了優化，之前沒有過，這是一次檢驗，檢查DeepSeek能否擺脫對英偉達芯片的依賴。

The Information報道稱，在新模型發布前，通常會向英偉達、AMD提前開放權限，方便芯片商支持，但這一次DeepSeek沒有這樣做，而是給了中國芯片制造商早期訪問權限。

華為表示，基于昇騰950系列的昇騰超節點產品將支持DeepSeek V4。也就是說，如果企業和個人想運行修改版DeepSeek V4，可以使用華為芯片。

不難看出，AI全面國產化已經提速，從芯片到軟件框架再到數據中心，必須全面國產化，刻不容緩。

擺脫英偉達體系并不簡單，主要是受到軟件生態系統的制約。轉向華為體系，意味著要調整模型代碼、重建工具，要證明系統足夠穩定，可以投入使用。

從現有信息看，DeepSeek似乎并沒有完全擺脫英偉達，它只將V4訓練過程的一部分適配了中國芯片。一些人認為，V4可能仍然是在英偉達芯片上訓練的。

中國芯片仍有差距，仍需要追趕，目前國產芯片更適合推理而非訓練。V4的未來成本將與華為芯片聯系起來。DeepSeek宣稱，華為昇騰950超節點于今年下半年開始大規模出貨后，屆時V4-Pro的價格可能會大幅下降。如果能奏效，V4可能表明中國正在成功構建新AI基礎設施。

分析師怎么看？

除了媒體解讀，業界分析師也對DeepSeek V4的推出發表了各自的看法。

金融服務公司晨星（MorningStar）的高級股票分析師蘇偉（Ivan Su）說：“R1震驚了美國市場，因為沒人料到中國模型能達到如此高的水平。V4只是這一趨勢的延續，而趨勢不會像沖擊那樣成為頭條新聞。”

中國模型比美國模型便宜，這已經是公認事實，美國股市早將這一因素考慮在內，所以這次美國股市并沒有暴跌。

Counterpoint Research首席分析師孫偉（Wei Sun）認為：“R1是在英偉達硬件上訓練的，V4不一樣，它在華為和寒武紀芯片上運行。也就是說，中國AI系統的構建和部署不再依賴英偉達，因此，V4可能比R1帶來的影響更大，它將加速國內采購，促進全球AI更快發展。”

DeepSeek在聲明中表示，V4在開源模型中擁有最好的智能體編程能力，并實現了“世界級”的推理能力。在廣泛的世界知識方面，V4的表現優于其他開源模型，只是不及Gemini。

據估計，美國AI初創公司內部約有80%都在使用中國開源模型，亞馬遜、微軟、谷歌的云平臺也提供中國模型。

一項分析發現，中國模型的運行成本僅為美國競爭對手的六分之一到四分之一，價格戰是中國模型的一大優勢，也是搶占市場的關鍵。

有趣的是，V4模型剛剛發布，DeepSeek便宣布降價打折，全系API的輸入緩存命中價格永久降至原有的1/10，DeepSeek-V4-Pro模型的API限時享受2.5折優惠，該優惠活動將持續至2026年5月5日。

有觀點認為，DeepSeek以如此快的速度重拳出擊，優惠力度如此之大，絕非偶然或者隨意為之。在美國模型的壓力下，中國AI的競爭力沒有被削弱，反而一直在增強。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

英偉達力薦，小團隊兩個月開源一款「光速級」智能體推理引擎

機器之心Pro 2026-05-07 15:06:46
0 跟貼 0
Claude、GPT、Gemini 全滅，SWE-Bench作者新作把AI圈干沉默了

機器之心Pro 2026-05-07 10:30:19
0 跟貼 0

噓，Claude正在「做夢」！睡一覺瘋狂進化，一夜暴漲6倍戰力

新智元 2026-05-07 12:07:18
0 跟貼 0

罕見！DeepSeek自曝多名技術骨干離職，AI大牛爭奪戰太激烈了

雷科技 2026-05-07 10:21:02
27 跟貼 27
拒絕智能手機，炮轟ChatGPT，沒有他就沒有今天的互聯網

DeepTech深科技 2025-12-26 18:07:26
35 跟貼 35

蟄伏一年，周銜團隊首個具身基礎模型，烹飪做實驗彈琴，效果炸場

機器之心Pro 2026-05-07 14:15:34
0 跟貼 0

一年磨一劍，今年最炸機器人Demo來了！

量子位 2026-05-07 14:45:11
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

法號“Gabi”！韓國有了“機器人和尚”

財聯社 2026-05-07 14:59:22
0 跟貼 0
Kimi即將完成20億美元融資，DeepSeek被曝投后估值或達450億美元

每日經濟新聞 2026-05-07 10:13:56
0 跟貼 0
地平線亮相北京車展全棧生態發布開啟整車智能體時代

汽車經緯網 2026-05-07 10:18:45
0 跟貼 0
液冷服務器概念震蕩拉升科華數據觸及漲停

財聯社 2026-05-07 14:08:10
0 跟貼 0
【探秘AIoT終端】紫光展銳 × 斑馬智能 160T 端側 AI Box 發布：即插即用，車企高階座艙部署神器

AIZQ知穹傳媒 2026-05-07 10:21:12
0 跟貼 0
中國科技巨頭集體采購華為芯片，NVIDIA份額已清零

快科技 2026-05-06 20:00:04
0 跟貼 0
本輪半導體行情暗藏深意，全球AI算力共振

每日經濟新聞 2026-05-07 10:14:17
0 跟貼 0
領先于Transformer！

機器之心Pro 2026-05-06 17:01:48
0 跟貼 0
10萬雙手，有多大力量？

正視頻 2026-05-04 04:59:39
0 跟貼 0
深夜時談黃仁勛：所有光鮮的成功，都藏著無人知曉的煎熬與孤獨

究竟視頻 2026-05-03 13:23:40
0 跟貼 0
這個Harness普通人可用！

機器之心Pro 2026-04-21 15:47:04
0 跟貼 0
英偉達開源個量子AI

機器之心Pro 2026-04-15 12:05:50
0 跟貼 0
銘普光磁：截至目前，公司未直接與英偉達合作

每日經濟新聞 2026-05-07 15:51:15
0 跟貼 0
奧特曼兩大「死對頭」聯手，但你才是這場 Claude 發布會最大的贏家

AppSo 2026-05-07 09:41:28
0 跟貼 0
北大團隊提出SEAlign對齊框架：顯著提升軟件工程智能體決策質量

機器之心Pro 2026-05-07 15:38:26
0 跟貼 0
孟晚舟事件再現，意大利將把中國芯片工程師徐澤偉引渡到美國！

小沖說百態 2026-05-05 10:51:35
0 跟貼 0
沈逸最徹透分析東大一戰成名，西大人破防！

夢妮的小廚房 2026-05-04 10:17:23
1177 跟貼 1177
早報｜DeepSeek首輪融資曝光，估值450億美元/谷歌稱Android不會推出「液態玻璃」/三星宣布在中國大陸停售所有家電產品

愛范兒 2026-05-07 08:25:32
2 跟貼 2
女子深夜下班回家，竟被自家房門反鎖在外

南陽日報 2026-05-06 19:18:04
700 跟貼 700
自制2N3055四管重低音功放無集成電路線路簡易

中氣愛 2026-05-03 00:29:19
0 跟貼 0
黃仁勛全世界穿皮衣，唯獨在中國換上了大花襖

雷科技 2026-01-27 17:19:30
0 跟貼 0
SpaceX成算力租賃巨頭 Anthropic大手一揮包下Colossus 1全部容量

財聯社 2026-05-07 01:38:23
13 跟貼 13
算力告急、馬斯克反轉、Claude要當工程基礎設施：Anthropic這場發布會說了什么

鈦媒體APP 2026-05-07 11:04:16
0 跟貼 0
他用DeepSeek-V4手搓Agent，沖上GitHub熱榜第一！

智東西 2026-05-07 08:51:24
3 跟貼 3
不可一世的美軍基地，如今已在一定程度上成了中方手中的“籌碼

戰武科普 2026-05-03 18:48:21
0 跟貼 0
俄外交部呼吁各國及時從基輔撤離人員

環球網資訊 2026-05-07 08:47:57
11461 跟貼 11461
缸中之腦現代版：20萬人腦神經元一周學會打Doom

量子位 2026-03-06 17:34:11
0 跟貼 0
全世界最貴的車！買了它是黃仁勛唯一的遺憾

雷科技 2026-02-06 23:52:44
2 跟貼 2
中國長城強勢3連板！一季報營收雙位數增長，自主智算戰略顯效

每日經濟新聞 2026-05-07 11:31:05
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
PackingStar雙智能體博弈，攻克14維難題

量子位 2026-02-16 13:12:43
0 跟貼 0
智能體從「單兵作戰」到「精銳團隊」 -2

機器之心Pro 2026-04-28 16:56:00
0 跟貼 0

極客網

科技使能新商業

2934文章數 2626關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

藝術

數碼

公開課

軍事航空

家居要聞

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

外媒：DeepSeek V4的三重意義

月之暗面完成20億美元融資，估值突破200億

記者詢問"是否敦促美方從霍爾木茲撤出軍艦" 中方回應

記者詢問"是否敦促美方從霍爾木茲撤出軍艦" 中方回應

巴黎再進歐冠決賽，最尷尬的情況還是發生了

小S阿雅重返大S母校，翻看大S畢業照

特朗普：美伊“很有可能”達成協議

理想為什么不做轎車，有了解釋……

態度原創

破繭成蝶 土味精裝房爆改

這位老教授筆下的青年，活力滿滿

歷經三年終于出貨！高端Linux筆記本正式開售 起售價1.28萬元

特朗普：美伊"很可能"達成協議

破繭成蝶土味精裝房爆改

歷經三年終于出貨！高端Linux筆記本正式開售起售價1.28萬元