大劉在《三體》中寫過一個后來被無數(shù)次引用的意象——黑暗森林。每個文明都是帶槍的獵人,誰先暴露自己,誰先死。
森林里不是沒有人,是每個人都知道亮燈會招來子彈,所以大家都熄燈。
2026年春天,頂級AI實驗室們,走入了這樣的黑暗森林。
———— / BEGIN / ————
4月16日,Anthropic 率先發(fā)布 Claude Opus 4.7。同一天,他們做了一個反常的動作——公開承認(rèn) Opus 4.7 的性能并不及一個尚未發(fā)布的模型 Mythos,理由是 safety concerns。(安全考量)
4月23 日,OpenAI 在官網(wǎng)掛出 GPT-5.5。同一天,Anthropic 又在官方博客發(fā)了一篇叫 “An update on recent Claude Code quality reports” 的事故復(fù)盤報告,承認(rèn)過去一個多月 Claude Code 確實變笨了——一個放新牌,一個補(bǔ)認(rèn)錯。但這位“新晉王者”幾乎是在炫耀:我們承認(rèn) Claude 暫時變笨——但你別忘了,我們手里還藏著一把 Mythos 沒出。
4月24 日,“神秘的東方力量” DeepSeek V4 Preview 上線,梁文鋒團(tuán)隊第一次把模型和華為昇騰 950PR 深度綁定做官宣;但所有人都看明白了——真正“滿血”的 V4 Pro Max,要等昇騰 950 超節(jié)點(diǎn)下半年量產(chǎn)之后才能放出來。
三家公司,三個動作。表面是各自的產(chǎn)品節(jié)奏,但拼在一起看,一件事浮出來:
每一家手里都握著至少一把“槍”——一個比公開版本更強(qiáng)的模型、一個還沒輪到公眾的下一代架構(gòu)、一片還沒大規(guī)模鋪開的芯片超節(jié)點(diǎn)。但沒有一家敢先把這把槍舉起來。
![]()
因為在這個行業(yè)里,“先亮”的代價從來都不止泄密那么簡單。先亮,意味著把自己的能力上限親手交給對手做參照系;意味著率先承擔(dān)安全審視、監(jiān)管收緊、輿論壓力的全部火力;意味著把自己變成下一輪所有競對都要瞄準(zhǔn)的那個移動靶子。
森林里沒有英雄主義——每一個先開槍的人,都把自己變成了下一個被瞄準(zhǔn)的人。
所以獵人們最理性的選擇,是熄燈、屏息、把武器藏在背后。
這就是博弈的最優(yōu)解。
Anthropic的有恃無恐
Claude 這一邊,在過去的一個月,幾乎上演了最糟糕的一次版本發(fā)布。
早早更新完 Opus 4.7,Anthropic 仍舊霸榜各種榜單,而且手里還藏著只提供給企業(yè)客戶的 Mythos——儼然一副不緊不慢的姿態(tài)。
但 Opus 4.7 的這一周期,幾乎是 Claude 用戶體驗最差的一次,“差評如潮”。
3 月初,Anthropic 改了 Claude Code 的默認(rèn)推理深度,從 high 調(diào)到 medium。這個決定的出發(fā)點(diǎn)可以理解:high 模式下 UI 經(jīng)常看起來像卡死了一樣,響應(yīng)慢得讓付費(fèi)用戶抓狂。但問題是,他們當(dāng)時沒有公布。
3 月底,又上線了一個“效率優(yōu)化”——如果 Claude Code 會話空閑超過一小時,系統(tǒng)就會清掉舊的 reasoning block。按設(shè)計,這是為了省算力。實際跑起來的效果,是每一輪對話之后 Claude 都像失憶,把上下文忘得干干凈凈。開發(fā)者社區(qū)那幾周涌進(jìn)大量吐槽:“Claude 開始不記得我上一輪讓它干什么了。”
直到近期,第三件事發(fā)生了——在系統(tǒng)提示里加了一條壓縮 verbosity 的指令。按 Anthropic 后來自己承認(rèn)的說法,這條指令讓 Claude Code 的編碼質(zhì)量直接跌了 3%。
三件事疊在一起,才有了 AMD 的一位 senior director 在 GitHub 上寫下的那句話——“Claude has regressed to the point it cannot be trusted to perform complex engineering”(Claude 已經(jīng)退化到無法再被信任去完成復(fù)雜工程類任務(wù))。Axios 4 月 16 日那篇 “Anthropic's AI downgrade stings power users” 把它抬到了主流視野。
然后 Anthropic 才承認(rèn),確實有點(diǎn)問題。
![]()
4月7 日,他們悄悄回滾了 reasoning effort 的調(diào)整;4 月 10 日修掉了 cache 的 bug;4 月 20 日撤掉了壓縮 verbosity 的系統(tǒng)提示。但真正的事故復(fù)盤報告,等到了 4 月 23 日才發(fā)出來——而這恰好是 GPT-5.5 公開發(fā)布的當(dāng)天。
這種帶著一絲“哦,我的工程策略有點(diǎn) bug,修復(fù)就好了”的輕蔑感,和 OpenAI 的重量級發(fā)布只在前后腳之間。很難說這是巧合。
更耐人尋味的是, Opus 4.7 發(fā)布的時候,Anthropic 順帶做了一個反常的動作:公開承認(rèn) Opus 4.7 的性能不及一個尚未發(fā)布的模型——Mythos。這很明顯是一種“戰(zhàn)略性退守”——Anthropic 把最強(qiáng)能力留在企業(yè)端、不急于推向大眾,因為團(tuán)隊還沒準(zhǔn)備好把 Mythos 放出去。
這個說法可以信。但從商業(yè)敘事的角度看,另一半同樣真實:Anthropic 等了六周才公開承認(rèn) Claude Code 在退化,等到 OpenAI 要放新牌的那一天才把問題端出來。如果不是同行壓力足夠大,如果不是 Opus 4.7 已經(jīng)證明了“我們還有后手”,這份聲明可能永遠(yuǎn)都不會到來。
在 Claude 這一側(cè),擠牙膏不是指刻意閹割能力,而是:能力的釋放節(jié)奏、對問題的披露節(jié)奏,都跟著競對的節(jié)奏走。
拿出自己最前沿的能力,注定會被當(dāng)做靶子打。又或者說,在 Anthropic 看來,4.6 對競爭對手造成的壓力都還沒散去——既然如此,更強(qiáng)的牌沒必要現(xiàn)在就打出來。
OpenAI 的故技重施
如果 Anthropic 是“藏著一個 Mythos 不發(fā)”,那 OpenAI 這一側(cè)的擠牙膏更隱蔽——它把能力的釋放權(quán),留在了自己服務(wù)器的負(fù)載曲線和一個叫 auto-router 的分檔機(jī)制里。
4月23 日 GPT-5.5 發(fā)布的同一天,Simon Willison(Django 框架共同創(chuàng)始人、AI 圈知名獨(dú)立評測者)在自己的博客里寫了一句審慎的話:“It's not a dramatic departure from what we've had before.”(這不是一次戲劇性的飛躍)。
![]()
他順手補(bǔ)了一條信息很關(guān)鍵:GPT-5.5 是自 GPT-4.5 之后 OpenAI 第一次完全重訓(xùn)的基礎(chǔ)模型;也就是說,過去半年發(fā)出去的 5.1、5.2、5.3、5.4,全部只是增量更新。換言之,過去的四次小版本更新,OpenAI 都是收著力氣發(fā)布的——因為他們不清楚競爭對手會放出什么東西。
“收著勁兒更新”有一個更容易理解的說法:擠牙膏。
但更值得記住的一幕發(fā)生在 GPT-5.5 上線幾個小時之后。Codex 用戶在 GitHub 提了 Issue ,投訴 Fast mode 一開始真的很快,等更多用戶被放進(jìn)來之后肉眼可見變慢,而計費(fèi)還按 Fast 檔結(jié)算。措辭很熟悉:“請 OpenAI 調(diào)查 GPT-5.5 Fast mode 是否在高負(fù)載下被降級。”
這幾乎就是 2025 年 8 月 7 日 GPT-5 首發(fā)當(dāng)天那一幕的精確重演——那一次,Reddit r/ChatGPT 把 “GPT-5 is horrible” 頂?shù)?4600+ upvotes,Sam Altman 第二天在 AMA 上親口承認(rèn) “the autoswitcher broke... GPT-5 seemed way dumber”——承認(rèn)了 router 在幕后替用戶做了降檔這件事。
同一個劇本,八個月后再度上演。
更戲謔的是,在 GPT-5.5 正式發(fā)布的前一天,OpenAI 的 Codex 把內(nèi)部 staging 環(huán)境誤推到了生產(chǎn)環(huán)境,被幾個 Pro 用戶截圖截了下來,幾分鐘之內(nèi)修掉,但泄漏的內(nèi)容已經(jīng)四處流傳。當(dāng)時出現(xiàn)在選擇器里的,除了 GPT-5.5 本身,還有一個叫 Glacier 的系列(tooltip 寫著 “Intelligence that moves continents”)、一個叫 Heisenberg 的生命科學(xué)模型、一個叫 Arcanine 的未知用途模型,以及代號 oai-2.1 等多個版本。
也就是說,就在 OpenAI 把 GPT-5.5 作為“下一代”放出來的同一時間,內(nèi)部至少跑著 5 到 6 條平行的產(chǎn)品線,每一條都還沒輪到公眾。
OpenAI 自己倒是認(rèn)了。在 2026 年官方的年度路線圖里,他們用了一個學(xué)術(shù)圈討論已久的詞——capability overhang——承認(rèn)當(dāng)前大模型的真實能力和用戶實際能用出的效果之間,存在一個巨大的 gap。
熟悉嗎?和 Anthropic 對待 Mythos 的話術(shù)幾乎是同一句話。就算 4 月 22 日那次 Codex 泄露真的是誤操作,OpenAI 主動把 capability overhang 這個詞放進(jìn)路線圖,傳遞的信號已經(jīng)寫得很清楚——我們手里還多得很,你們看著辦。
你手里有遠(yuǎn)多于賣給用戶的東西,你才有的擠。GPT-5.5 的 24 小時,把這個前提再一次變成了現(xiàn)場直播。
Deepseek 的耐心等待
DeepSeek 這一邊,“擠”的方式徹底變了——它不是在藏能力,而是在等一個更合適的交付時機(jī)。
1.6T MoE、1M 上下文、Pro/Flash 雙規(guī)格,定價 3.48 per 1M tokens——是 GPT-5.5 的幾十分之一,是 Opus 4.7 的量級差。海外獨(dú)立評測者給出的結(jié)論是兩句話:性能貼近但略低于 GPT-5.4 / Gemini 3.1-Pro,價格“把前沿實驗室的經(jīng)濟(jì)學(xué)打穿了”。
但放在 DeepSeek 自己的坐標(biāo)系里,V4 Preview 已經(jīng)比 V3 那種“便宜到詭異”的價格貴了不止一點(diǎn)。所有人都知道——這不是滿血版。
DeepSeek V4 的完整故事,不以發(fā)布為終點(diǎn),更不以發(fā)布為起點(diǎn)。
要從 2025 年 R2 那次沒發(fā)出來的發(fā)布講起。R2 原定于 2025 年 5 月發(fā)布,但最終被延后到秋冬。整個中國Deepseek 的基礎(chǔ)設(shè)施遷向華為的 CANN 生態(tài)。對于任何一個實驗室實驗室,這都不可能是一個季度能完成的工程——編譯器、算子、通信庫、推理框架、MoE 路由,全部要重寫。
而 V4 這一次,是 DeepSeek 第一次把昇騰正式寫進(jìn)訓(xùn)練硬件清單。V4 是混合訓(xùn)練的第一個版本——昇騰首次入場。
但專門為大規(guī)模訓(xùn)練優(yōu)化的下一代芯片昇騰 950DT,按華為路線圖要 2026 年 Q4 才量產(chǎn)。也就是說,V4 訓(xùn)練能跑起來,是用上一代的 950PR 拼出來的;要讓 V4 Pro Max 這種 1.6T MoE 的滿血版本既能訓(xùn)得徹底又能大規(guī)模推得起來,還要等下一代到位。
真正的工程難點(diǎn)不是“V4 能不能訓(xùn)出來”——已經(jīng)訓(xùn)出來了——而是“V4怎樣在昇騰上跑得滿、跑得穩(wěn)、跑得便宜”。
昇騰 950PR 在 2026 年 Q1 量產(chǎn),F(xiàn)P4 算力 1.56 PFLOPS、片上內(nèi)存 112GB,紙面規(guī)格對標(biāo)并超過英偉達(dá) H20。但從一顆芯片跑得起,到一整片超節(jié)點(diǎn)能穩(wěn)定服務(wù)數(shù)百萬 token/秒的推理請求,是兩回事。V4 Pro Max 的滿血版,鎖的就是這個“超節(jié)點(diǎn)”——昇騰 950 系列的大規(guī)模集群版本,2026 年下半年陸續(xù)到位。
這構(gòu)成了一個和前兩家完全不同的策略。Anthropic 和 OpenAI 擠牙膏的邏輯,是我手里有更強(qiáng)的,先不給你;DeepSeek 擠牙膏的邏輯,是我滿血的那一版,要等一個讓價格再下一個臺階的時刻。
這個差別很重要。
DeepSeek 真正的殺手锏從來不是“性能最前沿”,而是“在性能夠用的前提下,把 token 價格砍到別人不敢砍的位置”。V4 Preview 在英偉達(dá)卡和昇騰 950PR 上做了適配,但要做到量產(chǎn)規(guī)模的滿血推理,必須等超節(jié)點(diǎn)到位。一旦等到那一刻,兩件事會同時發(fā)生:一是 V4 Pro Max 的能力可以釋放到頂;二是推理成本、API 定價會再落一階——對一家靠價格打穿市場的公司,后者比前者更致命。
人們真正期待的、在 2025 年初發(fā)生過的那個“DeepSeek 時刻”,沒有在這次發(fā)布里再次上演。而 V4 Preview 的發(fā)布其實是一段預(yù)告片,真正的重頭戲,是下半年的“DeepSeek + 華為昇騰”時刻。
從這個角度看,梁文鋒團(tuán)隊現(xiàn)在做的不是被迫的“藏”,而是一次商業(yè)上克制的“選擇”——選擇把最強(qiáng)版本的首發(fā),交到一個它最有話語權(quán)的場景里:國產(chǎn)超節(jié)點(diǎn)大規(guī)模部署后的第一天。在那之前,先用 V4 Preview 把性價比的敘事再鞏固一輪。
![]()
DeepSeek 背負(fù)的從來不是讓國產(chǎn)大模型在某個榜單上拔到第一的“長板敘事”,而是讓芯片、訓(xùn)練、推理、定價四條線同時跑通的“系統(tǒng)性敘事”——后者比前者重要得多。
就在前幾天,黃仁勛在 Dwarkesh Patel 的播客上說,如果 DeepSeek 在華為芯片上首發(fā),“那對我們美國來說是個可怕的結(jié)果”(“a horrible outcome for our nation”)。
現(xiàn)在英偉達(dá)還把控著頂尖算力。但按照黃仁勛自己拋出的那塊“AI 五層蛋糕”——能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用——國產(chǎn)大模型產(chǎn)業(yè)在每一層都已經(jīng)有了能跑通的國產(chǎn)方案,差距正在以肉眼可見的速度縮小。補(bǔ)上芯片這塊最后的拼圖,DeepSeek 的開源大模型故事,才是一個比美國大模型更大的故事:這是一場不用消耗過多成本、讓全球?qū)崿F(xiàn)智能平權(quán)的重要一步。
讓全世界都可以繞過某些被霸權(quán)掌控的先進(jìn)算力,走入高效的智能社會。
尾聲
Anthropic 的“藏”——是主動的。他們有 Mythos,沒發(fā),理由是 safety。
OpenAI 的“藏”——是結(jié)構(gòu)的。他們有 Pro 檔,不常給你,理由是 infrastructure 和價格分層。
DeepSeek 的“藏”——是必要的。它關(guān)乎一整套社會智能躍遷的敘事范本。
但從另一個側(cè)面來看,這又像極了大劉描繪的黑暗森林:在這片漆黑的智能森林里,每一個頂尖獵人都不會率先開出自己的那一槍。
暴露意味著毫無保留,意味著沒有底牌,會成為另一個獵人的活靶子。
沒人知道誰會率先打出最致命的一槍。
但可以確定的是,今天你用的每一個模型,都不是它真正的樣子。
本文來自公眾號:象先志 作者:阿卡
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.