網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

AI 巨頭，走入黑暗森林

2026-04-28 07:48:30　來源: 人人都是產(chǎn)品經(jīng)理社區(qū)

廣東舉報

分享至

大劉在《三體》中寫過一個后來被無數(shù)次引用的意象——黑暗森林。每個文明都是帶槍的獵人，誰先暴露自己，誰先死。

森林里不是沒有人，是每個人都知道亮燈會招來子彈，所以大家都熄燈。

2026年春天，頂級AI實驗室們，走入了這樣的黑暗森林。

———— / BEGIN / ————

4月16日，Anthropic 率先發(fā)布 Claude Opus 4.7。同一天，他們做了一個反常的動作——公開承認(rèn) Opus 4.7 的性能并不及一個尚未發(fā)布的模型 Mythos，理由是 safety concerns。（安全考量）

4月23 日，OpenAI 在官網(wǎng)掛出 GPT-5.5。同一天，Anthropic 又在官方博客發(fā)了一篇叫 “An update on recent Claude Code quality reports” 的事故復(fù)盤報告，承認(rèn)過去一個多月 Claude Code 確實變笨了——一個放新牌，一個補(bǔ)認(rèn)錯。但這位“新晉王者”幾乎是在炫耀：我們承認(rèn) Claude 暫時變笨——但你別忘了，我們手里還藏著一把 Mythos 沒出。

4月24 日，“神秘的東方力量” DeepSeek V4 Preview 上線，梁文鋒團(tuán)隊第一次把模型和華為昇騰 950PR 深度綁定做官宣；但所有人都看明白了——真正“滿血”的 V4 Pro Max，要等昇騰 950 超節(jié)點(diǎn)下半年量產(chǎn)之后才能放出來。

三家公司，三個動作。表面是各自的產(chǎn)品節(jié)奏，但拼在一起看，一件事浮出來：

每一家手里都握著至少一把“槍”——一個比公開版本更強(qiáng)的模型、一個還沒輪到公眾的下一代架構(gòu)、一片還沒大規(guī)模鋪開的芯片超節(jié)點(diǎn)。但沒有一家敢先把這把槍舉起來。

因為在這個行業(yè)里，“先亮”的代價從來都不止泄密那么簡單。先亮，意味著把自己的能力上限親手交給對手做參照系；意味著率先承擔(dān)安全審視、監(jiān)管收緊、輿論壓力的全部火力；意味著把自己變成下一輪所有競對都要瞄準(zhǔn)的那個移動靶子。

森林里沒有英雄主義——每一個先開槍的人，都把自己變成了下一個被瞄準(zhǔn)的人。

所以獵人們最理性的選擇，是熄燈、屏息、把武器藏在背后。

這就是博弈的最優(yōu)解。

Anthropic的有恃無恐

Claude 這一邊，在過去的一個月，幾乎上演了最糟糕的一次版本發(fā)布。

早早更新完 Opus 4.7，Anthropic 仍舊霸榜各種榜單，而且手里還藏著只提供給企業(yè)客戶的 Mythos——儼然一副不緊不慢的姿態(tài)。

但 Opus 4.7 的這一周期，幾乎是 Claude 用戶體驗最差的一次，“差評如潮”。

3 月初，Anthropic 改了 Claude Code 的默認(rèn)推理深度，從 high 調(diào)到 medium。這個決定的出發(fā)點(diǎn)可以理解：high 模式下 UI 經(jīng)常看起來像卡死了一樣，響應(yīng)慢得讓付費(fèi)用戶抓狂。但問題是，他們當(dāng)時沒有公布。

3 月底，又上線了一個“效率優(yōu)化”——如果 Claude Code 會話空閑超過一小時，系統(tǒng)就會清掉舊的 reasoning block。按設(shè)計，這是為了省算力。實際跑起來的效果，是每一輪對話之后 Claude 都像失憶，把上下文忘得干干凈凈。開發(fā)者社區(qū)那幾周涌進(jìn)大量吐槽：“Claude 開始不記得我上一輪讓它干什么了。”

直到近期，第三件事發(fā)生了——在系統(tǒng)提示里加了一條壓縮 verbosity 的指令。按 Anthropic 后來自己承認(rèn)的說法，這條指令讓 Claude Code 的編碼質(zhì)量直接跌了 3%。

三件事疊在一起，才有了 AMD 的一位 senior director 在 GitHub 上寫下的那句話——“Claude has regressed to the point it cannot be trusted to perform complex engineering”（Claude 已經(jīng)退化到無法再被信任去完成復(fù)雜工程類任務(wù)）。Axios 4 月 16 日那篇 “Anthropic's AI downgrade stings power users” 把它抬到了主流視野。

然后 Anthropic 才承認(rèn)，確實有點(diǎn)問題。

4月7 日，他們悄悄回滾了 reasoning effort 的調(diào)整；4 月 10 日修掉了 cache 的 bug；4 月 20 日撤掉了壓縮 verbosity 的系統(tǒng)提示。但真正的事故復(fù)盤報告，等到了 4 月 23 日才發(fā)出來——而這恰好是 GPT-5.5 公開發(fā)布的當(dāng)天。

這種帶著一絲“哦，我的工程策略有點(diǎn) bug，修復(fù)就好了”的輕蔑感，和 OpenAI 的重量級發(fā)布只在前后腳之間。很難說這是巧合。

更耐人尋味的是， Opus 4.7 發(fā)布的時候，Anthropic 順帶做了一個反常的動作：公開承認(rèn) Opus 4.7 的性能不及一個尚未發(fā)布的模型——Mythos。這很明顯是一種“戰(zhàn)略性退守”——Anthropic 把最強(qiáng)能力留在企業(yè)端、不急于推向大眾，因為團(tuán)隊還沒準(zhǔn)備好把 Mythos 放出去。

這個說法可以信。但從商業(yè)敘事的角度看，另一半同樣真實：Anthropic 等了六周才公開承認(rèn) Claude Code 在退化，等到 OpenAI 要放新牌的那一天才把問題端出來。如果不是同行壓力足夠大，如果不是 Opus 4.7 已經(jīng)證明了“我們還有后手”，這份聲明可能永遠(yuǎn)都不會到來。

在 Claude 這一側(cè)，擠牙膏不是指刻意閹割能力，而是：能力的釋放節(jié)奏、對問題的披露節(jié)奏，都跟著競對的節(jié)奏走。

拿出自己最前沿的能力，注定會被當(dāng)做靶子打。又或者說，在 Anthropic 看來，4.6 對競爭對手造成的壓力都還沒散去——既然如此，更強(qiáng)的牌沒必要現(xiàn)在就打出來。

OpenAI 的故技重施

如果 Anthropic 是“藏著一個 Mythos 不發(fā)”，那 OpenAI 這一側(cè)的擠牙膏更隱蔽——它把能力的釋放權(quán)，留在了自己服務(wù)器的負(fù)載曲線和一個叫 auto-router 的分檔機(jī)制里。

4月23 日 GPT-5.5 發(fā)布的同一天，Simon Willison（Django 框架共同創(chuàng)始人、AI 圈知名獨(dú)立評測者）在自己的博客里寫了一句審慎的話：“It's not a dramatic departure from what we've had before.”（這不是一次戲劇性的飛躍）。

他順手補(bǔ)了一條信息很關(guān)鍵：GPT-5.5 是自 GPT-4.5 之后 OpenAI 第一次完全重訓(xùn)的基礎(chǔ)模型；也就是說，過去半年發(fā)出去的 5.1、5.2、5.3、5.4，全部只是增量更新。換言之，過去的四次小版本更新，OpenAI 都是收著力氣發(fā)布的——因為他們不清楚競爭對手會放出什么東西。

“收著勁兒更新”有一個更容易理解的說法：擠牙膏。

但更值得記住的一幕發(fā)生在 GPT-5.5 上線幾個小時之后。Codex 用戶在 GitHub 提了 Issue ，投訴 Fast mode 一開始真的很快，等更多用戶被放進(jìn)來之后肉眼可見變慢，而計費(fèi)還按 Fast 檔結(jié)算。措辭很熟悉：“請 OpenAI 調(diào)查 GPT-5.5 Fast mode 是否在高負(fù)載下被降級。”

這幾乎就是 2025 年 8 月 7 日 GPT-5 首發(fā)當(dāng)天那一幕的精確重演——那一次，Reddit r/ChatGPT 把 “GPT-5 is horrible” 頂?shù)?4600+ upvotes，Sam Altman 第二天在 AMA 上親口承認(rèn) “the autoswitcher broke... GPT-5 seemed way dumber”——承認(rèn)了 router 在幕后替用戶做了降檔這件事。

同一個劇本，八個月后再度上演。

更戲謔的是，在 GPT-5.5 正式發(fā)布的前一天，OpenAI 的 Codex 把內(nèi)部 staging 環(huán)境誤推到了生產(chǎn)環(huán)境，被幾個 Pro 用戶截圖截了下來，幾分鐘之內(nèi)修掉，但泄漏的內(nèi)容已經(jīng)四處流傳。當(dāng)時出現(xiàn)在選擇器里的，除了 GPT-5.5 本身，還有一個叫 Glacier 的系列（tooltip 寫著 “Intelligence that moves continents”）、一個叫 Heisenberg 的生命科學(xué)模型、一個叫 Arcanine 的未知用途模型，以及代號 oai-2.1 等多個版本。

也就是說，就在 OpenAI 把 GPT-5.5 作為“下一代”放出來的同一時間，內(nèi)部至少跑著 5 到 6 條平行的產(chǎn)品線，每一條都還沒輪到公眾。

OpenAI 自己倒是認(rèn)了。在 2026 年官方的年度路線圖里，他們用了一個學(xué)術(shù)圈討論已久的詞——capability overhang——承認(rèn)當(dāng)前大模型的真實能力和用戶實際能用出的效果之間，存在一個巨大的 gap。

熟悉嗎？和 Anthropic 對待 Mythos 的話術(shù)幾乎是同一句話。就算 4 月 22 日那次 Codex 泄露真的是誤操作，OpenAI 主動把 capability overhang 這個詞放進(jìn)路線圖，傳遞的信號已經(jīng)寫得很清楚——我們手里還多得很，你們看著辦。

你手里有遠(yuǎn)多于賣給用戶的東西，你才有的擠。GPT-5.5 的 24 小時，把這個前提再一次變成了現(xiàn)場直播。

Deepseek 的耐心等待

DeepSeek 這一邊，“擠”的方式徹底變了——它不是在藏能力，而是在等一個更合適的交付時機(jī)。

1.6T MoE、1M 上下文、Pro/Flash 雙規(guī)格，定價 3.48 per 1M tokens——是 GPT-5.5 的幾十分之一，是 Opus 4.7 的量級差。海外獨(dú)立評測者給出的結(jié)論是兩句話：性能貼近但略低于 GPT-5.4 / Gemini 3.1-Pro，價格“把前沿實驗室的經(jīng)濟(jì)學(xué)打穿了”。

但放在 DeepSeek 自己的坐標(biāo)系里，V4 Preview 已經(jīng)比 V3 那種“便宜到詭異”的價格貴了不止一點(diǎn)。所有人都知道——這不是滿血版。

DeepSeek V4 的完整故事，不以發(fā)布為終點(diǎn)，更不以發(fā)布為起點(diǎn)。

要從 2025 年 R2 那次沒發(fā)出來的發(fā)布講起。R2 原定于 2025 年 5 月發(fā)布，但最終被延后到秋冬。整個中國Deepseek 的基礎(chǔ)設(shè)施遷向華為的 CANN 生態(tài)。對于任何一個實驗室實驗室，這都不可能是一個季度能完成的工程——編譯器、算子、通信庫、推理框架、MoE 路由，全部要重寫。

而 V4 這一次，是 DeepSeek 第一次把昇騰正式寫進(jìn)訓(xùn)練硬件清單。V4 是混合訓(xùn)練的第一個版本——昇騰首次入場。

但專門為大規(guī)模訓(xùn)練優(yōu)化的下一代芯片昇騰 950DT，按華為路線圖要 2026 年 Q4 才量產(chǎn)。也就是說，V4 訓(xùn)練能跑起來，是用上一代的 950PR 拼出來的；要讓 V4 Pro Max 這種 1.6T MoE 的滿血版本既能訓(xùn)得徹底又能大規(guī)模推得起來，還要等下一代到位。

真正的工程難點(diǎn)不是“V4 能不能訓(xùn)出來”——已經(jīng)訓(xùn)出來了——而是“V4怎樣在昇騰上跑得滿、跑得穩(wěn)、跑得便宜”。

昇騰 950PR 在 2026 年 Q1 量產(chǎn)，F(xiàn)P4 算力 1.56 PFLOPS、片上內(nèi)存 112GB，紙面規(guī)格對標(biāo)并超過英偉達(dá) H20。但從一顆芯片跑得起，到一整片超節(jié)點(diǎn)能穩(wěn)定服務(wù)數(shù)百萬 token/秒的推理請求，是兩回事。V4 Pro Max 的滿血版，鎖的就是這個“超節(jié)點(diǎn)”——昇騰 950 系列的大規(guī)模集群版本，2026 年下半年陸續(xù)到位。

這構(gòu)成了一個和前兩家完全不同的策略。Anthropic 和 OpenAI 擠牙膏的邏輯，是我手里有更強(qiáng)的，先不給你；DeepSeek 擠牙膏的邏輯，是我滿血的那一版，要等一個讓價格再下一個臺階的時刻。

這個差別很重要。

DeepSeek 真正的殺手锏從來不是“性能最前沿”，而是“在性能夠用的前提下，把 token 價格砍到別人不敢砍的位置”。V4 Preview 在英偉達(dá)卡和昇騰 950PR 上做了適配，但要做到量產(chǎn)規(guī)模的滿血推理，必須等超節(jié)點(diǎn)到位。一旦等到那一刻，兩件事會同時發(fā)生：一是 V4 Pro Max 的能力可以釋放到頂；二是推理成本、API 定價會再落一階——對一家靠價格打穿市場的公司，后者比前者更致命。

人們真正期待的、在 2025 年初發(fā)生過的那個“DeepSeek 時刻”，沒有在這次發(fā)布里再次上演。而 V4 Preview 的發(fā)布其實是一段預(yù)告片，真正的重頭戲，是下半年的“DeepSeek + 華為昇騰”時刻。

從這個角度看，梁文鋒團(tuán)隊現(xiàn)在做的不是被迫的“藏”，而是一次商業(yè)上克制的“選擇”——選擇把最強(qiáng)版本的首發(fā)，交到一個它最有話語權(quán)的場景里：國產(chǎn)超節(jié)點(diǎn)大規(guī)模部署后的第一天。在那之前，先用 V4 Preview 把性價比的敘事再鞏固一輪。

DeepSeek 背負(fù)的從來不是讓國產(chǎn)大模型在某個榜單上拔到第一的“長板敘事”，而是讓芯片、訓(xùn)練、推理、定價四條線同時跑通的“系統(tǒng)性敘事”——后者比前者重要得多。

就在前幾天，黃仁勛在 Dwarkesh Patel 的播客上說，如果 DeepSeek 在華為芯片上首發(fā)，“那對我們美國來說是個可怕的結(jié)果”（“a horrible outcome for our nation”）。

現(xiàn)在英偉達(dá)還把控著頂尖算力。但按照黃仁勛自己拋出的那塊“AI 五層蛋糕”——能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用——國產(chǎn)大模型產(chǎn)業(yè)在每一層都已經(jīng)有了能跑通的國產(chǎn)方案，差距正在以肉眼可見的速度縮小。補(bǔ)上芯片這塊最后的拼圖，DeepSeek 的開源大模型故事，才是一個比美國大模型更大的故事：這是一場不用消耗過多成本、讓全球?qū)崿F(xiàn)智能平權(quán)的重要一步。

讓全世界都可以繞過某些被霸權(quán)掌控的先進(jìn)算力，走入高效的智能社會。

尾聲

Anthropic 的“藏”——是主動的。他們有 Mythos，沒發(fā)，理由是 safety。

OpenAI 的“藏”——是結(jié)構(gòu)的。他們有 Pro 檔，不常給你，理由是 infrastructure 和價格分層。

DeepSeek 的“藏”——是必要的。它關(guān)乎一整套社會智能躍遷的敘事范本。

但從另一個側(cè)面來看，這又像極了大劉描繪的黑暗森林：在這片漆黑的智能森林里，每一個頂尖獵人都不會率先開出自己的那一槍。

暴露意味著毫無保留，意味著沒有底牌，會成為另一個獵人的活靶子。

沒人知道誰會率先打出最致命的一槍。

但可以確定的是，今天你用的每一個模型，都不是它真正的樣子。

本文來自公眾號：象先志作者：阿卡

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.