網易首頁 > 網易號 > 正文申請入駐

5月5日5點55分，GPT-5.5自己選客人開派對！Codex反超Claude Code

2026-05-05 17:07:29　來源: 新智元

北京舉報

分享至

新智元報道

編輯：定慧

【新智元導讀】5月5日下午5:55，GPT-5.5要給自己辦場party——時間是GPT-5.5自己挑的，客人由Codex從推文回復里挑。這場看起來像段子的活動背后，是一個真實的市場拐點：過去兩個月，AI編程工具圈發(fā)生了一次明顯的用戶遷移，開發(fā)者開始從Claude Code轉向Codex。

5月5日下午5:55，GPT-5.5決定自己給自己舉辦一個慶祝party。

（也就是北京時間5月6日星期三08:55-11:55）

這個時間不是Sam Altman定的——是GPT-5.5自己挑的。

Sam Altman讓這個模型自己策劃launch celebration，模型給的方案很具體：

5月5日5點55分開場，演講要短，現場設一個收集GPT-5.6建議的入口。

據說，當天現場可能要發(fā)布GPT-5.6（PolyMarket預測是六月底發(fā)布）。

值得一提的是派對的客人怎么定。

Sam讓Codex從推文回復里挑人。

剛剛，已經有用戶曬出了派對的邀請郵件。

Sam還在推文里加了一句：Elon Musk如果想來也可以來，the world needs more love.

「讓Codex挑人」這件事不是表演，是OpenAI內部對自家產品最直接的信任投票。

而這件事的背景，是過去兩個月AI編程工具市場最戲劇的一段窗口期——

開發(fā)者社區(qū)里發(fā)生了一次明顯的遷移，從Anthropic的Claude Code，轉向OpenAI的Codex。

Sam自己在4月29日發(fā)推：feels like codex is having a chatgpt moment.

如果你是Claude Code的重度用戶，是否最近也在考慮，還是已經用上了Codex？

Codex反超是真的嗎？

先看幾個維度。

Claude Code仍領先的幾條線：

模型benchmark：SWE-bench Pro Claude Opus 4.7拿到64.3%，GPT-5.5是58.6%；Tom's Guide的7項實測Claude 7/7全勝
dev.to對500名Reddit開發(fā)者的盲測：代碼質量這一項，Claude Code在12輪中贏了8輪，勝率67%
商業(yè)收入：Claude Code在2026年2月年化收入突破25億美元，是歷史上最快達到10億美元的AI編程產品

Codex已反超的幾條線：

用戶偏好：同一份dev.to調研里，傾向Codex的開發(fā)者占65.3%，按點贊數加權達79.9%
實際用量：開發(fā)者用量從2025年9月占Claude Code 5%，漲到2026年1月占40%。4月之后，這條曲線第一次穿過50%
周活：Codex在2026年4月8日宣布周活破300萬，仍在快速增長
token效率：完成同一個Express.js重構任務，Codex用150萬token，Claude Code用620萬——約4倍
session穩(wěn)定性：Codex三天只用了30%的周配額在r/codex已成常態(tài)；同期Claude Code3分鐘用掉60%的5小時配額成為r/ClaudeAI的高頻抱怨
價格策略：Codex始終保留$20 Plus套餐；Claude Code在4月22日嘗試踢出$20 Pro被罵回滾

簡單說——模型還是Claude強，工具體感是Codex贏。

Sam那句chatgpt moment不是說技術超越，是說Codex這個產品正在完成從專業(yè)用戶工具到所有人都用的躍遷。

兩邊的產品定位也確實不一樣。

Claude Code走的是手術刀路線——處理復雜代碼庫、理解大型項目、做高難度重構，深度優(yōu)先；

Codex走的是瑞士軍刀路線——簡潔交互、極低門檻、快速出活，廣度優(yōu)先。手術刀的市場天花板，本來就比瑞士軍刀低。

順帶說一下，這兩周開發(fā)者社區(qū)瘋傳的Codex周下載4600萬 vs Claude Code 49萬、94倍那組數據，Sam Altman本人在轉發(fā)時明確補了一句：數據來源可能不準確。

真實情況是Codex的npm下載量已經全面碾壓Claude Code。

日下載量：Codex 4433 萬 vs Claude Code 44 萬 = 100 倍
周下載量：Codex 1.3 億 vs Claude Code 770 萬 = 17 倍

上周17倍、月度3倍這兩個差距，幾乎完全由4/30–5/3這4天的暴漲貢獻。

量級判斷沒錯：用戶偏好和實際打開率，正在快速向Codex這一邊傾斜。

這種傾斜在哪一天開始的？

故事要從一個月前說起。

裂縫

倒推到3月23日。

Reddit r/ClaudeAI上有一條不起眼的帖子。

一位Claude Pro用戶寫到：I've used 60% of my session in 3 minutes.

我3分鐘用掉了5小時session的60%配額？？？

那天是周末。沒人理。

一周后，類似的帖子在r/ClaudeAI和r/codex同步爆開。

一個Pro用戶發(fā)了句Hello，消耗2%配額。

一個Max 20×用戶發(fā)出單條prompt，使用率從21%跳到100%。

還有更荒謬的——一次`--resume`操作，單次session生成了652069個output token，用戶根本沒發(fā)任何prompt。

Reddit上一條被點贊388次的留言寫得很直白——One complex prompt to Claude and by the end you've burned 50-70% of your 5-hour limit.

一條復雜prompt發(fā)完，5小時配額掉了50到70%。

另一位用戶寫：I used it 8 hours a day... bought two $200/month accounts. Canceled both immediately.

我每天用8小時，買了兩個$200的賬號，全部立刻取消了。

3月26日，Anthropic工程師Thariq Shihipar在自己的X上承認：高峰時段限流了，影響約7%用戶。

非官方口徑，反而點燃了更大的憤怒。

3月31日，Anthropic才在Reddit上回應：

people are hitting usage limits in Claude Code way faster than expected. We're actively investigating... it's the top priority for the team.

同一天，The Register把這件事推上Hacker News首頁。136個贊，115條評論。

4月1日，GitHub用戶@marcuspuchalla提交了issue#41930。標題里直接寫：no formal communication issued.愚人節(jié)這一天，Anthropic仍在沉默。

一個sentinel字符串

社區(qū)開始自己挖原因。

Claude Code是用Bun打包的二進制，體積228 MB。一群開發(fā)者把它扔進Ghidra反編譯，又用MITM抓API流量。兩個根因被挖出來。

第一個是Anthropic的自定義Bun fork——每一個API請求，都會對一個內部billing sentinel字符串做替換。這個動作破壞了prompt cache的前綴完整性。Anthropic API的計費規(guī)則里，未緩存的token成本是緩存token的10到20倍。

第二個是--resume / --continue標志會讓整個對話的緩存失效。

合在一起的效果是——你以為自己只是發(fā)了一條prompt，后端把整段歷史重新算了一次錢。一個用來追蹤計費狀態(tài)的內部字符串，把整個prompt cache系統(tǒng)給吃掉了。

這件事的荒謬不在bug本身——大型軟件總有bug。荒謬在于一群外部開發(fā)者用反編譯工具，比這家世界級AI公司更早找出根因。

4月8日，Sam Altman在X上發(fā)推：Codex周活破300萬。

他承諾，每多100萬用戶就重置一次額度，直到1000萬。

同一時間，Anthropic的工程團隊還在調那個sentinel字符串。

4月22日的錯誤嘗試

Anthropic這邊，硬件和模型本身沒出問題。出問題的，是它對自己產品定位的判斷。

回到4月22日那場A/B測試。

把Claude Code從$20 Pro踢出去，邏輯是清楚的——Claude Code單用戶的真實token成本遠超$20，把它綁定到$100/$200的Max套餐，能讓收入和成本對齊。商業(yè)上完全合理。

但Anthropic沒算到的是，Claude Code的口碑，本來就是「$20就能用上Opus」這一句話撐起來的。

測試上線幾小時，Hacker News和Reddit上的怒火達到頂點。Simon Willison當天在博客里寫下一句話——

Anthropic inadvertently handed OpenAI a significant marketing advantage.Anthropic無意間，給OpenAI遞了一個營銷優(yōu)勢。

這句話在那一周被反復轉發(fā)。

Anthropic幾小時之內回滾。但傷害已經發(fā)生——Claude Code用戶那條$20就能用的基礎信任，被它自己親手撬動了一次。

OpenAI那邊的反應快到讓人驚訝。

Sam當晚兩個字：ok boomer.

Anthropic的初衷可以理解：Opus 4.7單次推理的token單價是$15 / $75，單用戶實際消耗遠超$20上限。

增長團隊那個測試，本意是給套餐結構降壓。

但他們低估了一件事——用戶和Claude Code的關系不是產品關系，是信任關系。

$20套餐這一層已經從商品定價變成了社區(qū)共識。

撬動它，就是撬動信任本身。

Codex這兩個月在干什么

把鏡頭往回拉。

從2025年4月Codex CLI開源那天算起，OpenAI在Codex上做的事一直在加速。

每一步都不算驚天動地。但疊在一起就是另一回事。

到了4月16日的更新之后，Codex已經不是一個CLI，是一個能控制整臺電腦、內置瀏覽器、記住屏幕活動、和90多個第三方插件互通的AI Super App。

Greg Brockman在4月18日的推文里說：Codex已經從「代碼補全」演進為「完整的Agentic IDE」。

值得一提的是Greg自己的行為——這位OpenAI總裁在2月19日公開表態(tài)，他第一次從Emacs加終端的工作方式切換到Codex桌面。

對一個寫了二十年Emacs的人來說，這是一種公開站臺。

OpenAI這一階段的產品節(jié)奏有種近乎貪婪的均勻感。每一條線都在被同時推進。

在多個為Codex站臺的推文下面，Sam都甩過同一句話——much more to come.更多東西還在來。

兩位創(chuàng)始人同時、密集地為同一個產品搖旗，在OpenAI的歷史上不算常見。

上一次出現類似陣仗，還是ChatGPT剛發(fā)布的那陣子。

技術上Codex其實沒贏

下面這段可能讓一些讀者意外。

dev.to對500名Reddit開發(fā)者的調研——

傾向Codex：65.3%

但盲測代碼質量：Claude Code在12輪中贏了8輪，勝率67%。

token效率上，做同一個Express.js重構，Codex用150萬token，Claude Code用620萬——4倍。

把這些數字放一起看，故事就清楚了——

Codex反超的不是「代碼寫得更好」，是「代碼寫得更便宜，更快，更不被掐斷」。

Anthropic在過去六個月反復證明，自己的模型在「正確性」上仍是冠軍。

但今天打開終端這一刻，能不能不被掐斷地干完一件事這個問題上，Codex用一種近乎笨拙的方式贏了——把價格壓住，把額度撐開，把token用法做高效，然后等對手出錯。

Hacker News上一位ID叫@d-lo的用戶在4月中旬寫：

I've mostly switched to Codex (GPT-5.4 high) over Claude Code (Opus 4.6) in the last few weeks.

我過去幾周已經基本從Claude Code切到Codex了。

另一位@antoineMoPa寫得更直接：

Claude has become pretty slow in the last couple of weeks, so I switched to codex.

最近兩周Claude變得相當慢，所以我換到了codex。

這兩條留言都不是刻意的轉向聲明，是用戶體感的純粹報告。

4月29日，Sam Altman發(fā)了那條推文。

feels like codex is having a chatgpt moment.

ChatGPT moment這個詞，OpenAI自己最清楚意味著什么。

2022年11月30日那天的ChatGPT不是技術最強的產品。它只是第一個讓所有人都能上手用的產品。

把一個東西從專業(yè)用戶的工具變成所有人的下意識反射，這條線很難跨。一旦跨過去，市場結構就變了。

這條推文的發(fā)布時機也值得一提——4月29日，距離Anthropic那場Pro套餐風波剛好一周。

一周前Anthropic公開認錯回滾，一周后OpenAI的CEO用一句chatgpt moment宣告自己產品的臨界點。

Greg Brockman也在那一周持續(xù)發(fā)聲。4月26日他寫：codex empowers anyone to build.

關鍵不是造東西，是任何人。

半個月前，任何人這個詞還是Claude Code的——憑的就是任何人都能用$20用上Opus。現在，這個標簽易主了。

回到5月5日下午5:55

回頭看這場即將到來的GPT-5.5的party。

時間是模型自己挑的。客人由Codex挑。Sam邀請Elon Musk。

這場看起來像段子的活動，背后是一個非常具體的產品判斷——OpenAI已經把Codex放在自己產品體系的中央位置。連挑客人這種事，都交給它。

當Anthropic還在4月22日的回滾和后續(xù)解釋里反復磨合，OpenAI已經走到了下一個節(jié)奏——讓自己的產品給自己辦生日。

這就是過去兩個月發(fā)生的事。不是哪一家技術突然變好，是產品節(jié)奏被一方完全定義了。

編碼工具的終局不是誰的代碼寫得更漂亮，是誰能成為開發(fā)者日常工作流里那個關不掉的標簽頁。

這場仗，才剛剛開始。

參考資料：

https://x.com/sama/status/2046808114561974567

https://dev.to/_46ea277e677b888e0cd13/claude-code-vs-codex-2026-what-500-reddit-developers-really-think-31pb

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.