![]()
新智元報道
編輯:定慧
【新智元導讀】5月5日下午5:55,GPT-5.5要給自己辦場party——時間是GPT-5.5自己挑的,客人由Codex從推文回復里挑。這場看起來像段子的活動背后,是一個真實的市場拐點:過去兩個月,AI編程工具圈發(fā)生了一次明顯的用戶遷移,開發(fā)者開始從Claude Code轉向Codex。
5月5日下午5:55,GPT-5.5決定自己給自己舉辦一個慶祝party。
(也就是北京時間5月6日星期三08:55-11:55)
![]()
這個時間不是Sam Altman定的——是GPT-5.5自己挑的。
![]()
Sam Altman讓這個模型自己策劃launch celebration,模型給的方案很具體:
5月5日5點55分開場,演講要短,現場設一個收集GPT-5.6建議的入口。
![]()
據說,當天現場可能要發(fā)布GPT-5.6(PolyMarket預測是六月底發(fā)布)。
![]()
值得一提的是派對的客人怎么定。
Sam讓Codex從推文回復里挑人。
剛剛,已經有用戶曬出了派對的邀請郵件。
![]()
Sam還在推文里加了一句:Elon Musk如果想來也可以來,the world needs more love.
![]()
「讓Codex挑人」這件事不是表演,是OpenAI內部對自家產品最直接的信任投票。
![]()
而這件事的背景,是過去兩個月AI編程工具市場最戲劇的一段窗口期——
開發(fā)者社區(qū)里發(fā)生了一次明顯的遷移,從Anthropic的Claude Code,轉向OpenAI的Codex。
Sam自己在4月29日發(fā)推:feels like codex is having a chatgpt moment.
![]()
如果你是Claude Code的重度用戶,是否最近也在考慮,還是已經用上了Codex?
Codex反超是真的嗎?
先看幾個維度。
Claude Code仍領先的幾條線:
模型benchmark:SWE-bench Pro Claude Opus 4.7拿到64.3%,GPT-5.5是58.6%;Tom's Guide的7項實測Claude 7/7全勝
dev.to對500名Reddit開發(fā)者的盲測:代碼質量這一項,Claude Code在12輪中贏了8輪,勝率67%
商業(yè)收入:Claude Code在2026年2月年化收入突破25億美元,是歷史上最快達到10億美元的AI編程產品
Codex已反超的幾條線:
用戶偏好:同一份dev.to調研里,傾向Codex的開發(fā)者占65.3%,按點贊數加權達79.9%
實際用量:開發(fā)者用量從2025年9月占Claude Code 5%,漲到2026年1月占40%。4月之后,這條曲線第一次穿過50%
周活:Codex在2026年4月8日宣布周活破300萬,仍在快速增長
token效率:完成同一個Express.js重構任務,Codex用150萬token,Claude Code用620萬——約4倍
session穩(wěn)定性:Codex三天只用了30%的周配額在r/codex已成常態(tài);同期Claude Code3分鐘用掉60%的5小時配額成為r/ClaudeAI的高頻抱怨
價格策略:Codex始終保留$20 Plus套餐;Claude Code在4月22日嘗試踢出$20 Pro被罵回滾
簡單說——模型還是Claude強,工具體感是Codex贏。
Sam那句chatgpt moment不是說技術超越,是說Codex這個產品正在完成從專業(yè)用戶工具到所有人都用的躍遷。
兩邊的產品定位也確實不一樣。
Claude Code走的是手術刀路線——處理復雜代碼庫、理解大型項目、做高難度重構,深度優(yōu)先;
Codex走的是瑞士軍刀路線——簡潔交互、極低門檻、快速出活,廣度優(yōu)先。手術刀的市場天花板,本來就比瑞士軍刀低。
順帶說一下,這兩周開發(fā)者社區(qū)瘋傳的Codex周下載4600萬 vs Claude Code 49萬、94倍那組數據,Sam Altman本人在轉發(fā)時明確補了一句:數據來源可能不準確。
真實情況是Codex的npm下載量已經全面碾壓Claude Code。
![]()
日下載量:Codex 4433 萬 vs Claude Code 44 萬 = 100 倍
周下載量:Codex 1.3 億 vs Claude Code 770 萬 = 17 倍
![]()
上周17倍、月度3倍這兩個差距,幾乎完全由4/30–5/3這4天的暴漲貢獻。
量級判斷沒錯:用戶偏好和實際打開率,正在快速向Codex這一邊傾斜。
這種傾斜在哪一天開始的?
故事要從一個月前說起。
裂縫
倒推到3月23日。
Reddit r/ClaudeAI上有一條不起眼的帖子。
一位Claude Pro用戶寫到:I've used 60% of my session in 3 minutes.
我3分鐘用掉了5小時session的60%配額???
![]()
那天是周末。沒人理。
一周后,類似的帖子在r/ClaudeAI和r/codex同步爆開。
一個Pro用戶發(fā)了句Hello,消耗2%配額。
一個Max 20×用戶發(fā)出單條prompt,使用率從21%跳到100%。
還有更荒謬的——一次`--resume`操作,單次session生成了652069個output token,用戶根本沒發(fā)任何prompt。
Reddit上一條被點贊388次的留言寫得很直白——One complex prompt to Claude and by the end you've burned 50-70% of your 5-hour limit.
![]()
一條復雜prompt發(fā)完,5小時配額掉了50到70%。
另一位用戶寫:I used it 8 hours a day... bought two $200/month accounts. Canceled both immediately.
我每天用8小時,買了兩個$200的賬號,全部立刻取消了。
3月26日,Anthropic工程師Thariq Shihipar在自己的X上承認:高峰時段限流了,影響約7%用戶。
非官方口徑,反而點燃了更大的憤怒。
3月31日,Anthropic才在Reddit上回應:
people are hitting usage limits in Claude Code way faster than expected. We're actively investigating... it's the top priority for the team.
同一天,The Register把這件事推上Hacker News首頁。136個贊,115條評論。
4月1日,GitHub用戶@marcuspuchalla提交了issue#41930。標題里直接寫:no formal communication issued.愚人節(jié)這一天,Anthropic仍在沉默。
一個sentinel字符串
社區(qū)開始自己挖原因。
Claude Code是用Bun打包的二進制,體積228 MB。一群開發(fā)者把它扔進Ghidra反編譯,又用MITM抓API流量。兩個根因被挖出來。
第一個是Anthropic的自定義Bun fork——每一個API請求,都會對一個內部billing sentinel字符串做替換。這個動作破壞了prompt cache的前綴完整性。Anthropic API的計費規(guī)則里,未緩存的token成本是緩存token的10到20倍。
第二個是--resume / --continue標志會讓整個對話的緩存失效。
合在一起的效果是——你以為自己只是發(fā)了一條prompt,后端把整段歷史重新算了一次錢。一個用來追蹤計費狀態(tài)的內部字符串,把整個prompt cache系統(tǒng)給吃掉了。
這件事的荒謬不在bug本身——大型軟件總有bug。荒謬在于一群外部開發(fā)者用反編譯工具,比這家世界級AI公司更早找出根因。
4月8日,Sam Altman在X上發(fā)推:Codex周活破300萬。
他承諾,每多100萬用戶就重置一次額度,直到1000萬。
同一時間,Anthropic的工程團隊還在調那個sentinel字符串。
4月22日的錯誤嘗試
Anthropic這邊,硬件和模型本身沒出問題。出問題的,是它對自己產品定位的判斷。
回到4月22日那場A/B測試。
把Claude Code從$20 Pro踢出去,邏輯是清楚的——Claude Code單用戶的真實token成本遠超$20,把它綁定到$100/$200的Max套餐,能讓收入和成本對齊。商業(yè)上完全合理。
![]()
但Anthropic沒算到的是,Claude Code的口碑,本來就是「$20就能用上Opus」這一句話撐起來的。
測試上線幾小時,Hacker News和Reddit上的怒火達到頂點。Simon Willison當天在博客里寫下一句話——
Anthropic inadvertently handed OpenAI a significant marketing advantage.Anthropic無意間,給OpenAI遞了一個營銷優(yōu)勢。
這句話在那一周被反復轉發(fā)。
Anthropic幾小時之內回滾。但傷害已經發(fā)生——Claude Code用戶那條$20就能用的基礎信任,被它自己親手撬動了一次。
OpenAI那邊的反應快到讓人驚訝。
Sam當晚兩個字:ok boomer.
![]()
Anthropic的初衷可以理解:Opus 4.7單次推理的token單價是$15 / $75,單用戶實際消耗遠超$20上限。
增長團隊那個測試,本意是給套餐結構降壓。
但他們低估了一件事——用戶和Claude Code的關系不是產品關系,是信任關系。
$20套餐這一層已經從商品定價變成了社區(qū)共識。
撬動它,就是撬動信任本身。
Codex這兩個月在干什么
把鏡頭往回拉。
從2025年4月Codex CLI開源那天算起,OpenAI在Codex上做的事一直在加速。
每一步都不算驚天動地。但疊在一起就是另一回事。
到了4月16日的更新之后,Codex已經不是一個CLI,是一個能控制整臺電腦、內置瀏覽器、記住屏幕活動、和90多個第三方插件互通的AI Super App。
![]()
Greg Brockman在4月18日的推文里說:Codex已經從「代碼補全」演進為「完整的Agentic IDE」。
值得一提的是Greg自己的行為——這位OpenAI總裁在2月19日公開表態(tài),他第一次從Emacs加終端的工作方式切換到Codex桌面。
對一個寫了二十年Emacs的人來說,這是一種公開站臺。
OpenAI這一階段的產品節(jié)奏有種近乎貪婪的均勻感。每一條線都在被同時推進。
在多個為Codex站臺的推文下面,Sam都甩過同一句話——much more to come.更多東西還在來。
兩位創(chuàng)始人同時、密集地為同一個產品搖旗,在OpenAI的歷史上不算常見。
上一次出現類似陣仗,還是ChatGPT剛發(fā)布的那陣子。
技術上Codex其實沒贏
下面這段可能讓一些讀者意外。
dev.to對500名Reddit開發(fā)者的調研——
傾向Codex:65.3%
但盲測代碼質量:Claude Code在12輪中贏了8輪,勝率67%。
![]()
token效率上,做同一個Express.js重構,Codex用150萬token,Claude Code用620萬——4倍。
把這些數字放一起看,故事就清楚了——
Codex反超的不是「代碼寫得更好」,是「代碼寫得更便宜,更快,更不被掐斷」。
Anthropic在過去六個月反復證明,自己的模型在「正確性」上仍是冠軍。
但今天打開終端這一刻,能不能不被掐斷地干完一件事這個問題上,Codex用一種近乎笨拙的方式贏了——把價格壓住,把額度撐開,把token用法做高效,然后等對手出錯。
Hacker News上一位ID叫@d-lo的用戶在4月中旬寫:
I've mostly switched to Codex (GPT-5.4 high) over Claude Code (Opus 4.6) in the last few weeks.
我過去幾周已經基本從Claude Code切到Codex了。
另一位@antoineMoPa寫得更直接:
Claude has become pretty slow in the last couple of weeks, so I switched to codex.
最近兩周Claude變得相當慢,所以我換到了codex。
這兩條留言都不是刻意的轉向聲明,是用戶體感的純粹報告。
4月29日,Sam Altman發(fā)了那條推文。
feels like codex is having a chatgpt moment.
ChatGPT moment這個詞,OpenAI自己最清楚意味著什么。
2022年11月30日那天的ChatGPT不是技術最強的產品。它只是第一個讓所有人都能上手用的產品。
把一個東西從專業(yè)用戶的工具變成所有人的下意識反射,這條線很難跨。一旦跨過去,市場結構就變了。
這條推文的發(fā)布時機也值得一提——4月29日,距離Anthropic那場Pro套餐風波剛好一周。
一周前Anthropic公開認錯回滾,一周后OpenAI的CEO用一句chatgpt moment宣告自己產品的臨界點。
Greg Brockman也在那一周持續(xù)發(fā)聲。4月26日他寫:codex empowers anyone to build.
關鍵不是造東西,是任何人。
半個月前,任何人這個詞還是Claude Code的——憑的就是任何人都能用$20用上Opus。現在,這個標簽易主了。
回到5月5日下午5:55
回頭看這場即將到來的GPT-5.5的party。
時間是模型自己挑的。客人由Codex挑。Sam邀請Elon Musk。
這場看起來像段子的活動,背后是一個非常具體的產品判斷——OpenAI已經把Codex放在自己產品體系的中央位置。連挑客人這種事,都交給它。
當Anthropic還在4月22日的回滾和后續(xù)解釋里反復磨合,OpenAI已經走到了下一個節(jié)奏——讓自己的產品給自己辦生日。
這就是過去兩個月發(fā)生的事。不是哪一家技術突然變好,是產品節(jié)奏被一方完全定義了。
編碼工具的終局不是誰的代碼寫得更漂亮,是誰能成為開發(fā)者日常工作流里那個關不掉的標簽頁。
這場仗,才剛剛開始。
參考資料:
https://x.com/sama/status/2046808114561974567
https://dev.to/_46ea277e677b888e0cd13/claude-code-vs-codex-2026-what-500-reddit-developers-really-think-31pb
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.