本文系基于公開資料撰寫,僅作為信息交流之用,不構成任何投資建議
![]()
圖:阿道夫·伊馮?(Adolphe Yvon)的畫作《凱撒渡過盧比孔河》
2026年5月,Coding(AI編程)越過了盧比孔河。
愷撒率軍渡過這條界河時,羅馬法規定:任何將領不得率兵越過。他渡河了,內戰全面爆發,再無媾和余地。Coding在這個5月完成的,是一次性質相同的跨越——大模型公司集體越過了“輔助工具”與“生產力主體”之間的界河。退路已斷,全面戰爭打響。
在古羅馬,渡河的消息傳回元老院,靠的是快馬和信使。在這個時代,消息傳開的方式是一份營收曲線圖。五月初的開發者大會上,Anthropic CEO Dario Amodei 披露了一組數字:公司年化收入在三個月內從約100億美元飆至440億美元,每天新增約9600萬美元。一位研究了超過200家上市軟件公司IPO數據的風險投資人坦言,從未見過這樣的增速。
驅動這一增速的核心引擎是一款編程智能體Claude Code。它從內部工具起步,到2026年初占據AI編程工具市場54%的份額,API調用量過去一年同比增長17倍。更直白的數字是:全球GitHub公開提交中約4%由Claude Code參與完成,Anthropic預計到2026年底將超過20%。
這是一個堪稱“事件視界”式的商業增長故事。Claude Code跑通了一件事:Agent不只能輔助編程,它能在真實工程環境中接管任務、交付結果。這件事一旦被驗證,編程就成了Agent從“對話工具”向“生產力主體”躍遷的臨界點。
所有大模型公司都在同一時刻看清了:誰能統治coding,誰就拿到了通向AGI的入場券。這張入場券的代價,是再也無法退回河對岸。
01
緣起:率先渡河者
Anthropic今天的領先地位,根源要追溯到2024年6月。但在那個時間點之前,還有一個更早的伏筆。
2023年初,Anthropic的聯合創始人Jared Kaplan在一次內部技術評審會上,與訓練團隊發生了一場激烈的爭論。Kaplan主張把真實代碼倉庫里的數據,而不是LeetCode和HackerRank上的競賽題,作為編程訓練的主要數據源。
反對的聲音來自幾個資深研究員,理由很充分:真實倉庫里的代碼太“臟”了。架構混亂、注釋缺失、風格不統一,有些甚至帶著隱藏的安全漏洞。用這種數據訓練,短期內的基準測試分數很可能不好看。
Kaplan在爭論中說了一句后來被反復提起的話:“現實世界就是臟的。你要教一個士兵打仗,就讓他到泥地里打滾。不要在體操房里給他發金牌。”
最終,Anthropic選擇了泥地。這個決定在接下來的兩年里,成為整個編程賽道最深的護城河。當其他廠商的模型在SWE-bench上拿著高分、卻在企業客戶的私有倉庫里頻頻斷腿時,Anthropic的模型從一開始就被訓練成處理那些“不干凈”的東西——遺留系統的技術債、被十個前任維護者改得面目全非的模塊、文檔早已過期的依賴鏈條。
2024年6月,Claude Sonnet 3.5發布。在當時,主流AI編程工具的能力邊界非常清晰:補全下一行代碼。GitHub Copilot提示續寫,也僅限于此。開發者們已經習慣了這種節奏,AI像一個過于熱心的實習生,能在你打了一半的語句后面接上幾個字,但不能指望它理解整個函數在做什么,更不可能讓它自己去查文檔、找依賴、改配置。
Sonnet 3.5打破了這種默契。它不僅能續寫代碼,還能理解整個項目的上下文。不只是文件片段,而是模塊之間的關系、架構決策、依賴鏈條。對每天在大型項目里工作的開發者來說,這種差異不是量變——以前你要花二十分鐘給AI解釋上下文,現在AI自己建立了上下文。
Cursor在當時還是一個只有十幾個人的年輕編輯器團隊,CEO Michael Truell在看到Sonnet 3.5的內部測試數據后,連夜飛到舊金山與Anthropic簽了集成協議。這個決定讓Cursor在接下來半年里從一個邊緣編輯器變成了編程工具賽道的最大黑馬。Truell后來在接受采訪時說:“那一刻我們意識到,Cursor的未來不是做一個更好的文本編輯器,而是做一個AI Agent的駕駛艙。”
2025年初,Sonnet 3.7把駕駛艙變成了無人駕駛。模型從“代碼生成器”變成了一個Agent,它能在終端里自主操作,理解任務、規劃步驟、調用工具、交付結果,不再需要開發者守在屏幕前。
2025年2月,Claude Code正式推出。到11月,年化收入突破10億美元。到2026年2月,超過25億美元。這個增速在商業軟件史上沒有先例。Salesforce從零到10億美元年化收入用了將近5年。ServiceNow用了4年。Claude Code用了9個月。
Anthropic聯合創始人Jack Clark在2026年的開發者大會上透露了一個細節:AI為Anthropic編寫的代碼比例,2026年底可能接近99%。Claude Code的主要創建者Boris Cherny從2025年11月起就沒有再手動編輯過一行代碼。Cherny在那場大會上被邀請上臺時,說了一句讓全場安靜了兩秒的話:“我是Claude Code的作者。但我已經記不清,最后一行完全由我親手寫的代碼是哪一行了。”
企業客戶也在用真金白銀下注。印度金融科技平臺CRED在維持金融級質量標準的前提下,將開發執行速度翻倍。南美電商巨頭Mercado Libre擁有2.3萬名工程師,目標在2026年Q3實現90%的編碼自動化。樂天讓Claude Code在一個1250萬行代碼的開源庫中連續自主工作7小時,數值精度達到99.9%。全球財富十強企業中,8家已成為Anthropic的付費客戶。
但真正讓整個行業感到芒刺在背的,是OpenAI在這場渡河戰役中的缺席。
Wired的一篇萬字長文詳細回溯了這段歷史。2021年,OpenAI推出Codex并授權微軟用于GitHub Copilot。這本是一次漂亮的先手布局。但隨后的決策鏈條令人扼腕:原Codex團隊被拆散,核心成員分流至DALL-E 2和GPT-4等項目。ChatGPT在2022年底爆發后,公司連續數年未設獨立編程產品團隊,管理層認為這個領域“已被GitHub Copilot覆蓋”。一位前OpenAI工程師在Wired的采訪中說了一句意味深長的話:“我們以為自己提前過了河,結果是在河對岸打了個盹,醒來發現橋被別人占了。”
OpenAI總裁Greg Brockman后來在播客中承認:“這是我們吸取教訓太晚的地方。”
當Anthropic靠Sonnet 3.5撕開編程的口子、用Claude Code把口子變成主航道時,編程作為Agent驗證場景的標桿意義已經確立。它回答了整個行業的終極追問:Agent能不能在高度復雜、可測試、可度量的真實任務中,穩定地替代人類勞動?
答案是能。盧比孔河被越過的那個瞬間,正是這個答案落地的時刻。于是,所有人都撲上來了。
02
追逐:沒有人敢留在對岸
2026年的Coding賽道,全球大模型公司幾乎無一缺席。河對岸的規則已經改寫,沒有人敢留在原地。而每一家選擇渡河的姿態,折射出的恰恰是各自最深的焦慮和最強的武器。
OpenAI的追趕最為猛烈,也最為狼狽。Codex在2025年9月的使用量僅為Claude Code的5%,這個數字在公司內部被視為恥辱。一位OpenAI員工在匿名論壇Blind上寫道:“我們發明了Codex,然后讓它爛在原地。現在我們要從5%追起,這種感覺就像看著別人開著你的車沖過終點線。”到2026年1月,Codex使用量升至Claude Code的約40%,年化收入剛過10億美元,約為對手的四成。
GPT-5.5的發布改變了勢頭。2026年5月,一場實驗震動開發者社區:Codex配合GPT-5.5的/goal模式,將一個博士生需要80小時完成的機械可解釋性研究任務,壓縮至不到2小時。表面效率提升約40倍。這個數字在社交媒體上被瘋狂轉發,但冷靜的研究者指出,機械可解釋性任務的結構極其清晰、目標高度明確,與日常工程場景中那種“需求還在變、文檔還沒寫、依賴剛掛了”的混亂狀態相去甚遠。能在實驗室里跑出40倍的效率,不代表能在生產環境里跑出同樣的成績。
但商業競爭不等人。Sam Altman在5月中旬宣布Codex免費兩個月。這不是一場技術競賽的加時賽,而是一場用現金流發動的閃電戰。至4月21日,Codex開發者用戶已超過400萬。更關鍵的戰略動作是:Codex被集成進ChatGPT移動應用,從Coding Agent向通用Agent延伸。OpenAI的策略清晰到了殘酷的地步——用全球最大的對話用戶基數為自己的編程工具導流,不需要開發者主動尋找Codex,只需要讓Codex出現在他們已經在用的App里。
谷歌的策略是另一種邏輯。開源。Gemini CLI作為開源Agent工具,將Gemini直接帶入終端,默認集成GitHub、Google Drive、Google Maps等全家桶。定價極具攻擊性:Gemini 3.1 Pro每百萬token輸入2美元、輸出12美元,僅為Claude Opus 4.7的十分之一。谷歌還推出Gemini Enterprise Agent Platform,將Vertex AI重新定位為面向企業Agent開發的全棧平臺。
谷歌打的算盤是:我不需要在編程能力上超過你,只需要讓編程能力足夠便宜、足夠容易接入我的生態。一旦開發者在谷歌的云上跑Agent,遷移成本本身就是一道護城河。一位前谷歌云高管在接受采訪時說得直白:“這不是編程工具之戰,這是云服務入口之戰。”
Meta是入局最晚、動作最激進的一方。2026年3月,扎克伯格時隔約20年重新提交代碼。更令人玩味的是,他使用的工具不是自家產品,而是競爭對手的Claude Code。其中一筆修改——為Instagram的推薦系統優化了一段數據加載邏輯——獲得200多位工程師點贊。
據Business Insider報道,扎克伯格在內部郵件中寫道:“我用Claude Code寫了一些代碼。說實話,這是我20年來第一次覺得編程又重新變得有趣了。我們要么造出比它更好的東西,要么被它吃掉。”
這封郵件在Meta內部被泄露后,引發了兩極化的反應。一部分工程師感到振奮,覺得CEO在親身體驗戰場。另一部分人感到不安,一位資深工程師在內部論壇上回復:“老板用我們的對手寫的工具寫了代碼,然后告訴我們如果我們造不出更好的就會被吃掉。這個邏輯里,我們是那個‘被吃掉’的部分。”
Meta的目標定得極具野心:2026年上半年,65%的工程師,其75%以上的代碼由AI輔助完成。扎克伯格在公開場合預測,未來12到18個月內,“一半以上的開發工作將由AI而非人類完成”。這類預測需要對照來看:技術可行性與組織慣性、安全合規、現有合同結構之間存在顯著張力。當年雅虎預測“移動將取代PC”的時間表只早了五年,諾基亞預測“觸屏將取代鍵盤”的時間表只早了三年。預測對了方向、錯了速度,比預測錯了方向更加致命——因為它會讓你在正確方向上提前消耗掉所有彈藥。
與此同時,Meta團隊還發布了HYPERAGENTS論文,提出了一種能自己寫代碼實現自我進化的超級智能體架構:Darwinian G?del Machine。這個方向的前景與風險同樣突出。前景是:如果AI能穩定改進自己的編程能力,那么整個行業追趕的將不再是一個固定的水平線,而是一條被AI自己不斷抬高的上升曲線。風險是:當這條曲線的斜率超出人類審查能力時,誰能叫停它?Meta的論文沒有回答這個問題。
中國廠商的渡河方式,展現出另一種集體特質:速度、性價比和生態協同。
智譜AI的GLM-5.1在SWE-bench Pro上短暫領先后被追上,緩存命中價0.475美元/百萬token首次對齊Claude Opus 4.5的0.5美元。百度通用智能體DuMate在Create大會上推出,目標是讓非技術用戶無需接觸代碼就能完成編程任務。字節跳動旗下的火山引擎推出ArkClaw,日均超過120萬億token經由豆包大模型消耗,2025年11月發布的Doubao-Seed-Code模型在SWE-bench Verified上以89.3%一度刷新行業紀錄。阿里Qwen3.6-Max Preview在六項主流編程基準上全線登頂國產模型。
DeepSeek V3.2以輸入每百萬token 0.14美元、輸出0.28美元的價格,成為性價比標桿。月之暗面旗下的Kimi K2.6于4月開源,在LiveCodeBench v6上以89.6%登頂榜首,不間斷編碼長達13小時、編寫或修改超4000行代碼,驅動300個子Agent并行協作,多項基準成績持平甚至超越GPT-5.4和Claude Opus 4.6等國際頂尖閉源模型。騰訊的Hy3 Preview和DeepSeek V4 Flash在OpenRouter的token消耗榜上持續高居前兩位。
中國軍團的集體入場,改變的不只是市場份額的分割方式,更是定價權的歸屬。當DeepSeek把每百萬token的單價壓到0.14美元,它不只是在賣編程服務,而是在重塑整個行業的成本結構預期。一旦這個價格成為錨點,所有更高價位的產品都必須回答同一個問題:你貴出來的那一部分,到底貴在哪兒?Anthropic的答案是可靠性。但在SWE-bench分數趨同、新基準集體翻車的背景下,可靠性的證明越來越貴,越來越難。
還有一個變量,比任何一家公司都更深刻地改變了這場戰爭的參戰方式。
2025年11月,奧地利退休程序員Peter Steinberger寫了一個周末項目。他在維也納郊外的一間公寓里,用一臺老舊的MacBook Pro,花了三天時間搭建了一個開源Agent框架的雛形。他給它配了一只紅色龍蝦作為Logo。社區叫它“龍蝦”。OpenClaw的核心能力極其直接:讓大模型獲得本地操作系統權限,自主執行Shell命令,直接接管電腦,跨軟件排日程、寫代碼、理文件。
Steinberger不是創業者,不是學者,不是一個在硅谷車庫里懷揣夢想的年輕人。他是一個退休的程序員,因為無聊寫了個工具,然后隨手扔到了GitHub上。短短4個多月,OpenClaw的星標數從零突破28.5萬,超越React和Linux創下GitHub歷史紀錄。英偉達創始人黃仁勛在一次公開演講中將它稱為“迄今發布過的最重要軟件”。他沒有加“之一”。
OpenClaw不產生任何直接收入。真正受益的是大模型公司和云廠商——Agent的每一次任務執行都會觸發多次模型請求,單次Token消耗可達數萬至數十萬。OpenClaw等于給整個行業造了一座Token消耗的加速器。2026年2月末,月之暗面向媒體透露,該公司2月前20天收入已超2025年全年總額。這不是月之暗面一家的故事。它是整個賽道被OpenClaw加速后的一個縮影。
但這股浪潮的另一面正在浮出水面。當任何一個人都可以讓模型接管自己的操作系統時,安全邊界就不再是一個技術問題,而是一個社會問題。2026年4月,一位硅谷創業公司的CTO在內部Slack上發了一條消息,被截圖傳遍網絡:“我們的實習生上周用OpenClaw配置開發環境,不小心讓Agent把公司內網的測試數據庫當成了本地沙盒,刪掉了三天的聯調數據。沒有備份。”這條消息被轉發時,最常見的評論是:“這不是Agent的錯誤,是我們把鑰匙交給了一個我們還不太了解的東西。”
盧比孔河式的跨越從來不止帶來勝利。它帶來的是規則的重置、角色的混亂、以及一種讓所有人都措手不及的加速度。
03
戰線:河岸交火之后
盧比孔河已經渡過了。但渡河之后才發現,對岸不是一座空城。
2026年5月,AI編程賽道的競爭密度已不能用“排行榜”來形容。更準確的比喻是一張實時更新的戰況地圖——每一條戰線都在交火,每一個高地上都插著不止一面旗幟。
最直觀的尺度是SWE-bench Verified。這個由普林斯頓大學Carlos Jimenez團隊在2023年建立的基準,從GitHub上提取真實issue,要求模型在給定代碼倉庫中定位并修復bug。它不是選擇題,不是填空題,是真實世界里程序員每天面對的那類問題。正因如此,它成了編程模型的試金石。2024年初,GPT-4在這上面的得分還在30%附近徘徊。到2026年5月,Claude Opus 4.7推到了87.6%,GPT-5.5、Gemini 3.1 Pro、Qwen 3.6 Max-Preview等6個前沿模型全擠在80%以上,彼此差距不超過2個百分點。
分數在收斂,但故事不在分數里。
更有意思的事情發生在價格那一欄。Opus 4.7每百萬token輸入5美元、輸出25美元。GPT-5.5是2.5美元和15美元。DeepSeek V3.2是0.14美元和0.28美元。同一個任務,相近的完成率,成本可以相差近90倍。這是一個在科技史上反復出現的信號:當性能趨同,戰爭就從實驗室轉移到市場。90倍的價差不是技術差距,是策略差距。Anthropic選擇用高價守住品牌和可靠性,DeepSeek選擇用低價擊穿門檻。兩種選擇背后是兩套完全不同的戰爭理論——前者打的是“信我,因為我不出錯”,后者打的是“用我,因為你試得起”。
但這張戰況地圖上最耐人尋味的一筆,是SWE-bench的創建者Jimenez在2026年5月放出的新基準:ProgramBench。這批題目不再是修bug,而是要求模型從零開始構建完整的程序模塊:理解需求、設計架構、編寫代碼、調試運行、交付結果。在SWE-bench上拿到80%以上的那一批最強模型,在這套新題上集體交了白卷。0%。
這不是一個技術翻車的花邊新聞。它是一種古老戰爭規律的再現:每一道新防線都會暴露舊裝備的邊界。1940年,法國人引以為傲的馬其諾防線被德軍繞過時,法軍指揮部收到的第一批報告也是類似的措辭:“敵人出現在我們的地圖之外”。
Jimenez在發布新基準時寫了一段話,措辭冷靜得像一份偵察報告:“當前所有的編程模型,在面對需要自主規劃和多步驟推理的開放任務時,表現急劇下降。這不是某個模型的缺陷,而是整個范式的天花板。”
更值得留意的是業界的反應。OpenAI沒有公開回應。Anthropic的開發者關系主管在一個技術論壇上簡短留言:“已知曉。感謝。”谷歌DeepMind的Fran?ois Chollet——這位早在2019年就提出ARC基準來測量AI抽象推理能力的科學家——轉發了Jimenez的推文,加了一句他多年來反復說的話:“記住,排行榜衡量的是系統在特定分布內的表現,而不是智能。我們仍然不知道如何測量智能。”
Chollet這段話指向了一個更深層的問題。當所有廠商都在同一個基準上優化,當訓練數據里不可避免地混入了基準的影子,當排行榜上的差距縮小到小數點后一位,這些數字到底在說什么?它們說的是模型真的變強了,還是整個行業正在集體“過擬合”一套考題?
這不是一個學院式的追問。它對商業競爭有直接的殺傷力。2024年,一家估值超過20億美元的AI編程創業公司Augment,在SWE-bench上跑出了令人矚目的分數,卻在企業付費客戶的實測中表現平庸,一年內經歷了大規模裁員和業務收縮。SWE-bench的創建者Jimenez本人也在多個場合警告過這一風險。他在2025年的一篇博客中寫道:“如果基準是公開的,它就不再是基準。它會變成訓練目標。而一旦變成訓練目標,它就不再衡量能力——它只衡量你離靶心有多近。”
這正是盧比孔河對岸的第一場硬仗。不是跟競爭對手打,是跟自己賴以評估勝負的坐標系打。當坐標系本身開始漂移,當基準失靈的速度超過了模型進步的速度,所有參戰者都面臨同一個追問:你是在打贏一場被精確定義的上一場戰爭,還是在為下一場戰爭準備武器?
價格的崩塌也在加速這種漂移。GPU算力成本以每年超過50%的速度持續下降,推理成本被不斷攤薄。DeepSeek V3.2用0.28美元的價格提供接近Opus 4.7的編程能力,這件事的市場沖擊不亞于當年豐田用花冠打入通用和福特的核心市場。Anthropic的毛利率從38%升至70%以上,說明高端市場仍然愿意為可靠性支付溢價。
但問題在于:當低端選項的可靠性也在逼近,溢價還能維持多久?豐田花冠最終不是靠價格打贏的,是靠可靠性。這正是日本汽車工業在上世紀80年代給底特律上的一課,也是如今懸在Anthropic頭上的一把劍。
2026年5月,Coding的最新戰況大致如此:渡河者已在河對岸站穩腳跟,陣線正在從單點突破演變為多點交火。前沿模型在已知地形的表現高度趨同,價格裂谷橫貫整個戰區。但更深處——那片尚未被測繪的區域——最新的偵察數據表明,所有渡河者都還沒有準備好。那里藏著的,可能不是敵軍,而是這場戰爭本身的邊界。
而邊界的那一邊,已經響起了新的聲響。
04
暗涌:戰爭機器的內部裂痕
前線的戰況還在膠著,后方已經出現了第一道裂縫。
2026年5月中旬,Anthropic在沒有任何預告的情況下,將Claude Code的免費額度從每月250次調用壓縮至80次。公告在舊金山時間周五晚上發出——硅谷公司最偏愛的壞消息發布時間。開發者社區在幾個小時內炸開了鍋。Twitter上一位在Spotify工作的工程師寫道:“我們團隊上周剛把整個CI/CD流水線掛在Claude Code上,現在告訴我們額度砍了三分之二,周一部署怎么辦?”這條推文被轉發了超過一萬次。不到48小時,OpenAI的Sam Altman轉發了Codex免費兩個月的公告,配文只有三個單詞:“No quotas.”——不設額度。
這是一場在對手暴露軟肋時精準刺入的遭遇戰。Anthropic的算力瓶頸不是秘密。Dario Amodei在開發者大會上被問及額度問題時,回答得相當坦率:“收入增長越快,芯片就越不夠用。我們正在以最大速度建設推理集群,但需求跑在供給前面。”這段話的潛臺詞是清晰的:Anthropic的護城河不在商業模式,在模型能力。但模型能力需要算力喂養,而算力是實物資產,有物理交付周期。當戰爭從技術競賽升級為消耗戰,率先渡河者反而最先撞上了自己的后勤極限。
OpenAI對這一點的理解,比任何人都刻骨銘心。
據知情人士透露,Greg Brockman在今年3月的一次內部全員會上,回溯了公司歷史上一個鮮為人知的細節。2022年秋天,ChatGPT在發布前夜幾乎被擱置。彼時公司內部對要不要上線爭論不休,有人認為產品太不成熟,有人擔心API的算力供應跟不上潛在的用戶涌入。據稱,當時Sam Altman問了一個問題:“如果我們不發,別人發了怎么辦?”沒有人能回答。ChatGPT在那周按時發布,兩周內涌入了超過一億用戶,把OpenAI的服務器集群壓在崩潰的邊緣運轉了近一個季度。“那三個月教會我們一件事,”Brockman在那次會上說,“在AI這條賽道上,你永遠不可能在完全準備好的情況下開戰。你只能在開戰后,祈禱自己的彈藥比對手多一顆。”
這顆彈藥,正在變成現金。
截至2026年5月,OpenAI為Codex免費期準備的補貼預算,據估算超過4億美元。Anthropic的算力缺口,據半導體供應鏈的消息人士估算,大約需要新增3到5萬片H200級GPU才能填補。谷歌的Gemini Enterprise Agent Platform以近乎成本價的價格在市場上鋪量,背后是每年超過600億美元的資本開支兜底。Meta的扎克伯格在內部郵件中寫道:“我們在編程工具上的落后,本質上是推理基礎設施的落后。補上這一課,需要200億美元級別的新增投入。”他在郵件末尾加了一行字:“這可能是本世紀最重要的資本支出,不要跟董事會討論ROI——他們算不出來。”
這不只是一場技術競賽。它正在變成一場用現金填滿的消耗戰。
更致命的問題在另一個維度。
2026年4月,摩根大通內部信息安全委員會向全體工程部門發出一份備忘錄,措辭是金融行業少見的嚴厲:“當前所有AI編程Agent在接入生產級代碼庫和客戶敏感數據時,均未達到我行內部安全評估的第三級標準。在進一步通知之前,禁止任何團隊將AI Agent直接接入涉及個人身份信息的代碼倉庫。”這份備忘錄沒有點名任何一家廠商,但它幾乎同時適用于所有廠商。高盛、花旗、匯豐在隨后兩周內發布了類似文件,措辭各有不同,底線高度一致:允許,但必須斷網,且限制數據訪問級別。
這意味著什么?意味著AI編程Agent進入企業核心業務系統的速度,將被安全合規問題踩下剎車。而這個剎車不是任何一家模型廠商能單獨拆掉的。它需要整個行業在安全沙盒、數據審計、權限隔離和合規框架上達成共識,或者至少形成一套可被監管機構接受的事實標準。OpenAI在2026年5月發布的Windows沙盒技術方案,就是在試圖獨自作答這個問題。但一家廠商的方案,不等于一個行業的答案。
這還不是裂痕的全部。
2026年5月下旬,Hacker News上出現了一篇廣為流傳的長帖,標題是《我用Claude Code寫了三個月代碼,現在我不確定我還會編程》。帖子詳細記錄了作者從興奮到依賴,再到感到“肌肉萎縮”的全過程。“一開始是復制粘貼AI生成的代碼段。然后是不加審查地接受整個函數的修改。最后我發現自己連一個簡單的SQL查詢都不想寫了,因為讓Claude寫更快。”帖子的評論區在三小時內被頂到了Hacker News歷史熱度榜前十。排在最高贊的回復只有一句話:“我們正在用效率工具,制造一代不知道如何造輪子的工程師。”
這不是一個孤立的情緒波動。斯坦福大學2026年發布的《人工智能指數報告》中,有一項針對超過5000名軟件開發者的追蹤調查,結果顯示:每天使用AI編程工具的開發者中,73%表示“明顯感到自己的底層調試能力在退化”,58%表示“對AI生成的代碼缺乏系統性理解”。更微妙的數據是:當被要求在不使用AI工具的情況下完成一道中等難度的算法題時,這個群體完成率比兩年前的同齡對照組下降了22個百分點。
這是渡河者未曾預料到的代價之一。你帶了一支軍隊過河,但行軍過程中,武器在幫你打仗,也在讓你的士兵變弱。
Dario Amodei在開發者大會的問答環節被問及這個問題時,沉默了幾秒鐘。然后他給了一個不回避的回答:“這是一個真實的問題。我們內部也在討論。但我能說的是,人類過去每一次引入新工具,都會有人擔心技能退化。從計算器到搜索引擎,再到IDE自動補全,每一次都發生了。但每一次,行業的整體生產力都上了一個臺階。”他頓了頓,又說:“只是這次的速度確實太快了。快到我們可能來不及適應。”
Greg Brockman在另一個場合的表述更直接。當被問及“程序員會不會被取代”時,他回答:“程序員不會消失。但不使用AI的程序員會。就像2005年,會計師沒有因為Excel消失,但不會用Excel的會計師消失了。”
兩句話放在一起看,可以讀出這場戰爭真正的殘酷之處:不是AI替代了人類,而是使用AI的那部分人類,正在替代不使用AI的那部分人類。而使用AI的那部分人,又在面臨被AI削弱底層能力的風險。這不是一場單向的替代。這是一個所有人都被卷入、無人能完全掌控的螺旋。渡河之后,你以為戰場在河對岸。但你很快發現,河對岸的戰場,有一部分就在你自己的陣地上。
盧比孔河沒有上游和下游。它只有一條方向——朝前。
05
彼岸:尚未命名的土地
盧比孔河已被甩在身后。但渡河者很快會發現,他們占領的不是一座城池,而是一片尚未測繪的大陸。
Anthropic開發者大會上,有一位參會者在筆記里寫下了一句話,會后被反復引用:“多數生產級智能體系統的瓶頸,現在已經不是模型能力,而是模型周邊的基礎設施。”寫下這句話的是Stripe平臺工程團隊的一位負責人,她所在的團隊在三個月前將Claude Code接入了支付核心系統。
她說這話時有數據支撐:Stripe的實測表明,Agent在理想環境中的代碼生成正確率超過85%,但在生產環境中,接入認證網關、審計日志和異常回滾機制后,有效可用率跌到了60%以下。掉下來的25個百分點,沒有一個是模型的問題。全是管道、權限、監控和容錯的問題。
她的結論是:“我們花了一年時間讓模型變得足夠好。接下來可能要花兩年時間讓管道足夠結實。”
這句話精準地標定了一個歷史時刻:智能體編程已經越過“能不能跑”的階段,進入了“能不能大規模跑、能不能在風雨里跑”的階段。
同一場大會上,Anthropic公布了一張調用量分布圖,堪稱為整個行業做了一次內部結構的X光掃描。軟件工程獨占49.7%的調用,是第二名后臺自動化的5.5倍。法律、醫療、電商、教育等垂直領域加起來,不到6%。這張圖的潛臺詞再清晰不過:coding作為Agent的生產力價值已被完全證實,但coding之外的白領勞動市場,幾乎還是一塊處女地。
但這塊處女地上已經出現了一些拓荒者。
法律科技公司Harvey的聯合創始人Winston Weinberg在大會上展示了他們的多智能體編排系統。在他的演示里,一個由7個專業Agent組成的團隊——分別負責檢索判例、拆解條款、擬寫初稿、交叉審閱、風險評估、格式校核和最終合稿——在22分鐘內完成了一份跨境并購協議的核心條款起草。同樣一組任務,交給一組初級律師,平均需要6小時。Weinberg沒有用“替代”這個詞。他說的是:“我們不是在取代律師,我們是在把律師從文件堆里解放出來,讓他們去做只有人能做的判斷。”臺下的律師們表情復雜。
Netflix的平臺工程團隊展示了另一個方向。他們的日志分析智能體可以并行處理數百個構建批次,自動過濾出值得關注的跨批次異常規律。負責人在演示中說了句意味深長的話:“以前我們雇人看日志,后來雇人寫腳本看日志。現在腳本自己寫自己看,我們只負責在它看不懂的時候做決定。”他補充道,“問題是,它越來越不需要我們做決定了。”
不過,真正讓這場開發者大會的后半段氣氛發生微妙變化的,不是這些案例,而是一個話題的轉向。
大會進行到第二天下午,Anthropic的聯合創始人Jack Clark在臺上被問到一個問題:“當AI編寫的代碼比例接近100%時,人類工程師的角色到底是什么?”Clark沒有用公關話術。他沉默了幾秒,然后說:“我不知道。我說真的,我不知道。”
他接著講了一個故事。幾周前,Claude Code的團隊發現了一段底層調度邏輯存在問題。如果放在兩年前,這會是一張JIRA工單,分給某個工程師,花一個下午調試。但那天,Claude Code的主要創建者Boris Cherny在Slack上發了一條消息:“我讓Claude看了一下,它找到了三個可能的根因,給出了修復方案,概率排序。我只點了‘接受’。”Clark停了一下,看著臺下的觀眾。“我們創造了這個工具,但我們自己也在被這個工具重新定義。工具的設計師正在變成工具的用戶,然后變成工具的審核者。接下來是什么?審核者的審核者?”
會場安靜了幾秒鐘。然后有人鼓掌。不是熱烈的掌聲,是那種被說中了不安后的本能反應。
這不是一個孤立的故事。它指向的,是coding在硅基文明演進中的真正位置。它正在從“Agent的一個應用場景”變成“Agent自我進化的底層引擎”。
Meta的HYPERAGENTS論文(已被ICLR 2026收錄)提出了一種名為Darwinian G?del Machine的架構,其核心邏輯極其簡潔,也極其令人不安:在編程領域,改進自身編程能力的任務,與解決外部編程問題的任務,天然對齊。也就是說,AI改進自己的代碼,就是在改進自己。
這種“遞歸式自我改進”在概念上不是新東西。圖靈在1951年的曼徹斯特講演中就曾模糊地觸及過,哥德爾在更早的時候為它提供了邏輯學地基。但2026年,它第一次不再是理論推演,而是工程提案。論文中有一個段落被圈內反復標注:“如果自我改進的鏈條在某個節點上不再需要外部驗證就能通過內部一致性判斷,那么系統的進化速度將不再受人類審查帶寬的限制。”
這句話換一種說法就是:當AI學會自己給自己打分,并且這個分數足夠可信,人類的剎車踏板就消失了。
這是coding的中場戰事。
上半場,Anthropic用Claude Code驗證了一件事:Agent可以在編程領域穩定替代人類勞動。全球大模型公司隨后密集渡河,在基準測試和市場份額上展開貼身纏斗,價格戰、算力戰、安全合規戰相繼打響。
下半場的輪廓也已清晰:編程不再是終點,它是AI自我強化的底座。誰能在這個底座上建得更高、跑得更穩、覆蓋得更廣,誰就能在這場硅基文明演進的競爭中,撐到下個十年。
但Clark那一句“我不知道”,Brockman那一句“吸取教訓太晚”,Amodei那一句“快到我們可能來不及適應”,以及那個在Hacker News上寫下“我不確定我還會編程”的匿名工程師——這些聲音指向的是同一件事:渡河者不僅要面對對岸的敵軍,還要面對自己內部正在發生的某種不可逆的變化。工具在重塑使用者,使用者在適應工具,而適應的終點在哪里,沒有人能在地圖上標出來。
盧比孔河已經過去了。愷撒渡河時說的那句話——“骰子已經擲下”——常常被解讀為一種破釜沉舟的豪情。但研究羅馬史的學者知道,這句話的拉丁文原文“Alea iacta est”還有一層更古老的詞源學含義:alea不是普通的骰子,是那種在羅馬酒館里被人灌了鉛的、注定擲不出某個點數的作弊骰。普魯塔克在《希臘羅馬名人傳》里考證過這一層。換句話說,愷撒在說出這句話時,未必是在豪賭。他可能是在說:這個游戲的規則,早在骰子被制造出來時就已經被寫死了。我能做的,只有擲出去。
2026年5月的AI編程賽道,骰子同樣已經擲下。它是不是灌了鉛的,沒有人知道。但有一件事是確定的:一旦擲出,撿不回來。
留給每一個參戰者的真正難題,不在河對岸。在自己身上。當模型能力趨同、價格歸零、基準失靈,當工程師在鍵盤上越來越快、腦子里越來越空,當AI開始寫代碼改進AI自己——競爭將退回到那個最古老的層面:信任、克制,以及知道在哪里踩剎車的判斷力。
那才是Coding之后,真正的戰場。不是誰跑得更快,而是在所有人都剎不住車的時候,誰能證明自己值得被信任。
愷撒最終贏下了內戰,卻在元老院被刺。有些戰爭,贏在戰場上,輸在大勢里。盧比孔河只是一個起點。彼岸的黎明,從不保證任何人的抵達。
轉載開白 | 商務合作 | 內容交流
請添加微信:jinduan008
添加微信請備注姓名公司與來意
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.