![]()
整理 | Tina
程序員們,先別忙著焦慮 AI 會搶走你的飯碗。現在更該焦慮的,可能是你們的 CTO 和 CFO 了:因為讓 AI 寫代碼,實在太燒錢了。
Copilot 和 Claude Code,幾乎在同一時間,給行業踩了一腳剎車。
今天(4 月 28 日),GitHub 宣布從 2026 年 6 月 1 日起,GitHub Copilot 將告別“無限暢飲”模式,將 Copilot 從“按請求計費”轉為“按使用量計費”。
![]()
幾乎同一時間,Anthropic 限制了 Claude Code 中 Opus 模型的訪問,每月 20 美元的 Pro 用戶想繼續用?請額外付費。
![]()
![]()
這就引出了一個繞不開的問題:用 AI 寫代碼花的錢,哪天會比直接雇一個程序員還貴?如今這個轉折點,已經不遠了。
從“自助餐”到“按粒收費”
先看看 GitHub Copilot 漲價的程度。
GitHub Copilot 原來的模式是按“請求次數”計費,你問一句“怎么寫快排”和讓 AI 替你跑一個小時的自主編碼會話,消耗的額度是一樣的。因此,需要大量“思考”的復雜提示往往會使 GitHub 的成本超過其獲得的訂閱費收入。GitHub 產品團隊首席產品官 Mario Rodriguez 在今天的博客中坦言:“GitHub 已經吸收了太多推理成本,當前模式不可持續。”
這種壓力,其實已經開始體現在更早的動作里。GitHub :為了止住持續擴大的虧損,公司暫停了 Copilot、Pro、Pro+ 以及 Student 套餐的新用戶注冊。
在這樣的背景下,計費邏輯開始徹底重寫。從 6 月 1 日起,新模式下一切以 token 為單位。GitHub 推出了自己的虛擬計費單位, “GitHub AI Credits”,每個 Credit 價值 0.01 美元。Copilot 用戶在使用過程中會消耗輸入 token、輸出 token 以及緩存 token,這些都會根據所使用的模型分別計價,最終統一折算為 AI Credits。
訂閱價格表面上沒變:Copilot Pro 仍是每月 10 美元,每月 1000 Credits。Pro+ 是 39 美元,每月 3900 Credits。用完之后,要么設置超額預算繼續付費,要么等下個月額度重置。
真正麻煩的是,token 賬單很難提前算清。一次請求會“想”多久、調用多少工具、讀多少上下文、生成多少內容,用戶事前并不知道。GitHub 也意識到這一點,只能先給一點“模糊的可見性”。Rodriguez 透露,公司將在 5 月初推出“費用預覽”功能,讓用戶和管理員在 6 月 1 日正式切換前,能夠看到預估成本。
對于按年訂閱的用戶,可以選擇提前取消并按比例退款,或者在訂閱到期后降級為 Copilot Free——這些年費套餐將不再支持續訂。而且那些堅持用完年費訂閱的用戶 ,將會明顯感受到高端模型價格的上漲。 例如,Anthropic 的 Opus 4.7,在原有按請求計費模式下的倍率為 7.5 倍,未來將提升至 27 倍;OpenAI 的 GPT-5.4,也將從 1 倍上漲到 6 倍。
![]()
![]()
所以 GitHub 的調整,相當于承認了:之前是在虧本讓開發者“薅羊毛”,現在要把高階模型真正的推理成本轉嫁回去。
Anthropic 也一樣。 本月初,數百萬 OpenClaw 用戶發現這款爆火的 AI 代理工具 。現在 Claude Code 也一并改了規則:每月 20 美元的 Pro 用戶想繼續用 Opus 模型?得額外付費。(雖然后來有Claude工程師說這是之前的文件,但綜合各方看法,很可能是因為之前的ab測試激起了用戶情緒,Anthropic被迫收回收費策略,而且20美元套餐極易觸發時長限制。)負責人 Boris Cherny 也曾直言:“訂閱模式本就不是為這種使用強度設計的。”翻譯成人話:OpenClaw 這些工具 7×24 小時跑 Agent,我們扛不住了。
輪到用戶填這個“無底洞”了
過去幾年,AI 公司一直用接近“自助餐”的方式擴張:低價,甚至免費,讓更多人先用起來,把規模做大。
在這個階段,主流做法是按人頭收費,本質上是一種“平均成本”的模式。也就是說,不管一個人每天跑幾個 agent,還是一周只問兩次問題,平臺都按同一檔訂閱費來收。高頻用戶多出來的成本,會被低頻用戶攤掉,也會被平臺自己吸收。訂閱制本質上是在用“平均成本”覆蓋這種極不均衡的使用。
可一旦 agent 普及,這個模型就會迅速失效。所以 Copilot 和 Claude Code 現在做的,其實是把過去被平均掉、被平臺吸收掉的成本,重新按 token 拆回到每一次真實使用上。
某種程度上,這并不新鮮。 它像是 2010 年代科技繁榮的重演:當年風險投資推動網約車、電商、外賣、即時配送,用補貼換增長。一旦公司站穩腳跟,就開始提價、拓展收入、為投資人兌現回報——當然,也有不少沒撐住直接崩盤的。
但 AI 燒錢的速度,比近幾十年任何一個行業都快。 AI 公司在全球砸下數據中心,投入數萬億美元,承諾更強的模型、更低的成本、以及“人人可用的 AI”。可現實是,哪怕只是止住虧損都很難,更別說實現投資人期待的回報了。
有外媒在分析這一輪 AI 資本熱潮時,援引了 Gartner 的一組數據。分析師 Will Sommer 估算,2024 到 2029 年,全球 AI 數據中心的資本投入將達到 6.3 萬億美元——差不多是美國一年 GDP 的四分之一。為了避免資產減值,廠商需要大約 25% 的投資回報率(像亞馬遜、微軟那種水平)。如果回報低于 7%,就是“對所有投資者的災難”。
要達到那根最低 7% 的紅線,大型 AI 公司到 2029 年需要累計賺出接近 7 萬億美元的 AI 收入,相當于平均每年 2 萬億美元。如果想實現“歷史性回報”,這個數字要提高到 8.2 萬億美元。
那這些錢要從哪來?只能靠賣 token。
Token 是 AI 理解和處理數據的最小單位,可以是文字、圖片或聲音。通常來說,一個 token 大約對應英文中的 3 到 4 個字符,一篇 1500 字的文章大約 2050 個 token。問題是,要賺到每年 2 萬億美元,需要處理的 token 數量大到荒謬。作為對比,谷歌曾透露它每月處理約 1.3 千萬億(quadrillion,也就是 1 后面 15 個零)個 token。把所有廠商加一起,每年大概處理 100 到 200 千萬億個 token。
但 Gartner 算了一下:要實現年入 2 萬億美元,算上每個 token 大約 10% 的利潤率,token 的消耗量需要在未來幾年增長 5 萬到 10 萬倍——也就是從現在的每年百萬億級,跳到每年 1 后面 21 個零 那個級別(sextillion,簡單說,比現在多五位數)。
問題是,現在的公司根本沒有能力處理這么多 token。它們正在拼命建設數據中心,但算力依然緊張。即便有能力處理,它們也面臨另一個問題:這些 token 很可能是虧錢的。
Sommer 估算,如果只計算基礎設施和電力成本,“每個 token 的利潤看起來還算合理”。但隨著模型越來越復雜、token 消耗越來越大,這個利潤空間正在迅速收窄,甚至消失。而一旦把間接成本算進去——例如擴建算力以及不斷訓練下一代模型的“天文級”開銷——這些利潤幾乎被完全吞噬。
“當你把下一代模型所需的基礎設施成本也算進去,這個模式就越來越站不住腳。”Sommer 預測,市場整合幾乎不可避免,每個區域最終可能只剩不超過兩家大模型廠商。
所以,慷慨的免費額度時代,也該結束了。對那些免費用戶很多的 AI 實驗室來說,問題從來不是“要不要變現”,而是“什么時候開始、下手多重”。它們希望 token 用量繼續增長,但成本要么自己扛,要么轉嫁給用戶。這也是為什么如今 GitHub Copilot 和 Anthropic 必須放棄訂閱制的原因。
浪費不可避免,成本逼近臨界點
AI 公司不得不把成本轉嫁給用戶,但問題是,很多 token 本來就是被“白燒”掉的:一部分來自技術機制,一部分來自員工內卷。
在 AI 發展的早期,大部分算力成本都花在模型訓練上,而推理相對便宜。但隨著模型能力提升、系統功能不斷疊加,推理階段的資源消耗已經顯著上升。尤其是 AI agent——那些希望能夠替用戶完成復雜、多步驟任務、而不需要持續人工干預的工具——相比幾年前的基礎聊天模型,會消耗成倍增長的 token。
你輸入一句話,Agent 就在后臺工作中消耗大量 token:推演不同路徑、啟動子 agent 去完成子任務,或者對每一步結果進行驗證。這些你根本看不見,但每一筆都算在賬單上。更麻煩的是,Agent 一定會產生“無效 token”:走錯路退回來、反復檢查卻不改東西、甚至停下來“給自己寫首詩”。整個行業都在努力減少這種浪費,但短時間內沒戲。
那這些 token 到底燒在哪了?
首先是最基礎的輸入 token 和輸出 token。輸出往往比輸入貴 2 到 6 倍——因為生成是串行的,輸入可以并行。這個價差不是隨便定的,是物理層面的差異,即生成比讀取更難。
真正燒錢的是推理 token。當你使用帶“深度思考”的模型時,它不會直接給答案,而是先“思考”,生成成千上萬 token。一個簡單數學問題,最終答案可能只有 200 個 token,甚至只輸出一個“42”,但模型內部可能生成了上千甚至幾千個推理 token。你的賬單是“推理 token + 輸出 token”的總和。推理 token 已經成為一個新的市場分層,高級推理,就是更高價格。
還有一類正在拖垮很多 Agent 系統的,是工具調用 token 和系統 token。給模型接入工具時,你必須把工具的 JSON schema 一起發過去。10 個工具,加上完整描述,每次調用就多出 3000~4000 個 token,而且無論是否真用到,成本都會發生。更致命的是 Agent 的循環調用:思考→調工具→讀結果→再思考……可能跑 6 到 15 輪。一個 50 token 的用戶問題,最終可能消耗超過 10 萬 token。不建模的話,最終賬單會親自“教育你”。
除此之外,還有視覺 token(一張截圖比發一整頁文字還貴)、音頻視頻 token(一小時會議錄音 18 萬 token)、結構性 token(這是“看不見的腳手架”:序列開始 / 結束標記、區分 system/user/assistant 的角色 token、batch 處理時的 padding token、以及各種模式觸發 token)。
技術上的浪費已經夠頭疼了,更糟糕的是,一些企業還在主動放大這種浪費。
tokenmaxxing 這個概念最早在硅谷流行起來,但傳播速度很快。員工拼命消耗更多 token,以此證明自己“深度擁抱 AI”。Visa 自豪地宣布,它的 token 使用量從 2 月的 1 萬億翻到了 3 月的 2 萬億。摩根大通和迪士尼內部甚至設有儀表盤,專門追蹤員工用了多少 AI 代幣。誰消耗得多,誰就顯得更“前沿”。
今年 4 月,Meta 內部出現了一個叫 Claudeonomics 的排行榜,追蹤全公司 8.5 萬人的 AI token 消耗,只展示前 250 名。為了沖榜,有人讓 Agent 跑幾個小時,有人一次性跑幾十個用例,還有人直接寫無限循環腳本——讓 AI 不斷調用自己,一晚上刷出幾十億 token。30 天內,全公司燒掉了 60 萬億 token,按公開定價估算相當于 9 億美元。排名最高的個人,一個月賬單接近 200 萬美元。
這些數字放在一起,會逼出一個更直接的問題:人和 AI,到底哪個更貴?
過去大家默認 AI 便宜,是因為真實成本被補貼和平均掉了。Copilot 每月十幾美元、Claude Code 每月幾十美元,看起來當然比一個工程師便宜。現在 token 開始逐筆計價,這個賬就變了。假設一個工程師年綜合成本是 25 萬美元,折到每月大約 2 萬美元。如果一個 AI 工具每月花 1000 美元,但能穩定替代 5% 以上的工程產出,那就是劃算的;如果一個團隊每月 token 賬單燒到幾萬、幾十萬美元,卻只換來一些重復嘗試和無效產出,那 AI 反而比人貴。
所以真正的問題不是“AI 要不要用”,而是“AI 賬單什么時候會超過一個程序員的工資”。
在今年 2 月的一期播客里,硅谷知名天使投資人、All-In Podcast 聯合主持人 Jason Calacanis(曾早期投資 Uber、Robinhood 等公司)提出這個問題:token 成本什么時候會超過員工工資?他說,“這個臨界點,不是未來,是馬上就會發生。”
那些重度使用 AI、長時間跑 agent 的開發者,其實早已到了這個點。
同場的 Chamath Palihapitiya 也提到,他的公司已經開始給開發者設定 token 預算。按他的說法,單個 agent 通過 Claude API 跑起來,一天就可能花掉 300 美元,一年就是 10 萬美元。團隊必須至少提升 2 倍生產力,才能覆蓋“工資 + AI 賬單”的總成本。
否則,AI 不是降本工具,而是新的成本黑洞。
https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/
https://docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing#model-multipliers-for-annual-copilot-pro-and-copilot-pro-subscribers
https://x.com/i/trending/2048906922825519314
https://www.theverge.com/ai-artificial-intelligence/917380/ai-monetization-anthropic-openai-token-economics-revenue
https://www.youtube.com/watch?v=JK6QnFKv080
https://www.youtube.com/watch?v=CnaegIpkenA
聲明:本文為 InfoQ 整理,不代表平臺觀點,未經許可禁止轉載。
會議推薦
世界模型的下一個突破在哪?Agent 從 Demo 到工程化還差什么?安全與可信這道坎怎么過?研發體系不重構,還能撐多久?
AICon 上海站 2026,4 大核心專題等你來:世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。
誠摯邀請你登臺分享實戰經驗。AICon 2026,期待與你同行。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.