網易首頁 > 網易號 > 正文申請入駐

AI 寫代碼太燒錢了：Copilot、Claude 一起漲價，不如把程序員請回來？

2026-04-29 12:27:55　來源: AI前線

北京舉報

分享至

整理 | Tina

程序員們，先別忙著焦慮 AI 會搶走你的飯碗。現在更該焦慮的，可能是你們的 CTO 和 CFO 了：因為讓 AI 寫代碼，實在太燒錢了。

Copilot 和 Claude Code，幾乎在同一時間，給行業踩了一腳剎車。

今天（4 月 28 日），GitHub 宣布從 2026 年 6 月 1 日起，GitHub Copilot 將告別“無限暢飲”模式，將 Copilot 從“按請求計費”轉為“按使用量計費”。

幾乎同一時間，Anthropic 限制了 Claude Code 中 Opus 模型的訪問，每月 20 美元的 Pro 用戶想繼續用？請額外付費。

這就引出了一個繞不開的問題：用 AI 寫代碼花的錢，哪天會比直接雇一個程序員還貴？如今這個轉折點，已經不遠了。

從“自助餐”到“按粒收費”

先看看 GitHub Copilot 漲價的程度。

GitHub Copilot 原來的模式是按“請求次數”計費，你問一句“怎么寫快排”和讓 AI 替你跑一個小時的自主編碼會話，消耗的額度是一樣的。因此，需要大量“思考”的復雜提示往往會使 GitHub 的成本超過其獲得的訂閱費收入。GitHub 產品團隊首席產品官 Mario Rodriguez 在今天的博客中坦言：“GitHub 已經吸收了太多推理成本，當前模式不可持續。”

這種壓力，其實已經開始體現在更早的動作里。GitHub ：為了止住持續擴大的虧損，公司暫停了 Copilot、Pro、Pro+ 以及 Student 套餐的新用戶注冊。

在這樣的背景下，計費邏輯開始徹底重寫。從 6 月 1 日起，新模式下一切以 token 為單位。GitHub 推出了自己的虛擬計費單位， “GitHub AI Credits”，每個 Credit 價值 0.01 美元。Copilot 用戶在使用過程中會消耗輸入 token、輸出 token 以及緩存 token，這些都會根據所使用的模型分別計價，最終統一折算為 AI Credits。

訂閱價格表面上沒變：Copilot Pro 仍是每月 10 美元，每月 1000 Credits。Pro+ 是 39 美元，每月 3900 Credits。用完之后，要么設置超額預算繼續付費，要么等下個月額度重置。

真正麻煩的是，token 賬單很難提前算清。一次請求會“想”多久、調用多少工具、讀多少上下文、生成多少內容，用戶事前并不知道。GitHub 也意識到這一點，只能先給一點“模糊的可見性”。Rodriguez 透露，公司將在 5 月初推出“費用預覽”功能，讓用戶和管理員在 6 月 1 日正式切換前，能夠看到預估成本。

對于按年訂閱的用戶，可以選擇提前取消并按比例退款，或者在訂閱到期后降級為 Copilot Free——這些年費套餐將不再支持續訂。而且那些堅持用完年費訂閱的用戶，將會明顯感受到高端模型價格的上漲。例如，Anthropic 的 Opus 4.7，在原有按請求計費模式下的倍率為 7.5 倍，未來將提升至 27 倍；OpenAI 的 GPT-5.4，也將從 1 倍上漲到 6 倍。

所以 GitHub 的調整，相當于承認了：之前是在虧本讓開發者“薅羊毛”，現在要把高階模型真正的推理成本轉嫁回去。

Anthropic 也一樣。本月初，數百萬 OpenClaw 用戶發現這款爆火的 AI 代理工具。現在 Claude Code 也一并改了規則：每月 20 美元的 Pro 用戶想繼續用 Opus 模型？得額外付費。（雖然后來有Claude工程師說這是之前的文件，但綜合各方看法，很可能是因為之前的ab測試激起了用戶情緒，Anthropic被迫收回收費策略，而且20美元套餐極易觸發時長限制。）負責人 Boris Cherny 也曾直言：“訂閱模式本就不是為這種使用強度設計的。”翻譯成人話：OpenClaw 這些工具 7×24 小時跑 Agent，我們扛不住了。

輪到用戶填這個“無底洞”了

過去幾年，AI 公司一直用接近“自助餐”的方式擴張：低價，甚至免費，讓更多人先用起來，把規模做大。

在這個階段，主流做法是按人頭收費，本質上是一種“平均成本”的模式。也就是說，不管一個人每天跑幾個 agent，還是一周只問兩次問題，平臺都按同一檔訂閱費來收。高頻用戶多出來的成本，會被低頻用戶攤掉，也會被平臺自己吸收。訂閱制本質上是在用“平均成本”覆蓋這種極不均衡的使用。

可一旦 agent 普及，這個模型就會迅速失效。所以 Copilot 和 Claude Code 現在做的，其實是把過去被平均掉、被平臺吸收掉的成本，重新按 token 拆回到每一次真實使用上。

某種程度上，這并不新鮮。它像是 2010 年代科技繁榮的重演：當年風險投資推動網約車、電商、外賣、即時配送，用補貼換增長。一旦公司站穩腳跟，就開始提價、拓展收入、為投資人兌現回報——當然，也有不少沒撐住直接崩盤的。

但 AI 燒錢的速度，比近幾十年任何一個行業都快。 AI 公司在全球砸下數據中心，投入數萬億美元，承諾更強的模型、更低的成本、以及“人人可用的 AI”。可現實是，哪怕只是止住虧損都很難，更別說實現投資人期待的回報了。

有外媒在分析這一輪 AI 資本熱潮時，援引了 Gartner 的一組數據。分析師 Will Sommer 估算，2024 到 2029 年，全球 AI 數據中心的資本投入將達到 6.3 萬億美元——差不多是美國一年 GDP 的四分之一。為了避免資產減值，廠商需要大約 25% 的投資回報率（像亞馬遜、微軟那種水平）。如果回報低于 7%，就是“對所有投資者的災難”。

要達到那根最低 7% 的紅線，大型 AI 公司到 2029 年需要累計賺出接近 7 萬億美元的 AI 收入，相當于平均每年 2 萬億美元。如果想實現“歷史性回報”，這個數字要提高到 8.2 萬億美元。

那這些錢要從哪來？只能靠賣 token。

Token 是 AI 理解和處理數據的最小單位，可以是文字、圖片或聲音。通常來說，一個 token 大約對應英文中的 3 到 4 個字符，一篇 1500 字的文章大約 2050 個 token。問題是，要賺到每年 2 萬億美元，需要處理的 token 數量大到荒謬。作為對比，谷歌曾透露它每月處理約 1.3 千萬億（quadrillion，也就是 1 后面 15 個零）個 token。把所有廠商加一起，每年大概處理 100 到 200 千萬億個 token。

但 Gartner 算了一下：要實現年入 2 萬億美元，算上每個 token 大約 10% 的利潤率，token 的消耗量需要在未來幾年增長 5 萬到 10 萬倍——也就是從現在的每年百萬億級，跳到每年 1 后面 21 個零那個級別（sextillion，簡單說，比現在多五位數）。

問題是，現在的公司根本沒有能力處理這么多 token。它們正在拼命建設數據中心，但算力依然緊張。即便有能力處理，它們也面臨另一個問題：這些 token 很可能是虧錢的。

Sommer 估算，如果只計算基礎設施和電力成本，“每個 token 的利潤看起來還算合理”。但隨著模型越來越復雜、token 消耗越來越大，這個利潤空間正在迅速收窄，甚至消失。而一旦把間接成本算進去——例如擴建算力以及不斷訓練下一代模型的“天文級”開銷——這些利潤幾乎被完全吞噬。

“當你把下一代模型所需的基礎設施成本也算進去，這個模式就越來越站不住腳。”Sommer 預測，市場整合幾乎不可避免，每個區域最終可能只剩不超過兩家大模型廠商。

所以，慷慨的免費額度時代，也該結束了。對那些免費用戶很多的 AI 實驗室來說，問題從來不是“要不要變現”，而是“什么時候開始、下手多重”。它們希望 token 用量繼續增長，但成本要么自己扛，要么轉嫁給用戶。這也是為什么如今 GitHub Copilot 和 Anthropic 必須放棄訂閱制的原因。

浪費不可避免，成本逼近臨界點

AI 公司不得不把成本轉嫁給用戶，但問題是，很多 token 本來就是被“白燒”掉的：一部分來自技術機制，一部分來自員工內卷。

在 AI 發展的早期，大部分算力成本都花在模型訓練上，而推理相對便宜。但隨著模型能力提升、系統功能不斷疊加，推理階段的資源消耗已經顯著上升。尤其是 AI agent——那些希望能夠替用戶完成復雜、多步驟任務、而不需要持續人工干預的工具——相比幾年前的基礎聊天模型，會消耗成倍增長的 token。

你輸入一句話，Agent 就在后臺工作中消耗大量 token：推演不同路徑、啟動子 agent 去完成子任務，或者對每一步結果進行驗證。這些你根本看不見，但每一筆都算在賬單上。更麻煩的是，Agent 一定會產生“無效 token”：走錯路退回來、反復檢查卻不改東西、甚至停下來“給自己寫首詩”。整個行業都在努力減少這種浪費，但短時間內沒戲。

那這些 token 到底燒在哪了？

首先是最基礎的輸入 token 和輸出 token。輸出往往比輸入貴 2 到 6 倍——因為生成是串行的，輸入可以并行。這個價差不是隨便定的，是物理層面的差異，即生成比讀取更難。

真正燒錢的是推理 token。當你使用帶“深度思考”的模型時，它不會直接給答案，而是先“思考”，生成成千上萬 token。一個簡單數學問題，最終答案可能只有 200 個 token，甚至只輸出一個“42”，但模型內部可能生成了上千甚至幾千個推理 token。你的賬單是“推理 token + 輸出 token”的總和。推理 token 已經成為一個新的市場分層，高級推理，就是更高價格。

還有一類正在拖垮很多 Agent 系統的，是工具調用 token 和系統 token。給模型接入工具時，你必須把工具的 JSON schema 一起發過去。10 個工具，加上完整描述，每次調用就多出 3000～4000 個 token，而且無論是否真用到，成本都會發生。更致命的是 Agent 的循環調用：思考→調工具→讀結果→再思考……可能跑 6 到 15 輪。一個 50 token 的用戶問題，最終可能消耗超過 10 萬 token。不建模的話，最終賬單會親自“教育你”。

除此之外，還有視覺 token（一張截圖比發一整頁文字還貴）、音頻視頻 token（一小時會議錄音 18 萬 token）、結構性 token（這是“看不見的腳手架”：序列開始 / 結束標記、區分 system/user/assistant 的角色 token、batch 處理時的 padding token、以及各種模式觸發 token）。

技術上的浪費已經夠頭疼了，更糟糕的是，一些企業還在主動放大這種浪費。

tokenmaxxing 這個概念最早在硅谷流行起來，但傳播速度很快。員工拼命消耗更多 token，以此證明自己“深度擁抱 AI”。Visa 自豪地宣布，它的 token 使用量從 2 月的 1 萬億翻到了 3 月的 2 萬億。摩根大通和迪士尼內部甚至設有儀表盤，專門追蹤員工用了多少 AI 代幣。誰消耗得多，誰就顯得更“前沿”。

今年 4 月，Meta 內部出現了一個叫 Claudeonomics 的排行榜，追蹤全公司 8.5 萬人的 AI token 消耗，只展示前 250 名。為了沖榜，有人讓 Agent 跑幾個小時，有人一次性跑幾十個用例，還有人直接寫無限循環腳本——讓 AI 不斷調用自己，一晚上刷出幾十億 token。30 天內，全公司燒掉了 60 萬億 token，按公開定價估算相當于 9 億美元。排名最高的個人，一個月賬單接近 200 萬美元。

這些數字放在一起，會逼出一個更直接的問題：人和 AI，到底哪個更貴？

過去大家默認 AI 便宜，是因為真實成本被補貼和平均掉了。Copilot 每月十幾美元、Claude Code 每月幾十美元，看起來當然比一個工程師便宜。現在 token 開始逐筆計價，這個賬就變了。假設一個工程師年綜合成本是 25 萬美元，折到每月大約 2 萬美元。如果一個 AI 工具每月花 1000 美元，但能穩定替代 5% 以上的工程產出，那就是劃算的；如果一個團隊每月 token 賬單燒到幾萬、幾十萬美元，卻只換來一些重復嘗試和無效產出，那 AI 反而比人貴。

所以真正的問題不是“AI 要不要用”，而是“AI 賬單什么時候會超過一個程序員的工資”。

在今年 2 月的一期播客里，硅谷知名天使投資人、All-In Podcast 聯合主持人 Jason Calacanis（曾早期投資 Uber、Robinhood 等公司）提出這個問題：token 成本什么時候會超過員工工資？他說，“這個臨界點，不是未來，是馬上就會發生。”

那些重度使用 AI、長時間跑 agent 的開發者，其實早已到了這個點。

同場的 Chamath Palihapitiya 也提到，他的公司已經開始給開發者設定 token 預算。按他的說法，單個 agent 通過 Claude API 跑起來，一天就可能花掉 300 美元，一年就是 10 萬美元。團隊必須至少提升 2 倍生產力，才能覆蓋“工資 + AI 賬單”的總成本。

否則，AI 不是降本工具，而是新的成本黑洞。

https://github.blog/news-insights/company-news/github-copilot-is-moving-to-usage-based-billing/

https://docs.github.com/en/copilot/reference/copilot-billing/models-and-pricing#model-multipliers-for-annual-copilot-pro-and-copilot-pro-subscribers

https://x.com/i/trending/2048906922825519314

https://www.theverge.com/ai-artificial-intelligence/917380/ai-monetization-anthropic-openai-token-economics-revenue

https://www.youtube.com/watch?v=JK6QnFKv080

https://www.youtube.com/watch?v=CnaegIpkenA

聲明：本文為 InfoQ 整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

世界模型的下一個突破在哪？Agent 從 Demo 到工程化還差什么？安全與可信這道坎怎么過？研發體系不重構，還能撐多久？

AICon 上海站 2026，4 大核心專題等你來：世界模型與多模態智能突破、Agent 架構與工程化實踐、Agent 安全與可信治理、企業級研發體系重構。14 個專題全面開放征稿。

誠摯邀請你登臺分享實戰經驗。AICon 2026，期待與你同行。

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.