![]()
Token 與 Agent 爆發帶來的新機會。
文丨高洪浩
編輯丨宋瑋
《晚點 LatePost》獨家獲悉,自今年春節以來,字節跳動云計算業務火山引擎的豆包大模型日均調用量已超過 100 萬億 Tokens(詞元),不到兩個月上漲了超 60%。來自個人用戶的 Token 消耗近期也明顯增長。
據了解,全球目前只有三家公司的 Token 消耗量超過 100 萬億,分別是 OpenAI、Google 與字節跳動。不過字節跳動的 Token 消耗主要來自中國市場,海外市場則在快速增長階段。
一位火山引擎人士告訴我們,火山目前的增長還是在一定約束條件下實現的——字節跳動旗下的視頻生成模型 Seedance 2.0 API 尚未在海外正式上線。
Token 是 AI 理解和生成文本的最小語義處理單元,使用者每一次與大模型的交互(提問、生成的代碼、生成的圖片和視頻等),最終都要被拆解成 Token 來完成運算。因此 Token 調用量成為了衡量 AI 模型活躍度、AI 企業算力承載力的關鍵指標。
過去一年里,Claude Code 等編程智能體(Agent)產品的走紅讓許多科技公司進一步意識到了 Token 的重要性——一次智能體任務往往包含多輪推理、工具調用和任務執行,Token 消耗通常顯著高于普通 AI 對話。OpenClaw 則將 Agent 推向了更廣泛的大眾用戶,進一步放大了 Token 的價值。
當地時間 3 月 16 日,英偉達創始人兼 CEO 黃仁勛在英偉達 GPU 技術大會(NVIDIA GTC)上稱,Token 將是未來數字世界最核心、最值錢的大宗商品;Token 的相關指標(吞吐量、生成速度)將成為全球企業 CEO 追蹤的核心經營數據,它的表現會直接反映在企業后續的收入中。
提供 MaaS(模型即服務)業務的云廠商是這一輪 Token 大爆發最大的受益者之一。它們通過出售模型調用服務、推理能力和配套工具獲利;市場對 Token 需求的激增會直接推高它們的模型調用量,并帶動收入增長。
2025 年起,圍繞 Token 的 AI 云戰爭已經打響。亞馬遜 AWS 管理層在 10 月的財報電話會議披露,長遠來看,MaaS 的收入貢獻將與 EC2(亞馬遜 AWS 的 CPU 和 GPU 計算實例業務,總營收占比超過 30%)不相上下。
阿里云則在 11 月末啟動了 “百煉戰役”,目標是短期內將百煉(阿里云的 MaaS 平臺)Token 調用規模提升三倍以上。今年 3 月 16 日,阿里巴巴成立了 Alibaba Token Hub 事業群,由集團 CEO 吳泳銘直接帶隊。
阿里云智能集團資深副總裁、公共云事業部總裁劉偉光在接受我們的訪談時曾提到,過去取得了什么成績并不重要,下一年增量的 10% 都會大于上一年的全量。2026 年,阿里云的目標是拿下中國 AI 云市場增量的 80%。
《晚點 LatePost》獨家了解到,火山引擎此前曾定下了 2026 年 MaaS 業務收入超百億元的目標,隨著 Seed 2.0、Seedance 2.0 等模型發布、OpenClaw 持續爆火,團隊已提升了收入目標。就在上一年,火山引擎也曾因這塊業務增長迅猛,兩度上調收入目標。
從邊緣走向競爭中心的 MaaS 業務
2022 年底,隨著新一輪生成式 AI 浪潮卷起,云廠商迎來了一個新的機會:將大模型封裝成可調用、可計費的云服務,賣給企業與開發者,并借此打開新的收入來源。
在早期,國內的幾家頭部云廠商中,只有火山引擎對于推進 MaaS 業務最為積極,也始終將 MaaS 放在了很高的戰略位置。2024 年,火山引擎甚至調整了銷售團隊的業績考核指標,把銷售 MaaS 產品排在第一位。銷售賣同等價格的 MaaS 產品得到的回報,要比賣傳統云服務更高。
相比阿里、華為與騰訊,字節在云計算上起步最晚,很難在傳統的云服務上突圍,新興的 MaaS 業務因而成了它最有可能實現彎道超車的機會——先切入模型服務市場,進而拉動 IaaS、PaaS 以及上層應用服務的增長。
這在海外已有先例。比如對微軟的云服務 Azure 來說,出售 OpenAI 模型的 API 只是第一步。客戶一旦開始把大模型真正接進業務,往往就不只購買模型能力本身,還會繼續采購檢索、數據庫、數據平臺等配套云服務,這將直接提升他們在 Azure 上的整體支出。
推廣 MaaS 業務也有助于字節的大模型能力迭代。一位火山引擎人士告訴我們,模型只有通過 MaaS 進入真實的 B 端場景,團隊才能持續獲得真實反饋,比如模型是否被用起來了、被用在什么場景、哪些地方做得好、哪些地方還不夠好,并據此優化模型效果。
上述火山引擎人士透露,火山引擎很早就通過與客戶開展協作計劃意識到,B 端的企業客戶會更多用 AI 來做長線程任務,有大量 Agentic Coding(智能體式編程)的需求,這在一定程度上反向推動了字節模型能力的演進。
許多傳統的云廠商雖然也很早發布了自己的 MaaS 業務,但推進的節奏并不算快。部分原因在于,它們原有的收入和組織能力,仍主要建立在 CPU 時代的傳統云計算生意上,包括 IaaS、數據庫、存儲、網絡、安全以及各類企業軟件服務。大模型帶來的這套新需求,無論是底層算力結構,還是上層產品形態,都和過去很不一樣。轉型需要時間。
此外在國內大模型能力相對有限的階段,全行業的 Token 消耗規模還不大且價格較低——百萬 Tokens 在一元錢左右,這就導致 MaaS 業務的營收規模很小,不被市場所看好。
根據國際數據公司(IDC)公布的數據,2024 年中國整體公有云服務市場規模則超過了 3000 億元,MaaS 市場規模僅為 7.1 億元。
直到 2025 年初,MaaS 在中國終于迎來第一次顯著提速。DeepSeek 的出現讓大模型走出技術圈,進入更廣泛的應用場景,越來越多企業和開發者開始通過云端調用模型。
另一個驅動力是多模態模型的成熟,生圖、生視頻的需求在快速增長。一位火山引擎人士回憶,字節的視頻生成模型 Seedance 1.0 剛上線的時候,內部感覺它可能還不能很好地被使用在一些特別專業的創作上。但后來的實際情況是,有相當多的用戶會用它來創作整部漫劇,這極大帶動了火山引擎 Token 消耗量的增長。
國家數據局 2025 年 8 月數據顯示,2024 年初中國日均 Token 消耗量為 1000 億。截至 2025 年 6 月底,中國日均 Token 消耗量突破 30 萬億,一年半時間增長了 300 多倍。
MaaS 也開始從云服務行業的邊緣走向中心。
《財經》曾報道,2025 年 12 月末,阿里云智能集團資深副總裁、公共云事業部總裁劉偉光在一場小規模溝通中稱,MaaS 收入在云廠商整體收入的占比,有可能達到 30% 甚至更高。
我們了解到,火山引擎在大模型領域的增長也在帶動其傳統云計算服務。目前火山引擎一定比例的 CPU 算力、數據庫等需求來自大模型客戶。
Agent 的爆發帶動 AI 云市場擴容
2025 年 5 月,Anthropic 推出的 Claude Code 在開發者群體與企業間流行了起來。它提供了一種全新的服務——讓 AI 真正進入工作流,成為能讀代碼、調工具、跑任務的 Agent,從根本上改變了構建軟件的方式。
Claude Code 等產品還帶動了 Coding Plan 這類面向開發者的付費模式開始快速成型。它把原本按次、按量調用的 AI 編程能力,變成了可以高頻使用的服務,進一步加快了 Agent 在開發者中的普及,并持續推高了 Token 消耗。
半導體與算力研究機構 SemiAnalysis 估算,目前 GitHub 上約 4% 的公開代碼提交(commit)由 Claude Code 完成;按這一趨勢,到 2026 年底,Claude Code 占 GitHub 每日公開提交總量的比例可能超過 20%。
年底,OpenClaw 的出現又將 Agent 帶入到了更廣泛的大眾群體中,Agent 也開始從 Coding 走向更廣泛場景,包括搜索資料、處理郵件、撰寫文檔、安排日常事務。
2026 年初,Agent 風潮來到中國,硅谷此前經歷過的一切又在這里重演了一遍。
最先受益的是幾家 AI 創業公司。2 月,智譜將面向開發者的 GLM Coding Plan 價格上調至少 30%,直接原因便是開發者對 AI 編程工具的需求上升;長期聚焦 C 端產品的 MiniMax 也在其招股書和第一次財報中重點介紹了自己的 Coding Plan 模式。3 月 23 日,MiniMax 宣布將自己的 Coding Plan 升級為 Token Plan,成為了全球首個支持全模態模型的統一訂閱計劃。
國內的一眾類 OpenClaw 涌現后,Agent 進入大眾視野。一位火山引擎人士告訴我們,過去一個多月,來自個人用戶的 Token 消耗增長了約 16 倍。
Agent 的普及、Token 的暴漲也在帶動 MaaS 和 AI 云市場擴容。
對企業來說,通過公有云調用(MaaS)是當前使用大模型最實用、也最有效的方式。企業真正需要的不是自己維護機器,而是按 Token 靈活調用模型能力;同時,大模型迭代極快、不同模型的最佳部署方式又各不相同,只有 MaaS 這類持續升級的平臺,才能更快接入新模型,并把背后的部署、適配和運維復雜度一并接住。
繼亞馬遜 AWS、谷歌云年初釋放漲價信號后,騰訊云、阿里云、百度智能云密集跟進,主流云計算服務商基本上全都加入漲價行列。
不過 Agent 時代對云廠商帶來的挑戰也不小。過去的云平臺基本都是為 Web、App 場景服務的,現在則要轉向圍繞著 Agent 設計。
火山引擎智能算法負責人吳迪曾在火山引擎 FORCE 原動力大會上提到,下一代 Agent 應用絕不能只停留在探索層面,最終要真正走進企業的生產和業務需求里。這就要求 Agent 需要具備三大核心能力,長期記憶的能力,隨業務數據變化的自我進化能力,以及準確執行多步驟復雜任務的能力。
對任何一家云廠商而言,這注定是一場艱難的攻堅戰。“(MaaS)這個事還太早期了。” 火山引擎總裁譚待此前曾跟我們提到。他也會告訴團隊 “馬拉松才跑 500 米,別取得一點點小成績就滿意了。”
題圖來源:《銀翼殺手》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.