![]()
“干活的Token,是簡單問答的10倍,甚至100倍。”
在幾天前中關村論壇的一場開源主題圓桌上,當楊植麟把“為什么漲價”的問題直接拋給智譜CEO張鵬時,收到了這樣的回答。
張鵬選擇用模型市場眼下正在發生的現實來回答,而這樣的市場判斷,在智譜剛披露的財報里,已經得到了驗證。
智譜今日發布的財報披露,2025年公司收入7.243億元,同比增長131.9%;毛利2.967億元,綜合毛利率41%;研發投入31.804億元。
只看上面這一組數字,已經呈現出了智譜的2025:收入在快速放大,投入也在同步拉高,這家扎根五道口、由清華孵化的大模型公司正持續在基模研發領域投入,換取模型能力和市場位置。
但如果把財報中的收入結構拆開看,會發現智譜“激進”的技術投入,已經開始涌現回報。
云端API收入1.904億元,同比增長292.6%,收入占比相比2024年,從15.5%提升到26.3%。
與此同時,智譜的業務已經覆蓋218個國家和地區,連接超過400萬開發者和企業,付費開發者規模達到24.2萬。
翻譯過來就是,API調用正在變成可靠的收入來源,甚至有進一步擴大的趨勢。
進入2026年,智譜對GLM系列服務連續提價:2月上漲約30%,取消首購優惠;到3月,整體API價格較去年底提升約83%。
然而,價格上調之后,平臺用戶仍然繼續增長,調用也沒有出現明顯回落。
財報發布后首日,市場迅速給出了積極反響,截至今天上午10點,智譜股價暴漲25%、突破870港元,市值來到4000億港元區間。
以智譜為代表的大模型公司正在掌握定價權,這是這份財報和近期動態中給出的答案。
01
Agent驅動下的MaaS:調用開始“爆炸”
在上市前,相比起MaaS,智譜的主要收入路徑其實很清晰:本地化部署。做項目、交付模型,但這一類收入集中在項目周期內,增長的持續性相對不穩定。
智譜在2025年的收入結構里,這一模式仍然存在。本地部署收入5.339億元,占比超過七成,但財報同時提到,本地化部署業務為滿足客戶需求投入更多交付資源,導致毛利率階段性下降。
所以,撐起財報收入和毛利率的,其實是GLM系列大模型本身。
財報顯示,智譜2025年API收入1.904億元,MaaS平臺連接超過400萬開發者,付費開發者規模24.2萬。
調用量的激增,正在讓MaaS服務的商業化落地愈發常態和持續。
國家數據局披露,截至2026年3月,中國日均Token調用量已經超過140萬億,相比2024年初增長超過1000倍,較2025年底的100萬億規模,在三個月內再次提升40%以上。
![]()
OpenRouter的統計進一步說明這一結構的變化:在3月中旬的一周里,全球模型調用量達到20.4萬億Token,中國模型占7.359萬億,環比增長56.9%,并連續多周超過美國模型。
其中,GLM系列模型和其他4家國產模型一同,在榜單前十名中占據了5席。
這組數據背后,是調用形態發生了變化。
在早期的Chatbot時代,調用的主要場景是問答,一問一答結束,Token消耗與文本長度直接相關。現在的調用更多側重于Agent形態下執行任務,一次請求往往包含多輪推理、工具調用和結果修正。
OpenClaw這類Agent框架的爆發,把這種變化推到了極致。一個重度用戶的日均Token消耗可以達到數千萬甚至更高,而傳統對話產品的月消耗通常只是百萬級。
毫無疑問,這為包括GLM在內的頭部基座模型提供了大量落地場景。
“GLM模型的Coding能力在全行業范圍內取得了廣泛的認可。隨著旗艦模型GLM5的發布,智譜再次率先完成了從vibe coding到Agentic,也就是到智能體工程的跨度。”電話會議上,智譜CEO張鵬這樣介紹GLM模型迭代策略。
而根據財報披露,中國前十大互聯網公司中已有9家接入GLM模型,集中在代碼生成、自動化流程和Agent執行場景。
這些調用并非“樣板工程”,而是實打實在業務流程內部運行。一旦模型進入業務流程,API調用這件事,就逐漸變成了一個系統行為。
“面對2月以來供不應求的市場,我們將繼續加大投入國產芯片軟硬一體化的調優,將推理性能壓榨到極限。”電話會議上,智譜CEO張鵬這樣總結道。他表示,“這不是為了短期的盈利,而是為了支撐那條不斷上揚的高質量Token消耗的指數型曲線。”
以Coding能力為基座,以Agent為落地場景,這就回答了為什么API收入能夠“撐”起智譜這份財報。
02
從調用到價格:智譜為什么能漲價
事實上,從幾年前百模大戰開始,國產模型在行業中一直在比拼性價比。“每百萬Token多少錢”成為了各類模型分析中的關鍵指標,價格也成為了一種最直觀的競爭手段。
但從去年底開始,這個邏輯出現了明顯變化。
回到OpenRouter的榜單上,在全球調用量前十的模型中,中國模型已經占據半數以上,且主要由海外開發者驅動,這意味著以GLM為代表的國產模型不僅依靠中國市場,也在全球開發者生態中發揮重要作用。
同時,國產模型在多個榜單中占據主導位置。近日,全球權威LLM Agent(大模型智能體)基準測試機構ClawBench更新了2026年3月評測數據,其中,智譜旗下GLM-5-Turbo模型以93.9的高分登頂全球榜首,成為當前全球智能體能力最強的大模型;同屬智譜的GLM-5模型以91.7分位列榜單第6位。
技術驅動和Agent調用激增的雙重背景下,大模型行業的供需關系開始發生變化。
智譜是行業中最先做出反應的AI公司之一。
![]()
公開信息顯示,2026年一季度,GLM Coding Plan上漲約30%,GLM-5-Turbo再上漲約20%,累計漲幅超過80%。
值得關注的是,在價格上調之后,用戶側調用沒有下降,反而進一步向Coding和Agent場景集中。
顯然,當模型真正能提供生產力,API產生的調用不是“可有可無”的需求,而是用戶側的剛需。而在AI生產力領域,Coding扮演了一種基座級生產力的角色。
在幾個月前的AGI-NEXT論壇上,智譜創始人唐杰曾表示:“DeepSeek之后,行業需要思考的是‘下一場戰役’的核心方向。我們團隊為此爭論了無數個夜晚,最終,智譜決定將所有精力都投入到Coding領域。”
同樣在那場論壇上,騰訊首席科學家姚順雨也提到,在Coding場景,“用戶愿意為最好、也最貴的模型付費”。
顯然,智譜財報中的表現,正是上述路徑的延續。
更直接的信號在用戶側的真實使用上。GLM-5上線后,由于需求過高,出現階段性限流。當供給成為約束,大模型公司也就有了掌握定價權的底氣。
再看GLM系列的發展路徑。
GLM從4.5到5,再到5-Turbo和5.1,能力提升集中在長上下文、多步推理和工具調用。這些能力直接對應的是Coding和Agent場景,聚焦于最具價值的調用場景。
底層效率也在同步變化。智譜通過架構優化,將推理成本壓縮到原來的50%,同時保持性能。這讓高頻調用成為可能,也讓高價值調用具備規模基礎。
而在模型技術路線上,智譜GLM系列一直是Coding能力的領跑者之一。GLM5系列在多項權威評測中取得全球開源第一、綜合排名全球前三,并在Code Arena編程榜與OpenAI、Anthropic并列第一。
在算力側,GLM模型已經進入國產芯片的軟硬協同階段,通過系統級優化提升推理效率。這意味著供給端也在逐步適配調用增長。
調用結構、模型能力、算力供給,這三件事在同一時間發生變化。
在電話會議中,智譜CEO張鵬提出了TAC(Token Architect Capability)框架,這個框架可以用一個公式來理解:AGI商業價值 = 智能上界 × Token消耗規模。
把這個公式套在財報里就會發現,當模型開始形成生產力,調用規模進而快速放大,收入自然隨之增長。
顯然,不是所有模型都有資格漲價,只有那些被放進生產流程、承擔實際任務的模型,才有這個能力。
再回到智譜這份財報。
超過30億的研發投入,顯示出智譜還在持續加碼模型能力和算力基礎。嘗到了靠API賺錢的甜頭后,智譜沒有因此停下強化技術路徑的腳步。
在瞄準AGI的賽道上,智譜不是唯一的參與者,盡管它已經是少數跑通MaaS商業化流程的公司之一。
掌握定價權,并非是一個一勞永逸的節點,而會是一個動態競爭的過程。掌握了先手定價權的智譜,無疑想要把技術路線的紅利,逐漸轉化為AGI賽道上的長期競爭優勢。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.