![]()
整理|華衛
昨日,智譜交出了 2025 年度業績報告,這是其上市近三個月后的首份年度財報。今年 1 月 8 日,智譜登陸港交所,股價從發行價 116.2 港元一度沖至近 700 港元,目前市值超 3000 億港元。
這份業績報告喜憂參半,其收入激增但亦被分析師評增長低于預期,且綜合毛利率不佳。智譜表示,公司預計通過收入增長和提升運營效率實現盈利,但尚未給出具體時間表。智譜還在財報中傳達了一個信號,將繼續加大投資,增加國產芯片在訓練模型中的使用。
營收翻倍增長,虧損同比擴大
財報顯示,智譜 2025 年營收 7.24 億元,同比增長 131.9%;毛利 2.97 億元,同比增長 68.7%;毛利率為 41.0%,較上年的 56.3% 下降 15.3 個百分點;年內虧損 47.18 億元,同比擴大 59.5%;經調整后凈虧損 31.82 億元,同比擴大 29.1%;研發投入 31.8 億元,同比增長 44.9%。
![]()
從營收情況來看,智譜是一家典型的大模型公司:收入增長很快,但虧損巨大;研發投入仍然非常重,強度達營收的 4.4 倍。此外,智譜的毛利率下降明顯,整體綜合毛利率由 2024 年的 56.3% 降至 41.0%。
收入結構上,智譜 2025 年以本地化部署服務為主。其中,本地化部署服務收入 5.34 億元,同比增長 102.3%,占總收入的 73.7%;云端部署服務收入 1.90 億元,同比增長 292.6%,占比 26.3%。需要注意的是,2025 年智譜這兩種服務模式的毛利率變化不一。云端部署毛利率從上年的 3.3% 提升到 18.9%,改善不小;但本地化部署毛利率則從 66.0% 下降到 48.8%。
![]()
財報中對此的解釋是,云端部署業務主要由于模型推理效率提升、算力規模擴張導致邊際成本遞減,同時價格有所增加;即通過對推理側的極致工程優化,在大幅度降低單位成本的同時,實現了毛利表現的穩健提升;本地化部署業務由于為滿足客戶需求而投入了更多的交付資源。
具體按業務形態與核心產品線來拆分,智譜 2025 年的企業級通用大模型收入 3.66 億元,占比 50.4%;開放平臺及 API 收入 1.90 億元,占比 26.3%;企業級智能體收入 1.66 億元,占比 22.9%;技術服務及其他收入占比低。
![]()
值得一提的是,智譜所有業務收入相較 2024 年均同比增長。其中,企業級通用大模型收入增幅達 70.5%,開放平臺及 API 的收入增幅達 292.6%,企業級智能體收入增幅達 248.8%,技術服務及其他收入增幅達 31.6%。
Token 價值大增,
核心指標直追 Anthropic 水平
“‘智能上界的突破’是這個時代唯一的物理第一性。如果說智能上界決定了技術的定價權,那么 Token 的消耗規模則決定了商業價值的體量。”智譜在財報中稱,其內部推導出了一個簡潔的公式: AGI 商業價值 = 智能上界×Token 消耗規模。2025 年,隨著 GLM 在編程 (Coding) 與智能體 (Agent) 等元場景的深度滲透,智譜付費 Token 消耗量實現了指數級躍遷。憑借 GLM 系列,智譜實現了從開發者生態到全球化 MaaS (Model-as-a-Service) 平臺的全面爆發。
據了解,在稍晚的智譜年度業績發布電話會上,智譜 CEO 張鵬進一步提出了“Token 架構力”(Token Architect)新概念,將 AI 生產力價值定義為“智能調用量 × 智能質量 × 經濟轉化效率”。并且,張鵬表示,“當模型足夠強,API 本身就是最好的商業模式。”
在業務模式上,智譜一直對標 Anthropic。Anthropic 的 CEO Dario Amodei 曾透露,公司 60% 至 75% 的收入來自 API,且明確將編程作為核心用例,因為"企業用例為模型改進提供了更強的激勵"。智譜此次發布的財報中,表演最亮眼的也來自 API 平臺。
財報顯示,截至報告期末,智譜 API 平臺 ARR 實現 17 億元,過去一年提升 60 倍。2025 年推出的 GLM Coding Plan,付費開發者規模突破 24.2 萬。GLM-5 發布后 24 小時內即獲得字節、阿里、騰訊等頭部大廠官方接入,中國前 10 大互聯網公司中已有 9 家深度集成 GLM。2026 年 3 月推出的 Claw Plan 上線僅兩天訂閱用戶即破 10 萬,上線 20 天訂閱用戶突破 40 萬。截至 2026 年 3 月,智譜的平臺注冊企業及用戶突破 400 萬,服務全球超過 218 個國家及地區。
張鵬強調,智譜 API 價格在 2026 年一季度上調 83% 后,市場依然供不應求,調用量增長 400%。在今年第一季度,智譜對 API 價格進行兩次上調。2 月,智譜主動上調價格 30% 并取消首購優惠。
人人都是“Token 架構師”,
告別 App 堆疊
“智譜不是一家傳統意義上的軟件公司,我們是一個以 AGI 為信仰的原生智能實驗室。”在財報中,智譜預測道,2026 年,智能范式將從輕量化的 Vibe Coding(氛圍編程)向工業級的 Agentic Engineering(智能體工程)演變,再進化為具備自主規劃、環境感知與自我迭代能力的數字工程師,最終實現跨越多步迭代、具備邏輯一致性的 Long-horizon Task(長程任務)閉環執行,這將進一步帶來智能上界的突破與 Token 調用的指數級增長。
而當大模型具備長程任務執行的閉環能力后,核心競爭力將重塑為 TAC(Token Architecture Capability, Token 架構能力)。TAC = 智能調用量×智能質量×經濟轉化效率。未來,衡量一個個體或組織價值的標準,不再是掌握了多少信息,而是其作為 Token 架構師,在給定預算下構建復雜 Agent 系統并驅動大模型完成復雜 Agent 系統的自主運行。“智譜的目標是成為提升全社會 TAC 的基礎設施,讓每一滴 Token 都能轉化為可交付的經濟增量。”
![]()
隨著 OpenClaw 等應用驅動的 Token 消耗進入指數級軌道,一場智能輸出革命正在發生。首先是推理再中心化:憑借超大規模集群的規模經濟與極致的推理優化,云端大參數基模的效率將進一步提高。其次高質量 Token 出海。據了解,GLM-5 的國產化適配已超越簡單的算子移植,進入了 Co-design(軟硬協同設計)階段。在底層內核層面,通過 Lightning Indexer 等定制化融合內核與 FlashComm 通信優化,最大限度隱藏了內存訪問與通信延遲,這種深度調優讓 GLM 系列在國產芯片上跑出了比肩國際頂級芯片的推理效率。
進入 2026 年,算力范式正在發生劇變,OpenClaw 的爆發式應用提前引燃了 Token 消耗狂潮。智譜稱,他們將繼續加大投入,尤其是深耕國產芯片的“Day 0”適配與軟硬一體化調優。“我們將推理性能壓榨至極限,不是為了短期盈利,而是為了支撐那條不斷上揚的、高質量 Token 消耗的指數曲線。”
同時,智譜指出,大模型正在吞噬軟件,未來的計算平臺將不再是 App 的堆疊,而是 API 商店與 Agent 矩陣的協同。在 LLM-OS 架構下,模型直接理解模糊意圖、拆解長程任務并調度全棧資源。誰的模型進入了系統內核,誰就掌握了下一代計算的定義權。
https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf
聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。
會議推薦
QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。
今日薦文
你也「在看」嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.