網易首頁 > 網易號 > 正文申請入駐

智譜AI財報炸場，Token價值暴漲、核心指標直追Anthropic水平！CEO張鵬：人人都將是“Token架構師

2026-04-01 14:58:23　來源: AI前線

北京舉報

分享至

整理｜華衛

昨日，智譜交出了 2025 年度業績報告，這是其上市近三個月后的首份年度財報。今年 1 月 8 日，智譜登陸港交所，股價從發行價 116.2 港元一度沖至近 700 港元，目前市值超 3000 億港元。

這份業績報告喜憂參半，其收入激增但亦被分析師評增長低于預期，且綜合毛利率不佳。智譜表示，公司預計通過收入增長和提升運營效率實現盈利，但尚未給出具體時間表。智譜還在財報中傳達了一個信號，將繼續加大投資，增加國產芯片在訓練模型中的使用。

營收翻倍增長，虧損同比擴大

財報顯示，智譜 2025 年營收 7.24 億元，同比增長 131.9%；毛利 2.97 億元，同比增長 68.7%；毛利率為 41.0%，較上年的 56.3% 下降 15.3 個百分點；年內虧損 47.18 億元，同比擴大 59.5%；經調整后凈虧損 31.82 億元，同比擴大 29.1%；研發投入 31.8 億元，同比增長 44.9%。

從營收情況來看，智譜是一家典型的大模型公司：收入增長很快，但虧損巨大；研發投入仍然非常重，強度達營收的 4.4 倍。此外，智譜的毛利率下降明顯，整體綜合毛利率由 2024 年的 56.3% 降至 41.0%。

收入結構上，智譜 2025 年以本地化部署服務為主。其中，本地化部署服務收入 5.34 億元，同比增長 102.3%，占總收入的 73.7%；云端部署服務收入 1.90 億元，同比增長 292.6%，占比 26.3%。需要注意的是，2025 年智譜這兩種服務模式的毛利率變化不一。云端部署毛利率從上年的 3.3% 提升到 18.9%，改善不小；但本地化部署毛利率則從 66.0% 下降到 48.8%。

財報中對此的解釋是，云端部署業務主要由于模型推理效率提升、算力規模擴張導致邊際成本遞減，同時價格有所增加；即通過對推理側的極致工程優化，在大幅度降低單位成本的同時，實現了毛利表現的穩健提升；本地化部署業務由于為滿足客戶需求而投入了更多的交付資源。

具體按業務形態與核心產品線來拆分，智譜 2025 年的企業級通用大模型收入 3.66 億元，占比 50.4%；開放平臺及 API 收入 1.90 億元，占比 26.3%；企業級智能體收入 1.66 億元，占比 22.9%；技術服務及其他收入占比低。

值得一提的是，智譜所有業務收入相較 2024 年均同比增長。其中，企業級通用大模型收入增幅達 70.5%，開放平臺及 API 的收入增幅達 292.6%，企業級智能體收入增幅達 248.8%，技術服務及其他收入增幅達 31.6%。

Token 價值大增，

核心指標直追 Anthropic 水平

“‘智能上界的突破’是這個時代唯一的物理第一性。如果說智能上界決定了技術的定價權，那么 Token 的消耗規模則決定了商業價值的體量。”智譜在財報中稱，其內部推導出了一個簡潔的公式： AGI 商業價值 = 智能上界×Token 消耗規模。2025 年，隨著 GLM 在編程 (Coding) 與智能體 (Agent) 等元場景的深度滲透，智譜付費 Token 消耗量實現了指數級躍遷。憑借 GLM 系列，智譜實現了從開發者生態到全球化 MaaS (Model-as-a-Service) 平臺的全面爆發。

據了解，在稍晚的智譜年度業績發布電話會上，智譜 CEO 張鵬進一步提出了“Token 架構力”（Token Architect）新概念，將 AI 生產力價值定義為“智能調用量 × 智能質量 × 經濟轉化效率”。并且，張鵬表示，“當模型足夠強，API 本身就是最好的商業模式。”

在業務模式上，智譜一直對標 Anthropic。Anthropic 的 CEO Dario Amodei 曾透露，公司 60% 至 75% 的收入來自 API，且明確將編程作為核心用例，因為"企業用例為模型改進提供了更強的激勵"。智譜此次發布的財報中，表演最亮眼的也來自 API 平臺。

財報顯示，截至報告期末，智譜 API 平臺 ARR 實現 17 億元，過去一年提升 60 倍。2025 年推出的 GLM Coding Plan，付費開發者規模突破 24.2 萬。GLM-5 發布后 24 小時內即獲得字節、阿里、騰訊等頭部大廠官方接入，中國前 10 大互聯網公司中已有 9 家深度集成 GLM。2026 年 3 月推出的 Claw Plan 上線僅兩天訂閱用戶即破 10 萬，上線 20 天訂閱用戶突破 40 萬。截至 2026 年 3 月，智譜的平臺注冊企業及用戶突破 400 萬，服務全球超過 218 個國家及地區。

張鵬強調，智譜 API 價格在 2026 年一季度上調 83% 后，市場依然供不應求，調用量增長 400%。在今年第一季度，智譜對 API 價格進行兩次上調。2 月，智譜主動上調價格 30% 并取消首購優惠。

人人都是“Token 架構師”，

告別 App 堆疊

“智譜不是一家傳統意義上的軟件公司，我們是一個以 AGI 為信仰的原生智能實驗室。”在財報中，智譜預測道，2026 年，智能范式將從輕量化的 Vibe Coding（氛圍編程）向工業級的 Agentic Engineering（智能體工程）演變，再進化為具備自主規劃、環境感知與自我迭代能力的數字工程師，最終實現跨越多步迭代、具備邏輯一致性的 Long-horizon Task（長程任務）閉環執行，這將進一步帶來智能上界的突破與 Token 調用的指數級增長。

而當大模型具備長程任務執行的閉環能力后，核心競爭力將重塑為 TAC（Token Architecture Capability, Token 架構能力）。TAC = 智能調用量×智能質量×經濟轉化效率。未來，衡量一個個體或組織價值的標準，不再是掌握了多少信息，而是其作為 Token 架構師，在給定預算下構建復雜 Agent 系統并驅動大模型完成復雜 Agent 系統的自主運行。“智譜的目標是成為提升全社會 TAC 的基礎設施，讓每一滴 Token 都能轉化為可交付的經濟增量。”

隨著 OpenClaw 等應用驅動的 Token 消耗進入指數級軌道，一場智能輸出革命正在發生。首先是推理再中心化：憑借超大規模集群的規模經濟與極致的推理優化，云端大參數基模的效率將進一步提高。其次高質量 Token 出海。據了解，GLM-5 的國產化適配已超越簡單的算子移植，進入了 Co-design（軟硬協同設計）階段。在底層內核層面，通過 Lightning Indexer 等定制化融合內核與 FlashComm 通信優化，最大限度隱藏了內存訪問與通信延遲，這種深度調優讓 GLM 系列在國產芯片上跑出了比肩國際頂級芯片的推理效率。

進入 2026 年，算力范式正在發生劇變，OpenClaw 的爆發式應用提前引燃了 Token 消耗狂潮。智譜稱，他們將繼續加大投入，尤其是深耕國產芯片的“Day 0”適配與軟硬一體化調優。“我們將推理性能壓榨至極限，不是為了短期盈利，而是為了支撐那條不斷上揚的、高質量 Token 消耗的指數曲線。”

同時，智譜指出，大模型正在吞噬軟件，未來的計算平臺將不再是 App 的堆疊，而是 API 商店與 Agent 矩陣的協同。在 LLM-OS 架構下，模型直接理解模糊意圖、拆解長程任務并調度全棧資源。誰的模型進入了系統內核，誰就掌握了下一代計算的定義權。

https://www1.hkexnews.hk/listedco/listconews/sehk/2026/0331/2026033101550_c.pdf

聲明：本文為 AI 前線整理，不代表平臺觀點，未經許可禁止轉載。

會議推薦

QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題，聚焦 100+ 重磅議題，匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家，圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

今日薦文

你也「在看」嗎？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.