網易首頁 > 網易號 > 正文申請入駐

一文讀懂Token經濟學新模式

2026-05-18 16:47:55　來源: 華爾街見聞官方

上海舉報

分享至

AI應用的商業化，正在從賣軟件、賣會員，延伸到賣Token調用能力。這里的Token，是大模型處理信息的最小信息單元，也是模型API計費、結算和消耗的基礎。隨著調用量放大，Token本身開始像一種“庫存”被采購、路由、拆分、轉售。

華源證券分析師陳良棟在近期發布的傳媒行業專題中，把核心變化概括為：“Token運營正在形成一個新的中間層市場，即探索Token分銷模式，連接上游大模型廠商與下游開發者、企業和個人，本質是全球Token的批發到零售網絡的流動性基礎設施。”

這門生意出現的背景并不復雜：一邊是中國Token調用量快速放大，2024年年初日均調用量為1000億，2025年底升至100萬億，2026年3月突破140萬億；另一邊，國產大模型能力上臺階，在部分榜單和調用量中已經進入全球第一梯隊。需求變大、模型變多，真正卡住交易的環節變成了支付、網絡、接口、合規、渠道和場景落地。

但Token分銷不能簡單理解成“倒賣API額度”。最薄的一層利潤來自轉售利差，更厚的部分來自推理加速、統一接口、企業端Prompt工程、Agent編排、模型選型和業務系統集成。也正因為進入門檻不算高，這個市場的風險同樣直接：競爭加劇、墊資和壞賬、上游模型廠商政策變化，都會壓縮中間層利潤。

Token開始有了“批發商”和“零售商”

Token分銷的基本鏈條包括三類角色。

上游是模型方，包括字節跳動Seedance系列、阿里巴巴Qwen系列、智譜GLM系列、月之暗面Kimi系列、DeepSeek系列等，它們是Token的源頭供給方。

中間是代理平臺，負責承接上游模型資源，再分銷給終端用戶。它的工作不只是轉手賣額度，還要把不同模型的接口協議轉換成統一API格式，讓下游通過一個API Key就能調用多款模型。

下游是實際消耗Token的人，包括個人用戶、開發者、企業客戶，也可能包括下級分銷從業者。

這個中間層的價值集中在幾個地方：國內直連降低網絡門檻；一套代碼適配多模型；支持個人支付、對公支付；批量采購后可能拿到更低成本；一個平臺聚合GPT、Claude、DeepSeek、Kimi等不同模型，減少開發者反復接入的成本。

所以，Token分銷看起來輕資產，不需要自己訓練大模型，也不需要大規模服務器集群。核心資產變成API中轉調度系統、上游模型資源、渠道客戶和服務能力。

調用量暴漲，是這門生意最直接的燃料

Token運營模式成立，首先要有足夠大的消耗量。

中國日均Token調用量在兩年內從1000億提升到140萬億以上，增長超過千倍。調用量的擴張來自各類垂直Agent落地，也來自企業把生成式AI嵌入更多業務流程。

IDC數據給出的路徑更激進：中國企業活躍智能體數量預計將在2031年突破3.5億，年復合增長率超過135%；隨著智能體任務密度和復雜度提升，智能體Token消耗年均增幅有望超過30倍。

執行類智能體已經能看到這種變化。OpenClaw在OpenRouter平臺的周度Token消耗量，從2026年2月2日至3月16日的0.81T升至4.97T，占比從8.31%提高到24.36%。

Token一旦成為大規模消耗品，圍繞它的采購、計價、路由和結算就會自然分層。模型方未必直接服務每一個客戶，終端客戶也未必愿意逐個接入模型，中間層因此有了空間。

國產模型的性價比，打開Token出海的入口

國產大模型能力提升，是Token分銷從國內走向跨境的關鍵變量。

SuperCLUE數據顯示，字節豆包、DeepSeek系列等國產模型綜合評分已經突破70分，與GPT-5.4、Gemini等海外頭部模型的差距縮小；通義千問、Kimi、智譜GLM等模型也形成了較清晰的梯隊。

OpenRouter數據中，截至2026年5月10日的一周，騰訊Hy3 preview（free）位居調用量榜首；前五、前十、前二十名中，國產大模型分別有2款、6款、9款。

更有標志性的變化發生在2026年一季度。2月9日至15日，中國模型在OpenRouter上的調用量達到4.12萬億Token，首次超過同期美國模型的2.94萬億Token。2月16日至22日，中國模型周調用量進一步升至5.16萬億Token；平臺調用量前五模型中，有四款來自中國廠商，分別為MiniMax M2.5、Kimi K2.5、智譜GLM-5和DeepSeek V3.2，合計貢獻Top5總調用量的85.7%。

價格優勢也很突出。MiniMax M2.5和GLM 5的輸入價格均為每百萬Token 0.3美元，Claude Opus 4.6為5美元；輸出價格方面，MiniMax M2.5為1.1美元，GLM 5為2.55美元，Claude Opus 4.6為25美元。國產模型在AI Agent、代碼開發等高Token消耗場景中，性價比差異會被持續放大。

全球AI資源不均衡，路由平臺成了“中轉站”

Token分銷不是只解決價格問題，還解決資源錯配。

海外頭部大模型受到地域訪問限制、合規規則和支付門檻影響，無法直接觸達包括中國大陸開發者在內的部分用戶。國產優質大模型走向海外，也會遇到本地化適配、渠道鋪設和用戶獲客難題。

這種不均衡，催生了跨境流轉、聚合路由和分層分銷需求。

OpenRouter已經是一個典型樣本。其平臺處理Token量級從2025年每周5萬億至7萬億，提升到2026年4月每周超過20萬億；2026年年化收入超過5000萬美元，較2025年10月披露的逾1000萬美元年化收入增長約五倍。

國內也有類似平臺。硅基流動是一站式大模型云服務平臺，基于自研推理引擎做高效推理加速，同時提供企業級大模型服務。截至2025年12月，平臺注冊用戶超過900萬，企業用戶超過10000位，上線模型超過150個。

甚至美國政治相關資本也進入這一賽道。2026年5月5日，與特朗普及其家族有密切聯系的加密貨幣公司WLFI攜手WorldClaw推出WorldRouter，整合Claude、GPT、Gemini等超過300款模型，以USD1結算，定價較官方公開費率低約30%。

真正的利潤，不一定在“倒手差價”

Token分銷有三種盈利方式。

第一種是轉售利差。平臺向上游模型廠商批量采購API額度，再向下游客戶加價銷售。OpenRouter在供應商成本上加收約5.5%的溢價，就是這一模式的代表。

第二種是技術溢價。平臺通過自研推理加速引擎降低單Token運行成本，在售價接近甚至低于官方價格時，依靠算力效率差獲取毛利。硅基流動的SiliconLLM與OneDiff技術，將語言模型推理速度提升10倍，文生圖效率提高3倍，使大模型API調用成本低至行業的1/10。

第三種是企業增值服務。企業部署AI的成本并不只在Token單價，還包括Prompt工程、多模型選型、業務系統集成、工作流編排、運維調度和員工AI能力建設。基礎Token價格下降后，這些隱性成本反而更容易成為付費點。

硅基流動的企業級MaaS平臺就是這一方向：面向企業用戶提供模型訓練調優、部署推理、應用開發支撐三層能力，覆蓋數據處理、模型微調、Prompt工程和RAG等，最終以標準化API形式交付給能源、金融、政府等行業。

營銷、短劇、游戲、電商，是更容易消耗Token的場景

Token分銷要賺錢，最終要落到真實場景。

生成式AI應用正在進入醫療健康、泛交通、工業制造等行業，也開始參與企業決策支持、戰略管理等核心流程。但不少企業的智能化轉型基礎薄弱，數據資產積累不足，算力投入有限，直接部署AI能力并不容易。

相比之下，營銷廣告公司手里已有客戶和場景，涉及短劇、漫劇、游戲、電商等領域，Token消耗需求更直接，也更持續。對這類公司來說，機會不只是轉售模型能力，而是把Token嵌入客戶的內容生成、投放、素材生產、視頻化等流程。

投資線索也沿著兩條主線展開：

一類是具備優質模型能力的公司，包括阿里巴巴、騰訊控股、快手、昆侖萬維、智譜、MiniMax等。
另一類是具有強Token場景和優質客源的公司，尤其是擁有海外客戶資源和營銷場景、愿意在AI營銷和AI視頻化方向積極布局的公司，包括易點天下、藍色光標等。

風險也很硬：低門檻、要墊資、上游說了算

Token分銷的商業模式輕，但護城河并不天然深。

同業競爭是第一層風險。分銷業務技術門檻較低，頭部代理商一旦憑借資金、客戶和渠道優勢入場，可能快速復制模式，壓縮利潤空間。

墊資和壞賬是第二層風險。分銷商對下游客戶往往采用月結或季結，但向上游采購API額度時需要墊資。Token消耗規模越大，墊資壓力越大；一旦客戶拖欠，壞賬風險會同步放大。

上游模型廠商政策變化是第三層風險。大模型廠商掌握API價格和接入規則，可能調整價格，也可能收緊第三方接入政策。對中間層來說，這是最難控制的一環。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.