AI應用的商業化,正在從賣軟件、賣會員,延伸到賣Token調用能力。這里的Token,是大模型處理信息的最小信息單元,也是模型API計費、結算和消耗的基礎。隨著調用量放大,Token本身開始像一種“庫存”被采購、路由、拆分、轉售。
華源證券分析師陳良棟在近期發布的傳媒行業專題中,把核心變化概括為:“Token運營正在形成一個新的中間層市場,即探索Token分銷模式,連接上游大模型廠商與下游開發者、企業和個人,本質是全球Token的批發到零售網絡的流動性基礎設施。”
這門生意出現的背景并不復雜:一邊是中國Token調用量快速放大,2024年年初日均調用量為1000億,2025年底升至100萬億,2026年3月突破140萬億;另一邊,國產大模型能力上臺階,在部分榜單和調用量中已經進入全球第一梯隊。需求變大、模型變多,真正卡住交易的環節變成了支付、網絡、接口、合規、渠道和場景落地。
但Token分銷不能簡單理解成“倒賣API額度”。最薄的一層利潤來自轉售利差,更厚的部分來自推理加速、統一接口、企業端Prompt工程、Agent編排、模型選型和業務系統集成。也正因為進入門檻不算高,這個市場的風險同樣直接:競爭加劇、墊資和壞賬、上游模型廠商政策變化,都會壓縮中間層利潤。
Token開始有了“批發商”和“零售商”
Token分銷的基本鏈條包括三類角色。
上游是模型方,包括字節跳動Seedance系列、阿里巴巴Qwen系列、智譜GLM系列、月之暗面Kimi系列、DeepSeek系列等,它們是Token的源頭供給方。
中間是代理平臺,負責承接上游模型資源,再分銷給終端用戶。它的工作不只是轉手賣額度,還要把不同模型的接口協議轉換成統一API格式,讓下游通過一個API Key就能調用多款模型。
下游是實際消耗Token的人,包括個人用戶、開發者、企業客戶,也可能包括下級分銷從業者。
![]()
這個中間層的價值集中在幾個地方:國內直連降低網絡門檻;一套代碼適配多模型;支持個人支付、對公支付;批量采購后可能拿到更低成本;一個平臺聚合GPT、Claude、DeepSeek、Kimi等不同模型,減少開發者反復接入的成本。
所以,Token分銷看起來輕資產,不需要自己訓練大模型,也不需要大規模服務器集群。核心資產變成API中轉調度系統、上游模型資源、渠道客戶和服務能力。
調用量暴漲,是這門生意最直接的燃料
Token運營模式成立,首先要有足夠大的消耗量。
中國日均Token調用量在兩年內從1000億提升到140萬億以上,增長超過千倍。調用量的擴張來自各類垂直Agent落地,也來自企業把生成式AI嵌入更多業務流程。
IDC數據給出的路徑更激進:中國企業活躍智能體數量預計將在2031年突破3.5億,年復合增長率超過135%;隨著智能體任務密度和復雜度提升,智能體Token消耗年均增幅有望超過30倍。
執行類智能體已經能看到這種變化。OpenClaw在OpenRouter平臺的周度Token消耗量,從2026年2月2日至3月16日的0.81T升至4.97T,占比從8.31%提高到24.36%。
Token一旦成為大規模消耗品,圍繞它的采購、計價、路由和結算就會自然分層。模型方未必直接服務每一個客戶,終端客戶也未必愿意逐個接入模型,中間層因此有了空間。
國產模型的性價比,打開Token出海的入口
國產大模型能力提升,是Token分銷從國內走向跨境的關鍵變量。
SuperCLUE數據顯示,字節豆包、DeepSeek系列等國產模型綜合評分已經突破70分,與GPT-5.4、Gemini等海外頭部模型的差距縮小;通義千問、Kimi、智譜GLM等模型也形成了較清晰的梯隊。
OpenRouter數據中,截至2026年5月10日的一周,騰訊Hy3 preview(free)位居調用量榜首;前五、前十、前二十名中,國產大模型分別有2款、6款、9款。
更有標志性的變化發生在2026年一季度。2月9日至15日,中國模型在OpenRouter上的調用量達到4.12萬億Token,首次超過同期美國模型的2.94萬億Token。2月16日至22日,中國模型周調用量進一步升至5.16萬億Token;平臺調用量前五模型中,有四款來自中國廠商,分別為MiniMax M2.5、Kimi K2.5、智譜GLM-5和DeepSeek V3.2,合計貢獻Top5總調用量的85.7%。
![]()
價格優勢也很突出。MiniMax M2.5和GLM 5的輸入價格均為每百萬Token 0.3美元,Claude Opus 4.6為5美元;輸出價格方面,MiniMax M2.5為1.1美元,GLM 5為2.55美元,Claude Opus 4.6為25美元。國產模型在AI Agent、代碼開發等高Token消耗場景中,性價比差異會被持續放大。
全球AI資源不均衡,路由平臺成了“中轉站”
Token分銷不是只解決價格問題,還解決資源錯配。
海外頭部大模型受到地域訪問限制、合規規則和支付門檻影響,無法直接觸達包括中國大陸開發者在內的部分用戶。國產優質大模型走向海外,也會遇到本地化適配、渠道鋪設和用戶獲客難題。
這種不均衡,催生了跨境流轉、聚合路由和分層分銷需求。
OpenRouter已經是一個典型樣本。其平臺處理Token量級從2025年每周5萬億至7萬億,提升到2026年4月每周超過20萬億;2026年年化收入超過5000萬美元,較2025年10月披露的逾1000萬美元年化收入增長約五倍。
國內也有類似平臺。硅基流動是一站式大模型云服務平臺,基于自研推理引擎做高效推理加速,同時提供企業級大模型服務。截至2025年12月,平臺注冊用戶超過900萬,企業用戶超過10000位,上線模型超過150個。
甚至美國政治相關資本也進入這一賽道。2026年5月5日,與特朗普及其家族有密切聯系的加密貨幣公司WLFI攜手WorldClaw推出WorldRouter,整合Claude、GPT、Gemini等超過300款模型,以USD1結算,定價較官方公開費率低約30%。
真正的利潤,不一定在“倒手差價”
Token分銷有三種盈利方式。
第一種是轉售利差。平臺向上游模型廠商批量采購API額度,再向下游客戶加價銷售。OpenRouter在供應商成本上加收約5.5%的溢價,就是這一模式的代表。
第二種是技術溢價。平臺通過自研推理加速引擎降低單Token運行成本,在售價接近甚至低于官方價格時,依靠算力效率差獲取毛利。硅基流動的SiliconLLM與OneDiff技術,將語言模型推理速度提升10倍,文生圖效率提高3倍,使大模型API調用成本低至行業的1/10。
第三種是企業增值服務。企業部署AI的成本并不只在Token單價,還包括Prompt工程、多模型選型、業務系統集成、工作流編排、運維調度和員工AI能力建設。基礎Token價格下降后,這些隱性成本反而更容易成為付費點。
![]()
硅基流動的企業級MaaS平臺就是這一方向:面向企業用戶提供模型訓練調優、部署推理、應用開發支撐三層能力,覆蓋數據處理、模型微調、Prompt工程和RAG等,最終以標準化API形式交付給能源、金融、政府等行業。
營銷、短劇、游戲、電商,是更容易消耗Token的場景
Token分銷要賺錢,最終要落到真實場景。
生成式AI應用正在進入醫療健康、泛交通、工業制造等行業,也開始參與企業決策支持、戰略管理等核心流程。但不少企業的智能化轉型基礎薄弱,數據資產積累不足,算力投入有限,直接部署AI能力并不容易。
相比之下,營銷廣告公司手里已有客戶和場景,涉及短劇、漫劇、游戲、電商等領域,Token消耗需求更直接,也更持續。對這類公司來說,機會不只是轉售模型能力,而是把Token嵌入客戶的內容生成、投放、素材生產、視頻化等流程。
投資線索也沿著兩條主線展開:
一類是具備優質模型能力的公司,包括阿里巴巴、騰訊控股、快手、昆侖萬維、智譜、MiniMax等。風險也很硬:低門檻、要墊資、上游說了算
另一類是具有強Token場景和優質客源的公司,尤其是擁有海外客戶資源和營銷場景、愿意在AI營銷和AI視頻化方向積極布局的公司,包括易點天下、藍色光標等。
Token分銷的商業模式輕,但護城河并不天然深。
同業競爭是第一層風險。分銷業務技術門檻較低,頭部代理商一旦憑借資金、客戶和渠道優勢入場,可能快速復制模式,壓縮利潤空間。
墊資和壞賬是第二層風險。分銷商對下游客戶往往采用月結或季結,但向上游采購API額度時需要墊資。Token消耗規模越大,墊資壓力越大;一旦客戶拖欠,壞賬風險會同步放大。
上游模型廠商政策變化是第三層風險。大模型廠商掌握API價格和接入規則,可能調整價格,也可能收緊第三方接入政策。對中間層來說,這是最難控制的一環。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.