網易首頁 > 網易號 > 正文申請入駐

AI從“炫技”轉向“算賬” Token與工程化能力成新硬通貨

2026-05-01 00:40:05　來源: 21世紀經濟報道

廣東舉報

分享至

AI行業熱鬧非凡。近日，DeepSeek、騰訊、小米等密集發布新模型，與此同時，人工智能的浪潮正從技術喧囂，轉向產業深處的務實探索。

在北電數智近期舉辦的第二屆酒仙橋論壇上，這一轉變成為與會專家、產業人士關注的核心。不少人士指出，AI的焦點已從實驗室的“炫技”全面走向產業端的“算賬”，智能成本與工程化落地能力，將成為決定下一輪競爭格局的關鍵。

“模型崇拜”已成過去式

過去兩年，參數規模和榜單能力一度被視為衡量大模型實力的重要標尺。但是當前，行業的關注點正在從“模型能力有多大”轉向“技術落地有多穩”。

“人工智能不是虛擬經濟，而是關乎國計民生的實體產業。”北電數智首席技術官謝東指出，當前產業落地的核心堵點，在于傳統架構無法適配AI時代的生產需求，“AI的產業落地不是單點技術的堆疊，而是一項需要全棧協同的復雜系統工程。”

這一觀點得到了中國工程院院士鄭緯民的呼應。在他看來，隨著人工智能邁入“智能體時代”，產業競爭的核心標準已經發生了根本性轉變，從比拼算力集群規模，正在轉向更加關注每瓦Token生產效率、服務穩定性和單位成本產出。

所謂“每瓦Token生產效率”，本質上是衡量單位能耗下系統能夠穩定輸出多少有效Token，它不只取決于芯片算力，還取決于模型結構、顯存利用、批處理策略、KV Cache管理、跨節點通信、調度系統和推理框架優化。

鄭緯民提出，行業正在從以模型調用為中心的MaaS（模型即服務），進一步走向以Token產能、Token成本和Token服務質量為核心計量對象的TaaS（Token即服務）。模型仍是能力基礎，但產業競爭的評價單位，正在從“模型參數與榜單能力”轉向“單位成本下穩定生產高質量Token的能力”。

“未來，TaaS作為智能體時代生產智能的新型工業級服務體系，其目標是讓智能生成能力像水電一樣被穩定調度與供給。”他同時透露，我國Token消耗已從2024年的日均千億級飆升至如今的日均140萬億級，但當前的算力基礎設施主要服務于大模型訓練，實際Token產能受限于系統優化不足，陷入高耗能、低產出等困局。

這意味著，單純堆砌芯片和算力已無法解決現實問題。謝東以北電數智的實踐為例介紹，他們正在通過“數算模用”的全棧工程化創新，解決國產芯片從“能用”到“好用”的工程難題，以及模型部署、推理加速和規模化部署、工程化落地的問題。

每一分成本都要算清楚

隨著智能體“龍蝦”的爆火，巨大的成本消耗催生了“Token經濟學”。

Token是大模型處理文本與多模態信息的基本計量單元，既對應信息輸入輸出，也映射到底層算力、顯存、時延和服務成本。無論是用戶的一句提問，還是智能體執行的一次復雜任務，背后都會轉化為Token的實際消耗。

北電數智CMO楊震拆解了一個更務實的商業邏輯。“現在大家關心的不是模型跑得多快，而是花同樣的錢，能不能享受最穩定的服務。”楊震談道，針對Token生產的不穩定性，北電數智推出了系統級的推理優化方案。

其核心邏輯是解決在高并發推理場景下，系統容易出現的請求排隊、尾延遲升高、顯存抖動、上下文重建、任務重試和服務降級等問題，確保在異構集群中，用戶能獲得高質量、無間斷的API調用體驗。

楊震進一步解釋稱，異構算力調度和推理優化的難點，是“前進”和“寶塔”要解決的核心命題。“前進”把不同集群變成整體系統，從算力層、數據層到智能體層做到系統融合；“寶塔”是做系統級的推理適配，讓單卡或多芯集群提供高質量的API調用，不會出現請求失敗、響應超時、長隊列等待、上下文中斷、任務重試等問題。

目前，AI行業已從早期技術探索階段，進入規模化落地、體系化運營的深水區，企業和產業對AI成本可控、服務穩定、工程化落地的要求進一步放大，“算得清成本、跑得穩服務、落得透場景”成為行業剛需。謝東稱：“AI不能只停留在模型層，必須進入真實世界的生產系統，形成可落地、可復制、可持續的能力體系。”

未來，AI行業的核心競爭力不再是模型參數與算力堆砌，而是能否將算力、數據、模型轉化為穩定、高效、可規模化的真實生產力，這也是人工智能從技術概念走向實體產業、賦能千行百業的必由之路。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.