AI行業熱鬧非凡。近日,DeepSeek、騰訊、小米等密集發布新模型,與此同時,人工智能的浪潮正從技術喧囂,轉向產業深處的務實探索。
在北電數智近期舉辦的第二屆酒仙橋論壇上,這一轉變成為與會專家、產業人士關注的核心。不少人士指出,AI的焦點已從實驗室的“炫技”全面走向產業端的“算賬”,智能成本與工程化落地能力,將成為決定下一輪競爭格局的關鍵。
“模型崇拜”已成過去式
過去兩年,參數規模和榜單能力一度被視為衡量大模型實力的重要標尺。但是當前,行業的關注點正在從“模型能力有多大”轉向“技術落地有多穩”。
“人工智能不是虛擬經濟,而是關乎國計民生的實體產業。”北電數智首席技術官謝東指出,當前產業落地的核心堵點,在于傳統架構無法適配AI時代的生產需求,“AI的產業落地不是單點技術的堆疊,而是一項需要全棧協同的復雜系統工程。”
這一觀點得到了中國工程院院士鄭緯民的呼應。在他看來,隨著人工智能邁入“智能體時代”,產業競爭的核心標準已經發生了根本性轉變,從比拼算力集群規模,正在轉向更加關注每瓦Token生產效率、服務穩定性和單位成本產出。
所謂“每瓦Token生產效率”,本質上是衡量單位能耗下系統能夠穩定輸出多少有效Token,它不只取決于芯片算力,還取決于模型結構、顯存利用、批處理策略、KV Cache管理、跨節點通信、調度系統和推理框架優化。
鄭緯民提出,行業正在從以模型調用為中心的MaaS(模型即服務),進一步走向以Token產能、Token成本和Token服務質量為核心計量對象的TaaS(Token即服務)。模型仍是能力基礎,但產業競爭的評價單位,正在從“模型參數與榜單能力”轉向“單位成本下穩定生產高質量Token的能力”。
“未來,TaaS作為智能體時代生產智能的新型工業級服務體系,其目標是讓智能生成能力像水電一樣被穩定調度與供給。”他同時透露,我國Token消耗已從2024年的日均千億級飆升至如今的日均140萬億級,但當前的算力基礎設施主要服務于大模型訓練,實際Token產能受限于系統優化不足,陷入高耗能、低產出等困局。
這意味著,單純堆砌芯片和算力已無法解決現實問題。謝東以北電數智的實踐為例介紹,他們正在通過“數算模用”的全棧工程化創新,解決國產芯片從“能用”到“好用”的工程難題,以及模型部署、推理加速和規模化部署、工程化落地的問題。
每一分成本都要算清楚
隨著智能體“龍蝦”的爆火,巨大的成本消耗催生了“Token經濟學”。
Token是大模型處理文本與多模態信息的基本計量單元,既對應信息輸入輸出,也映射到底層算力、顯存、時延和服務成本。無論是用戶的一句提問,還是智能體執行的一次復雜任務,背后都會轉化為Token的實際消耗。
北電數智CMO楊震拆解了一個更務實的商業邏輯。“現在大家關心的不是模型跑得多快,而是花同樣的錢,能不能享受最穩定的服務。”楊震談道,針對Token生產的不穩定性,北電數智推出了系統級的推理優化方案。
其核心邏輯是解決在高并發推理場景下,系統容易出現的請求排隊、尾延遲升高、顯存抖動、上下文重建、任務重試和服務降級等問題,確保在異構集群中,用戶能獲得高質量、無間斷的API調用體驗。
楊震進一步解釋稱,異構算力調度和推理優化的難點,是“前進”和“寶塔”要解決的核心命題。“前進”把不同集群變成整體系統,從算力層、數據層到智能體層做到系統融合;“寶塔”是做系統級的推理適配,讓單卡或多芯集群提供高質量的API調用,不會出現請求失敗、響應超時、長隊列等待、上下文中斷、任務重試等問題。
目前,AI行業已從早期技術探索階段,進入規模化落地、體系化運營的深水區,企業和產業對AI成本可控、服務穩定、工程化落地的要求進一步放大,“算得清成本、跑得穩服務、落得透場景”成為行業剛需。謝東稱:“AI不能只停留在模型層,必須進入真實世界的生產系統,形成可落地、可復制、可持續的能力體系。”
未來,AI行業的核心競爭力不再是模型參數與算力堆砌,而是能否將算力、數據、模型轉化為穩定、高效、可規模化的真實生產力,這也是人工智能從技術概念走向實體產業、賦能千行百業的必由之路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.