![]()
過(guò)去五個(gè)月,阿里云的MaaS收入增長(zhǎng)了15倍,這只是阿里云重構(gòu)自己的一個(gè)側(cè)面。阿里云在峰會(huì)上宣布完成"芯片-云-模型-推理"全棧Agent化升級(jí),同步推出全新AI產(chǎn)品官網(wǎng)"千問(wèn)云"、搭載自研AI芯片真武M890的超節(jié)點(diǎn)服務(wù)器,以及最新旗艦?zāi)P蚎wen3.7-Max。
用阿里云資深副總裁劉偉光的話(huà)說(shuō):"我們正在建設(shè)中國(guó)最大的AI工廠。"工廠這個(gè)比喻暗示了一套完整的生產(chǎn)邏輯,片是原材料,云是車(chē)間,模型是機(jī)器,推理平臺(tái)是流水線(xiàn),最終產(chǎn)出的商品是Token。
而這次重構(gòu)的本質(zhì),是把過(guò)去17年圍繞"人使用云"搭建的整套體系,改造成"Agent消費(fèi)Token"的新體系。
芯片這張牌,為什么現(xiàn)在打
阿里云過(guò)去很少在公開(kāi)場(chǎng)合強(qiáng)調(diào)芯片。這次峰會(huì),不僅發(fā)布了新一代訓(xùn)推一體AI芯片真武M890,還破天荒地公布了未來(lái)兩年的芯片路線(xiàn)圖,真武V900、真武J900兩代產(chǎn)品逐年推進(jìn)。
真武M890配備144GB顯存,片間互聯(lián)帶寬800GB/s,性能是上一代真武810E的3倍,搭配自研的ICN Switch互聯(lián)芯片,128張AI芯片可以組成一臺(tái)機(jī)器,P2P時(shí)延壓到150納秒以?xún)?nèi)
但參數(shù)之外,更關(guān)鍵的信息是規(guī)模,真武系列累計(jì)出貨56萬(wàn)片,已經(jīng)進(jìn)入電信、一汽、浦發(fā)銀行等20多個(gè)行業(yè)的400多家客戶(hù)。
![]()
劉偉光反復(fù)用谷歌做類(lèi)比,谷歌TPU和Gemini的深度綁定,讓谷歌在自家框架里跑出了最優(yōu)的性?xún)r(jià)比。阿里云當(dāng)然想走同樣的路,他把競(jìng)爭(zhēng)邏輯歸結(jié)為一句話(huà):"如果未來(lái)拼的是每一塊芯片都能跑出比競(jìng)爭(zhēng)對(duì)手更多的高質(zhì)量Token,那我們就勝利了。"
再加上倚天CPU、磐脈智能網(wǎng)卡、鎮(zhèn)岳存儲(chǔ)主控芯片,平頭哥的芯片版圖已經(jīng)從單點(diǎn)延伸到了算力、網(wǎng)絡(luò)、存儲(chǔ)的完整覆蓋。當(dāng)推理需求指數(shù)級(jí)膨脹的時(shí)候,只有把芯片握在自己手里,才能控制住每個(gè)Token的邊際成本。
道理不復(fù)雜。模型公司可以比拼參數(shù),云廠商最終比的是誰(shuí)的Token更便宜、更穩(wěn)定、更快。芯片是這場(chǎng)成本戰(zhàn)的起點(diǎn)。
云本身也得重寫(xiě)
芯片解決的是"跑得動(dòng)"的問(wèn)題,但Agent對(duì)云的需求遠(yuǎn)不止算力。
傳統(tǒng)云產(chǎn)品的交互邏輯是給人設(shè)計(jì)的,打開(kāi)控制臺(tái),看菜單,配參數(shù),點(diǎn)按鈕。這套東西對(duì)Agent來(lái)說(shuō)完全不可用,Agent不看網(wǎng)頁(yè),不點(diǎn)按鈕,它需要的是結(jié)構(gòu)化的能力描述、標(biāo)準(zhǔn)化的調(diào)用協(xié)議和可預(yù)期的反饋。
阿里云CTO李飛飛用一組對(duì)比來(lái)說(shuō)明問(wèn)題:傳統(tǒng)云的工作負(fù)載是穩(wěn)態(tài)的,一臺(tái)ECS開(kāi)出來(lái)可能跑幾個(gè)月甚至幾年;但Agent的工作負(fù)載是"無(wú)規(guī)律彈性、短生命周期、瞬時(shí)起量即走",一個(gè)Agent執(zhí)行完任務(wù),沙箱就銷(xiāo)毀了,下一個(gè)請(qǐng)求可能幾毫秒后就來(lái),也可能幾小時(shí)后才來(lái)。
為此,阿里云做了三件事。
第一,把云產(chǎn)品Skill化、MCP化和CLI化。簡(jiǎn)單說(shuō)就是把每個(gè)云產(chǎn)品封裝成Agent可以直接調(diào)用的標(biāo)準(zhǔn)化接口,像調(diào)函數(shù)一樣調(diào)云。
第二,為Agent構(gòu)建專(zhuān)屬的運(yùn)行環(huán)境——輕量沙箱、多Agent協(xié)同、跨任務(wù)記憶、數(shù)據(jù)流轉(zhuǎn)通路。
第三,重建調(diào)度邏輯,從"資源調(diào)度"轉(zhuǎn)向"任務(wù)調(diào)度",因?yàn)楫?dāng)海量Agent同時(shí)并發(fā)的時(shí)候,傳統(tǒng)的資源編排方式扛不住。
劉偉光表示,一些AI應(yīng)用上線(xiàn)后,會(huì)自動(dòng)在后臺(tái)開(kāi)通云資源——虛擬機(jī)、數(shù)據(jù)庫(kù)實(shí)例、沙箱環(huán)境,全程不需要人介入,一個(gè)客戶(hù)一天內(nèi)自動(dòng)開(kāi)通的資源量,相當(dāng)于過(guò)去人工操作兩周。
"這已經(jīng)等于說(shuō)Agent在自己使用云了。"劉偉光給出了一個(gè)內(nèi)部測(cè)算的換算關(guān)系:Token消耗可以按比例折算成GPU用量,而每一卡GPU的增長(zhǎng),大致帶動(dòng)一比一的CPU增長(zhǎng)。也就是說(shuō),Token收入的增長(zhǎng)不是在蠶食傳統(tǒng)云收入,而是在拉動(dòng)它,前提是云平臺(tái)能夠接得住Agent的工作負(fù)載。
因此,阿里云不是在原來(lái)的體系上加一層AI能力,而是從交互方式、調(diào)度邏輯、計(jì)費(fèi)模型到產(chǎn)品形態(tài)全部推翻重來(lái)。
模型不是用來(lái)聊天的
全棧重構(gòu)的第三層是模型。Qwen3.7-Max在Arena全球盲測(cè)總榜中排到了國(guó)產(chǎn)第一,超過(guò)Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,這次發(fā)布的重點(diǎn),是阿里對(duì)模型能力方向的重新定義。
阿里巴巴通義大模型負(fù)責(zé)人周靖人表示,"過(guò)去我們追求模型'說(shuō)得好',現(xiàn)在要求模型'做得到'。"
![]()
以阿里云在芯片的實(shí)踐來(lái)看,在訓(xùn)練時(shí)從未接觸過(guò)的真武M890芯片上,Qwen3.7-Max僅憑一份任務(wù)說(shuō)明,從零開(kāi)始自主工作了35個(gè)小時(shí),獨(dú)立完成了一個(gè)生產(chǎn)級(jí)AI計(jì)算內(nèi)核的編寫(xiě)和調(diào)優(yōu),最終性能比官方版本提升了10倍,整個(gè)過(guò)程沒(méi)有人類(lèi)干預(yù),沒(méi)有中間指導(dǎo)。
這說(shuō)明了模型在Agent場(chǎng)景下的核心能力,長(zhǎng)程自主執(zhí)行,接過(guò)一個(gè)任務(wù),自己拆解、自己規(guī)劃、自己寫(xiě)代碼、自己調(diào)試,連續(xù)干35個(gè)小時(shí)不停。
為了支撐這種級(jí)別的推理需求,百煉平臺(tái)也做了對(duì)應(yīng)升級(jí),并池調(diào)度提升GPU利用率,上下文緩存消除重復(fù)計(jì)算,吞吐彈性調(diào)度應(yīng)對(duì)并發(fā)波峰。
在生態(tài)上,百煉保持開(kāi)放接入,除了千問(wèn)模型矩陣,還上線(xiàn)了智譜GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6等第三方模型。
劉偉光提到,"客戶(hù)在實(shí)際使用中不會(huì)只用一個(gè)模型,是多模型組合。我們提供組合,客戶(hù)在平臺(tái)上找到最適合自己的搭配。"峰會(huì)現(xiàn)場(chǎng),六家國(guó)內(nèi)頭部模型公司的高管集體站臺(tái),場(chǎng)面頗有"國(guó)內(nèi)AI聯(lián)盟"的意味。
近三個(gè)月內(nèi),千問(wèn)旗艦?zāi)P瓦B續(xù)迭代了3.5、3.6、3.7三個(gè)版本。這個(gè)發(fā)布節(jié)奏本身就在傳遞信號(hào),模型能力的競(jìng)賽遠(yuǎn)沒(méi)有結(jié)束,而阿里打算用自研芯片+自研模型的縱向整合來(lái)建立長(zhǎng)期優(yōu)勢(shì)。
這場(chǎng)重構(gòu)的真正賭注
回過(guò)頭來(lái)看,阿里云這次全棧重構(gòu)的底層邏輯簡(jiǎn)單純粹,當(dāng)AI收入的增長(zhǎng)速度遠(yuǎn)超傳統(tǒng)云業(yè)務(wù),當(dāng)Token有可能取代ECS成為最大的產(chǎn)品線(xiàn),當(dāng)Agent開(kāi)始自動(dòng)開(kāi)通云資源而不再需要人類(lèi)登錄控制臺(tái),整套為人設(shè)計(jì)的技術(shù)體系就到了不得不改的時(shí)候。
但執(zhí)行層面的難度是另一回事。劉偉光自己也承認(rèn),轉(zhuǎn)型"說(shuō)起來(lái)容易,做起來(lái)非常難"。過(guò)去銷(xiāo)售團(tuán)隊(duì)跟客戶(hù)的IT部門(mén)打交道,現(xiàn)在做MaaS要跟業(yè)務(wù)部門(mén)甚至CEO對(duì)話(huà),
"你的對(duì)話(huà)能力、閱歷,完全是另一個(gè)層次的要求"。阿里云已經(jīng)在大客戶(hù)上設(shè)立了專(zhuān)職的MaaS銷(xiāo)售,與傳統(tǒng)IaaS銷(xiāo)售分開(kāi)考核、獨(dú)立作戰(zhàn)。
考核指標(biāo)也在變,不再只看調(diào)用量,而是看"高質(zhì)量Token",解決實(shí)際問(wèn)題的Token,而不是灌水聊天的Token。三個(gè)核心指標(biāo):付費(fèi)客戶(hù)數(shù)的日增長(zhǎng)、核心業(yè)務(wù)系統(tǒng)接入模型的數(shù)量、Agent自主完成任務(wù)閉環(huán)的效率。
這些組織和機(jī)制層面的調(diào)整,往往比技術(shù)發(fā)布更能說(shuō)明一家公司的真實(shí)判斷,阿里云要重建收入結(jié)構(gòu)、客戶(hù)關(guān)系和銷(xiāo)售體系。劉偉光表示,"以前我們做云的時(shí)候,客戶(hù)的IT預(yù)算是能算出來(lái)的,線(xiàn)下多少臺(tái)服務(wù)器,搬上來(lái)大概多少錢(qián),能看到題目。但做MaaS,這個(gè)題的答案你是不知道的,進(jìn)去之后可能超乎你的想象。"
題目看不到了,答案也不確定,但阿里云還是決定把整套體系拆開(kāi)重寫(xiě),因?yàn)槲ㄒ淮_定的是,AI是比以往大上十倍甚至百倍的機(jī)會(huì)。
這大概就是這次峰會(huì)最值得關(guān)注的信息:不是哪款芯片多出算力,哪個(gè)模型排名第幾,而是中國(guó)最大的云廠商,正在用一種接近創(chuàng)業(yè)公司的激進(jìn)姿態(tài),賭一個(gè)它認(rèn)定會(huì)到來(lái)的未來(lái)。(本文作者 | 張帥,編輯 | 楊林)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.