![]()
從技術(shù)路徑、算力密度、降溫方向(液冷)到服務(wù)方案,服務(wù)器行業(yè)有了翻天覆地的變化。它不再是一個(gè)“裝滿顯卡的鐵盒子”,而是一個(gè)集芯片、互聯(lián)、散熱、軟件于一體的復(fù)雜系統(tǒng)。
文|劉青青
ID | BMR2004
當(dāng)AI從“會(huì)聊天”走向“能辦事”,算力的評(píng)價(jià)標(biāo)準(zhǔn)徹底變了。
2026年新年剛過,OpenClaw在全球掀起了智能體應(yīng)用的旋風(fēng),同時(shí)也引爆了Token需求焦慮——不同于傳統(tǒng)對(duì)話式AI,OpenClaw這類自主智能體需要指數(shù)級(jí)增長(zhǎng)的Token消耗。
IDC數(shù)據(jù)指出,到2030年,全球活躍AI智能體將達(dá)22.16億,年度Token消耗量將從2025年的0.0005千萬億Tokens飆升至152667千萬億Tokens——增長(zhǎng)超3億倍。
Token的需求焦慮正倒逼算力基礎(chǔ)設(shè)施的底層變革,浪潮信息首席AI戰(zhàn)略官劉軍判斷,智能體時(shí)代,AI算力的“北極星指標(biāo)”已經(jīng)轉(zhuǎn)移,浮點(diǎn)運(yùn)算能力、算力峰值等正變成商業(yè)決策的噪聲,真正決定輸贏的,只有兩個(gè)指標(biāo):Token速度與Token成本。
2025年9月,浪潮信息(000977.SZ)發(fā)布面向智能體優(yōu)化AI計(jì)算系統(tǒng),讓AI推理進(jìn)入“10毫秒、1塊錢”時(shí)代。如今,更快、更低成本的AI服務(wù)器還在持續(xù)研發(fā)創(chuàng)新,為噴涌的AI算力需求、智能體的規(guī)模化落地構(gòu)筑基石。
與此同時(shí),在AI服務(wù)器之外,浪潮信息全場(chǎng)景的AI智算產(chǎn)品矩陣不斷壯大。浪潮信息數(shù)據(jù)顯示,2025年,公司全球有效專利數(shù)17000+,其中發(fā)明專利占比80%。
從AI服務(wù)器產(chǎn)品到全場(chǎng)景AI智算矩陣,再到“AI+”的行業(yè)解決方案,浪潮信息秉承“計(jì)算力是生產(chǎn)力、智算力是創(chuàng)新力”的理念,推動(dòng)世界智能進(jìn)化。
01
造一臺(tái)AI服務(wù)器
AI服務(wù)器的不斷進(jìn)化,都是為了迎接如今智能體時(shí)代的終極考驗(yàn)。
從為云計(jì)算、數(shù)據(jù)庫、虛擬化、企業(yè)IT設(shè)計(jì)的普通服務(wù)器,到為大模型訓(xùn)練/推理、深度學(xué)習(xí)、算力集群設(shè)計(jì)的AI服務(wù)器,AI服務(wù)器在10年間快速迭代。
早在2016年,AlphaGo戰(zhàn)勝圍棋世界冠軍李世石震驚世界,就讓無數(shù)企業(yè)意識(shí)到了智能時(shí)代即將到來。這一年,浪潮信息提出將“智慧計(jì)算”作為業(yè)務(wù)戰(zhàn)略發(fā)展方向,服務(wù)器開始“加速卡疊加”,GPU作為“計(jì)算外掛”的插件融進(jìn)傳統(tǒng)服務(wù)器。
發(fā)布“智慧計(jì)算”戰(zhàn)略之后,浪潮信息在2017年又明確了其發(fā)展方向,即圍繞“計(jì)算、數(shù)據(jù)、算法”三大支柱,擴(kuò)大計(jì)算生態(tài),推進(jìn)“平臺(tái)+應(yīng)用”深度融合。很快,浪潮信息服務(wù)器實(shí)現(xiàn)變革式創(chuàng)新,2019年推出了第一代真正面向大規(guī)模AI訓(xùn)練的旗艦服務(wù)器——NF5488M5。
據(jù)了解,AI服務(wù)器NF5488M5在業(yè)界首次實(shí)現(xiàn)了4U空間內(nèi)集成8顆通過高速NVSwitch無阻塞全互聯(lián)的最新一代NVIDIA Tesla V100 Tensor Core 32GB GPUs,AI計(jì)算性能可達(dá)每秒1000萬億次。
這也標(biāo)志著AI服務(wù)器從“通用+ GPU”走向AI原生架構(gòu),GPU中心主義+多卡高速互聯(lián)(NVLink單機(jī)高速互聯(lián)、InfiniBand 集群高速通信、PCIe 5.0高速總線)成為主流。值得一提的是,盡管GPU占據(jù)主導(dǎo),但晶圓級(jí)引擎、集成LPU、存內(nèi)計(jì)算、數(shù)據(jù)流架構(gòu)等多元化探索還在繼續(xù)。
2022年,浪潮信息通過“all in液冷”戰(zhàn)略,建成亞洲最大液冷數(shù)據(jù)中心研發(fā)生產(chǎn)基地“天池”。很快,在AI服務(wù)器領(lǐng)域,傳統(tǒng)的風(fēng)冷散熱已經(jīng)走到盡頭,液冷技術(shù)從“可選”變成了“標(biāo)配”。
與此同時(shí),AI服務(wù)器行業(yè)算力密度持續(xù)翻倍。一臺(tái)服務(wù)器可搭載的GPU數(shù)量從早期4卡(4 張GPU)逐步提升至8卡;后來面向功耗極高的超大規(guī)模智算中心,16卡才能滿足超高密訓(xùn)練;如今面向萬億參數(shù)大模型,內(nèi)部高速互聯(lián)的64路超節(jié)點(diǎn)架構(gòu)才能支撐起指數(shù)級(jí)提升的算力需求。
2025年8月,浪潮信息發(fā)布超節(jié)點(diǎn)AI服務(wù)器“元腦SD200”,將64張卡融合成統(tǒng)一內(nèi)存、統(tǒng)一編址的超節(jié)點(diǎn),能同時(shí)運(yùn)行DeepSeek R1、Kimi K2等四大國產(chǎn)開源模型。可以看到,AI服務(wù)器主流架構(gòu)正在經(jīng)歷從“GPU為中心”向“系統(tǒng)級(jí)超節(jié)點(diǎn)”的躍遷。
現(xiàn)在,浪潮信息的一臺(tái)AI服務(wù)器要整合超過10000個(gè)零部件,其中包括50多類專用芯片,涉及30多個(gè)技術(shù)方向,例如材料學(xué)、熱力學(xué)、電池技術(shù)、流體力學(xué)、化學(xué)等一系列學(xué)科。
與此同時(shí),服務(wù)器行業(yè)也已經(jīng)從賣硬件、賣標(biāo)準(zhǔn)化設(shè)備,轉(zhuǎn)向賣算力方案、集群、智算中心、液冷整套系統(tǒng)。
如今的AI服務(wù)器,不再是一個(gè)“裝滿顯卡的鐵盒子”,而是一個(gè)集芯片、互聯(lián)、散熱、軟件于一體的復(fù)雜系統(tǒng)。
02
“10毫秒”時(shí)代與“1塊錢”時(shí)代
對(duì)Token交互速度的考量正在重構(gòu)AI算力系統(tǒng)的價(jià)值評(píng)估體系。
萬億參數(shù)大模型只是AI服務(wù)器過去面臨的挑戰(zhàn),現(xiàn)在AI服務(wù)器要應(yīng)對(duì)的是即將爆發(fā)式增長(zhǎng)的AI智能體。
據(jù)了解,傳統(tǒng)對(duì)話模型像在快餐店點(diǎn)餐——用戶提問,模型回答,交易完成,整個(gè)過程的Token消耗是離散、短暫的。但OpenClaw這類自主智能體,像雇用了一位全天候在崗的數(shù)字員工:它需要拆解目標(biāo)、規(guī)劃步驟、調(diào)用工具、檢查結(jié)果……每一步都在消耗Token,每一輪對(duì)話都在放大成本。
OpenClaw開啟了自主智能體的時(shí)代,但真正支撐“數(shù)字員工”規(guī)模化運(yùn)作的,不是模型排行榜上的分?jǐn)?shù),不是發(fā)布會(huì)PPT上的峰值算力,而是底層基礎(chǔ)設(shè)施對(duì)Token的可持續(xù)供給能力。
劉軍強(qiáng)調(diào),面對(duì)未來Token消耗量指數(shù)級(jí)增長(zhǎng)、復(fù)雜任務(wù)Token需求激增數(shù)十倍的必然趨勢(shì),現(xiàn)有成本水平仍難支撐AI的普惠落地。未來,AI要真正成為如同 “水電煤” 般的基礎(chǔ)資源,Token成本必須在現(xiàn)有基礎(chǔ)上實(shí)現(xiàn)數(shù)量級(jí)跨越,成本能力將從“核心競(jìng)爭(zhēng)力”進(jìn)一步升級(jí)為“生存入場(chǎng)券”,直接決定AI企業(yè)在智能體時(shí)代的生死存亡。
圍繞Token速度與成本重構(gòu)計(jì)算架構(gòu),浪潮信息正圍繞兩個(gè)核心方向進(jìn)行破局。
一是打穿延遲瓶頸,開啟“10毫秒時(shí)代”。元腦SD200超節(jié)點(diǎn)AI服務(wù)器代表著浪潮信息“向上突破”的戰(zhàn)略方向,用極限交互速度解決“能不能算、算得快不快”的問題,為前沿AI探索提供基礎(chǔ)設(shè)施。
對(duì)Token交互速度的考量正在重構(gòu)AI算力系統(tǒng)的價(jià)值評(píng)估體系。當(dāng)前全球主要大模型API服務(wù)商的Token生成速度,基本維持在10—20毫秒,而國內(nèi)的生成速度普遍高于30毫秒。
如今,浪潮信息推出元腦SD200超節(jié)點(diǎn)AI服務(wù)器,實(shí)現(xiàn)DeepSeek R1大模型單Token生成速度低至8.9毫秒,帶動(dòng)國內(nèi)AI服務(wù)器Token生成速度率先進(jìn)入“10毫秒時(shí)代”。
據(jù)介紹,元腦SD200超節(jié)點(diǎn)AI服務(wù)器基于高帶寬、低延時(shí)、原生內(nèi)存語義的開放總線協(xié)議,通過構(gòu)建高性能交換單元打造3D Mesh高性能互連超擴(kuò)展系統(tǒng),支持64張本土AI芯片高密度算力擴(kuò)展,能夠很好地滿足DeepSeek等大模型的低延遲推理需求,加快Token生成速度。
二是擊穿成本底線,開啟“1塊錢時(shí)代”。2025年9月,浪潮信息推出元腦HC1000超擴(kuò)展AI服務(wù)器,將推理成本首次擊穿至1元/百萬Token。元腦HC1000超擴(kuò)展AI服務(wù)器代表著浪潮信息“向下普及”的戰(zhàn)略方向,用極致降低成本解決“用不用得起、能不能規(guī)模化”的問題,推動(dòng)智能體產(chǎn)業(yè)化落地。
據(jù)介紹,元腦HC1000超擴(kuò)展AI服務(wù)器基于全新設(shè)計(jì)的全對(duì)稱DirectCom極速架構(gòu),采用無損超擴(kuò)展設(shè)計(jì),可高效聚合海量本土AI芯片,支持極大推理吞吐量,推理成本大幅拉低,為智能體突破Token成本瓶頸提供極致性能的創(chuàng)新算力系統(tǒng)。
03
“元腦”的“三重奏”
浪潮信息正全面推進(jìn)算力、算法、數(shù)據(jù)和互連技術(shù)的創(chuàng)新,隨著“元腦”品牌的升級(jí)壯大,其也在加速“人工智能+”的落地。
在 “10毫秒、1塊錢”時(shí)代,除了令人矚目的元腦系列AI服務(wù)器產(chǎn)品,浪潮信息還構(gòu)建起涵蓋浪潮計(jì)算產(chǎn)品的“元腦”品牌,以及共建共贏的“元腦生態(tài)”。
在2019年浪潮信息生態(tài)伙伴大會(huì)(IPF大會(huì))上,浪潮信息正式發(fā)布“AI元腦”和“元腦生態(tài)”,即通過“AI元腦”中的AI計(jì)算平臺(tái)、AI資源平臺(tái)、AI算法工具平臺(tái),連接元腦生態(tài)中的“左手伙伴”(技術(shù)型伙伴)和“右手伙伴”(戰(zhàn)略型伙伴、能力型伙伴),并迅速幫助用戶和合作伙伴形成AI原生能力。到2024年,“元腦”全面升級(jí)為包括所有計(jì)算產(chǎn)品的智算品牌,同時(shí)“元腦”也是生態(tài)品牌。
一方面,除了以元腦SD200、元腦HC1000為代表的AI服務(wù)器,浪潮信息的“元腦”品牌還涵蓋全場(chǎng)景的AI智算產(chǎn)品矩陣。
在算力方面,浪潮信息2025年推出了元腦R1推理服務(wù)器,業(yè)界首次實(shí)現(xiàn)單機(jī)支持16張標(biāo)準(zhǔn)PCIe雙寬卡;元腦CPU推理服務(wù)器挖掘通用算力潛能,適配多樣化應(yīng)用場(chǎng)景;2024年與Intel聯(lián)合發(fā)布AI通用服務(wù)器,首款A(yù)I通用服務(wù)器NF8260G7在通用處理器平臺(tái)上首次實(shí)現(xiàn)單機(jī)可運(yùn)行千億參數(shù)“源2.0”大模型。
在算法方面,浪潮信息2024年推出企業(yè)大模型開發(fā)平臺(tái)EPAI(Enterprise Platform of AI)“元腦企智”,為企業(yè)AI大模型落地應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺(tái)。
此外,在存儲(chǔ)層面,浪潮信息發(fā)布高端存儲(chǔ)HF18000G7產(chǎn)品,以創(chuàng)新的元磐架構(gòu)和iTurbo7.0 智能引擎適配多種業(yè)務(wù)規(guī)模和場(chǎng)景。
在網(wǎng)絡(luò)層面,以全新開放網(wǎng)絡(luò)架構(gòu)為突破,面向人工智能場(chǎng)景提供超級(jí)AI以太網(wǎng)、IB網(wǎng)絡(luò)等多樣化的網(wǎng)絡(luò)解決方案,為大模型訓(xùn)練和推理提供領(lǐng)先的AI網(wǎng)絡(luò)性能。
浪潮信息正全面推進(jìn)算力、算法、數(shù)據(jù)和互連技術(shù)的創(chuàng)新,隨著“元腦”品牌的升級(jí)壯大,其也在加速“人工智能+”的落地。
另一方面,浪潮信息“元腦生態(tài)”保持快速增長(zhǎng)。目前,“元腦生態(tài)”已對(duì)接600+算法廠商、8000+系統(tǒng)集成商和分銷商。
早在2019年“元腦”面世時(shí),浪潮信息就發(fā)布“元腦生態(tài)”計(jì)劃,鏈接“左手伙伴”和“右手伙伴”。2021年,“元腦生態(tài)”宣布升級(jí),重點(diǎn)建設(shè)元腦生態(tài)平臺(tái)AI Store,承載“聚合器”和“孵化器”兩大功能,致力于建設(shè)從技術(shù)、方案到交付、服務(wù)的完整生態(tài)。
通過多元的算力供給、全棧的AI Infra軟件棧、豐富的大模型經(jīng)驗(yàn),“元腦生態(tài)”實(shí)現(xiàn)“百模”與“千行”的對(duì)接,已在智能制造、智慧金融、智慧科研等領(lǐng)域成功落地應(yīng)用。
例如,在“元腦生態(tài)+醫(yī)療”領(lǐng)域,佛山市南海區(qū)人民醫(yī)院(以下簡(jiǎn)稱“南海人醫(yī)”)、浪潮信息、廣州天銳醫(yī)健信息科技有限公司(以下簡(jiǎn)稱“天銳醫(yī)健”)三方聯(lián)合,共創(chuàng)基層醫(yī)療智能體。
南海人醫(yī)擁有790萬條真實(shí)病歷,這是一座沉睡的“數(shù)據(jù)金礦”;天銳醫(yī)健懂業(yè)務(wù)、有場(chǎng)景,但缺乏將醫(yī)療數(shù)據(jù)轉(zhuǎn)化為大模型能力的路徑;而浪潮信息提供基礎(chǔ)算力設(shè)施與大模型應(yīng)用開發(fā)平臺(tái)元腦企智EPAl,讓數(shù)據(jù)、業(yè)務(wù)與算力平臺(tái)實(shí)現(xiàn)深度串聯(lián)與協(xié)同,破解大模型醫(yī)療核心落地難題。
數(shù)據(jù)顯示,該基層醫(yī)療智能體助力醫(yī)療導(dǎo)診效率提升20倍,病歷質(zhì)控提速60%,惠及12.67萬億患者。
浪潮信息指出,AI是算法、算力、數(shù)據(jù)、互聯(lián)高度耦合的復(fù)雜系統(tǒng)。浪潮信息的核心戰(zhàn)略在于“以系統(tǒng)為中心”的創(chuàng)新,通過全局優(yōu)化,解決“算得不夠快”“算效不夠高”的挑戰(zhàn)。
與此同時(shí),浪潮信息堅(jiān)信:“AI的終極價(jià)值在于應(yīng)用。中國擁有全球最多元的產(chǎn)業(yè)生態(tài),每一個(gè)領(lǐng)域都蘊(yùn)藏著巨大的AI賦能潛力。因此,我們的核心戰(zhàn)略并非僅僅提供算力硬件,而是深入理解行業(yè)應(yīng)用場(chǎng)景,將技術(shù)與業(yè)務(wù)需求深度融合。”
從AI產(chǎn)品“元腦”,到生態(tài)品牌“元腦”,再到涵蓋所有計(jì)算產(chǎn)品的智算品牌“元腦”,浪 潮信息“元腦”的“三重奏”都踩在AI時(shí)代的節(jié)奏上,助力千行百業(yè)加速AI產(chǎn)業(yè)創(chuàng)新,推動(dòng)世界智能進(jìn)化。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.