2026年初,中國AI芯片戰(zhàn)場進(jìn)入群雄并起、優(yōu)勝劣汰的關(guān)鍵階段。
隨著阿里發(fā)布真武810E PPU,并披露其已在阿里云部署16000卡國產(chǎn)萬卡集群,一場圍繞“誰真正掌握AI時代底層話語權(quán)”的較量,已走向商業(yè)落地的生死線。
就在2025年,昇騰因“盤古大模型套殼Qwen”陷入輿論風(fēng)暴;龍芯在默默推進(jìn)其全自研GPGPU;以寒武紀(jì)、摩爾線程、沐曦股份、壁仞科技、天數(shù)智芯為代表的國產(chǎn)GPU/ASIC陣營,則在資本與政策的雙重驅(qū)動下加速商業(yè)化。
這不再是簡單的芯片性能比拼,而是一場架構(gòu)、軟件、盈利模式與產(chǎn)業(yè)政策的多維博弈。
![]()
公司
芯片類型
核心特點
阿里
PPU
框架原生兼容,無需改代碼,訓(xùn)推一體
昇騰
ASIC
推理高效,訓(xùn)練脆弱,CANN生態(tài)封閉
寒武紀(jì)
ASIC
聚焦推理,訓(xùn)練脆弱,已實現(xiàn)盈利
摩爾
沐曦
壁仞
天數(shù)
GPGPU
圖形+AI,兼容CUDA,尚處虧損期
龍芯
GPGPU
完全自研GPU,無CUDA依賴,性能入門級
阿里真武效法谷歌模式
阿里真武810E的發(fā)布,標(biāo)志著國產(chǎn)AI芯片的一條新路徑:它沒有選擇在硬件架構(gòu)上死磕英偉達(dá),而是試圖用軟件去“架空”CUDA的壁壘。
不同于以往國產(chǎn)芯片往往要求開發(fā)者去適應(yīng)硬件、“學(xué)方言”改代碼的痛苦過程,真武810E走的是一條“軟件遷就人”的路子。它通過編譯器層面的深度兼容,讓大多數(shù)基于主流框架(如PyTorch)開發(fā)的模型,幾乎不需要改動就能直接運行。
這種“拿來即用”的兼容性,相比昇騰CANN生態(tài)那種需要開發(fā)者深度介入、手動適配算子的“硬門檻”,在商業(yè)落地上顯然更具親和力。
從硬件本身來看,96GB HBM2e顯存和700GB/s的互聯(lián)帶寬,保證了它在處理大模型時的吞吐能力。
更關(guān)鍵的是,它的核心設(shè)計不再是固定的專用電路,而是靈活的通用計算陣列。
這意味著當(dāng)新的AI算法出現(xiàn)時,它不需要重新設(shè)計芯片,往往只需要升級一下編譯器軟件就能支持。
但真武真正的護(hù)城河,其實不在芯片本身,而在其背后的“全棧生態(tài)”。
放眼全球,能同時把“算力芯片+云基礎(chǔ)設(shè)施+大模型”這三塊核心拼圖湊齊的,除了谷歌(TPU + Google Cloud + Gemini),也就只有阿里(真武 + 阿里云 + 千問)。
這一點至關(guān)重要。
當(dāng)其他廠商還在賣“裸芯片”、讓客戶自己去摸索適配時,阿里賣的其實是“已經(jīng)驗證過的算力服務(wù)”。
Qwen作為目前國產(chǎn)第一梯隊的開源模型,已經(jīng)在真武芯片上跑通了每一個細(xì)節(jié)。這種“用自家模型,驗證自家芯片”的模式,才是阿里真正的底氣。
它讓真武810E既保留了GPGPU的通用性,又擁有了類似谷歌TPU那樣的垂直整合效率。
![]()
昇騰寒武紀(jì)推理有余訓(xùn)練不足
阿里真武正在進(jìn)行“通才”路線,那么昇騰910B和寒武紀(jì)則更像是一個極端的“特長生”。
昇騰的核心設(shè)計邏輯是“為了特定考題而生”。在處理標(biāo)準(zhǔn)化的、固定的AI任務(wù)(如推理)時,它的效率高,能追平英偉達(dá)。但這種極致的專用性,也帶來了致命的弱點——它太“硬”了,缺乏變通。
本質(zhì)上說,昇騰和寒武紀(jì)這類ASIC,就是以犧牲通用性能,換取特定場景的專用性能。
AI算法的迭代速度是以月為單位的。
當(dāng)DeepSeek、GLM、Qwen、Kimi等新模型采用了最新的算法架構(gòu)(如MoE、稀疏注意力)時,昇騰固化的硬件單元往往無法直接支持。
這就好比試卷上的題型變了,但這名考生只會背標(biāo)準(zhǔn)答案。
結(jié)果就是,為了運行新模型,開發(fā)者必須手動編寫大量底層代碼(算子)來填坑,或者被迫讓芯片切換到低效的通用模式,導(dǎo)致性能出現(xiàn)斷崖式下跌。
此外,在構(gòu)建萬卡集群進(jìn)行大規(guī)模訓(xùn)練時,昇騰也暴露出了短板。相比于英偉達(dá)成熟的連接技術(shù),昇騰在大規(guī)模并聯(lián)時的通信穩(wěn)定性仍有差距,頻繁的故障和崩潰,讓它在訓(xùn)練超大模型時顯得力不從心。
這就是所謂的“ASIC剛性陷阱”:它在推理應(yīng)用上能做到極致的性價比,但在需要靈活應(yīng)變的訓(xùn)練和渲染場景中,卻因為“偏科”而難以勝任。
2025年的“盤古套殼”風(fēng)波,本質(zhì)上就是因為自家AI芯片難以適應(yīng)新算法的訓(xùn)練需求,團隊才不得已使用了英偉達(dá)GPU和千問——這與其說是道德問題,不如說是技術(shù)路線帶來的無奈。
無獨有偶,寒武紀(jì)同樣存在“ASIC剛性陷阱”,寒武紀(jì)聚焦高性能推理場景,具備能效比高優(yōu)勢,適合推理密集型客戶。
不過,寒武紀(jì)短板也明顯,那就是通用性弱,無法用于訓(xùn)練或圖形渲染,長期面臨PPU/GPGPU的生態(tài)擠壓。
值得一提的是,寒武紀(jì)已經(jīng)具備自我造血能力,而不是完全依然風(fēng)投燒錢。2025年營收突破60億元,凈利潤突破16億元,成為國產(chǎn)AI芯片中唯一規(guī)模化盈利企業(yè)。
![]()
國產(chǎn)GPU缺乏人無我有的殺手級應(yīng)用
摩爾線程、沐曦、壁仞、天數(shù)智芯均為GPGPU架構(gòu),兼容CUDA,試圖復(fù)刻英偉達(dá)路徑。
在技術(shù)來源上,不乏技術(shù)引進(jìn)的底色,比如摩爾線程、壁仞的GPU IP就源自Imagination公司的授權(quán)。
摩爾線程主打全功能GPU,覆蓋AI、圖形、游戲,2025年營收約15億元,虧損約10億元。三年累計虧損額約59億。
沐曦專注數(shù)據(jù)中心GPU,2025年營收約16億元,虧損約7億元。三年累計虧損額30.57億。
壁仞科技高舉高打,PPT很漂亮,但商業(yè)化緩慢。2025年上半年營收5890.3萬,凈虧損約5.5億。三年累計虧損47.5億。
天數(shù)智芯2025年上半年營收3.24億,凈虧損約6億。3年累計虧損28.72億。
這幾家公司的共同特點是共同特點是高研發(fā)投入、強兼容性(支持CUDA)、但尚未盈利。它們的規(guī)劃藍(lán)圖也如出一轍,那就是只要產(chǎn)業(yè)生態(tài)做起來,未來可對標(biāo)英偉達(dá)A100。
不過,面對真武810E的框架原生路線,這些廠商仍需解決一個根本問題——CUDA兼容≠市場盈利。沒有殺手級應(yīng)用場景和頭部客戶背書,僅靠硬件參數(shù)和兼容CUDA難以突圍。
![]()
龍芯GPU另辟蹊徑專注細(xì)分市場
龍芯GPU完全自研,不依賴任何國外IP。其FP32算力約1.5 TFLOPS,INT8 AI算力約32 TOPS,性能相當(dāng)于GTX 1050,雖落性能大幅落后于真武,但在保密辦公、工控、邊緣終端等場景具備不可替代性。
其軟件棧基于OpenCL,并初步適配PyTorch。真正的價值在于絕對安全可控——這是英偉達(dá)、摩爾線程等GPU都無法提供的。
未來若能將GPGPU集成進(jìn)CPU(如龍芯7000系列SoC),有望在端側(cè)小模型場景中占據(jù)一席之地。
![]()
從資本狂歡到盈利分水嶺
2025年是中國AI芯片的分化之年。
正所謂幾家歡喜幾家愁,有人彈冠相慶,有人黯然神傷。
阿里憑借千問+阿里云+真武,已構(gòu)建AI全棧閉環(huán):
真武810E已在青海聯(lián)通部署16000卡綠色智算集群;
服務(wù)小鵬、國家電網(wǎng)、中科院等400+客戶;
Qwen開源模型衍生超20萬個,下載破10億次,反哺芯片適配。
阿里不賣芯片,只賣算力的模式,規(guī)避了生態(tài)冷啟動難題,直接綁定高價值客戶。不僅在技術(shù)上實現(xiàn)全棧閉環(huán),在商業(yè)上也實現(xiàn)了正循環(huán)。
寒武紀(jì)是當(dāng)下國產(chǎn)AI芯片中唯一規(guī)模化盈利企業(yè),穩(wěn)坐ASIC陣營AI芯片頭把交椅,用實際行動證明垂直場景+高能效比+政策紅利仍是可行路徑。
摩爾線程、沐曦、壁仞、天數(shù)智芯在資本市場備受追捧,且有美國英偉達(dá)GPGPU禁令倒逼下的國產(chǎn)替代推波助瀾,但若不能在未來幾年內(nèi)證明商業(yè)化能力,恐將陷入“有技術(shù)、無市場”的困境。
昇騰則在“盤古套殼”事件后,輿論神話破滅,風(fēng)評口碑兩極分化,在業(yè)內(nèi)人士中路人緣差,在真實開發(fā)者生態(tài)中影響力急劇萎縮,高度依賴政府、國企采購,成為依靠政策紅利的“政商神話”。
龍芯不參與云端軍備競賽,而是押注端側(cè)小模型+分布式學(xué)習(xí),在本地推理等“數(shù)據(jù)不出域”場景中,打造端側(cè)AI的“安全島”。
維度
主導(dǎo)者
核心戰(zhàn)場
關(guān)鍵能力
云端大模型
阿里(PPU)
萬卡集群、互聯(lián)網(wǎng)
編譯器+互聯(lián)+生態(tài)+訓(xùn)練效率
高性能推理
寒武紀(jì)(ASIC)
互聯(lián)網(wǎng)、國企
能效比、性價比
通用GPU生態(tài)
摩爾/沐曦/壁仞/天數(shù)
科研、中小企業(yè)、圖形渲染
CUDA兼容
政務(wù)市場
昇騰(ASIC)
政府、國企
政策綁定、政商神話
安全端側(cè)
龍芯(GPGPU)
保密PC、工控、ATM
端側(cè)AI“安全島”
真正的國產(chǎn)替代是能用而非能吹
昇騰盤古的神話破滅,源于用“套殼”和指鹿為馬式營銷掩蓋技術(shù)缺陷;
寒武紀(jì)在商業(yè)上的成功,證明了AISC在專用場景的價值;
摩爾線程、沐曦、壁仞、天數(shù)智芯豪賭GPUGPU,是對英偉達(dá)的模仿和追趕;
龍芯的堅守,是端側(cè)AI安全的最后防線;
阿里真武則讓中國開發(fā)者第一次擁有了不依賴CUDA,又能高效跑大模型的國產(chǎn)選擇。
未來,中國AI芯片將從“百花齊放”走向“優(yōu)勝劣汰”。
能活下來的,不是估值最高的,不是PPT最漂亮的,不是政府輸血最多的,而是真正解決客戶問題、創(chuàng)造商業(yè)價值的。
能用而非能吹,這才是檢驗AI芯片國產(chǎn)替代的終極標(biāo)準(zhǔn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.