文/王新喜
AI芯片格局正在發(fā)生變化。
2026年一季度,中國AI芯片戰(zhàn)場,格局發(fā)生微妙變化,據(jù)路透社4月29日報道,DeepSeek-V4發(fā)布后,字節(jié)跳動、騰訊和阿里巴巴正在搶購華為國產芯片。
推動這輪增長的核心是AI芯片需求上升,這是一場低調但不可逆的集體轉身,國產芯片加速落地,依托本土硬件搭建的算力底座,正在加速成型。
國產算力要閉環(huán)
過去兩年,中國企業(yè)高端芯片買不到,只能將就美國“閹割版”的H20,但誰也沒想到?美國政客和英偉達,親手幫中國踢出了“臨門一腳”。
后來特朗普政府批準更高端H200對華銷售,附加了苛刻條件:首先是數(shù)量封頂,中國客戶能買到的H200總量,連美國本土客戶采購量的一半都不到,后來特朗普政府又爆出了要定7.5萬顆采購上限的消息。
![]()
此外,所有運往中國的H200芯片,都得先送到美方指定的第三方實驗室“體檢”,這樣確保芯片沒有任何可以被中方自行升級、改造的空間,甚至還要接受美方的各種核查,相當于買一顆芯片,就要被美方全程盯著。
![]()
結果就是中國企業(yè)直接集體拒單。首席執(zhí)行官黃仁勛在過去的一年里頻繁走訪上海、深圳,甚至在財報會上直言不諱地提醒,中國市場曾貢獻了英偉達四分之一的營收,失去這個市場是難以承受的。
如今,對英偉達而言,更難受的事情是,中國本土AI企業(yè)DeepSeek正式發(fā)布新一代大模型V4,宣布將全面開源,向全球開發(fā)者開放使用。
華為官方同步官宣,其最新研發(fā)的AI芯片,已成功實現(xiàn)與DeepSeek V4模型的全鏈路適配,可穩(wěn)定流暢運行該模型。
![]()
大模型有著上萬億個參數(shù),每個參數(shù)本質上是一串數(shù)字,這些數(shù)字全都要存放在芯片的儲存空間里;目前英偉達的整個生態(tài)體系,主流用 FP8,靠 8 位比特記錄一個數(shù)字,F(xiàn)P4 只需要 4 位比特就行。
DeepSeek V4 訓練時,用了一種叫 mxFP4 的精度方案。
FP4 的優(yōu)勢,是更少的存儲空間,更低的計算成本,跑差不多效果的模型。如果這套方法論能在華為芯片平臺上進一步打磨成熟,美國通過硬件封鎖建立的護城河,就會比想象中淺得多。
此外是,隨著DeepSeek那套極致壓縮算力需求的技術,與華為不斷成熟的本土芯片生態(tài)深度綁定,中國的AI產業(yè)鏈就有可能在不依賴任何美國硬件的前提下,實現(xiàn)自給自足的高速發(fā)展。
英偉達的護城河,從來不是芯片本身。是CUDA。
CUDA作為“事實標準”的軟件生態(tài)位,過去近二十年里,幾乎所有主流AI框架、算子庫、開源模型的首發(fā)優(yōu)化,都把CUDA作為默認起點。英偉達的CUDA就跟當年的Windows一樣,軟件、工具、教程、開發(fā)者全圍著它轉。
![]()
但華為走出了另一條路:昇騰芯片配套CANN生態(tài)系統(tǒng),全面開源、開放。
DeepSeek V4 在訓練階段選了 FP4,昇騰 950 恰好是國內唯一支持 FP4 的芯片,這根本不是模型做完再臨時去兼容國產芯片,而是在模型訓練起步階段,選擇精度規(guī)格的時候,已經專門為這顆芯片量身鋪路了。
據(jù)彭博社此前的獨家報道,為了實現(xiàn)與國產算力的完美適配,DeepSeek特意推遲了V4模型的發(fā)布時間,花費數(shù)月時間重新編寫底層代碼,實現(xiàn)從英偉達CUDA框架,向華為自研CANN框架的全面切換,徹底擺脫了對英偉達軟件生態(tài)的依賴。
![]()
黃仁勛在一檔節(jié)目中直言:“如果DeepSeek率先在華為平臺上發(fā)布,對我們國家來說將是可怕的結果。全球AI模型都將運行在非美國硬件上。”
黃仁勛擔心的事情已經發(fā)生了。
![]()
過去幾年,中國AI產業(yè)的底色一直是「用英偉達的芯片,追美國的模型」,V4 釋放的信號已經是開始用自己的芯片跑自己的模型了,芯片和模型從一開始就在一起長。
與此同時,算力競賽的背后,還是電力的較量,數(shù)據(jù)中心屬于高耗能設施,電力保障能力直接決定了算力的上限。
而中國在這一領域,早已握有堅實的底牌。2025年,中國全社會用電量早已突破10.4萬億千瓦時,是美國全年用電量的2.5倍,充足且低成本的電力供應,為中國算力產業(yè)的快速擴張,提供了不可替代的堅實支撐。
英偉達擔心的事發(fā)生了
今天中國AI芯片的突破,值得振奮。但遠未到慶祝的時候,首先是產能。
芯片產能一直是決定芯片出貨的一個重要變量。
在手機Soc芯片領域,2023年8月Mate60的麒麟芯片回歸的時候,手機銷量就被芯片產能問題嚴重掣肘,直到三年后也就是今年,華為麒麟芯片產能問題才得以解決。
在AI芯片領域,昇騰 950 的產能也是另一個未知數(shù),全年75萬顆的出貨計劃,光字節(jié)和阿里兩家就要走一半以上,后面排隊的還有騰訊、百度和一眾中小廠商。
供不應求的局面下,產能能不能跟上,直接決定這條新鏈路的傳導速度。
![]()
其次,AI突破要看生態(tài)的突破,國產芯片目前接住的是推理側,訓練側的硬骨頭、CUDA 生態(tài)十幾年積累的護城河,這些都是真的。
全球生態(tài)的突破與滲透非朝夕之功,開源只是第一步,開發(fā)者對開源模型生態(tài)的擁抱與穩(wěn)定性,才是決定持久戰(zhàn)輸贏的關鍵。
![]()
當然,還有一點是光刻機的自主突破。只有國產光刻機跑通,芯片成本才能大幅下降,算力才能真正飛入千家萬戶。
在光刻機方面,美方禁令現(xiàn)在直接擴大到所有DUV浸沒式光刻機,中國囤的光刻機用5-10年不是問題,國產28nm浸沒式光刻機也在工藝驗證階段。
無論是磁懸浮雙工件臺還是193納米準分子激光器,其核心零部件的技術都在逐步突破,可以說,再給中國幾年時間,將逐步實現(xiàn)全鏈條自主。
![]()
國產算力閉環(huán),英偉達焦慮到公開失態(tài)——這只是一個開始,因為中國科技企業(yè)采購華為芯片,不是單純的情懷選擇,而是兼顧成本核算、供應鏈安全、產業(yè)自主的理性決策。
等到2030年,隨著國產芯片的產能與規(guī)模上來,成本持續(xù)下降,自主可控的算力底座持續(xù)完善,到那時回頭看,美國的禁令反而助推了中國AI芯片產業(yè)的歷史進程的加速,一旦中國在頂級模型層面跑通國產算力閉環(huán),一切就云淡風輕了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.