AI越聰明,對數據的要求好像就越變態?
不是隨便網上扒點文本就能喂大模型了。在生物醫藥、新材料、芯片設計這些領域,數據要么太貴(做一次實驗幾百萬),要么根本拿不到(涉及機密或安全),要么現實條件不允許(比如模擬核反應堆內部)。
那怎么辦?用超級計算機“算”出來。
算力產業發展方陣這份《2025年科學計算行業發展研究報告》,看完我只想說:科學計算不是“算得快”,是“算得準”。它是AI的“數據工廠”加“驗證臺”。
報告有三個判斷
判斷一:科學計算是科學智能閉環中的“數據生成器”,不是可選項,是必選項。 AI模型訓練依賴高質量數據,而科研和工程中的真實數據往往稀缺、昂貴或不可得。科學計算通過高精度仿真批量生成“可信數據”,是打破數據瓶頸的關鍵。
判斷二:通用芯片架構在科學計算面前“水土不服”,專用化和軟硬協同設計才是出路。 用GPU跑分子動力學,理論算力再高,實際效率也經常打折扣。內存墻、功耗墻、通信墻三座大山壓著,不走專用路線就翻不過去。
判斷三:中國科學計算市場正以年復合增長21.5%狂奔,2029年有望達到2760億元。 政府砸錢建超算中心,企業掏錢搞仿真研發,高端制造、新能源、生物醫藥是三大引擎。但軟件生態和自主內核,還是短板。
一、科學計算是什么?不是“算得快”,是“算得準”
科學計算的核心不是比誰算得快,而是比誰算得準——能不能用數值仿真把真實世界的物理過程重建出來。
它的定位很清楚:在“數據生成—模型訓練—生態反饋”的科學智能閉環中,科學計算負責第一環:生成高質量、可驗證的仿真數據。你訓練一個藥物篩選模型,沒有幾萬條分子動力學數據,模型根本學不會。這些數據從哪里來?一部分來自實驗,但更多來自超級計算機的日夜運轉。
所以,科學計算本質上是一個“數據工廠”。而且它產出的數據有物理機理約束,不是瞎編的,是“可驗證、可復現”的。
二、市場有多大?1040億,年增21.5%
報告給出了一組很具體的數字:
2024年中國科學計算市場規模約1040.6億元,預計到2029年增長到2759.9億元,年復合增長率21.5%。
其中,政府端(超算中心、科研院所)2024年約456億元,企業端(制造業、藥企、芯片公司等)約584億元。企業端增速更快,因為越來越多公司把科學計算當成研發核心工具。
按技術類型拆開看:CAE(工程仿真)336億元、QM(量子力學計算)282億元、MD(分子動力學)238億元,這三塊占了大部分。
按行業拆:高端裝備243億元、新材料211億元、集成電路206億元、生物醫藥170億元、新能源148億元——前五名加起來占了94%。低空經濟雖然現在只有3.8億元,但增速36%,是潛力股。
三、技術瓶頸:通用芯片跑科學計算,效率經常只有三成
報告點出了一個殘酷的事實:用通用CPU/GPU跑科學計算,實際效率經常只有理論峰值的三成左右。
問題出在三個地方:
- 算法適配性低:快速傅里葉變換、稀疏矩陣運算這些科學計算常用算法,在GPU上優化困難,大量算力被浪費。
- 內存墻+功耗墻:處理器算力翻倍的速度遠超內存帶寬,數據搬不動;E級超跑起來動輒二三十兆瓦,電費嚇人。
- 大規模并行通信效率遞減:節點越多,通信開銷越大,加速比非線性下降。
怎么辦?兩條路。
一條是“專用一體機”,比如D.E. Shaw研究所開發的Anton系列超級計算機,專攻分子動力學模擬,比通用超算快幾千倍。一條是“軟件定義硬件”,比如思朗科技的MaPU架構,通過可編程內核在同一套芯片上適配不同算法,兼顧通用和效率。
報告認為,未來科學計算的突破口不在堆算力,而在“算效”——每瓦特能跑出多少有效計算。
四、八大應用場景,誰在花錢?
報告詳細拆了八個行業,每個都給出了市場規模和增速:
- 生物醫藥:2024年170億元,預計2029年522億元,CAGR 21.6%。分子動力學(MD)和自由能微擾(FEP)是核心技術。一個關鍵門檻:要實現百萬原子級大體系、微秒級時長的模擬,計算效率至少需要1微秒/天。目前只有美國Anton和國內“天穹”能做到,其他平臺基本卡在門外。
- 高端裝備(航空航天、汽車、船舶):2024年243億元,2029年580億元,CAGR 19.5%。CAE仿真替代風洞實驗,波音787只做了11種物理測試,而767做了77種。
- 集成電路:2024年206億元,2029年447億元,CAGR 17.3%。EDA、計算光刻、多物理場仿真全靠科學計算撐著。
- 新能源:2024年148億元,2029年326億元,CAGR 34.3%。寧德時代用高通量模擬篩選電池材料,從海量分子基因庫里找到理想配方。
- 新材料:2024年211億元,2029年643億元,CAGR 21.6%。BASF自建超算“Quriosity”,用分子建模預測化妝品成分效果。
- 合成生物:2024年45億元,2029年156億元,CAGR 24.0%。
- 地球科學:2024年14億元,2029年58億元,CAGR 35.7%。
- 低空經濟:2024年3.8億元,2029年30億元,CAGR 36.3%。體量小但增速快。
五、國產自主:芯片、整機、軟件都在補課
報告用了很大篇幅梳理產業鏈,我挑幾個重點說。
芯片層面:國際是NVIDIA、Intel、AMD的天下,國內有多條路線——飛騰、鯤鵬、昇騰、寒武紀、思朗科技(MaPU)、龍芯(LoongArch)等。其中MaPU走的是“軟件定義硬件”路線,不依賴國外IP,值得關注。
整機層面:中科曙光、浪潮、聯想等具備超算整機集成能力,但高端互連(類似InfiniBand)還是短板。專用一體機方面,思朗的“天穹”3D科學計算機號稱能做到5微秒/天的分子動力學模擬,雖不及Anton的10微秒,但已經是國內天花板。
軟件層面:ANSYS、COMSOL、Gaussian等高端仿真軟件還是歐美主導,國內盈建科、霍萊沃、安世亞太等在追趕,但生態差距明顯。好消息是AI正在重塑科學計算軟件——AlphaFold顛覆了蛋白質結構預測,國產軟件可以借AI彎道超車。
總結幾句
科學計算不是“炫技”,是“保底”。 沒有它,AI在科研和工程上就是“盲人摸象”。
市場在高速增長,1040億的盤子五年翻一倍多。技術瓶頸很明顯,但專用一體機、軟硬協同設計、AI+仿真都是破局方向。
國產自主是一條長路——從指令集、芯片、互連、整機到軟件棧,每個環節都要補課。但報告里也提到了不少亮眼實踐:思朗的MaPU架構、天穹一體機,寧德時代的高通量模擬,航天航空的數字仿真云平臺……
誰能在關鍵科學領域率先跑通“仿真生成數據—數據驅動模型—模型指導實驗—實驗反饋優化”的閉環,誰就能掌握下一輪科技競爭的定價權。
報告節選
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.