物理AI正從概念走向產(chǎn)業(yè)現(xiàn)實(shí)。浙商證券在最新發(fā)布的行業(yè)深度報(bào)告中指出,繼感知AI、生成式AI、Agentic AI之后,物理AI將成為AI技術(shù)演進(jìn)的下一站——其核心在于讓模型理解并預(yù)測真實(shí)世界狀態(tài),從而驅(qū)動(dòng)自動(dòng)駕駛、具身智能和工業(yè)軟件等場景的深度變革。
在市場規(guī)模上,Coatue Management預(yù)計(jì)物理AI市場規(guī)模至少可達(dá)6萬億美元,較數(shù)字AI高出約50%。英偉達(dá)CEO黃仁勛在2026年CES上表示,物理AI可重塑價(jià)值約50萬億美元的制造和物流產(chǎn)業(yè)。與此同時(shí),頂尖學(xué)者與科技巨頭正密集入場:圖靈獎(jiǎng)得主楊立昆成立的AMI Labs完成10.3億美元種子輪融資;AI教母李飛飛聯(lián)合創(chuàng)立的World Labs完成10億美元新一輪融資,成立不到兩年估值突破50億美元;英偉達(dá)則宣布下一代芯片F(xiàn)eynman專為物理AI設(shè)計(jì),預(yù)計(jì)2028年發(fā)布。
浙商證券認(rèn)為,當(dāng)前物理AI尚無固定實(shí)現(xiàn)范式,需由世界模型與VLA(視覺—語言—?jiǎng)幼髂P停┕餐巍W詣?dòng)駕駛、具身智能和工業(yè)軟件構(gòu)成物理AI最核心的三大落地場景,其中自動(dòng)駕駛有望率先跑通"數(shù)據(jù)閉環(huán)"與"商業(yè)閉環(huán)"。報(bào)告建議重點(diǎn)關(guān)注具備世界模型能力的公司,以及上述三大場景中的軟硬件標(biāo)的。
技術(shù)定義:從生成式AI到物理AI的范式躍遷
浙商證券報(bào)告指出,物理AI是可以理解真實(shí)世界的AI系統(tǒng),需要回答兩個(gè)核心問題:世界接下來如何變化,以及實(shí)體發(fā)生動(dòng)作之后世界會(huì)如何反應(yīng)。相較于生成式AI局限于數(shù)字世界的語言理解與內(nèi)容生成,物理AI的工作空間在真實(shí)物理世界,核心能力涵蓋感知、行動(dòng)與控制,價(jià)值體現(xiàn)于工業(yè)控制、具身智能和無人駕駛等實(shí)體場景。
![]()
黃仁勛將AI技術(shù)演進(jìn)總結(jié)為三代范式:從感知AI到生成式AI,再到Agentic AI,下一站將是物理AI——"能夠運(yùn)行、推理、計(jì)劃和行動(dòng)的AI"。
物理AI的模型能力亦經(jīng)歷三個(gè)階段的演進(jìn)。1.0時(shí)代依賴硬編碼規(guī)則,場景適應(yīng)性差;2.0時(shí)代轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng),依靠海量數(shù)據(jù)模仿學(xué)習(xí),但缺乏對(duì)物理世界的真正理解;當(dāng)前進(jìn)入3.0推理驅(qū)動(dòng)時(shí)代,以世界模型+VLA+強(qiáng)化學(xué)習(xí)為核心,具備環(huán)境推理、因果理解與規(guī)劃能力,支持復(fù)雜任務(wù)的閉環(huán)決策。
![]()
核心技術(shù):世界模型與VLA尚未形成統(tǒng)一范式
浙商證券報(bào)告強(qiáng)調(diào),當(dāng)前物理AI的實(shí)現(xiàn)依賴世界模型與VLA兩大核心組件,但兩者均處于技術(shù)路線尚未收斂的階段。
世界模型的原始概念來自強(qiáng)化學(xué)習(xí)領(lǐng)域,指AI智能體通過在內(nèi)部構(gòu)建外部世界表征,從而在"腦海中"預(yù)演行動(dòng)方案。其核心價(jià)值在于,真實(shí)世界具有不可逆性,傳統(tǒng)仿真也無法支持智能體進(jìn)行"決策—觀察結(jié)果"的反復(fù)試錯(cuò)循環(huán),而世界模型則可構(gòu)建無限逼近真實(shí)世界的虛擬環(huán)境,以更低成本、更安全的方式支撐AI訓(xùn)練。
谷歌DeepMind CEO Demis Hassabis在2026年CNBC開年采訪中判斷:AGI還差一塊拼圖,可能正是世界模型。
目前,世界模型在學(xué)術(shù)領(lǐng)域形成四條主流技術(shù)路線:觀測級(jí)生成式模型強(qiáng)在"逼真",以Sora為代表;潛在空間模型強(qiáng)在"效率",以JEPA系列為代表;強(qiáng)化學(xué)習(xí)導(dǎo)向模型強(qiáng)在"決策",以Dreamer系列為代表;以對(duì)象為中心的模型強(qiáng)在"可解釋性",以SlotFormer為代表。李飛飛認(rèn)為,世界模型需具備生成式、多模態(tài)、交互式三種能力。
VLA模型(視覺—語言—?jiǎng)幼髂P停﹦t通過端到端學(xué)習(xí),在統(tǒng)一模型中將視覺和語言模態(tài)的任務(wù)語義映射到具體操作,省略手工設(shè)計(jì)規(guī)則與模塊對(duì)接。自2023年谷歌DeepMind發(fā)布RT-2以來,VLA研究進(jìn)入新階段,斯坦福于2024年發(fā)布首個(gè)開源7B參數(shù)通用機(jī)器人操控VLA模型OpenVLA,英偉達(dá)于2025年發(fā)布面向通用人形機(jī)器人的開源VLA基礎(chǔ)模型GR00T N1。
![]()
三大落地場景:自動(dòng)駕駛、具身智能與工業(yè)軟件
自動(dòng)駕駛是浙商證券認(rèn)為最有望率先跑通物理AI"數(shù)據(jù)閉環(huán)"與"商業(yè)閉環(huán)"的場景。每年全球車輛累計(jì)行駛里程約13萬億英里,可持續(xù)采集的多模態(tài)真實(shí)數(shù)據(jù)、清晰的商業(yè)收費(fèi)模式以及可規(guī)模化復(fù)制的產(chǎn)業(yè)鏈,為自動(dòng)駕駛構(gòu)建獨(dú)特優(yōu)勢。
![]()
2026年北京車展上,物理AI已成為隱形主線。自動(dòng)駕駛解決方案商層面,小馬智行CTO樓天城發(fā)布世界模型2.0,核心突破在于賦予AI自我診斷與定向進(jìn)化能力;Momenta正式發(fā)布R7強(qiáng)化學(xué)習(xí)世界模型;輕舟智航宣布戰(zhàn)略重心從"無人駕駛"全面升級(jí)為"通用物理AI"。車企層面,小鵬計(jì)劃將2026年物理AI相關(guān)研發(fā)投入提升至70億元;吉利發(fā)布WAM世界行為模型,并宣布與英偉達(dá)在物理AI領(lǐng)域深度協(xié)同;奇瑞官宣與英偉達(dá)達(dá)成全球戰(zhàn)略合作,聚焦輔助駕駛、座艙AI和機(jī)器人三大領(lǐng)域。
具身智能被浙商證券定義為物理AI"感知—理解—推理—行動(dòng)"閉環(huán)的核心載體。物理AI技術(shù)棧的演進(jìn),正推動(dòng)機(jī)器人從"剛性自動(dòng)化"走向"真實(shí)自主"——相比傳統(tǒng)機(jī)器人,物理AI賦能的機(jī)器人可處理不可預(yù)測和未知零部件,減少人工編碼工作量,加快部署速度。
![]()
工業(yè)軟件被定位為物理AI訓(xùn)練、驗(yàn)證、部署和運(yùn)維的"控制臺(tái)"。報(bào)告認(rèn)為,工業(yè)軟件數(shù)據(jù)不可復(fù)制、安全合規(guī)要求高、云邊端協(xié)同復(fù)雜,構(gòu)成較強(qiáng)護(hù)城河,與物理AI之間呈互補(bǔ)共生、雙向賦能關(guān)系:工業(yè)軟件為物理AI提供物理底座、高質(zhì)量數(shù)據(jù)與驗(yàn)證環(huán)境;物理AI則為工業(yè)軟件提供智能加速、自動(dòng)化決策與閉環(huán)優(yōu)化能力。CAE仿真、數(shù)字孿生、工業(yè)控制、工業(yè)IoT、能源調(diào)度、EDA/CAD均是主要受益場景。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.