網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI革命下一站——物理AI有哪些新進(jìn)展？

2026-05-27 17:00:24　來源: 華爾街見聞官方

上海舉報(bào)

分享至

物理AI正從概念走向產(chǎn)業(yè)現(xiàn)實(shí)。浙商證券在最新發(fā)布的行業(yè)深度報(bào)告中指出，繼感知AI、生成式AI、Agentic AI之后，物理AI將成為AI技術(shù)演進(jìn)的下一站——其核心在于讓模型理解并預(yù)測真實(shí)世界狀態(tài)，從而驅(qū)動(dòng)自動(dòng)駕駛、具身智能和工業(yè)軟件等場景的深度變革。

在市場規(guī)模上，Coatue Management預(yù)計(jì)物理AI市場規(guī)模至少可達(dá)6萬億美元，較數(shù)字AI高出約50%。英偉達(dá)CEO黃仁勛在2026年CES上表示，物理AI可重塑價(jià)值約50萬億美元的制造和物流產(chǎn)業(yè)。與此同時(shí)，頂尖學(xué)者與科技巨頭正密集入場：圖靈獎(jiǎng)得主楊立昆成立的AMI Labs完成10.3億美元種子輪融資；AI教母李飛飛聯(lián)合創(chuàng)立的World Labs完成10億美元新一輪融資，成立不到兩年估值突破50億美元；英偉達(dá)則宣布下一代芯片F(xiàn)eynman專為物理AI設(shè)計(jì)，預(yù)計(jì)2028年發(fā)布。

浙商證券認(rèn)為，當(dāng)前物理AI尚無固定實(shí)現(xiàn)范式，需由世界模型與VLA（視覺—語言—?jiǎng)幼髂Ｐ停┕餐巍Ｗ詣?dòng)駕駛、具身智能和工業(yè)軟件構(gòu)成物理AI最核心的三大落地場景，其中自動(dòng)駕駛有望率先跑通"數(shù)據(jù)閉環(huán)"與"商業(yè)閉環(huán)"。報(bào)告建議重點(diǎn)關(guān)注具備世界模型能力的公司，以及上述三大場景中的軟硬件標(biāo)的。

技術(shù)定義：從生成式AI到物理AI的范式躍遷

浙商證券報(bào)告指出，物理AI是可以理解真實(shí)世界的AI系統(tǒng)，需要回答兩個(gè)核心問題：世界接下來如何變化，以及實(shí)體發(fā)生動(dòng)作之后世界會(huì)如何反應(yīng)。相較于生成式AI局限于數(shù)字世界的語言理解與內(nèi)容生成，物理AI的工作空間在真實(shí)物理世界，核心能力涵蓋感知、行動(dòng)與控制，價(jià)值體現(xiàn)于工業(yè)控制、具身智能和無人駕駛等實(shí)體場景。

黃仁勛將AI技術(shù)演進(jìn)總結(jié)為三代范式：從感知AI到生成式AI，再到Agentic AI，下一站將是物理AI——"能夠運(yùn)行、推理、計(jì)劃和行動(dòng)的AI"。

物理AI的模型能力亦經(jīng)歷三個(gè)階段的演進(jìn)。1.0時(shí)代依賴硬編碼規(guī)則，場景適應(yīng)性差；2.0時(shí)代轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)，依靠海量數(shù)據(jù)模仿學(xué)習(xí)，但缺乏對(duì)物理世界的真正理解；當(dāng)前進(jìn)入3.0推理驅(qū)動(dòng)時(shí)代，以世界模型+VLA+強(qiáng)化學(xué)習(xí)為核心，具備環(huán)境推理、因果理解與規(guī)劃能力，支持復(fù)雜任務(wù)的閉環(huán)決策。

核心技術(shù)：世界模型與VLA尚未形成統(tǒng)一范式

浙商證券報(bào)告強(qiáng)調(diào)，當(dāng)前物理AI的實(shí)現(xiàn)依賴世界模型與VLA兩大核心組件，但兩者均處于技術(shù)路線尚未收斂的階段。

世界模型的原始概念來自強(qiáng)化學(xué)習(xí)領(lǐng)域，指AI智能體通過在內(nèi)部構(gòu)建外部世界表征，從而在"腦海中"預(yù)演行動(dòng)方案。其核心價(jià)值在于，真實(shí)世界具有不可逆性，傳統(tǒng)仿真也無法支持智能體進(jìn)行"決策—觀察結(jié)果"的反復(fù)試錯(cuò)循環(huán)，而世界模型則可構(gòu)建無限逼近真實(shí)世界的虛擬環(huán)境，以更低成本、更安全的方式支撐AI訓(xùn)練。

谷歌DeepMind CEO Demis Hassabis在2026年CNBC開年采訪中判斷：AGI還差一塊拼圖，可能正是世界模型。

目前，世界模型在學(xué)術(shù)領(lǐng)域形成四條主流技術(shù)路線：觀測級(jí)生成式模型強(qiáng)在"逼真"，以Sora為代表；潛在空間模型強(qiáng)在"效率"，以JEPA系列為代表；強(qiáng)化學(xué)習(xí)導(dǎo)向模型強(qiáng)在"決策"，以Dreamer系列為代表；以對(duì)象為中心的模型強(qiáng)在"可解釋性"，以SlotFormer為代表。李飛飛認(rèn)為，世界模型需具備生成式、多模態(tài)、交互式三種能力。

VLA模型（視覺—語言—?jiǎng)幼髂Ｐ停﹦t通過端到端學(xué)習(xí)，在統(tǒng)一模型中將視覺和語言模態(tài)的任務(wù)語義映射到具體操作，省略手工設(shè)計(jì)規(guī)則與模塊對(duì)接。自2023年谷歌DeepMind發(fā)布RT-2以來，VLA研究進(jìn)入新階段，斯坦福于2024年發(fā)布首個(gè)開源7B參數(shù)通用機(jī)器人操控VLA模型OpenVLA，英偉達(dá)于2025年發(fā)布面向通用人形機(jī)器人的開源VLA基礎(chǔ)模型GR00T N1。

三大落地場景：自動(dòng)駕駛、具身智能與工業(yè)軟件

自動(dòng)駕駛是浙商證券認(rèn)為最有望率先跑通物理AI"數(shù)據(jù)閉環(huán)"與"商業(yè)閉環(huán)"的場景。每年全球車輛累計(jì)行駛里程約13萬億英里，可持續(xù)采集的多模態(tài)真實(shí)數(shù)據(jù)、清晰的商業(yè)收費(fèi)模式以及可規(guī)模化復(fù)制的產(chǎn)業(yè)鏈，為自動(dòng)駕駛構(gòu)建獨(dú)特優(yōu)勢。

2026年北京車展上，物理AI已成為隱形主線。自動(dòng)駕駛解決方案商層面，小馬智行CTO樓天城發(fā)布世界模型2.0，核心突破在于賦予AI自我診斷與定向進(jìn)化能力；Momenta正式發(fā)布R7強(qiáng)化學(xué)習(xí)世界模型；輕舟智航宣布戰(zhàn)略重心從"無人駕駛"全面升級(jí)為"通用物理AI"。車企層面，小鵬計(jì)劃將2026年物理AI相關(guān)研發(fā)投入提升至70億元；吉利發(fā)布WAM世界行為模型，并宣布與英偉達(dá)在物理AI領(lǐng)域深度協(xié)同；奇瑞官宣與英偉達(dá)達(dá)成全球戰(zhàn)略合作，聚焦輔助駕駛、座艙AI和機(jī)器人三大領(lǐng)域。

具身智能被浙商證券定義為物理AI"感知—理解—推理—行動(dòng)"閉環(huán)的核心載體。物理AI技術(shù)棧的演進(jìn)，正推動(dòng)機(jī)器人從"剛性自動(dòng)化"走向"真實(shí)自主"——相比傳統(tǒng)機(jī)器人，物理AI賦能的機(jī)器人可處理不可預(yù)測和未知零部件，減少人工編碼工作量，加快部署速度。

工業(yè)軟件被定位為物理AI訓(xùn)練、驗(yàn)證、部署和運(yùn)維的"控制臺(tái)"。報(bào)告認(rèn)為，工業(yè)軟件數(shù)據(jù)不可復(fù)制、安全合規(guī)要求高、云邊端協(xié)同復(fù)雜，構(gòu)成較強(qiáng)護(hù)城河，與物理AI之間呈互補(bǔ)共生、雙向賦能關(guān)系：工業(yè)軟件為物理AI提供物理底座、高質(zhì)量數(shù)據(jù)與驗(yàn)證環(huán)境；物理AI則為工業(yè)軟件提供智能加速、自動(dòng)化決策與閉環(huán)優(yōu)化能力。CAE仿真、數(shù)字孿生、工業(yè)控制、工業(yè)IoT、能源調(diào)度、EDA/CAD均是主要受益場景。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.