網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

物理AI是什么？廣州企業(yè)正在訓(xùn)練另一種“大腦”

2026-04-29 20:44:18　來源: 廣州市科協(xié)

廣東舉報(bào)

分享至

日前

廣州智駕企業(yè)小馬智行

正式發(fā)布其在物理AI領(lǐng)域的

最新技術(shù)成果——

PonyWorld世界模型2.0

小馬智行圖源：廣州科技創(chuàng)新

消息一出，再次勾起了人們

對(duì)物理AI的關(guān)注

它到底是什么？

和我們常說的AI有什么區(qū)別？

除了小馬智行

廣州又有哪些企業(yè)

對(duì)其進(jìn)行了布局？

今天，跟你聊個(gè)明白

什么是物理AI

大多數(shù)時(shí)候，我們談?wù)摰腁I，無(wú)論是能寫詩(shī)作畫的ChatGPT，還是去年風(fēng)靡全網(wǎng)的DeepSeek，都是大語(yǔ)言模型，其核心是“從文本中學(xué)習(xí)世界的知識(shí)”，它通過學(xué)習(xí)互聯(lián)網(wǎng)上海量的文本數(shù)據(jù)，學(xué)會(huì)了語(yǔ)言的規(guī)律、人類的知識(shí)，能生成流暢的文字、回答各種問題、完成文本類的任務(wù)。然而，它的所有知識(shí)，都來自于人類社會(huì)數(shù)千年的歷史經(jīng)驗(yàn)，它對(duì)現(xiàn)實(shí)世界的重力、摩擦力與空間感一無(wú)所知。

如果將它們植入一個(gè)機(jī)械智能體，它能跟你上聊天文下聊地理，情緒價(jià)值拉滿，但如果讓它為你煎一個(gè)雞蛋，對(duì)不起，超出能力范圍了。

而物理AI（Physical AI），則是能沖破數(shù)字桎梏，與現(xiàn)實(shí)進(jìn)行交互的大模型。目前，它的主流技術(shù)路徑有兩個(gè)：

1??VLA——看得懂，做得出

VLA全稱Vision-Language-Action Model（視覺—語(yǔ)言—?jiǎng)幼髂Ｐ停诵墓δ苁墙邮請(qǐng)D像/視頻、自然語(yǔ)言指令，直接輸出智能體（如機(jī)器人）可執(zhí)行的動(dòng)作序列，實(shí)現(xiàn)“感知—理解—執(zhí)行”。

2??世界模型——先預(yù)判，再?zèng)Q策

世界模型是智能體構(gòu)建的內(nèi)部預(yù)測(cè)系統(tǒng)，核心是基于歷史環(huán)境狀態(tài)與動(dòng)作輸入，預(yù)判環(huán)境未來的演化趨勢(shì)，進(jìn)而幫助智能體優(yōu)化決策路徑。其本質(zhì)是復(fù)刻生物對(duì)世界的預(yù)判本能，融合神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等技術(shù)，構(gòu)建對(duì)物理世界的動(dòng)態(tài)表征。

物理AI的廣州探索

不難看出

物理AI與智能駕駛、具身智能

簡(jiǎn)直就是天作之合

小馬智行

本次發(fā)布的

PonyWorld世界模型2.0

正是該公司在物理AI領(lǐng)域

的最新技術(shù)成果

小馬智行搭建的世界模型，可以理解為建在云端的“虛擬駕校”，AI在“虛擬駕校”中反復(fù)開車、預(yù)設(shè)各種突發(fā)狀況，訓(xùn)練駕駛能力。

小馬智行搭建的世界模型圖源：廣州科技創(chuàng)新

與1.0相比，2.0實(shí)現(xiàn)了超級(jí)進(jìn)化：

自我診斷能力：

AI知道自己“哪里不行”

PonyWorld2.0結(jié)合小馬智行車端模型的Intention（意圖）語(yǔ)義層，實(shí)現(xiàn)了對(duì)每一次駕駛決策的自動(dòng)化回溯與歸因分析。系統(tǒng)能夠自動(dòng)區(qū)分問題根源，并將診斷結(jié)果精準(zhǔn)反饋至模型訓(xùn)練流程。

定向進(jìn)化能力：

從“廣撒網(wǎng)”到“精準(zhǔn)補(bǔ)短板”

基于自我診斷結(jié)果，PonyWorld2.0能夠自動(dòng)識(shí)別世界模型精度不足的具體場(chǎng)景，并主動(dòng)生成定向數(shù)據(jù)采集任務(wù)。例如，系統(tǒng)可自動(dòng)推送指令：“請(qǐng)于特定時(shí)段在指定路口重點(diǎn)采集逆光條件下非機(jī)動(dòng)車與行人混行場(chǎng)景數(shù)據(jù)。”研發(fā)與測(cè)試團(tuán)隊(duì)由此圍繞世界模型的“精度需求”高效協(xié)作，實(shí)現(xiàn)AI引導(dǎo)下的定向數(shù)據(jù)采集與模型迭代。

訓(xùn)練效率躍升：

專練“難題”，跳過“送分題”

PonyWorld2.0可根據(jù)車端模型的薄弱環(huán)節(jié)，在世界模型中自動(dòng)生成針對(duì)性訓(xùn)練場(chǎng)景，大幅減少無(wú)效訓(xùn)練數(shù)據(jù)的存儲(chǔ)與計(jì)算開銷，顯著提升每一輪迭代的效率和效果。

而廣州的另一家

自動(dòng)駕駛科技公司

文遠(yuǎn)知行

也采取了相似的技術(shù)路徑

今年1月，文遠(yuǎn)知行發(fā)布自研通用仿真模型——WeRide GENESIS，構(gòu)建起物理AI與生成AI之間的融合橋梁。

仿真模型在數(shù)字世界中高精度還原真實(shí)世界的駕駛環(huán)境，讓自動(dòng)駕駛車輛在虛擬城市中“直接上路”。通過仿真的方式，AI司機(jī)能夠經(jīng)歷海量多樣的道路、天氣與交通場(chǎng)景，練習(xí)應(yīng)對(duì)緊急情況或罕見事件的能力。

WeRide GENESIS可根據(jù)實(shí)景自動(dòng)生成對(duì)應(yīng)點(diǎn)云數(shù)據(jù)，從而創(chuàng)建仿真世界圖源：廣州科技創(chuàng)新

值得一提的是，針對(duì)真實(shí)反映客觀世界中復(fù)雜且難以預(yù)測(cè)的交互行為，WeRide GENESIS內(nèi)建了“AI主體”模塊，致力于為每一位交通參與者構(gòu)建智能行為模型，使其能夠模擬從日常駕駛到高風(fēng)險(xiǎn)行為的全譜系反應(yīng)。

例如，它可以模擬在路口猶豫不決最終又突然加速搶行的駕駛員，或者在車縫中穿梭的外賣騎手。這種對(duì)客體不確定性交互的模擬，對(duì)自動(dòng)駕駛系統(tǒng)提升在實(shí)際復(fù)雜交通流中應(yīng)變能力極為重要。

WeRide GENESIS同樣具備“AI診斷”功能。它能夠自動(dòng)捕捉急剎車造成乘客舒適度降低、遇到復(fù)雜路況識(shí)別感知延遲或預(yù)測(cè)偏差等不理想的駕駛行為，分析其根本原因并提供可執(zhí)行的改進(jìn)方案。

說到擁抱物理AI

廣州還有一家標(biāo)桿企業(yè)——

小鵬集團(tuán)

近日，小鵬集團(tuán)發(fā)布《2025年環(huán)境、社會(huì)及管治報(bào)告》。《報(bào)告》中明確，集團(tuán)將于2026年實(shí)現(xiàn)Robotaxi、人形機(jī)器人、飛行汽車三大物理AI應(yīng)用的量產(chǎn)。這三大應(yīng)用，其核心大模型都是小鵬的VLA2.0。

如果說傳統(tǒng)智駕系統(tǒng)是“按腳本開車”，小鵬VLA2.0則實(shí)現(xiàn)了“像人一樣思考開車”，其摒棄傳統(tǒng)的規(guī)則驅(qū)動(dòng)模式，以物理AI大模型理解路況，實(shí)現(xiàn)從“特征匹配”到“物理邏輯推理”的跨越。

這種技術(shù)架構(gòu)帶來的直觀改變，是智駕系統(tǒng)終于能應(yīng)對(duì)現(xiàn)實(shí)中的突發(fā)狀況。

例如，導(dǎo)航未及時(shí)更新施工導(dǎo)致封路的狀態(tài)時(shí)，系統(tǒng)14秒內(nèi)自主推理多條路徑的可行性并選擇最優(yōu)解；

路邊車輛車門微開時(shí)，提前捕捉意圖并預(yù)留避讓空間，實(shí)現(xiàn)從容繞行；

夜間及雨雪環(huán)境下，攝像頭感知力超人眼，模型決策幾乎不受影響，可輕松避讓深色衣物行人和小動(dòng)物。

此外，無(wú)地圖支持下，系統(tǒng)也能通過理解物理環(huán)境自主規(guī)劃路徑，即便在鄉(xiāng)村土路、無(wú)導(dǎo)航園區(qū)等人車混行場(chǎng)景，也能平穩(wěn)通行。

小鵬VLA 2.0能識(shí)別到路邊車輛突然打開車門并預(yù)留避讓空間。圖源：廣州科技創(chuàng)新

小鵬的另一款拳頭產(chǎn)品人形機(jī)器人IRON，通過搭載物理AI大模型，融合了視覺、語(yǔ)言與行動(dòng)能力，使其能夠執(zhí)行對(duì)話、行走和復(fù)雜交互等任務(wù)。目前，小鵬已與寶鋼達(dá)成合作，計(jì)劃今年入駐鋼鐵廠負(fù)責(zé)高溫管道巡檢，替代人類進(jìn)入危險(xiǎn)作業(yè)區(qū)。

人形機(jī)器人IRON 圖源：廣州科技創(chuàng)新

廣州為物理AI應(yīng)用落地

筑牢生態(tài)底座

2026年，被科技界視為“物理AI元年”。以小馬智行、文遠(yuǎn)知行、小鵬集團(tuán)為代表的廣州科技企業(yè)站在了時(shí)代的風(fēng)口。

物理AI的核心價(jià)值，在于打破了“數(shù)字AI”與“現(xiàn)實(shí)世界”的壁壘——它不再是停留在屏幕里的算法，而是能走進(jìn)工廠、道路、社區(qū)，真正解決實(shí)際問題的“實(shí)干家”。

對(duì)于廣州而言，這些企業(yè)所取得的突破，不僅彰顯了城市在智能網(wǎng)聯(lián)汽車、機(jī)器人等前沿領(lǐng)域的技術(shù)積淀，更勾勒出物理AI落地的清晰路徑，讓“AI+實(shí)體經(jīng)濟(jì)”不再是空談。

除了頭部企業(yè)的引領(lǐng)，廣州的產(chǎn)業(yè)生態(tài)也在為物理AI的發(fā)展保駕護(hù)航——廣州擁有完整的產(chǎn)業(yè)鏈布局，從芯片、傳感器等核心零部件，到整車制造、場(chǎng)景測(cè)試，再到算法研發(fā)、數(shù)據(jù)服務(wù)，已形成了閉環(huán)式產(chǎn)業(yè)生態(tài)。

同時(shí)，廣州持續(xù)出臺(tái)系列政策支持前沿技術(shù)創(chuàng)新，設(shè)立智能網(wǎng)聯(lián)汽車與自動(dòng)駕駛產(chǎn)業(yè)專項(xiàng)資金，搭建測(cè)試驗(yàn)證平臺(tái)，為企業(yè)提供場(chǎng)景試點(diǎn)、人才扶持等全方位保障，讓物理AI技術(shù)有了“落地生根”的土壤。

相信在不久的將來

我們就能看到自動(dòng)駕駛汽車

穿梭在城市的每一條街道

人形機(jī)器人為我們提供家庭服務(wù)

飛行汽車解決出行擁堵

而這一切

都離不開今天廣州

在物理AI領(lǐng)域的每一步深耕

參考來源

廣州科技創(chuàng)新《物理AI是什么？廣州企業(yè)正在訓(xùn)練另一種“大腦”》

https://mp.weixin.qq.com/s/TO2Umw6wCDcE47XijX2kDQ

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.