日前
廣州智駕企業(yè)小馬智行
正式發(fā)布其在物理AI領(lǐng)域的
最新技術(shù)成果——
PonyWorld世界模型2.0
![]()
小馬智行 圖源:廣州科技創(chuàng)新
消息一出,再次勾起了人們
對(duì)物理AI的關(guān)注
它到底是什么?
和我們常說的AI有什么區(qū)別?
除了小馬智行
廣州又有哪些企業(yè)
對(duì)其進(jìn)行了布局?
今天,跟你聊個(gè)明白
![]()
什么是物理AI
大多數(shù)時(shí)候,我們談?wù)摰腁I,無(wú)論是能寫詩(shī)作畫的ChatGPT,還是去年風(fēng)靡全網(wǎng)的DeepSeek,都是大語(yǔ)言模型,其核心是“從文本中學(xué)習(xí)世界的知識(shí)”,它通過學(xué)習(xí)互聯(lián)網(wǎng)上海量的文本數(shù)據(jù),學(xué)會(huì)了語(yǔ)言的規(guī)律、人類的知識(shí),能生成流暢的文字、回答各種問題、完成文本類的任務(wù)。然而,它的所有知識(shí),都來自于人類社會(huì)數(shù)千年的歷史經(jīng)驗(yàn),它對(duì)現(xiàn)實(shí)世界的重力、摩擦力與空間感一無(wú)所知。
如果將它們植入一個(gè)機(jī)械智能體,它能跟你上聊天文下聊地理,情緒價(jià)值拉滿,但如果讓它為你煎一個(gè)雞蛋,對(duì)不起,超出能力范圍了。
而物理AI(Physical AI),則是能沖破數(shù)字桎梏,與現(xiàn)實(shí)進(jìn)行交互的大模型。目前,它的主流技術(shù)路徑有兩個(gè):
1??VLA——看得懂,做得出
VLA全稱Vision-Language-Action Model(視覺—語(yǔ)言—?jiǎng)幼髂P停诵墓δ苁墙邮請(qǐng)D像/視頻、自然語(yǔ)言指令,直接輸出智能體(如機(jī)器人)可執(zhí)行的動(dòng)作序列,實(shí)現(xiàn)“感知—理解—執(zhí)行”。
2??世界模型——先預(yù)判,再?zèng)Q策
世界模型是智能體構(gòu)建的內(nèi)部預(yù)測(cè)系統(tǒng),核心是基于歷史環(huán)境狀態(tài)與動(dòng)作輸入,預(yù)判環(huán)境未來的演化趨勢(shì),進(jìn)而幫助智能體優(yōu)化決策路徑。其本質(zhì)是復(fù)刻生物對(duì)世界的預(yù)判本能,融合神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等技術(shù),構(gòu)建對(duì)物理世界的動(dòng)態(tài)表征。
![]()
物理AI的廣州探索
不難看出
物理AI與智能駕駛、具身智能
簡(jiǎn)直就是天作之合
小馬智行
本次發(fā)布的
PonyWorld世界模型2.0
正是該公司在物理AI領(lǐng)域
的最新技術(shù)成果
小馬智行搭建的世界模型,可以理解為建在云端的“虛擬駕校”,AI在“虛擬駕校”中反復(fù)開車、預(yù)設(shè)各種突發(fā)狀況,訓(xùn)練駕駛能力。
![]()
小馬智行搭建的世界模型 圖源:廣州科技創(chuàng)新
與1.0相比,2.0實(shí)現(xiàn)了超級(jí)進(jìn)化:
自我診斷能力:
AI知道自己“哪里不行”
PonyWorld2.0結(jié)合小馬智行車端模型的Intention(意圖)語(yǔ)義層,實(shí)現(xiàn)了對(duì)每一次駕駛決策的自動(dòng)化回溯與歸因分析。系統(tǒng)能夠自動(dòng)區(qū)分問題根源,并將診斷結(jié)果精準(zhǔn)反饋至模型訓(xùn)練流程。
定向進(jìn)化能力:
從“廣撒網(wǎng)”到“精準(zhǔn)補(bǔ)短板”
基于自我診斷結(jié)果,PonyWorld2.0能夠自動(dòng)識(shí)別世界模型精度不足的具體場(chǎng)景,并主動(dòng)生成定向數(shù)據(jù)采集任務(wù)。例如,系統(tǒng)可自動(dòng)推送指令:“請(qǐng)于特定時(shí)段在指定路口重點(diǎn)采集逆光條件下非機(jī)動(dòng)車與行人混行場(chǎng)景數(shù)據(jù)。”研發(fā)與測(cè)試團(tuán)隊(duì)由此圍繞世界模型的“精度需求”高效協(xié)作,實(shí)現(xiàn)AI引導(dǎo)下的定向數(shù)據(jù)采集與模型迭代。
訓(xùn)練效率躍升:
專練“難題”,跳過“送分題”
PonyWorld2.0可根據(jù)車端模型的薄弱環(huán)節(jié),在世界模型中自動(dòng)生成針對(duì)性訓(xùn)練場(chǎng)景,大幅減少無(wú)效訓(xùn)練數(shù)據(jù)的存儲(chǔ)與計(jì)算開銷,顯著提升每一輪迭代的效率和效果。
而廣州的另一家
自動(dòng)駕駛科技公司
文遠(yuǎn)知行
也采取了相似的技術(shù)路徑
今年1月,文遠(yuǎn)知行發(fā)布自研通用仿真模型——WeRide GENESIS,構(gòu)建起物理AI與生成AI之間的融合橋梁。
仿真模型在數(shù)字世界中高精度還原真實(shí)世界的駕駛環(huán)境,讓自動(dòng)駕駛車輛在虛擬城市中“直接上路”。通過仿真的方式,AI司機(jī)能夠經(jīng)歷海量多樣的道路、天氣與交通場(chǎng)景,練習(xí)應(yīng)對(duì)緊急情況或罕見事件的能力。
![]()
WeRide GENESIS可根據(jù)實(shí)景自動(dòng)生成對(duì)應(yīng)點(diǎn)云數(shù)據(jù),從而創(chuàng)建仿真世界 圖源:廣州科技創(chuàng)新
值得一提的是,針對(duì)真實(shí)反映客觀世界中復(fù)雜且難以預(yù)測(cè)的交互行為,WeRide GENESIS內(nèi)建了“AI主體”模塊,致力于為每一位交通參與者構(gòu)建智能行為模型,使其能夠模擬從日常駕駛到高風(fēng)險(xiǎn)行為的全譜系反應(yīng)。
例如,它可以模擬在路口猶豫不決最終又突然加速搶行的駕駛員,或者在車縫中穿梭的外賣騎手。這種對(duì)客體不確定性交互的模擬,對(duì)自動(dòng)駕駛系統(tǒng)提升在實(shí)際復(fù)雜交通流中應(yīng)變能力極為重要。
WeRide GENESIS同樣具備“AI診斷”功能。它能夠自動(dòng)捕捉急剎車造成乘客舒適度降低、遇到復(fù)雜路況識(shí)別感知延遲或預(yù)測(cè)偏差等不理想的駕駛行為,分析其根本原因并提供可執(zhí)行的改進(jìn)方案。
說到擁抱物理AI
廣州還有一家標(biāo)桿企業(yè)——
小鵬集團(tuán)
近日,小鵬集團(tuán)發(fā)布《2025年環(huán)境、社會(huì)及管治報(bào)告》。《報(bào)告》中明確,集團(tuán)將于2026年實(shí)現(xiàn)Robotaxi、人形機(jī)器人、飛行汽車三大物理AI應(yīng)用的量產(chǎn)。這三大應(yīng)用,其核心大模型都是小鵬的VLA2.0。
如果說傳統(tǒng)智駕系統(tǒng)是“按腳本開車”,小鵬VLA2.0則實(shí)現(xiàn)了“像人一樣思考開車”,其摒棄傳統(tǒng)的規(guī)則驅(qū)動(dòng)模式,以物理AI大模型理解路況,實(shí)現(xiàn)從“特征匹配”到“物理邏輯推理”的跨越。
這種技術(shù)架構(gòu)帶來的直觀改變,是智駕系統(tǒng)終于能應(yīng)對(duì)現(xiàn)實(shí)中的突發(fā)狀況。
例如,導(dǎo)航未及時(shí)更新施工導(dǎo)致封路的狀態(tài)時(shí),系統(tǒng)14秒內(nèi)自主推理多條路徑的可行性并選擇最優(yōu)解;
路邊車輛車門微開時(shí),提前捕捉意圖并預(yù)留避讓空間,實(shí)現(xiàn)從容繞行;
夜間及雨雪環(huán)境下,攝像頭感知力超人眼,模型決策幾乎不受影響,可輕松避讓深色衣物行人和小動(dòng)物。
此外,無(wú)地圖支持下,系統(tǒng)也能通過理解物理環(huán)境自主規(guī)劃路徑,即便在鄉(xiāng)村土路、無(wú)導(dǎo)航園區(qū)等人車混行場(chǎng)景,也能平穩(wěn)通行。
![]()
小鵬VLA 2.0能識(shí)別到路邊車輛突然打開車門并預(yù)留避讓空間。 圖源:廣州科技創(chuàng)新
小鵬的另一款拳頭產(chǎn)品人形機(jī)器人IRON,通過搭載物理AI大模型,融合了視覺、語(yǔ)言與行動(dòng)能力,使其能夠執(zhí)行對(duì)話、行走和復(fù)雜交互等任務(wù)。目前,小鵬已與寶鋼達(dá)成合作,計(jì)劃今年入駐鋼鐵廠負(fù)責(zé)高溫管道巡檢,替代人類進(jìn)入危險(xiǎn)作業(yè)區(qū)。
![]()
人形機(jī)器人IRON 圖源:廣州科技創(chuàng)新
![]()
廣州為物理AI應(yīng)用落地
筑牢生態(tài)底座
2026年,被科技界視為“物理AI元年”。以小馬智行、文遠(yuǎn)知行、小鵬集團(tuán)為代表的廣州科技企業(yè)站在了時(shí)代的風(fēng)口。
物理AI的核心價(jià)值,在于打破了“數(shù)字AI”與“現(xiàn)實(shí)世界”的壁壘——它不再是停留在屏幕里的算法,而是能走進(jìn)工廠、道路、社區(qū),真正解決實(shí)際問題的“實(shí)干家”。
對(duì)于廣州而言,這些企業(yè)所取得的突破,不僅彰顯了城市在智能網(wǎng)聯(lián)汽車、機(jī)器人等前沿領(lǐng)域的技術(shù)積淀,更勾勒出物理AI落地的清晰路徑,讓“AI+實(shí)體經(jīng)濟(jì)”不再是空談。
除了頭部企業(yè)的引領(lǐng),廣州的產(chǎn)業(yè)生態(tài)也在為物理AI的發(fā)展保駕護(hù)航——廣州擁有完整的產(chǎn)業(yè)鏈布局,從芯片、傳感器等核心零部件,到整車制造、場(chǎng)景測(cè)試,再到算法研發(fā)、數(shù)據(jù)服務(wù),已形成了閉環(huán)式產(chǎn)業(yè)生態(tài)。
同時(shí),廣州持續(xù)出臺(tái)系列政策支持前沿技術(shù)創(chuàng)新,設(shè)立智能網(wǎng)聯(lián)汽車與自動(dòng)駕駛產(chǎn)業(yè)專項(xiàng)資金,搭建測(cè)試驗(yàn)證平臺(tái),為企業(yè)提供場(chǎng)景試點(diǎn)、人才扶持等全方位保障,讓物理AI技術(shù)有了“落地生根”的土壤。
相信在不久的將來
我們就能看到自動(dòng)駕駛汽車
穿梭在城市的每一條街道
人形機(jī)器人為我們提供家庭服務(wù)
飛行汽車解決出行擁堵
而這一切
都離不開今天廣州
在物理AI領(lǐng)域的每一步深耕
參考來源
廣州科技創(chuàng)新《物理AI是什么?廣州企業(yè)正在訓(xùn)練另一種“大腦”》
https://mp.weixin.qq.com/s/TO2Umw6wCDcE47XijX2kDQ
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.