![]()
4月25日,在2026北京車展上,Momenta四位合伙人罕見同臺,公司CEO曹旭東站在臺上,身后的大屏幕上打出一行字:“Momenta R7,物理AI序章”。
這一天,Moment宣布:R7強化學習世界模型實現量產首發(fā),物理AI正式從技術理念走向規(guī)模化量產落地。
一周前,曹旭東剛剛和團隊反復推敲過這個標題,“序章”這個詞是他堅持的。他認為,智能駕駛正從“看見世界”走向“理解世界”,物理AI的故事才剛剛開始。
這一天,Momenta宣布了幾組數據:累計定點車型超過200款,已交付超70款量產車型,搭載Momenta系統(tǒng)的量產車輛規(guī)模超過80萬臺。最快不到40天,就可以完成10萬臺交付。
對比三年前,Momenta首個10萬臺量產用了整整24個月。“飛輪效應正在加速形成。”Momenta合伙人孫環(huán)說。
本屆北京車展上,超過20個品牌、60余款車型搭載了Momenta方案,包括梅賽德斯-奔馳、奧迪、寶馬的新發(fā)布車型。在展館里走一圈,幾乎每走幾步就能看到一輛搭載Momenta系統(tǒng)的車。
但曹旭東想講的,不止是商業(yè)數字。他和團隊把這場發(fā)布會的核心,留給了兩個關鍵詞:世界模型與強化學習。
從看見到“理解”
曹旭東口中的“物理AI”指的是什么?他用了一個對比:大語言模型通過Next Token Prediction來壓縮數字世界的常識,讓AI學會了理解文本;而世界模型,則是通過World Model Prediction來預測物理世界的未來狀態(tài)和交互邏輯,讓AI理解物體的物理屬性、運動的因果關系。
“自主進化是智能持續(xù)迭代的關鍵動能。AI在環(huán)境中,根據目標,不斷接收反饋、試錯迭代、自主優(yōu)化。因此,世界模型與強化學習,共同構成物理AI的兩大核心支柱。”曹旭東說。
Momenta合伙人、研發(fā)SVP夏炎進一步拆解了Momenta世界模型的三個層次。
第一層是預訓練。通過海量真實駕駛數據的預訓練,將物理規(guī)律、常識與因果關系壓縮進模型,讓系統(tǒng)形成對物理世界的基礎認知。
第二層是仿真。將世界模型用于自動駕駛閉環(huán)仿真,讓系統(tǒng)推演自身行為變化時世界將如何演變,對長尾場景進行性能評估。
第三層,是在世界模型中進行強化學習。在前兩層基礎上,為強化學習構建一個高度真實的虛擬訓練場,讓系統(tǒng)在接近真實的環(huán)境中反復探索與試錯。
正是在這樣的虛擬訓練場中,系統(tǒng)從單純的“模仿學習”走向“想象與探索”,在虛擬世界中經歷千萬次推演,自主習得在復雜博弈中做出最優(yōu)決策的能力。
Momenta合伙人、研發(fā)SVP孫剛舉了一個例子:日常行車中,如果前車意外掉落一箱蘋果,搭載Momenta系統(tǒng)的車輛能夠自主預判蘋果滾落的軌跡與擴散范圍,提前平穩(wěn)減速、規(guī)劃繞行路線,以更從容的方式處理突發(fā)路況。
“現實世界中萬中無一的極端場景,在虛擬練兵場里已被反復經歷、充分消化。這一機制的目標,是讓模型在罕見極端場景下的表現超越人類駕駛員。”夏炎說。
“貧礦”變鋼鐵
“數據這件事,它不是單單的數據本身。你可以認為數據就是礦石,而且是含礦量很低的鐵礦石。”曹旭東在發(fā)布會后接受經濟觀察報等媒體采訪,被問到“數據飛輪最大的瓶頸是什么”時,他打了這個比方。
市面上有一種說法是,獲得大量數據沒那么難,難的是用好數據。曹旭東認同這個判斷。
“你怎么把貧礦變成富礦?”曹旭東舉例說,高速上三只小狗排隊橫穿高速,這樣的場景萬中無一、萬里挑一,把它挑出來,難度本身就是大海撈針。這已經有很高的門檻了。
從貧礦變成富礦,再從富礦變成鋼鐵,鋼鐵變成發(fā)動機,發(fā)動機最終裝到車上,這才是最終的價值。“擁有海量的原始數據,僅僅是一個價值源頭的10%,剩下的90%來自于這個體系的能力。”曹旭東說。
Momenta目前有超過80萬臺量產車在路上跑,可做到海量數據回流。在預訓練階段,這些數據通過World Model Pre-Training來訓練模型,讓它具備物理常識。但這還不夠。
“有物理常識不代表它是一個好司機。”曹旭東說。他表示,大量數據里有好的駕駛行為,但更多的是不好的駕駛行為。這就像大語言模型的訓練,通過海量數據輸入,模型具備了世界的常識,但不代表它有好的行為習慣。還需要Post-Training,把行為對齊到人類的好行為上。
按照官方說法,這套邏輯,Momenta已經跑了十年。
“敲門”敲八年
2017年,奔馳投資了Momenta。彼時,Momenta還是一家成立不久的創(chuàng)業(yè)公司。曹旭東記得,當時奔馳的董事長覺得“這個公司特別有活力”,所以選擇投資。
但Momenta與奔馳的第一個量產項目上市,是在2025年下半年。從投資到量產,整整八年。
“我當時問了一個清華的師兄,他告訴我說,你們跟奔馳合作量產至少需要十年。”曹旭東說。他回憶,2017年到2020年是POC階段,2020年到2022年是Pre SOP,2022年到2024年是小批量量產開發(fā)。2024年,Momenta拿下了奔馳所有電車和油車的業(yè)務。2025年底,才真正量產。
曹旭東以此來說明汽車行業(yè)的特殊性:“面向主機廠,國內OEM敲門敲三年,海外OEM敲門敲五到七年。”
這也是曹旭東判斷智駕格局會快速收斂的依據。在他看來,自動駕駛有非常強的規(guī)模效應和先發(fā)優(yōu)勢,“它的效應會比芯片行業(yè)更強”。
為了佐證自己的判斷,曹旭東還復盤了芯片行業(yè)的歷史:PC時代的芯片,全球只有兩家;手機芯片時代,全球也只有高通和聯發(fā)科兩家。而自動駕駛因為是軟件,邊際成本為零,規(guī)模效應更強。這種規(guī)模效應既體現在成本上,也體現在體驗提升上,即數據越多,模型能力越強。
“中國也就兩到三家,全球也就三到四家,會非常快速地收斂。”曹旭東說。目前,Momenta合作的客戶已經覆蓋德系BBA、大眾,日系豐田、本田、日產,美系通用、福特。他表示:“不光是今年,去年我們就已經是全球品牌的共同選擇了。”
物理AI需要“門票”
當被問及“物理AI被英偉達黃仁勛帶火后,很多公司都說自己是物理AI公司,Momenta在全球范圍內處于什么位置?”曹旭東的回答,從數字AI和物理AI的對比切入。
按照曹旭東的說法,數字AI在過去幾年突飛猛進,很重要的原因是數據能快速、規(guī)模地獲得。OpenAI很早就同時做了機器人和數字AI,但后來階段性地放棄了機器人,選擇做GPT——因為互聯網數據已經是海量的,而機器數據的獲取太難了。
“但是,我們所在的世界,既有數字的部分,又有物理的部分。物理的部分可能是更大的一部分。”曹旭東說。在他看來,當數字世界取得巨大進展后,經驗和方法必然要進入物理世界,并在物理世界中做創(chuàng)新,“這就是為什么我覺得現在是物理AI的序章剛開始。”
曹旭東對物理AI有一個核心判斷:最關鍵的,是數據閉環(huán)和商業(yè)閉環(huán),而且兩者是互動的。
曹旭東觀察到一個現象,即任何一個人工智能的應用,一旦接近人類水平,就會在很短時間大幅超越人類。“AlphaGo也好,人臉識別也好,接近人可能花了十年、二十年,但超越人、大幅超越人,可能就發(fā)生在一兩年、兩三年。”他說。
這背后的邏輯是什么?曹旭東的答案是,先有數據閉環(huán),才有足夠好的體驗。體驗一旦達到或超過人類水平,就能實現爆發(fā)式商業(yè)化。商業(yè)化帶來數據爆發(fā)式增長,數據增長又帶來模型能力爆發(fā)式增長。最終互相促進、互相激發(fā),形成強烈的正反饋。
“自動駕駛進入到了這個階段。機器人還需要一段時間。”曹旭東說。
曹旭東同時認為,物理AI是需要“門票”的。“自動駕駛要實現規(guī)模化L4,累計投入至少是百億美金。通用機器人呢?可能幾百億美金到千億美金級別,這還可能是創(chuàng)業(yè)公司的研發(fā)效率。”他說。
曹旭東的判斷是,長期來看,靠融資做成通用物理AI是不現實的,一定要有現金流業(yè)務。這個現金流業(yè)務,可以是自動駕駛,也可以是其他方向。無論如何,一定要有一個現金流業(yè)務來支持物理AI的研發(fā)。
Momenta選擇的路徑,是通過量產乘用車的規(guī)模商業(yè)化,支撐L4的研發(fā)。
但Momenta的L4不止Robotaxi。曹旭東透露,Momenta既做Robotaxi,也做Robovan物流,明年還會做Robotruck。邏輯回到一個核心理念:一個自動駕駛大模型,能夠實現所有的垂直應用,并且做得更好。
“這件事我們已經在Robotaxi、Robovan和乘用車上成功驗證了。這帶來的價值是,每個垂直場景的研發(fā)成本大幅降低,而每個場景的經驗和數據又匯總到大模型里,讓每個垂直領域做得更好。這是平臺優(yōu)勢。”曹旭東說。
曹旭東這個邏輯還類比了十多年前的互聯網行業(yè)——垂直電商和平臺電商并存,但最終勝出的是平臺。他判斷在自動駕駛大模型領域,也存在很強的平臺效應。
“東方硅谷”野心
發(fā)布會尾聲,曹旭東講了一段個人經歷。十年前,他在硅谷看到一條以仙童半導體命名的街道Fairchild Drive。正是這家公司,孕育了全球半導體產業(yè)的起點,最終鑄就了硅谷的傳奇。
“那一刻,我心中的那團熱火被點燃了。今天,我們希望攜手所有中國AI公司,共同書寫屬于東方的硅谷傳奇。”曹旭東說。
談到全球競爭,曹旭東提到一個觀點:中國技術和產品進入海外市場,給當地用戶帶來領先價值的同時,也會帶來一些對當地企業(yè)和就業(yè)的沖擊。
“比較好的解決方案,是借鑒中國之前的模式,做反向合資。讓當地享受中國技術的好體驗,同時中國技術賦能當地企業(yè),帶來更多發(fā)展和就業(yè)。這是一個共贏的模式。”曹旭東說。
至于具體算法的中外競爭,曹旭東認為,在中國環(huán)境下,知識流動和人才流動速度很快,單點算法并不存在特別大的壁壘。真正的差距,在更深處,也就是體系和組織的差距。
“架構能力比單點算法能力更重要。因為架構涉及取舍,好的架構能實現更好的積累和合力。而架構之上,是包含數據迭代、訓練、驗證的體系。體系之上,則是組織和文化。”曹旭東說。
(作者 濮振宇)
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。
![]()
濮振宇
汽車與出行新聞中心記者 關注汽車產業(yè)政策、行業(yè)企業(yè)轉型等,對自主品牌、主流合資品牌關注較多,擅長分析報道。 聯系郵箱:puzhenyu@eeo.com.cn 微信號:pzy369963493
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.