![]()
機器之心編輯部
過去十年,AI 卡的是算力;未來十年,物理 AI 卡的是數(shù)據(jù)。而數(shù)據(jù)的前提,是仿真。
沒有可規(guī)模化的仿真世界,就沒有可規(guī)模化的機器人數(shù)據(jù);沒有統(tǒng)一的仿真標準,就不會有真正的物理 AI 生態(tài)。
仿真,正在成為物理 AI 時代的 CUDA。
CUDA 曾經(jīng)把 GPU 計算變成 AI 時代的統(tǒng)一底座。今天,仿真正成為物理 AI 時代新的標準層。
物理 AI 的核心瓶頸已經(jīng)變了
回望過去的技術(shù)演進,每個階段都有自己的關(guān)鍵瓶頸。
大語言模型時代,這個瓶頸是算力。不論是閉源的 GPT、Claude,還是開源的 Llama、Qwen、DeepSeek,這條賽道的核心命題始終只有一個:如何用更多算力、在更大數(shù)據(jù)集上跑通 Scaling Law。算力的天花板在哪里,模型能力的邊界就在哪里。
支撐這一輪浪潮的底層基礎(chǔ)設(shè)施,正是以 CUDA 為代表的統(tǒng)一計算標準。CUDA 把 GPU 從圖形計算工具變成 AI 時代的通用計算底座,也讓大模型訓練第一次擁有了可規(guī)模化調(diào)用的計算基礎(chǔ)設(shè)施。誰掌握算力入口,誰就擁有時代紅利。
但進入物理 AI 時代,核心瓶頸正在從 “算力” 轉(zhuǎn)向 “數(shù)據(jù)”。
過去的大模型,本質(zhì)上是用互聯(lián)網(wǎng)語料學習人類世界;而物理 AI,需要學習真實物理世界。語言模型學習的是文字之間的關(guān)系,機器人學習的則是力如何傳遞、接觸如何發(fā)生、動作如何實現(xiàn)、世界如何反饋。
這意味著,物理 AI 所需要的數(shù)據(jù),不再是互聯(lián)網(wǎng)中天然存在的信息,而是必須在 “可交互、可執(zhí)行、可驗證” 的物理環(huán)境中被系統(tǒng)性生成。
![]()
數(shù)據(jù)的困境,來自機器人學習方式的根本差異。斯坦福教授李飛飛曾在談及機器人智能與傳統(tǒng)機器學習的差異時指出:“把數(shù)據(jù)帶入機器人訓練,遠比收集圖片困難得多。” 機器人模型要學會抓取、搬運、操作、行走,需要的不是靜態(tài)圖像,而是大量覆蓋真實物理交互的高質(zhì)量行動數(shù)據(jù)。
這類數(shù)據(jù)無法像網(wǎng)頁文本一樣從互聯(lián)網(wǎng)爬取,也無法通過簡單擴大算力憑空生成。自動駕駛尚有 “影子模式”:幾百萬輛量產(chǎn)車每天在真實道路上行駛,司機的每一個操作都可以成為天然監(jiān)督信號;機器人并沒有這樣的基礎(chǔ)設(shè)施
也正因如此,李飛飛進一步提出,可以用大量仿真數(shù)據(jù)訓練機器人 “大腦”,再用更少量的真實數(shù)據(jù)彌合通往現(xiàn)實世界的差距。換句話說,機器人數(shù)據(jù)不是現(xiàn)成存在的互聯(lián)網(wǎng)語料,而必須在可交互、可執(zhí)行、可驗證的環(huán)境中被系統(tǒng)性生產(chǎn)出來;沒有成熟的仿真體系,就沒有規(guī)模化的訓練數(shù)據(jù),也就沒有具身智能的持續(xù)迭代。
除了數(shù)據(jù)數(shù)量,數(shù)據(jù)質(zhì)量同樣關(guān)鍵。過去談論數(shù)據(jù)質(zhì)量,往往聯(lián)想到成功完成任務的樣本;但物理 AI 更需要理解失敗—— 物體為什么滑落,動作為什么失穩(wěn),接觸為什么偏離預期。只有不斷暴露問題、糾錯反饋,模型才可能從數(shù)據(jù)中真正獲得學習信號。
因此,數(shù)據(jù)背后還有一個同等重要卻更隱蔽的瓶頸:評測
大模型時代的評測相對成熟:訓練損失是可靠的優(yōu)化信號,標準化基準(MMLU、HumanEval 等)能直接反映模型能力進展。但在物理 AI 領(lǐng)域,這套邏輯失效了。訓練損失的下降與實驗室 Demo 的成功,已難以全面反映模型在真實環(huán)境中的綜合能力;今天跑通的動作,換一個燈光、換一個物體表面,可能就失效了。
問題的核心在于:機器人的訓練與評測,本質(zhì)上都需要在符合真實物理規(guī)則的環(huán)境中反復執(zhí)行。但真實世界不可無限重置、不可大規(guī)模并行,也難以系統(tǒng)性構(gòu)造失敗場景。沒有統(tǒng)一、可復現(xiàn)、可并行、可量化的評測體系,數(shù)據(jù)就很難有效指導訓練,模型也無法知道自己在哪里失敗,更無法定向補充數(shù)據(jù)、提升能力。
因此,仿真不再是輔助工具,而是物理 AI 數(shù)據(jù)生產(chǎn)與能力評測的前提條件。誰能構(gòu)建更大、更快、更真實的仿真世界,誰就同時打開了數(shù)據(jù)生產(chǎn)和能力評測兩道門,也就掌握了通往通用具身智能的鑰匙。
仿真
國際巨頭爭搶的物理 AI 戰(zhàn)略高地
如果說上述判斷還停留在理論層面,那么過去十幾年國際巨頭的一系列動作早已用真金白銀做出了表態(tài)。他們通過收購、開源、孵化、自研,不遺余力地要把仿真能力嵌入到自己的機器人技術(shù)棧與生態(tài)標準中。
NVIDIA 早在 2008 年就收購了當時最主流的物理引擎PhysX,并深度綁定自家 GPU 硬件,將其逐步從游戲物理工具演進為 Omniverse 中的高精度仿真內(nèi)核,成為 Isaac Sim 等機器人平臺的核心物理基礎(chǔ)設(shè)施。
Google DeepMind 在 2021 年收購了MuJoCo—— 此前它已是機器人和強化學習圈的標配工具,成為論文、基準測試、開源代碼的默認選項。由此,Google 順理成章地拿到了整個機器人學術(shù)界的工具鏈主導權(quán)。
Drake孵化自 MIT CSAIL,后被 Toyota Research Institute(TRI)接管,成為高可信動力學仿真的可擴展底座;Bullet 則隨著創(chuàng)始人的入職而與 Google 生態(tài)實現(xiàn)深度綁定。
Disney Research 則走了一條自研路線:孵化出專攻閉鏈機構(gòu)與極端工況運動求解的仿真引擎Kamino,專攻非標準構(gòu)型下如何穩(wěn)定站立和運動,從而解決商業(yè)化機器人落地的高頻痛點。
這些舉措并非偶然,而是全球頂級機構(gòu)在仿真賽道上有意識的戰(zhàn)略卡位。過去行業(yè)以為,仿真只是一個工程工具;但今天全球巨頭真正爭奪的,已經(jīng)不是 “誰的引擎更快”,而是誰能定義世界如何被建模、物理如何被表達、數(shù)據(jù)如何被生成、能力如何被評測、機器人如何被訓練。
因為誰定義仿真,誰就定義了機器如何理解現(xiàn)實世界。這已經(jīng)不是工具之爭,而是世界定義權(quán)之爭。
問題也隨之出現(xiàn):這些求解器長期分散在不同體系中,物理表達、資產(chǎn)標準、訓練接口和評測流程彼此割裂。物理 AI 需要的,不是更多單點工具,而是一個能把這些能力整合進同一架構(gòu)的中樞引擎。
Newton
全球物理 AI 基礎(chǔ)設(shè)施第一次走向統(tǒng)一
![]()
Newton應運而生。
這不是一次普通的開源發(fā)布,而是全球物理 AI 基礎(chǔ)設(shè)施第一次開始走向統(tǒng)一。過去十幾年,GPU 并行計算、高精度接觸動力學、復雜機構(gòu)求解、強化學習仿真、工業(yè)級機器人驗證,始終分散在不同體系中。Newton 第一次嘗試把這些能力放進同一個開放架構(gòu)中。
它想統(tǒng)一的是物理 AI 的底層世界模型。
2025 年 9 月,NVIDIA、Google DeepMind 與 Disney Research 聯(lián)合開源物理仿真引擎 Newton Beta 版。它不是某一家公司的單點開源嘗試,而是三家全球頂級機構(gòu)投入數(shù)百名工程師與研究員、歷時近兩年持續(xù)開發(fā),將各自最強的仿真能力放進同一個開放架構(gòu)中的結(jié)果。
NVIDIA 貢獻的是 GPU 原生加速、Warp 框架與 Isaac 生態(tài)。過去十幾年,NVIDIA 持續(xù)推動 GPU 從圖形計算走向通用計算,再走向 AI 訓練與物理仿真。到了 Newton,這套能力被進一步延伸到機器人學習場景:高并行、可擴展,并可與現(xiàn)代 AI 訓練基礎(chǔ)設(shè)施深度結(jié)合。
Google DeepMind 帶來的是 MuJoCo 在機器人學習與高精度接觸動力學上的長期積累。MuJoCo 曾是機器人強化學習和控制研究中最重要的仿真工具之一,而 Newton 將這一套高精度動力學能力遷移到 GPU 原生框架中,使其能夠支撐更大規(guī)模的并行訓練和評測。
Disney Research 則將 Kamino 等仿真能力納入其中。與標準機器人形態(tài)不同,Disney 長期面對的是閉鏈機構(gòu)、復雜結(jié)構(gòu)、非標準構(gòu)型與極端工況下的運動控制問題,這使其在復雜機構(gòu)穩(wěn)定求解上形成了獨特積累。Newton 將這一路線吸收進統(tǒng)一架構(gòu),使機器人仿真不再局限于傳統(tǒng)剛體系統(tǒng),而是進一步覆蓋復雜機構(gòu)、柔性材料與多物理交互。
也就是說,Newton 實現(xiàn)了GPU 并行計算、高精度接觸動力學、復雜機構(gòu)求解與機器人學習生態(tài)第一次在同一個開源架構(gòu)中實現(xiàn)系統(tǒng)性匯合
模塊化架構(gòu)、GPU 原生加速、自動微分能力與跨生態(tài)協(xié)作機制,使 Newton 不只是一個物理引擎,更像是面向物理 AI 訓練、評測與部署的統(tǒng)一仿真底座
這些特質(zhì),使Newton 從誕生之初就站在了物理 AI 基礎(chǔ)設(shè)施的關(guān)鍵位置
值得關(guān)注的是,在這個由全球頂級機構(gòu)共同構(gòu)成的物理 AI 仿真基礎(chǔ)設(shè)施版圖中,中國公司第一次出現(xiàn)在核心坐標上
中國公司第一次
進入全球物理 AI 標準定義層
![]()
今年三月,光輪智能正式受邀作為核心指導委員加入開源 GPU 加速物理引擎 Newton,在關(guān)鍵具身仿真技術(shù)方向上發(fā)揮主導作用,并與 NVIDIA、Google DeepMind、Disney Research, 共同引領(lǐng)推動下一代開源物理 AI 仿真標準。
同時加入的還有 Toyota Research Institute (豐田研究院),所帶來的高可信動力學仿真的可擴展軟件底座 Drake,進一步拓展了 Newton 的技術(shù)能力。
第一次,中國公司以核心共建者身份進入全球物理 AI 仿真基礎(chǔ)設(shè)施標準的定義層:過去二十年,操作系統(tǒng)生態(tài)由 Microsoft 與 Apple 定義,移動生態(tài)由 Apple 與 Google 定義,AI 訓練框架與計算標準由 NVIDIA 與 Google 等巨頭主導。而今天,物理 AI 的仿真標準終于開始有了中國公司的核心參與。
光輪加入 Newton TSC,是憑借全棧自研的 “求解—測量—生成” 三位一體技術(shù)平臺
- 首先,依托自研求解器與物理測量體系,主導 Newton 引擎核心能力的持續(xù)演進,包括求解器的物理驗證與系統(tǒng)性標定、接觸建模與多物理場能力優(yōu)化,以及仿真結(jié)果與真實世界一致性的持續(xù)提升。
- 其次,圍繞SimReady 體系,推動仿真資產(chǎn)在物理屬性規(guī)范、數(shù)據(jù)格式、接口標準、驗證流程與評測體系等方面的進一步統(tǒng)一,完善下一代仿真世界標準。
- 第三,依托物理測量工廠與資產(chǎn)生成體系,持續(xù)提升規(guī)模化 SimReady 世界供給能力,構(gòu)建高保真、可復用的仿真資產(chǎn)與場景庫,為全球開發(fā)者提供可直接使用的仿真資源。
求解、測量、生成三者合在一起,構(gòu)成從物理建模、引擎驗證到工程落地的完整閉環(huán),這使 Newton 不僅能算,而且可驗證、可復用、可規(guī)模化進入真實工業(yè)流程。
![]()
也正因此,光輪成為 Newton TSC 核心共建格局中唯一一家中國公司。這標志著其在物理 AI 底層技術(shù)領(lǐng)域的能力與影響力,獲得了國際生態(tài)的正式認可。
事實上,光輪在國際開源生態(tài)中的布局遠不止于 Newton。
此前,光輪智能已聯(lián)合 NVIDIA 開源發(fā)布Isaac Lab-Arena機器人策略評測基準框架,推動具身大模型評測走向可復現(xiàn)、可擴展、可規(guī)模化;自研LeIsaac仿真平臺被 Hugging Face 官方文檔收錄,成為全球開發(fā)者進入具身仿真的標準工程框架;聯(lián)手 World Labs,用RoboFinals解決世界模型評測難題;聯(lián)合通義千問,通過RoboFinals共建可復現(xiàn)、可診斷的工業(yè)級評測閉環(huán),推動具身智能評測從學術(shù) benchmark 走向工業(yè)級基礎(chǔ)設(shè)施。
從底層物理引擎,到開發(fā)者平臺,再到評測框架與工業(yè)級閉環(huán),光輪智能參與的并不是一個個孤立項目,而是一條清晰的生態(tài)路徑:底層物理引擎負責 “世界如何運行”,仿真平臺負責 “開發(fā)者如何使用”,評測框架負責 “模型如何被衡量”,工業(yè)級評測閉環(huán)則負責 “能力如何持續(xù)迭代”。
這條生態(tài)路徑的價值已經(jīng)在市場中得到驗證。今天,光輪智能已成為全球物理 AI 仿真與數(shù)據(jù)基礎(chǔ)設(shè)施的重要提供方,服務全球全部前五的世界模型團隊;國際主流具身智能團隊中,超過 80% 的仿真資產(chǎn)與合成數(shù)據(jù)來自光輪
在這條路徑上,光輪智能的角色發(fā)生變化:它不只是為頭部模型團隊提供仿真資產(chǎn)與合成數(shù)據(jù),更是在引領(lǐng)構(gòu)建物理 AI 時代的開源基礎(chǔ)設(shè)施、開發(fā)者平臺與評測標準
中國公司第一次以核心技術(shù)共建者的身份,進入全球物理 AI 仿真基礎(chǔ)設(shè)施標準形成的關(guān)鍵位置。
![]()
全球物理 AI 仿真 Top 5 專家天團
再看 Newton TSC 的人員構(gòu)成,可謂高手云集。
![]()
- Miles Macklin Ph.D.(NVIDIA)NVIDIA 仿真技術(shù)高級工程總監(jiān),Warp 框架的聯(lián)合創(chuàng)造者。如果說 Newton 的速度優(yōu)勢有一個技術(shù)源頭,就是 Macklin 和他的團隊十幾年來在 GPU 并行物理仿真上的積累。
- Yuval Tassa Ph.D.(Google DeepMind)機器人仿真團隊負責人,MuJoCo 聯(lián)合創(chuàng)始人。他解決了 MuJoCo-Warp 的融合問題,讓 MuJoCo 的物理精度在 GPU 上重生。Tassa 代表的是機器人學界最核心的一條高精度仿真路徑。
- 謝晨 Ph.D.(光輪智能)光輪智能創(chuàng)始人兼 CEO,曾任 NVIDIA 及 Cruise 自動駕駛仿真負責人,長期推動仿真與合成數(shù)據(jù)在自動駕駛和物理 AI 中的產(chǎn)業(yè)化落地。國際首創(chuàng)將生成式 AI 融入仿真,主導確立光輪“求解—測量—生成”三位一體全棧自研仿真技術(shù)路線。
- Moritz B?cher Ph.D.(Disney Research)Disney Research 負責人。Disney 的主題樂園可能是全球?qū)蕵窓C器人要求最苛刻的環(huán)境,Kamino 求解器就是在他手下誕生的。
- Michael Sherman Ph.D.(TRI)是機器人仿真基礎(chǔ)設(shè)施領(lǐng)域的老兵。作為 TRI 機器人仿真的核心負責人之一,其職業(yè)軌跡橫跨 SD/FAST、Simbody、OpenSim、Drake 等多代關(guān)鍵仿真平臺。
和這四位全球仿真領(lǐng)域的核心奠基者相比,謝晨博士的獨特之處在于:他不是從單一求解器、單一學術(shù)體系或單點工程模塊中走來,而是在自動駕駛與物理 AI 兩代產(chǎn)業(yè)浪潮中,持續(xù)主導仿真基礎(chǔ)設(shè)施的工程化、規(guī)模化與系統(tǒng)化落地
他先后在 Cruise 和 NVIDIA 主導自動駕駛仿真體系建設(shè),在 L4 自動駕駛一線驗證了仿真與合成數(shù)據(jù)對算法迭代的價值,也在全球仿真基礎(chǔ)設(shè)施從自動駕駛時代走向物理 AI 時代的承擔了關(guān)鍵角色。
在這一過程中,謝晨博士形成了區(qū)別于傳統(tǒng)仿真專家的系統(tǒng)性視角:仿真不是一個求解器、一套工具鏈,或一個用于測試的虛擬環(huán)境,而是一套貫穿數(shù)據(jù)生成、模型訓練、能力評測與真實部署的完整教育系統(tǒng)。
自動駕駛時代,仿真主要服務于視覺感知、場景回放與回歸測試;進入機器人與物理 AI 階段,仿真還必須解決接觸、力傳遞、材料形變、動作失敗等真實物理交互問題,并支撐模型在可復現(xiàn)、可規(guī)模化的環(huán)境中持續(xù)學習
2023 年,光輪智能的創(chuàng)立正是要把這一判斷系統(tǒng)化為可落地、可交付、可規(guī)模化的全棧仿真基礎(chǔ)設(shè)施。光輪所構(gòu)建的不是單點仿真工具,而是以求解、測量、生成、訓練、評測與部署為核心的完整閉環(huán),繼續(xù)引領(lǐng)仿真從 “輔助驗證工具” 走向物理 AI 的核心生產(chǎn)系統(tǒng)。
因此,他加入 Newton TSC,不只是個人入選,而是中國力量首次以核心構(gòu)建者身份進入全球物理 AI 基礎(chǔ)設(shè)施的核心坐標
仿真是物理 AI 時代的 CUDA
過去十年卡算力,未來十年卡數(shù)據(jù)。而數(shù)據(jù)的前提,是仿真。
2006 年,NVIDIA 發(fā)布 CUDA。在那之前,GPU 仍主要被視為圖形計算工具,普通開發(fā)者想調(diào)用其并行計算能力,門檻極高。CUDA 把 GPU 的計算能力抽象成一套標準接口,讓開發(fā)者可以規(guī)模化調(diào)用。
CUDA 成功的關(guān)鍵,在于它在關(guān)鍵窗口期同時完成了三件事:建立統(tǒng)一底層標準,讓碎片化算力可以被統(tǒng)一調(diào)用;構(gòu)建 cuDNN 等一整套工具鏈,把底層算力翻譯成開發(fā)者能直接調(diào)用的生產(chǎn)力;開放生態(tài),讓這套標準形成跨場景、跨開發(fā)者、跨模型訓練流程的普適性。
今天,物理 AI 正處在相似的歷史節(jié)點。大模型時代,CUDA 定義的是 “如何調(diào)用計算”;物理 AI 時代,仿真要定義的是 “如何生成世界”,因為機器人需要的是更多可交互、可執(zhí)行、可評測、可遷移的物理世界。因此,仿真正從工具層上升為標準層:它需要定義機器人的訓練場景、世界的表征邏輯、數(shù)據(jù)生產(chǎn)與結(jié)果評測方式……
歷史上,每一次基礎(chǔ)設(shè)施標準窗口期關(guān)閉之后,后來者都很難再獲得定義權(quán)。PC 時代,操作系統(tǒng)生態(tài)由 Microsoft 與 Apple 定義;移動時代,應用生態(tài)由 Apple 和 Google 定義;大模型時代,訓練框架與計算標準由 CUDA 定義。
而今天,物理 AI 的仿真層,正處于規(guī)則尚未凝固的窗口期。誰能定義世界如何被表達,數(shù)據(jù)如何被生成,能力如何被評測,機器人如何被訓練,誰就有機會定義物理 AI 的未來。
窗口不會永遠打開。
而這一次,中國公司第一次站上了書寫規(guī)則的位置。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.