網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

光輪智能與谷歌、英偉達共同定義物理AI仿真標準

2026-05-12 20:21:07　來源: 機器之心Pro

河北舉報

分享至

機器之心編輯部

過去十年，AI 卡的是算力；未來十年，物理 AI 卡的是數(shù)據(jù)。而數(shù)據(jù)的前提，是仿真。

沒有可規(guī)模化的仿真世界，就沒有可規(guī)模化的機器人數(shù)據(jù)；沒有統(tǒng)一的仿真標準，就不會有真正的物理 AI 生態(tài)。

仿真，正在成為物理 AI 時代的 CUDA。

CUDA 曾經(jīng)把 GPU 計算變成 AI 時代的統(tǒng)一底座。今天，仿真正成為物理 AI 時代新的標準層。

物理 AI 的核心瓶頸已經(jīng)變了

回望過去的技術(shù)演進，每個階段都有自己的關(guān)鍵瓶頸。

大語言模型時代，這個瓶頸是算力。不論是閉源的 GPT、Claude，還是開源的 Llama、Qwen、DeepSeek，這條賽道的核心命題始終只有一個：如何用更多算力、在更大數(shù)據(jù)集上跑通 Scaling Law。算力的天花板在哪里，模型能力的邊界就在哪里。

支撐這一輪浪潮的底層基礎(chǔ)設(shè)施，正是以 CUDA 為代表的統(tǒng)一計算標準。CUDA 把 GPU 從圖形計算工具變成 AI 時代的通用計算底座，也讓大模型訓練第一次擁有了可規(guī)模化調(diào)用的計算基礎(chǔ)設(shè)施。誰掌握算力入口，誰就擁有時代紅利。

但進入物理 AI 時代，核心瓶頸正在從 “算力” 轉(zhuǎn)向 “數(shù)據(jù)”。

過去的大模型，本質(zhì)上是用互聯(lián)網(wǎng)語料學習人類世界；而物理 AI，需要學習真實物理世界。語言模型學習的是文字之間的關(guān)系，機器人學習的則是力如何傳遞、接觸如何發(fā)生、動作如何實現(xiàn)、世界如何反饋。

這意味著，物理 AI 所需要的數(shù)據(jù)，不再是互聯(lián)網(wǎng)中天然存在的信息，而是必須在 “可交互、可執(zhí)行、可驗證” 的物理環(huán)境中被系統(tǒng)性生成。

數(shù)據(jù)的困境，來自機器人學習方式的根本差異。斯坦福教授李飛飛曾在談及機器人智能與傳統(tǒng)機器學習的差異時指出：“把數(shù)據(jù)帶入機器人訓練，遠比收集圖片困難得多。” 機器人模型要學會抓取、搬運、操作、行走，需要的不是靜態(tài)圖像，而是大量覆蓋真實物理交互的高質(zhì)量行動數(shù)據(jù)。

這類數(shù)據(jù)無法像網(wǎng)頁文本一樣從互聯(lián)網(wǎng)爬取，也無法通過簡單擴大算力憑空生成。自動駕駛尚有 “影子模式”：幾百萬輛量產(chǎn)車每天在真實道路上行駛，司機的每一個操作都可以成為天然監(jiān)督信號；機器人并沒有這樣的基礎(chǔ)設(shè)施

也正因如此，李飛飛進一步提出，可以用大量仿真數(shù)據(jù)訓練機器人 “大腦”，再用更少量的真實數(shù)據(jù)彌合通往現(xiàn)實世界的差距。換句話說，機器人數(shù)據(jù)不是現(xiàn)成存在的互聯(lián)網(wǎng)語料，而必須在可交互、可執(zhí)行、可驗證的環(huán)境中被系統(tǒng)性生產(chǎn)出來；沒有成熟的仿真體系，就沒有規(guī)模化的訓練數(shù)據(jù)，也就沒有具身智能的持續(xù)迭代。

除了數(shù)據(jù)數(shù)量，數(shù)據(jù)質(zhì)量同樣關(guān)鍵。過去談論數(shù)據(jù)質(zhì)量，往往聯(lián)想到成功完成任務的樣本；但物理 AI 更需要理解失敗—— 物體為什么滑落，動作為什么失穩(wěn)，接觸為什么偏離預期。只有不斷暴露問題、糾錯反饋，模型才可能從數(shù)據(jù)中真正獲得學習信號。

因此，數(shù)據(jù)背后還有一個同等重要卻更隱蔽的瓶頸：評測

大模型時代的評測相對成熟：訓練損失是可靠的優(yōu)化信號，標準化基準（MMLU、HumanEval 等）能直接反映模型能力進展。但在物理 AI 領(lǐng)域，這套邏輯失效了。訓練損失的下降與實驗室 Demo 的成功，已難以全面反映模型在真實環(huán)境中的綜合能力；今天跑通的動作，換一個燈光、換一個物體表面，可能就失效了。

問題的核心在于：機器人的訓練與評測，本質(zhì)上都需要在符合真實物理規(guī)則的環(huán)境中反復執(zhí)行。但真實世界不可無限重置、不可大規(guī)模并行，也難以系統(tǒng)性構(gòu)造失敗場景。沒有統(tǒng)一、可復現(xiàn)、可并行、可量化的評測體系，數(shù)據(jù)就很難有效指導訓練，模型也無法知道自己在哪里失敗，更無法定向補充數(shù)據(jù)、提升能力。

因此，仿真不再是輔助工具，而是物理 AI 數(shù)據(jù)生產(chǎn)與能力評測的前提條件。誰能構(gòu)建更大、更快、更真實的仿真世界，誰就同時打開了數(shù)據(jù)生產(chǎn)和能力評測兩道門，也就掌握了通往通用具身智能的鑰匙。

仿真

國際巨頭爭搶的物理 AI 戰(zhàn)略高地

如果說上述判斷還停留在理論層面，那么過去十幾年國際巨頭的一系列動作早已用真金白銀做出了表態(tài)。他們通過收購、開源、孵化、自研，不遺余力地要把仿真能力嵌入到自己的機器人技術(shù)棧與生態(tài)標準中。

NVIDIA 早在 2008 年就收購了當時最主流的物理引擎PhysX，并深度綁定自家 GPU 硬件，將其逐步從游戲物理工具演進為 Omniverse 中的高精度仿真內(nèi)核，成為 Isaac Sim 等機器人平臺的核心物理基礎(chǔ)設(shè)施。

Google DeepMind 在 2021 年收購了MuJoCo—— 此前它已是機器人和強化學習圈的標配工具，成為論文、基準測試、開源代碼的默認選項。由此，Google 順理成章地拿到了整個機器人學術(shù)界的工具鏈主導權(quán)。

Drake孵化自 MIT CSAIL，后被 Toyota Research Institute（TRI）接管，成為高可信動力學仿真的可擴展底座；Bullet 則隨著創(chuàng)始人的入職而與 Google 生態(tài)實現(xiàn)深度綁定。

Disney Research 則走了一條自研路線：孵化出專攻閉鏈機構(gòu)與極端工況運動求解的仿真引擎Kamino，專攻非標準構(gòu)型下如何穩(wěn)定站立和運動，從而解決商業(yè)化機器人落地的高頻痛點。

這些舉措并非偶然，而是全球頂級機構(gòu)在仿真賽道上有意識的戰(zhàn)略卡位。過去行業(yè)以為，仿真只是一個工程工具；但今天全球巨頭真正爭奪的，已經(jīng)不是 “誰的引擎更快”，而是誰能定義世界如何被建模、物理如何被表達、數(shù)據(jù)如何被生成、能力如何被評測、機器人如何被訓練。

因為誰定義仿真，誰就定義了機器如何理解現(xiàn)實世界。這已經(jīng)不是工具之爭，而是世界定義權(quán)之爭。

問題也隨之出現(xiàn)：這些求解器長期分散在不同體系中，物理表達、資產(chǎn)標準、訓練接口和評測流程彼此割裂。物理 AI 需要的，不是更多單點工具，而是一個能把這些能力整合進同一架構(gòu)的中樞引擎。

Newton

全球物理 AI 基礎(chǔ)設(shè)施第一次走向統(tǒng)一

Newton應運而生。

這不是一次普通的開源發(fā)布，而是全球物理 AI 基礎(chǔ)設(shè)施第一次開始走向統(tǒng)一。過去十幾年，GPU 并行計算、高精度接觸動力學、復雜機構(gòu)求解、強化學習仿真、工業(yè)級機器人驗證，始終分散在不同體系中。Newton 第一次嘗試把這些能力放進同一個開放架構(gòu)中。

它想統(tǒng)一的是物理 AI 的底層世界模型。

2025 年 9 月，NVIDIA、Google DeepMind 與 Disney Research 聯(lián)合開源物理仿真引擎 Newton Beta 版。它不是某一家公司的單點開源嘗試，而是三家全球頂級機構(gòu)投入數(shù)百名工程師與研究員、歷時近兩年持續(xù)開發(fā)，將各自最強的仿真能力放進同一個開放架構(gòu)中的結(jié)果。

NVIDIA 貢獻的是 GPU 原生加速、Warp 框架與 Isaac 生態(tài)。過去十幾年，NVIDIA 持續(xù)推動 GPU 從圖形計算走向通用計算，再走向 AI 訓練與物理仿真。到了 Newton，這套能力被進一步延伸到機器人學習場景：高并行、可擴展，并可與現(xiàn)代 AI 訓練基礎(chǔ)設(shè)施深度結(jié)合。

Google DeepMind 帶來的是 MuJoCo 在機器人學習與高精度接觸動力學上的長期積累。MuJoCo 曾是機器人強化學習和控制研究中最重要的仿真工具之一，而 Newton 將這一套高精度動力學能力遷移到 GPU 原生框架中，使其能夠支撐更大規(guī)模的并行訓練和評測。

Disney Research 則將 Kamino 等仿真能力納入其中。與標準機器人形態(tài)不同，Disney 長期面對的是閉鏈機構(gòu)、復雜結(jié)構(gòu)、非標準構(gòu)型與極端工況下的運動控制問題，這使其在復雜機構(gòu)穩(wěn)定求解上形成了獨特積累。Newton 將這一路線吸收進統(tǒng)一架構(gòu)，使機器人仿真不再局限于傳統(tǒng)剛體系統(tǒng)，而是進一步覆蓋復雜機構(gòu)、柔性材料與多物理交互。

也就是說，Newton 實現(xiàn)了GPU 并行計算、高精度接觸動力學、復雜機構(gòu)求解與機器人學習生態(tài)第一次在同一個開源架構(gòu)中實現(xiàn)系統(tǒng)性匯合

模塊化架構(gòu)、GPU 原生加速、自動微分能力與跨生態(tài)協(xié)作機制，使 Newton 不只是一個物理引擎，更像是面向物理 AI 訓練、評測與部署的統(tǒng)一仿真底座

這些特質(zhì)，使Newton 從誕生之初就站在了物理 AI 基礎(chǔ)設(shè)施的關(guān)鍵位置

值得關(guān)注的是，在這個由全球頂級機構(gòu)共同構(gòu)成的物理 AI 仿真基礎(chǔ)設(shè)施版圖中，中國公司第一次出現(xiàn)在核心坐標上

中國公司第一次

進入全球物理 AI 標準定義層

今年三月，光輪智能正式受邀作為核心指導委員加入開源 GPU 加速物理引擎 Newton，在關(guān)鍵具身仿真技術(shù)方向上發(fā)揮主導作用，并與 NVIDIA、Google DeepMind、Disney Research, 共同引領(lǐng)推動下一代開源物理 AI 仿真標準。

同時加入的還有 Toyota Research Institute (豐田研究院），所帶來的高可信動力學仿真的可擴展軟件底座 Drake，進一步拓展了 Newton 的技術(shù)能力。

第一次，中國公司以核心共建者身份進入全球物理 AI 仿真基礎(chǔ)設(shè)施標準的定義層：過去二十年，操作系統(tǒng)生態(tài)由 Microsoft 與 Apple 定義，移動生態(tài)由 Apple 與 Google 定義，AI 訓練框架與計算標準由 NVIDIA 與 Google 等巨頭主導。而今天，物理 AI 的仿真標準終于開始有了中國公司的核心參與。

光輪加入 Newton TSC，是憑借全棧自研的 “求解—測量—生成” 三位一體技術(shù)平臺

首先，依托自研求解器與物理測量體系，主導 Newton 引擎核心能力的持續(xù)演進，包括求解器的物理驗證與系統(tǒng)性標定、接觸建模與多物理場能力優(yōu)化，以及仿真結(jié)果與真實世界一致性的持續(xù)提升。
其次，圍繞SimReady 體系，推動仿真資產(chǎn)在物理屬性規(guī)范、數(shù)據(jù)格式、接口標準、驗證流程與評測體系等方面的進一步統(tǒng)一，完善下一代仿真世界標準。
第三，依托物理測量工廠與資產(chǎn)生成體系，持續(xù)提升規(guī)模化 SimReady 世界供給能力，構(gòu)建高保真、可復用的仿真資產(chǎn)與場景庫，為全球開發(fā)者提供可直接使用的仿真資源。

求解、測量、生成三者合在一起，構(gòu)成從物理建模、引擎驗證到工程落地的完整閉環(huán)，這使 Newton 不僅能算，而且可驗證、可復用、可規(guī)模化進入真實工業(yè)流程。

也正因此，光輪成為 Newton TSC 核心共建格局中唯一一家中國公司。這標志著其在物理 AI 底層技術(shù)領(lǐng)域的能力與影響力，獲得了國際生態(tài)的正式認可。

事實上，光輪在國際開源生態(tài)中的布局遠不止于 Newton。

此前，光輪智能已聯(lián)合 NVIDIA 開源發(fā)布Isaac Lab-Arena機器人策略評測基準框架，推動具身大模型評測走向可復現(xiàn)、可擴展、可規(guī)模化；自研LeIsaac仿真平臺被 Hugging Face 官方文檔收錄，成為全球開發(fā)者進入具身仿真的標準工程框架；聯(lián)手 World Labs，用RoboFinals解決世界模型評測難題；聯(lián)合通義千問，通過RoboFinals共建可復現(xiàn)、可診斷的工業(yè)級評測閉環(huán)，推動具身智能評測從學術(shù) benchmark 走向工業(yè)級基礎(chǔ)設(shè)施。

從底層物理引擎，到開發(fā)者平臺，再到評測框架與工業(yè)級閉環(huán)，光輪智能參與的并不是一個個孤立項目，而是一條清晰的生態(tài)路徑：底層物理引擎負責 “世界如何運行”，仿真平臺負責 “開發(fā)者如何使用”，評測框架負責 “模型如何被衡量”，工業(yè)級評測閉環(huán)則負責 “能力如何持續(xù)迭代”。

這條生態(tài)路徑的價值已經(jīng)在市場中得到驗證。今天，光輪智能已成為全球物理 AI 仿真與數(shù)據(jù)基礎(chǔ)設(shè)施的重要提供方，服務全球全部前五的世界模型團隊；國際主流具身智能團隊中，超過 80% 的仿真資產(chǎn)與合成數(shù)據(jù)來自光輪

在這條路徑上，光輪智能的角色發(fā)生變化：它不只是為頭部模型團隊提供仿真資產(chǎn)與合成數(shù)據(jù)，更是在引領(lǐng)構(gòu)建物理 AI 時代的開源基礎(chǔ)設(shè)施、開發(fā)者平臺與評測標準

中國公司第一次以核心技術(shù)共建者的身份，進入全球物理 AI 仿真基礎(chǔ)設(shè)施標準形成的關(guān)鍵位置。

全球物理 AI 仿真 Top 5 專家天團

再看 Newton TSC 的人員構(gòu)成，可謂高手云集。

Miles Macklin Ph.D.（NVIDIA）NVIDIA 仿真技術(shù)高級工程總監(jiān)，Warp 框架的聯(lián)合創(chuàng)造者。如果說 Newton 的速度優(yōu)勢有一個技術(shù)源頭，就是 Macklin 和他的團隊十幾年來在 GPU 并行物理仿真上的積累。
Yuval Tassa Ph.D.（Google DeepMind）機器人仿真團隊負責人，MuJoCo 聯(lián)合創(chuàng)始人。他解決了 MuJoCo-Warp 的融合問題，讓 MuJoCo 的物理精度在 GPU 上重生。Tassa 代表的是機器人學界最核心的一條高精度仿真路徑。
謝晨 Ph.D.（光輪智能）光輪智能創(chuàng)始人兼 CEO，曾任 NVIDIA 及 Cruise 自動駕駛仿真負責人，長期推動仿真與合成數(shù)據(jù)在自動駕駛和物理 AI 中的產(chǎn)業(yè)化落地。國際首創(chuàng)將生成式 AI 融入仿真，主導確立光輪“求解—測量—生成”三位一體全棧自研仿真技術(shù)路線。
Moritz B?cher Ph.D.（Disney Research）Disney Research 負責人。Disney 的主題樂園可能是全球?qū)蕵窓C器人要求最苛刻的環(huán)境，Kamino 求解器就是在他手下誕生的。
Michael Sherman Ph.D.（TRI）是機器人仿真基礎(chǔ)設(shè)施領(lǐng)域的老兵。作為 TRI 機器人仿真的核心負責人之一，其職業(yè)軌跡橫跨 SD/FAST、Simbody、OpenSim、Drake 等多代關(guān)鍵仿真平臺。

和這四位全球仿真領(lǐng)域的核心奠基者相比，謝晨博士的獨特之處在于：他不是從單一求解器、單一學術(shù)體系或單點工程模塊中走來，而是在自動駕駛與物理 AI 兩代產(chǎn)業(yè)浪潮中，持續(xù)主導仿真基礎(chǔ)設(shè)施的工程化、規(guī)模化與系統(tǒng)化落地

他先后在 Cruise 和 NVIDIA 主導自動駕駛仿真體系建設(shè)，在 L4 自動駕駛一線驗證了仿真與合成數(shù)據(jù)對算法迭代的價值，也在全球仿真基礎(chǔ)設(shè)施從自動駕駛時代走向物理 AI 時代的承擔了關(guān)鍵角色。

在這一過程中，謝晨博士形成了區(qū)別于傳統(tǒng)仿真專家的系統(tǒng)性視角：仿真不是一個求解器、一套工具鏈，或一個用于測試的虛擬環(huán)境，而是一套貫穿數(shù)據(jù)生成、模型訓練、能力評測與真實部署的完整教育系統(tǒng)。

自動駕駛時代，仿真主要服務于視覺感知、場景回放與回歸測試；進入機器人與物理 AI 階段，仿真還必須解決接觸、力傳遞、材料形變、動作失敗等真實物理交互問題，并支撐模型在可復現(xiàn)、可規(guī)模化的環(huán)境中持續(xù)學習

2023 年，光輪智能的創(chuàng)立正是要把這一判斷系統(tǒng)化為可落地、可交付、可規(guī)模化的全棧仿真基礎(chǔ)設(shè)施。光輪所構(gòu)建的不是單點仿真工具，而是以求解、測量、生成、訓練、評測與部署為核心的完整閉環(huán)，繼續(xù)引領(lǐng)仿真從 “輔助驗證工具” 走向物理 AI 的核心生產(chǎn)系統(tǒng)。

因此，他加入 Newton TSC，不只是個人入選，而是中國力量首次以核心構(gòu)建者身份進入全球物理 AI 基礎(chǔ)設(shè)施的核心坐標

仿真是物理 AI 時代的 CUDA

過去十年卡算力，未來十年卡數(shù)據(jù)。而數(shù)據(jù)的前提，是仿真。

2006 年，NVIDIA 發(fā)布 CUDA。在那之前，GPU 仍主要被視為圖形計算工具，普通開發(fā)者想調(diào)用其并行計算能力，門檻極高。CUDA 把 GPU 的計算能力抽象成一套標準接口，讓開發(fā)者可以規(guī)模化調(diào)用。

CUDA 成功的關(guān)鍵，在于它在關(guān)鍵窗口期同時完成了三件事：建立統(tǒng)一底層標準，讓碎片化算力可以被統(tǒng)一調(diào)用；構(gòu)建 cuDNN 等一整套工具鏈，把底層算力翻譯成開發(fā)者能直接調(diào)用的生產(chǎn)力；開放生態(tài)，讓這套標準形成跨場景、跨開發(fā)者、跨模型訓練流程的普適性。

今天，物理 AI 正處在相似的歷史節(jié)點。大模型時代，CUDA 定義的是 “如何調(diào)用計算”；物理 AI 時代，仿真要定義的是 “如何生成世界”，因為機器人需要的是更多可交互、可執(zhí)行、可評測、可遷移的物理世界。因此，仿真正從工具層上升為標準層：它需要定義機器人的訓練場景、世界的表征邏輯、數(shù)據(jù)生產(chǎn)與結(jié)果評測方式……

歷史上，每一次基礎(chǔ)設(shè)施標準窗口期關(guān)閉之后，后來者都很難再獲得定義權(quán)。PC 時代，操作系統(tǒng)生態(tài)由 Microsoft 與 Apple 定義；移動時代，應用生態(tài)由 Apple 和 Google 定義；大模型時代，訓練框架與計算標準由 CUDA 定義。

而今天，物理 AI 的仿真層，正處于規(guī)則尚未凝固的窗口期。誰能定義世界如何被表達，數(shù)據(jù)如何被生成，能力如何被評測，機器人如何被訓練，誰就有機會定義物理 AI 的未來。

窗口不會永遠打開。

而這一次，中國公司第一次站上了書寫規(guī)則的位置。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.