網易首頁 > 網易號 > 正文申請入駐

機器人的“ChatGPT時刻”為何遲遲未來？

2026-05-25 18:08:08　來源: DeepTech深科技

北京舉報

分享至

根據 CB Insights 的數據，2025 年人工智能領域的融資總額占風險投資總額的 48%，創歷史新高。投資者押注人工智能技術棧的各個層面，包括基礎模型，應用開發，以及 AI 數據中心等。

相比之下，機器人公司的總投資額達到 407 億美元，占所有風險投資的 9%。因此，一個價值數百億美元的問題隨之而來：AI 驅動的機器人需要具備什么條件，才能開始產生重大的經濟影響？

（來源：CB Insights）

近日，俄勒岡州立大學的機器人學教授兼Agility Robotics的聯合創始人 Jonathan Hurst（喬納森·赫斯特），以及曾擔任 Google X 旗下Everyday Robots“登月計劃”的首席執行官 Hans Peter Br?ndmo（漢斯·彼得·布朗德莫）對于“機器人是否會有 ChatGPT 時刻”這一問題進行了深入探討，并從五個方面進行了論證。

喬納森是腿足式機器人領域的國際知名專家，專注于開發能在真實世界中行走、奔跑和工作的動態機器人。其團隊研發的 Cassie 和 Digit 人形機器人已進入商業部署階段。

漢斯領導“Everyday Robots”登月計劃多年，致力于開發能在辦公室等真實環境中自主工作的 AI 機器人。該項目是谷歌早期將 AI 與機器人結合的重要嘗試，部署了上百臺移動操作機器人，積累了大量真實世界數據和經驗。

在他們看來，機器人領域不太可能出現像 ChatGPT 那樣單一、爆炸式的 AI 突破，而是需要通過長期艱苦的工程實踐、多種 AI 工具的協同配合，以及大量真實世界的數據和經驗積累，才能逐步實現真正有經濟價值的 AI 機器人。

網絡視頻與現實之間的鴻溝真實存在

多年來，網絡上充斥著人形機器人跳舞或跑酷的炫酷視頻，但機器人圈的常識是：“永遠別信網絡上的機器人視頻。” 能在復雜的真實環境中干實事的機器人，與精心剪輯的“劇本式”表演之間，仍存在著巨大差距。

以近期廣為宣傳的機器人表演為例，盡管其底層控制與同步編舞極其出色，但這仍是一場經過嚴格編排的預設表演。它所展現出的自主性與智能水平，其實更接近流水線上的工業機器人，離真正走進你家客廳還差得很遠。

答案很簡單：讓 AI 驅動的機器人在復雜多變的人類環境中執行通用任務，依然極其困難。表演這類技術奇跡或許會讓人產生“未來已來”的錯覺，但在這些演示中，AI 僅僅被用于底層的運動控制（比如防止機器人摔倒）。想要讓機器人在真實且非結構化的人類空間中成為通用幫手，這種底層控制僅僅是龐大解決方案的冰山一角。

數據瓶頸仍是未解難題

諸如 ChatGPT、Claude這樣的大型語言模型（LLMs）之所以擁有強大的泛化與多模態能力，歸功于其使用了海量且由人類生成的互聯網數據，這也構成了 AI 訓練的“黃金標準”。

然而，為 AI 賦予物理軀體并讓其與現實世界互動，至今仍是極其困難的未解之題。

通用機器人的 AI 必須在復雜多變的環境中，同時應對物理、幾何和時間等多重相互沖突的限制。為了具備通用性，它們必須依賴海量的高質量高維數據（涵蓋光照、力度、速度、關節極限及安全邊界等）進行訓練，以應對現實世界中幾乎無限的突發情況。

目前這類優質數據極其稀缺。業界只能依靠遠程操作、人類動作捕捉以及模擬器探索等方式來收集數據，這是一項極其浩大的工程。例如，谷歌 Everyday Robots 僅為了訓練一個垃圾分類模型，就在模擬器中運行了高達 2.4 億次實例。而機器人的每一項單點技能，想要達到（甚至尚未達到）人類水平，都需要耗費同等龐大的數據量。

不存在單一的機器人 AI

依靠單一 AI 模型驅動通用機器人與我們共存的時代還極其遙遠。

機器人的形態各異（輪式、雙足、多臂、飛行或水下等），且現實世界極其復雜，充滿了不可預知的人和動物。如何訓練一個模型在所有這些場景中安全可靠地運行？答案很簡單：做不到（至少在很長一段時間內不行）。

他們認為，引領通用機器人下一次重大突破的制勝架構將是面向機器人的“智能體 AI（Agentic AI）”。這是一種高層協調模型，能在有限監督下進行推理、規劃、使用工具并從結果中學習。這些運行在機器人上的高級模型，將作為“中樞”去調用各種執行特定任務的專用子模型。不久的將來，我們有望看到多個機器人通過搭載的智能體 AI 實現相互協作。

AI 工具正在解鎖機器人強大的新能力并催生新市場。令人振奮的是，這些模型正變得廣泛可用，有些甚至已經開源。正如互聯網的普及推動了真正的進步一樣，隨著人們能更廣泛地訪問這些 AI 工具和技術，機器人復雜行為的“平民化”將是不可避免的必然趨勢。

硬件依然是一塊難啃的骨頭

機器人是高度復雜的系統，其安全性與實用性依賴于從感知系統、控制中心到每一個底層執行器的精準協同。

以執行器（電機和齒輪）為例，過去在工業機器人上大規模使用的硬件，根本無法勝任人類生活環境的需求。傳統工業機器人一旦發生意外碰撞，沖擊力極大且極具破壞性；而人類的動作模式完全不同，我們在與世界互動時具有極高的“柔順性（compliance）”，常常利用與環境的物理接觸來幫助完成任務。

以插鑰匙為例：人類通常不需要將鑰匙與鎖孔完美對齊，而是憑感覺順著邊緣摸索并搖晃著插入。機器人想要具備類似的能力，就必須采用一種能敏銳感知力反饋、能與環境進行柔順交互的新型執行器。盡管這類硬件目前已經存在，但針對在人類周圍工作的機器人系統而言，它們還遠未實現大規模的量產與普及。

真正的價值來自于“簡單”的任務

看起來炫酷的任務與能創造實際價值的任務截然不同。機器人技術完美印證了“莫拉維克悖論（Moravec’s paradox）”：對人類極其困難的事（如復雜數學計算）對機器很容易，而對人類輕而易舉的事（如幼兒般的動作）對機器卻極其困難。

但商業落地是一塊無情的試金石，客戶只關心如何解決實際問題。AI 機器人必須在效率上超越現有方案，并具備絕對的可靠性與安全性。

以 Agility Robotics 為例，他們在客戶現場部署人形機器人 Digit 時，團隊發現首要障礙是安全。在人類空間中活動的機器人帶來了新的風險，最初的部署甚至不得不拉起物理屏障。為此，團隊耗費數年時間，深度依賴 AI 的人類檢測和行為控制技術，才逐步攻克這一安全挑戰。

（來源：Agility Robotics）

已經被谷歌解散的 Everyday Robots 項目也帶來了一些經驗教訓，2019 年在辦公樓內部署自主擦桌子和垃圾分類的機器人時，團隊迅速意識到真實世界對機器人而言有多么“混亂”和艱難。但正是這些現實經驗指導了 AI 系統的架構，并收集了能與模擬數據相結合的寶貴真實數據。

只有立足于滿足特定客戶需求，并在真實場景中不斷試錯，才是打造實用 AI 工具并最終邁向通用機器人的唯一路徑。脫離了豐富的現實世界經驗，根本不存在所謂的頓悟時刻，沒有一勞永逸的銀彈算法，也沒有任何海量數據能憑空捏造出一個通用機器人。

毋庸置疑，世界正通過機器人將 AI 引入現實的物理世界。喬納森和漢斯認為AI 會推動機器人進入“寒武紀大爆發”，但這個過程是漸進式、一步一個腳印的，而非一夜之間的奇跡。真正有價值的機器人將先在工廠、倉庫、物流、養老、災害救援等場景落地，然后逐步進入家庭。

1.https://www.cbinsights.com/research/report/venture-trends-2025/

2.https://engineering.oregonstate.edu/people/jonathan-hurst

3.https://www.linkedin.com/in/hanspeter/

4.https://spectrum.ieee.org/robotics-ai-breakthrough

運營/排版：何晨龍

注：封面/首圖由 AI 輔助生成

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.