![]()
根據 CB Insights 的數據,2025 年人工智能領域的融資總額占風險投資總額的 48%,創歷史新高。投資者押注人工智能技術棧的各個層面,包括基礎模型,應用開發,以及 AI 數據中心等。
相比之下,機器人公司的總投資額達到 407 億美元,占所有風險投資的 9%。因此,一個價值數百億美元的問題隨之而來:AI 驅動的機器人需要具備什么條件,才能開始產生重大的經濟影響?
![]()
(來源:CB Insights)
近日,俄勒岡州立大學的機器人學教授兼Agility Robotics的聯合創始人 Jonathan Hurst(喬納森·赫斯特),以及曾擔任 Google X 旗下Everyday Robots“登月計劃”的首席執行官 Hans Peter Br?ndmo(漢斯·彼得·布朗德莫)對于“機器人是否會有 ChatGPT 時刻”這一問題進行了深入探討,并從五個方面進行了論證。
喬納森是腿足式機器人領域的國際知名專家,專注于開發能在真實世界中行走、奔跑和工作的動態機器人。其團隊研發的 Cassie 和 Digit 人形機器人已進入商業部署階段。
漢斯領導“Everyday Robots”登月計劃多年,致力于開發能在辦公室等真實環境中自主工作的 AI 機器人。該項目是谷歌早期將 AI 與機器人結合的重要嘗試,部署了上百臺移動操作機器人,積累了大量真實世界數據和經驗。
在他們看來,機器人領域不太可能出現像 ChatGPT 那樣單一、爆炸式的 AI 突破,而是需要通過長期艱苦的工程實踐、多種 AI 工具的協同配合,以及大量真實世界的數據和經驗積累,才能逐步實現真正有經濟價值的 AI 機器人。
網絡視頻與現實之間的鴻溝真實存在
多年來,網絡上充斥著人形機器人跳舞或跑酷的炫酷視頻,但機器人圈的常識是:“永遠別信網絡上的機器人視頻。” 能在復雜的真實環境中干實事的機器人,與精心剪輯的“劇本式”表演之間,仍存在著巨大差距。
以近期廣為宣傳的機器人表演為例,盡管其底層控制與同步編舞極其出色,但這仍是一場經過嚴格編排的預設表演。它所展現出的自主性與智能水平,其實更接近流水線上的工業機器人,離真正走進你家客廳還差得很遠。
答案很簡單:讓 AI 驅動的機器人在復雜多變的人類環境中執行通用任務,依然極其困難。表演這類技術奇跡或許會讓人產生“未來已來”的錯覺,但在這些演示中,AI 僅僅被用于底層的運動控制(比如防止機器人摔倒)。想要讓機器人在真實且非結構化的人類空間中成為通用幫手,這種底層控制僅僅是龐大解決方案的冰山一角。
數據瓶頸仍是未解難題
諸如 ChatGPT、Claude這樣的大型語言模型(LLMs)之所以擁有強大的泛化與多模態能力,歸功于其使用了海量且由人類生成的互聯網數據,這也構成了 AI 訓練的“黃金標準”。
然而,為 AI 賦予物理軀體并讓其與現實世界互動,至今仍是極其困難的未解之題。
通用機器人的 AI 必須在復雜多變的環境中,同時應對物理、幾何和時間等多重相互沖突的限制。為了具備通用性,它們必須依賴海量的高質量高維數據(涵蓋光照、力度、速度、關節極限及安全邊界等)進行訓練,以應對現實世界中幾乎無限的突發情況。
目前這類優質數據極其稀缺。業界只能依靠遠程操作、人類動作捕捉以及模擬器探索等方式來收集數據,這是一項極其浩大的工程。例如,谷歌 Everyday Robots 僅為了訓練一個垃圾分類模型,就在模擬器中運行了高達 2.4 億次實例。而機器人的每一項單點技能,想要達到(甚至尚未達到)人類水平,都需要耗費同等龐大的數據量。
不存在單一的機器人 AI
依靠單一 AI 模型驅動通用機器人與我們共存的時代還極其遙遠。
機器人的形態各異(輪式、雙足、多臂、飛行或水下等),且現實世界極其復雜,充滿了不可預知的人和動物。如何訓練一個模型在所有這些場景中安全可靠地運行?答案很簡單:做不到(至少在很長一段時間內不行)。
他們認為,引領通用機器人下一次重大突破的制勝架構將是面向機器人的“智能體 AI(Agentic AI)”。這是一種高層協調模型,能在有限監督下進行推理、規劃、使用工具并從結果中學習。這些運行在機器人上的高級模型,將作為“中樞”去調用各種執行特定任務的專用子模型。不久的將來,我們有望看到多個機器人通過搭載的智能體 AI 實現相互協作。
AI 工具正在解鎖機器人強大的新能力并催生新市場。令人振奮的是,這些模型正變得廣泛可用,有些甚至已經開源。正如互聯網的普及推動了真正的進步一樣,隨著人們能更廣泛地訪問這些 AI 工具和技術,機器人復雜行為的“平民化”將是不可避免的必然趨勢。
硬件依然是一塊難啃的骨頭
機器人是高度復雜的系統,其安全性與實用性依賴于從感知系統、控制中心到每一個底層執行器的精準協同。
以執行器(電機和齒輪)為例,過去在工業機器人上大規模使用的硬件,根本無法勝任人類生活環境的需求。傳統工業機器人一旦發生意外碰撞,沖擊力極大且極具破壞性;而人類的動作模式完全不同,我們在與世界互動時具有極高的“柔順性(compliance)”,常常利用與環境的物理接觸來幫助完成任務。
以插鑰匙為例:人類通常不需要將鑰匙與鎖孔完美對齊,而是憑感覺順著邊緣摸索并搖晃著插入。機器人想要具備類似的能力,就必須采用一種能敏銳感知力反饋、能與環境進行柔順交互的新型執行器。盡管這類硬件目前已經存在,但針對在人類周圍工作的機器人系統而言,它們還遠未實現大規模的量產與普及。
真正的價值來自于“簡單”的任務
看起來炫酷的任務與能創造實際價值的任務截然不同。機器人技術完美印證了“莫拉維克悖論(Moravec’s paradox)”:對人類極其困難的事(如復雜數學計算)對機器很容易,而對人類輕而易舉的事(如幼兒般的動作)對機器卻極其困難。
但商業落地是一塊無情的試金石,客戶只關心如何解決實際問題。AI 機器人必須在效率上超越現有方案,并具備絕對的可靠性與安全性。
以 Agility Robotics 為例,他們在客戶現場部署人形機器人 Digit 時,團隊發現首要障礙是安全。在人類空間中活動的機器人帶來了新的風險,最初的部署甚至不得不拉起物理屏障。為此,團隊耗費數年時間,深度依賴 AI 的人類檢測和行為控制技術,才逐步攻克這一安全挑戰。
![]()
(來源:Agility Robotics)
已經被谷歌解散的 Everyday Robots 項目也帶來了一些經驗教訓,2019 年在辦公樓內部署自主擦桌子和垃圾分類的機器人時,團隊迅速意識到真實世界對機器人而言有多么“混亂”和艱難。但正是這些現實經驗指導了 AI 系統的架構,并收集了能與模擬數據相結合的寶貴真實數據。
只有立足于滿足特定客戶需求,并在真實場景中不斷試錯,才是打造實用 AI 工具并最終邁向通用機器人的唯一路徑。脫離了豐富的現實世界經驗,根本不存在所謂的頓悟時刻,沒有一勞永逸的銀彈算法,也沒有任何海量數據能憑空捏造出一個通用機器人。
毋庸置疑,世界正通過機器人將 AI 引入現實的物理世界。喬納森和漢斯認為AI 會推動機器人進入“寒武紀大爆發”,但這個過程是漸進式、一步一個腳印的,而非一夜之間的奇跡。真正有價值的機器人將先在工廠、倉庫、物流、養老、災害救援等場景落地,然后逐步進入家庭。
1.https://www.cbinsights.com/research/report/venture-trends-2025/
2.https://engineering.oregonstate.edu/people/jonathan-hurst
3.https://www.linkedin.com/in/hanspeter/
4.https://spectrum.ieee.org/robotics-ai-breakthrough
運營/排版:何晨龍
注:封面/首圖由 AI 輔助生成
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.