當(dāng)具身智能從概念走向落地,行業(yè)討論的焦點(diǎn),早已從“如何采集數(shù)據(jù)”轉(zhuǎn)向“哪種數(shù)據(jù)范式更優(yōu)”。UMI與Ego的路線之爭,一度讓行業(yè)陷入非此即彼的對立認(rèn)知:UMI作為傳統(tǒng)數(shù)據(jù)采集方案,相較于被熱捧的Ego路線,難免被部分觀點(diǎn)認(rèn)為迭代節(jié)奏偏緩,未能及時跟上新興需求,Ego則被捧為未來終局。但鹿明機(jī)器人推出的FastUMI Ego,用產(chǎn)品給出了不同答案——UMI并未過時,Ego也絕非終局,兩者融合才是具身智能落地的務(wù)實(shí)選擇。而要真正理解這種融合的價值,需要先看清數(shù)據(jù)采集的三層金字塔結(jié)構(gòu)。
UMI與Ego:各有局限,也各有價值
UMI(Universal Manipulation Interface)作為無本體數(shù)據(jù)采集的經(jīng)典方案,核心優(yōu)勢在于精準(zhǔn)捕捉操作細(xì)節(jié)。它通過輕量化末端設(shè)備,記錄手部動作、操作軌跡與動作對齊信息,是訓(xùn)練機(jī)器人精細(xì)操作能力的核心數(shù)據(jù)來源。但UMI的局限同樣明顯:視角局限于手部,缺乏全局環(huán)境信息,難以支撐機(jī)器人理解空間布局、場景上下文與環(huán)境交互邏輯。
Ego(Egocentric)數(shù)據(jù)則以第一視角感知全局環(huán)境為核心。通過頭戴式設(shè)備,Ego可記錄完整的空間關(guān)系、環(huán)境布局與任務(wù)上下文,彌補(bǔ)UMI在環(huán)境理解上的短板。但純Ego方案也有不足:側(cè)重全局感知,難以精準(zhǔn)捕捉手部操作的細(xì)微動作,且數(shù)據(jù)采集成本與場景適配性,遠(yuǎn)不及UMI靈活。 簡單來說,Ego負(fù)責(zé)‘看世界’,提供環(huán)境語義和空間上下文;UMI則負(fù)責(zé)‘把操作動作做干凈’,專注于操作細(xì)節(jié)。但僅有這兩層還不夠,精細(xì)的接觸任務(wù)需要第三層——靈巧手與觸覺技術(shù)來補(bǔ)齊。
![]()
FastUMI Ego:鹿明的融合方案,即插即用的雙模式
兩種路線各有所長、也各有瓶頸,強(qiáng)行判定誰取代誰,并不符合工程落地邏輯。
鹿明機(jī)器人推出的FastUMI Ego,正是基于這一判斷打造的融合型解決方案,其為全球首款即插即用、無需建圖的第一人稱數(shù)采方案,頭部運(yùn)動可實(shí)時映射為空間反饋,無需額外設(shè)備;視角系統(tǒng)水平與垂直FOV均>180°,支持左右手獨(dú)立追蹤及軌跡可視化,可避免數(shù)據(jù)失真。設(shè)備自重僅235g,配重均衡,佩戴舒適,通過多傳感器融合實(shí)現(xiàn)3mm級高精度定位,實(shí)時輸出三維軌跡及深度信息。
作為鹿明FastUMI無本體數(shù)采“全家桶”的核心新品,F(xiàn)astUMI Ego并非孤立存在,而是與系列產(chǎn)品協(xié)同,構(gòu)建起一體化基建體系。
“全家桶”還包含F(xiàn)astUMI Touch與FastUMI Go:前者是適配UMI的機(jī)械臂,靈活無局限,可高精度復(fù)現(xiàn)軌跡;后者是全球首款背包版數(shù)采設(shè)備,3mm精度,4h+續(xù)航,1TB存儲且可擴(kuò)容,4.6kg輕量化設(shè)計(jì),一鍵啟動即可作業(yè)。這一整套產(chǎn)品矩陣,實(shí)際上構(gòu)建了完整的數(shù)據(jù)采集金字塔:FastUMI Ego負(fù)責(zé)‘看世界’,提供空間上下文;FastUMI Touch(夾爪類)負(fù)責(zé)‘把操作動作做干凈’,以低成本覆蓋絕大部分常規(guī)任務(wù);而靈巧手與觸覺技術(shù)則作為高價值補(bǔ)充,應(yīng)對精細(xì)接觸場景。三層協(xié)同,各司其職。
![]()
行業(yè)共識:從“or”到“and”,融合才是破局關(guān)鍵
鹿明的融合思路,并非孤例。斯坦福大學(xué)上月發(fā)布的HoMMI框架,同樣在UMI基礎(chǔ)上增加自我中心感知能力,補(bǔ)充全身移動操作能力,驗(yàn)證了“UMI+Ego”路線的可行性。
行業(yè)觀點(diǎn)也逐漸趨于統(tǒng)一:真實(shí)世界沒有單模態(tài)答案,真正有價值的數(shù)據(jù),是同時保留環(huán)境、動作、接觸和結(jié)果的閉環(huán)數(shù)據(jù)。UMI負(fù)責(zé)“低頭干活”的操作細(xì)節(jié),Ego負(fù)責(zé)“抬頭看世界”的空間上下文,兩者結(jié)合,才能讓機(jī)器人既懂操作,又懂環(huán)境。
事實(shí)上,具身數(shù)據(jù)采集的核心邏輯是一套完整的“數(shù)據(jù)金字塔”,三層結(jié)構(gòu)相輔相成、缺一不可:第一層是Ego,負(fù)責(zé)“看世界”,提供最上層的環(huán)境語義和空間上下文,讓機(jī)器人感知所處場景;第二層是UMI或夾爪,負(fù)責(zé)“把操作動作做干凈”,其中夾爪仍是當(dāng)下大規(guī)模數(shù)據(jù)生產(chǎn)的“主食”,憑借低成本優(yōu)勢,可覆蓋絕大部分常規(guī)操作任務(wù);第三層是靈巧手與觸覺技術(shù),負(fù)責(zé)“補(bǔ)齊高難度接觸細(xì)節(jié)”,作為高價值補(bǔ)充,應(yīng)對精細(xì)、復(fù)雜的接觸類任務(wù)。這三層結(jié)構(gòu),共同構(gòu)成了具身數(shù)據(jù)采集的完整體系,打破了單一模態(tài)的局限。
![]()
結(jié)語:務(wù)實(shí)落地,而非追求終局
具身智能的終極形態(tài)仍在探索之中,現(xiàn)階段不必急于定義“終局”,更應(yīng)關(guān)注如何讓技術(shù)活下去、用起來。鹿明FastUMI Ego的核心價值,正是跳出路線博弈,以工程化思維補(bǔ)齊行業(yè)最缺的空間上下文能力,讓數(shù)據(jù)采集更高效、更完整、更貼近真實(shí)需求。鹿明通過FastUMI“全家桶”產(chǎn)品矩陣,搭配全球首個具身數(shù)據(jù)超市,打破數(shù)據(jù)孤島、降低采集成本,已啟動百萬小時數(shù)據(jù)采集計(jì)劃,規(guī)模化開采高質(zhì)量“物理石油”。
借著FastUMI Ego的發(fā)布,我們重新認(rèn)知具身數(shù)據(jù):這兩年行業(yè)總陷入“某類數(shù)據(jù)最強(qiáng)”的陷阱,但2026年已然清晰——真實(shí)世界沒有單模態(tài)答案,閉環(huán)數(shù)據(jù)才是關(guān)鍵,誰能融合環(huán)境、動作、接觸、結(jié)果,誰就更接近物理AI。鹿明的方向或許才是對的,它沒有用Ego否定UMI,而是讓UMI學(xué)會“抬頭看世界”。
正如行業(yè)共識:大多數(shù)“or”問題,最終會走向協(xié)同互補(bǔ)的“and”。鹿明的實(shí)踐證明,UMI與Ego的融合,是具身智能規(guī)模化落地的核心路徑。UMI未過時,Ego非終局,唯有這種務(wù)實(shí)布局,才能加速具身智能走進(jìn)千家萬戶。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.