![]()
![]()
出品|搜狐科技
作者|梁昌均
編輯| 楊 錦
剛剛過去的周末,300多臺機器人跑上馬拉松賽道。奪冠的機器人用時不僅比上次縮減了一半多,還打破了人類半馬的成績。
這背后是人形機器人運動控制、動力效率、系統穩定等綜合能力的進步。但此次參賽的六成選手依然是遙控機器人,而自主導航的機器人也出現失控、摔倒等問題。
“這次比賽很大程度上依然是硬件和小腦系統層面的比拼,但行業發展焦點已經是大腦層面,這次并沒有體現出太多進步。”有機器人從業者表示。
這顯示出具身模型——機器人大腦發展的相對滯后。而對這個爆火了一年多的行業來說,數據依然是具身模型發展的最大瓶頸,行業也還沒有找到有效解法。
這吸引了不少玩家入局,除了智元等初創企業,不少大廠也從中看到了機會,行業由此形成明顯的技術路線分歧。
近日,京東繼宣布以建成全球最大具身數據采集中心為目標的“女媧計劃”后,又推出覆蓋全鏈路的具身智能數據基礎設施,持續加碼具身智能賽道。
除了京東,百度、阿里、字節、騰訊等也在布局。它們一手通過投資,一手通過搭建數據平臺或研發具身模型,試圖在這波具身智能熱潮中搶占生態位。
![]()
數據瓶頸有多大?
自去年以來,具身智能就成為AI領域最火爆的領域之一。無論是投資規模,還是企業數量,都在快速增長。
然而,從業者卻感覺到,具身智能尤其是模型層面的進步,還未出現大的躍遷。要想讓機器人擺脫人為遙控,走向一定程度的自主智能,挑戰不少。
“整個具身領域發展到今天還是一個非常早期的階段,現在碰到最大的問題是數據短缺,導致具身模型沒有辦法訓練出來。”
數據是模型的燃料。但不同于大語言模型天然就有豐富多樣的公開語料供其訓練,具身數據則處于原始匱乏的狀態。
智元機器人聯創姚卯青就透露,GPT-5訓練語料折合約100億小時,而全行業的具身數據僅約50萬小時。
京東高管也在近日的京東具身智能生態發布會上告訴搜狐科技,現在市場上的具身數據集還在幾十萬小時的體量,而要想訓練出真正好的、具備泛化性的具身模型,至少需要一千萬小時量級的數據。
如何解決數據問題,企業各顯神通。智元為此成立了專門的數據采集公司覓蜂科技,計劃在2026年實現千萬小時級數據產能,到2030年實現百億小時級數據產能。
全國也掀起了具身智能數采中心建設熱潮,北京人形機器人創新中心和上海的國家地方共建人形機器人創新中心均打造了專業化的數據采集基地,并牽頭制定行業標準,推動開源開放。
這還催生了專門的數據采集服務公司,除智元成立的覓蜂科技,還誕生了光輪智能、靈生科技等創業公司。
京東的“女媧計劃”也正是為了解決具身數據瓶頸。
該計劃將發動超60萬人,聚焦京東供應鏈場景,兩年內積累1000萬小時人類真實場景視頻數據,京東號稱這將是“人類歷史上規模最大的數據采集行動”。
此外,京東還推出自研的數采設備,以及數據加工處理平臺、具身大模型和具身智能數據交易平臺,形成覆蓋采、存、標、訓、評、仿、測、用全鏈路的具身數據產業鏈。
看上具身數據這門生意的大廠不止京東,百度也在入場。百度智能云此前聯合多家具身智能企業,推出具身智能數據超市,以解決行業數據標準不一、流通不暢的痛點。
對比來看,其它大廠包括阿里、騰訊、字節等,則在底層的數據采集層面動作不多,而更多是在數據處理、訓練評估、仿真測試等方面提供基建服務。
某種程度看,誰掌握了更多更好的數據,誰就有可能在具身模型上率先取得突破,具身智能行業將圍繞數據打響爭奪戰。
![]()
具身數據生意經不好念
面對具身智能的數據荒,多方都想進入淘金,但這門生意經并不好念。規模、成本、質量、能否跨本體,都是挑戰。
搜狐科技從多位業內人士了解到,目前具身數據存在著明顯的數字金字塔結構。
最底層是互聯網公開數據,量大管飽,但對具身模型來說,缺乏指向性和具體場景,往往只能用來做基礎能力的預訓練,讓模型學習通用世界知識和語言理解。
再往上則是人類實操的第一視角數據以及虛擬環境中生成的仿真合成數據,站在塔尖的則是機器人本體視角數據,典型如真機遙操數據。
從下往上,越難獲取,價值越高,采集成本也越高。
多數觀點認為,真機遙操很難實現數據的規模化,場景的多樣性不足,采集成本也非常貴,而且大部分沒有在真實場景進行,所以會極大制約具身智能模型訓練的Scaling Up。
姚卯青就透露,目前國內真機數據的市場價格在每小時500-1000元之間,而無本體數據的價格預計收斂至真機數據的三分之一到二分之一。
“過去具身數據大部分都是做機器人遙操,很多頭部公司也就兩三萬條的遙操數據。如果堅持遙操的話,會發現場景非常受限,很多場景無法覆蓋,智能化程度就會受到很大的制約。”
京東具身智能業務有關負責人表示,京東采用的是人類第一視角的數據來解決具身模型訓練的Scaling Up問題,也就是通過人佩戴設備在各種場景去采集視頻數據。
同時,具身模型的訓練對數據質量的要求也非常高,如果數據質量不行,難以實現較好的訓練模型的效果。
這則涉及到數據采集設備是否足夠穩定,算法是否足夠精準,以及采集過程中是否有一定的質量控制,包括后續數據的質檢、過濾等,都會影響到最終的數據質量。
“一定要用高質量的數據集,想降成本也不能降低數據的質量,否則所謂的降成本就沒有任何價值。”京東前述負責人強調。
同時,目前具身數據還存在割裂問題,如真機遙操對本體的依賴和限制,導致無法做跨本體的遷移和操作等。這也形成了多樣的技術路線,如仿真派、真機派的分歧還在延續。
帕西尼創始人許晉誠則認為,具身數據的采集范式將從遙操、仿真時代逐漸走向以人為中心的人機解耦時代和EGO(第一視角)時代,未來則會邁向EGO+觸覺的全模態時代。
有具身模型研發人士告訴搜狐科技,目前具身智能遠沒有到Scaling Up非常強的地步,隨著數據量級的擴充,具身模型泛化能力還在指數級別提升。
這也是目前業內更關注數據的原因。同時,業內也在探索VLA、WAM、世界模型等各種模型架構。“但離真正的應用落地都還有很遠距離,誰會成為主流,現在無法給出定論。”
該人士還認為,具身數據的問題,并非靠哪家企業就能完全解決。
哪怕是京東,也在呼吁希望更多的行業伙伴加入,而不是靠自己單打獨斗。“我們做這件事情并不是單純要做數據服務的提供商,更多還是希望能建立針對具身行業的生態聯盟。”
因此,想要徹底解決數據瓶頸,需要行業共建,形成開源開放的生態。
![]()
大廠搶注AI下一個風口
縱然數據的問題依然懸而未決,但今年以來,隨著多家機器人走上春晚,具身智能這波熱潮依然還沒有退去的勢頭,機器人馬拉松則讓這波熱潮持續。
更顯著的趨勢是,行業融資在瘋狂加速。
據IT桔子,今年以來機器人板塊披露金額的122起融資中,資金總規模約345億元,而去年融資總額為588億元。這相當于不到四個月,就完成了去年行業近六成的融資。
同時,大額融資頻頻出現,今年單筆10億元及以上的融資至少已有15起,多家企業輪番刷新單筆融資紀錄。最新紀錄由它石智航創造,Pre-A輪獲得4.55億美金融資。
這也由此快速催生了一批估值超百億的具身智能獨角獸。
搜狐科技不完全統計,國內目前有宇樹、智元、眾擎、自變量、星海圖、云深處、智平方、帕西尼、銀河通用、千尋智能、星動紀元、逐際動力、靈心巧手、極佳視界、它石智航等至少15家具身智能公司的估值超過百億。
這其中,宇樹科創板上市申請已獲得受理,多家企業完成股改。可以預見,未來一兩年內,具身智能賽道有望迎來上市潮。
這些融資背后站著諸多大廠,百度、阿里、螞蟻、騰訊、京東、美團等相對積極,至少都出手五次以上。
![]()
宇樹、智元、自變量、星海圖等同時獲得多家大廠加持。宇樹同時獲得阿里、螞蟻、騰訊、美團四家大廠投資,自變量則同時獲得字節、阿里、美團、小米四家大廠投資。
具身智能被視為AI的下一個風口,是物理AI的核心賽道,不少機構都預測其有著萬億規模的市場潛力。
值得注意的是,除了投資,不少大廠自身還在圍繞具身數據、具身模型和基礎設施方面進行布局,以此想要成為具身行業的基建。
Omdia發布的《中國具身智能AI云市場1H25》顯示,百度智能云、阿里云、騰訊云、火山引擎、華為云等是該市場的主要玩家。隨著京東的發力,市場格局或會發生變化。
小米還在自研機器人本體,阿里旗下的高德則在探索四足機器人,而華為、騰訊、百度和螞蟻等此前均表態不會做機器人,而是專注模型基座或基礎設施服務。
一手做投資、一手搞基建,大廠在這波具身智能熱潮中,可以說相當積極。這背后不僅僅是短期的生意,更是大廠對AI下一個風口的提前押注。
![]()
![]()
運營編輯 |曹倩審核|孟莎莎
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.