![]()
成千上萬居民,一邊做著家務或者干著農活,一邊參與全球規模最大的AI行動。這樣的事,現在每天都在江蘇的宿遷發生。
這些居民頭戴的數據采集設備,會記錄下他們擦桌子、炒菜、縫紉服裝、照顧老人、剪枝摘果等各種動作數據。人們可能并不完全了解這件事的價值,但它確實在解決具身智能產業的根本瓶頸——“數據荒”。
機器人學習的不是知識,而是經驗
過去幾年,中國機器人的硬件與運動控制技術——“小腦”發展迅猛。四足機器人攀爬山地、人形機器人跑馬拉松……在電機、減速器、關節控制等物理層面,中國企業交出了令世界矚目的成績單。中商產業研究院數據顯示,2025年中國具身智能市場規模約9150億元,同比增長20.4%,預計2026年將突破10900億元。
然而,硬件競賽的熱鬧背后,一個短板日益凸顯:機器人缺乏真正的“大腦”。那些能表演、能炫技的機器人,無法理解真實的物理世界,連擰瓶蓋、磕雞蛋這類基礎動作都做不好,遑論走進家庭與工廠。
問題的根源在于數據。訓練一個具備泛化能力、適配多場景的高質量具身大模型,行業共識是需要數千萬小時甚至上億小時的訓練數據。而現實是,全行業能獲取的具身相關數據集加起來不過幾十萬小時——差了足足兩個數量級。物理AI真機交互數據量,不足大語言模型的兩萬分之一。這不是單純的技術問題,而是一場結構性短缺。
更被低估的是數據質量與生產邏輯。許多人以為架幾臺攝像機拍下人類動作即可,但原始視頻對機器人訓練幾乎毫無價值——它只記錄了“發生了什么”,而機器人需要知道“怎么發生的”:手在哪里、物體在哪里、三維空間結構如何、動作意圖是什么……這些信息必須經過精密處理與專業標注,才能轉化為有效數據。
機器人學習的不是知識,而是經驗。 它需要知道如何抓起裝滿水的杯子、如何調整力度、如何在失敗后修正動作。這些人類長期積累的“操作經驗”從未被數字化。正是這一痛點,讓行業目光集中到一種此前被忽視的數據類型上——第一視角人類操作數據。
為什么巨頭都在爭奪“第一視角數據”
過去一年,第一視角(Ego-centric)人類操作數據,正在成為全球具身智能領域最稀缺的資源。英偉達、Tesla、Figure、1X等公司紛紛大規模采集人類操作視頻,用于訓練機器人的模仿學習(Imitation Learning)。
![]()
相比傳統互聯網視頻只能告訴模型“發生了什么”,第一視角數據能讓機器人理解“動作為何這樣發生”。它不僅記錄結果,還保留了視線移動、手眼協同、空間關系、動作修正以及長任務決策鏈——這些隱性信息,正是機器人形成泛化能力的關鍵。
英偉達今年提出的EgoScale框架,明確將大規模第一視角數據視為機器人訓練的核心基礎設施。研究發現,隨著這類數據規模持續擴大,Vision-Language-Action(VLA)模型的真實任務成功率會穩定提升。機器人領域正在出現類似大模型的數據規模定律(scaling law):模型能力上限,取決于真實世界行為數據的規模與質量。
然而,這類數據過去幾乎不存在。實驗室的標準化數據無法覆蓋現實場景的隨機性——倉庫包裹每天不同,家庭環境不斷變化,布料會褶皺滑動。這意味著,具身智能最終競爭的,不只是模型能力,更是誰能持續獲得大規模真實場景中的第一視角人類數據。
為什么是京東做這件事
今年3月,京東官宣啟動人類歷史上最大規模的具身數據采集行動:兩年內動員超過10萬名內部員工、50萬外部協作人員,在宿遷就會有10萬人參與,完成1000萬小時無本體真實場景視頻數據,外加100萬小時機器人本體數據。
這背后真正的稀缺資源不是采集設備,而是場景。目前行業多數公司依賴實驗室采集或小規模眾包,難以持續獲得高頻、長流程、跨場景的人類操作數據。而京東的特殊性在于,它是中國少數同時擁有超大規模真實產業流、物流流與勞動流的平臺型企業:3600多個智能庫房、遍布全國的配送站、超萬家線下門店、20余萬家合作藥房,同時還是全國規模最大的家政服務公司,5萬多名家政人員服務千萬家庭——零售、物流、健康、家政、工業全場景覆蓋。
![]()
基于場景優勢,京東打造了全球首個采、存、標、訓、評、仿、測全鏈路具身智能數據基礎設施。
在數據采集端,JoyEgoCam通過車規級傳感器與4K鏡頭完成第一視角采集,即便在快遞分揀、貨物搬運等高速運動場景下,也能穩定記錄操作過程。
在數據處理端,原始視頻進入京東云AI數據湖后,會經過任務切分、語義標注、深度重建、手勢關鍵點定位等處理,最終轉化為機器人可直接學習的結構化數據。
治理完成的數據再接入京東云JoyBuilder模型開發平臺,模型訓練效率提升了3.5倍——過去訓練1億+數據的千卡訓練時間需要15小時,如今僅需22分鐘。
基于這套數據體系訓練的JoyAI-RA具身大模型,在仿真與真機測評中,任務執行平均成功率達到73.5%,超過英偉達GR00T N1.6、Physical Intelligence Pi0.5等行業頭部模型。
在宿遷,居民在家當“機器人老師”
5月20日,京東宣布全國首個具身智能數據采集社區已在宿遷正式運行。這是京東今年3月宣布建設全球最大具身數據采集中心以來,在具身智能數據基礎設施建設方面的又一重要進展,也標志著京東距兩年內積累超1000萬小時人類真實場景視頻數據的目標更進一步。
這座蘇北城市與京東的淵源可追溯二十余年。這里不僅是劉強東的老家,也是京東早期重要的客服中心與物流基地,宿遷積累了大量熟悉電商物流場景的勞動力,當京東的數據采集需求與宿遷的人力資源相遇,一種新的產業合作模式便自然生長出來。從電商中心、客服中心、物流樞紐、再到今天的具身智能布局,京東在宿遷投資已超過200億元。
![]()
在宿遷,參與數據采集的市民分布在各行各業,果園、服裝廠、康養機構……他們摘果子、折衣服、遞藥杯、搬貨,日常勞作被JoyEgoCam精準捕捉。這些市民成為真正的“機器人老師”,他們的真實行為動作為機器人提供了理解人類操作的優質“教材”。
這是一種雙贏:京東獲得高多樣性的真實場景數據;宿遷迎來一批全新數字職業——數據采集師、數據標注師、數據處理師、質量檢驗師,實現家門口的高質量就業。這也回應了社會關切的重要命題:具身智能并非只會替代就業,而是可以創造新職業、帶動勞動者共同成長。
更深層的意義在于,這是一條數字經濟時代的產業下沉新路徑:將前沿科技的基礎能力落地地方,與本地就業深度綁定,讓數據生產與價值收益實現本地化共享。宿遷繼電商物流之后,再次迎來關鍵發展機遇。這一模式未來可復制到更多城市,形成可規模化的數字經濟樣板。
不做封閉的數據王國:京東要當行業的“水電煤”
為了進一步提升數據規模,京東還推出了Real to Sim數據泛化服務:將真實人類動作轉化為仿真數據,再通過Sim to Real反向渲染生成逼真的機器人訓練數據,實現數據高效擴增。這意味著,機器人數據開始具備類似“自我繁殖”的能力。在整個過程中,數據基礎設施的重要性,開始超越單一模型本身。
京東收集的數據,并非只用于自身模型,而是以行業基礎設施的定位,為全行業提供數據支撐。京東具身智能數據交易平臺已正式上線,首批定向開放EgoLive高精標注數據集,這是目前業內質量最高的開源數據集:60FPS超高幀率,覆蓋300余個真實任務場景。
![]()
此外,京東還邀請合作伙伴匯入數據資源,共建規模化、標準化的數據生態。這種“搭臺”姿態指向一個更大的戰略雄心:成為具身智能時代的基礎設施提供商。
在這套生態體系中,上游是算法公司、AI芯片企業以及數據標注服務商;中游是各類倉儲機器人、配送機器人等硬件制造商;下游帶動系統集成、運維服務等相關產業。
與此同時,京東的產業落地多線并行。在零售側,JoyInside方案已與近200個家電家居、機器人、玩具品牌合作,2026年將助力機器人品牌伙伴銷售額突破百億元。在物流側,搭建機器人售后維修生態,機器人救護車服務覆蓋海內外,專業工程師團隊將擴至萬人規模。在工業側,打造一站式工業供應鏈服務,實現機器人制造物料100%覆蓋。
AI的關鍵戰場在物理世界
過去十年,AI的主戰場在數字世界——大語言模型用海量算力逼近認知邊界,卻終究是“旁觀者”:能寫出操作手冊,卻從未真正擰開過一個瓶蓋。
下一個十年,決戰將在物理世界。 或許正是因為這樣的判斷,京東在今年618啟動會上明確提出,將打造全球最大物理世界運營中心,推動AI從千行百業走進千家萬戶。
具身智能的使命,不是仿真“紙上談兵”,而是走進倉庫、工廠與家庭,在真實物理環境中感知、決策、行動。這需要的不是更多文本或圖像,而是人類從未被數字化的操作經驗——如何抓握、如何應對布料褶皺、如何在失敗中修正動作。這些經驗只能在真實場景中采集,并通過大規模、高質量的數據基礎設施,轉化為機器人的“肌肉記憶”。
當大模型企業還在算力與電價上內卷時,京東已將人、場景、真實操作數據作為核心生產要素,構建起連接數字與物理世界的產業護城河,將物理操作轉化為可計算、可復用的數字資產,讓機器人從“看懂”世界到真正“理解”。
當機器人掌握理貨、清潔、照護、配送等技能,它們將不再是實驗室里的炫技展品,而是承擔真實勞動的伙伴。而人,在訓練機器人的過程中,將日常經驗升華為驅動下一代AI的核心資產——這或許是人工智能從數字世界走向物理世界、與實體經濟和社會民生協同發展的最佳路徑。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.