你或許刷到了一段來自印度南部服裝廠的視頻。
工廠工人佩戴頭戴攝像頭,記錄手部動作以訓(xùn)練人工智能系統(tǒng)。
![]()
這是因?yàn)殡S著特斯拉、Figure AI 等公司競相開發(fā)人形機(jī)器人,訓(xùn)練它們所需的真實(shí)世界動作數(shù)據(jù)變得極為緊缺。
帕洛阿爾托的 Micro1 因此在全球 71 個國家招募了約 4000 名 工人,每月收到超過 16 萬小時的視頻素材。每人每周至少提交 10 小時錄像,交替完成不同類型的任務(wù)。
Scale AI 和 Encord 也在招募各自的數(shù)據(jù)采集隊(duì)伍,DoorDash 甚至在 2026 年 3 月推出 Tasks 應(yīng)用,讓旗下送餐員順帶在家錄家務(wù)視頻,不過專門排除了數(shù)據(jù)隱私法律嚴(yán)格的州。
每小時 15 美元
這份工作的具體操作,比聽起來要奇怪。
應(yīng)聘者首先要通過一個叫 Zara 的 AI 智能體面試。Zara 會和你對話,評估你是否適合,并要求你提交一段試錄視頻。
通過之后,你會收到一個額頭頭帶支架、一份錄制說明,和一張任務(wù)清單。說明上寫著,要讓雙手始終保持在鏡頭可見范圍內(nèi),動作要「保持自然速度」。
可自然速度在攝像頭下往往顯得太快,所以工人們普遍反映,實(shí)際錄制時必須刻意放慢,結(jié)果動作反而變得不自然,像是在模仿夢游。
還有一個門檻:你需要帶有 LiDAR 傳感器的 iPhone,也就是至少要 iPhone 12 Pro 以上的機(jī)型。
視頻提交之后,還要經(jīng)過 AI 和人工雙重審核,只有大約一半的素材最終可用。被拒的原因可能是光線不夠、手移出了畫面、動作太快,或者背景里出現(xiàn)了不該出現(xiàn)的東西。
工人按小時計(jì)酬,但如果視頻被拒,這段時間的勞動就白費(fèi)了。通過審核的視頻,隨后還會進(jìn)入一個標(biāo)注流程,由另一批人工標(biāo)注員逐幀標(biāo)記動作類別、物體名稱和運(yùn)動軌跡。
新德里的家教 Arjun 說,他通常要花一個小時構(gòu)思,才能想出能錄滿 15 分鐘的家務(wù)內(nèi)容。Micro1 要求工人不斷「變換內(nèi)容」,因?yàn)槎鄻踊膱鼍皩τ?xùn)練效果至關(guān)重要,但家的體量就那么大,創(chuàng)意遲早會耗盡。
美國家庭的視頻比其他地區(qū)賣得更貴。數(shù)據(jù)標(biāo)注公司 Objectways 的創(chuàng)始人 Ravi Rajalingam 解釋說,因?yàn)闄C(jī)器人公司預(yù)設(shè)了美國消費(fèi)者會最先購買人形機(jī)器人,所以美國家庭的操作環(huán)境數(shù)據(jù)更有價值,對應(yīng)的工人時薪有時高達(dá)越南或印度工人的三倍。同樣是疊衣服,身處洛杉磯的手和身處欽奈的手,收入可以差三倍。
![]()
圖源:https://newatlas.com/robotics/figures-humanoid-robots-household-chores-2025-helix-ai-brett-adcock/
Micro1 的副總裁 Arian Sadeghi 說,160 萬小時的月度素材遠(yuǎn)遠(yuǎn)不夠,「大概需要幾十億小時。我們連人與人之間的互動都還沒開始采集,現(xiàn)在只是最基礎(chǔ)的家務(wù)而已。」
幾十億小時,按照目前的采集速度,大概要連續(xù)工作一萬年。
幽靈勞動,顯形了
2019 年,人類學(xué)家 Mary Gray 和計(jì)算機(jī)科學(xué)家 Siddharth Suri 出版了一本書,叫 Ghost Work,直譯是「幽靈勞動」。
他們想描述的,是那些讓 AI 系統(tǒng)顯得「聰明」、卻從不出現(xiàn)在任何產(chǎn)品介紹里的人工勞動,標(biāo)注圖片、過濾違規(guī)內(nèi)容、清洗訓(xùn)練數(shù)據(jù)。
![]()
《銷聲匿跡:數(shù)字化工作的真正未來》
著者:[美]瑪麗?L.格雷、[美] 西達(dá)爾特?蘇里
譯者:左安浦
Gray 說,當(dāng)她剛開始研究這個問題時,去問工程師們,「誰在做這些工作」,得到的回答是「我也不太清楚」「我不敢去查」。
過去,幽靈工作主要發(fā)生在屏幕前,是點(diǎn)擊、標(biāo)注、審核這樣的操作。現(xiàn)在,身體本身,疊衣服的手勢、炒菜的節(jié)奏、打開冰箱的動作,都開始成為可以被采集、被定價、被轉(zhuǎn)售的原材料。
這些原材料從印度、尼日利亞、菲律賓、肯尼亞的普通家庭流出,匯聚到帕洛阿爾托和舊金山的公司,再轉(zhuǎn)化成產(chǎn)品流向市場。
Nick Couldry 和 Ulises Mejias 在研究數(shù)字經(jīng)濟(jì)時提出了一個框架,叫「數(shù)據(jù)殖民主義」,意思是:科技公司對數(shù)據(jù)的占有,在結(jié)構(gòu)上延續(xù)了歷史殖民主義對土地和資源的掠取邏輯,把人類的日常生活本身轉(zhuǎn)化為一種可供資本提取的原材料。
放在 Micro1 的案例里,工人每小時拿到 15 美元,在內(nèi)羅畢或馬尼拉是有競爭力的工資,但放在流入機(jī)器人公司的數(shù)十億美元投資面前,連零頭都算不上。
更值得注意的是信息上的不對等。Micro1 以保密為由,不向工人透露客戶名單,工人們也不清楚自己的數(shù)據(jù)將如何被存儲,會不會被轉(zhuǎn)售給其他第三方。工人簽了協(xié)議,收了錢,但他們在整條產(chǎn)業(yè)鏈里的信息處于末端,對自己正在參與的事情的全貌,知道得很少。
Gray 在研究幽靈勞動時發(fā)現(xiàn)了一件讓她印象深刻的事,工人們往往會自發(fā)找到彼此,建立非正式的互助網(wǎng)絡(luò),因?yàn)楣ぷ鞅旧硖峁┑闹С謳缀跏橇悖藗儽仨毧勘舜司S持做下去的意義感。孤立是這類勞動的默認(rèn)狀態(tài)。
2026 年,全球人形機(jī)器人市場預(yù)計(jì)達(dá)到 42.3 億美元,而到 2027 年,特斯拉等公司的量產(chǎn)計(jì)劃將使全球累計(jì)安裝量突破 10 萬臺。
這些機(jī)器人,大概率將進(jìn)入工廠和家庭,承擔(dān)體力勞動。而訓(xùn)練它們的數(shù)據(jù),正是來自那些現(xiàn)在還在用體力勞動糊口的人。
![]()
圖源:https://developer.nvidia.com/blog/teaching-robots-to-tackle-household-chores/
我們知道的,多于我們能說出的
哲學(xué)家邁克爾·波蘭尼在 1958 年寫了一本書叫 Personal Knowledge,他在書里說:我們知道的,多于我們能夠說出的。他稱之為「默會知識」,意思是人類有大量的知識不以命題的形式存在,而是以動作、感知、直覺的形式附著在身體里。
![]()
騎自行車是一個常見的例子,你知道怎么保持平衡,但沒有辦法把這件事寫成一套可以教給別人的規(guī)則。它只能通過實(shí)踐習(xí)得,通過觀察、模仿和重復(fù),在身體內(nèi)部慢慢積累,而不能被直接傳遞。
波蘭尼寫這本書的時候,AI 還不存在。但他的論斷在今天獲得了一種新的現(xiàn)實(shí)重量。
我們正在做的事,是試圖把這種默會知識,從人的身體里抽取出來,轉(zhuǎn)化為機(jī)器可以處理的數(shù)據(jù)。
Micro1 的工人們額頭上的攝像頭錄下的,除了是一個疊衣服的動作,還是手指如何感知布料的重量,手腕如何在恰當(dāng)?shù)臅r機(jī)翻轉(zhuǎn),視線如何在疊的過程中追蹤布料的邊緣。
![]()
Scale AI 宣布已收集超過 10 萬小時的素材 https://scale.com/blog/physical-ai
這是人類歷史上第一次嘗試大規(guī)模地把身體知識外化。
波蘭尼說,默會知識不能被完全言說,但這不代表它不能被掠取。Couldry 和 Mejias 說,數(shù)據(jù)殖民主義把日常生活本身變成了一種資源,一種「就在那里,隨時可以被提取」的東西。現(xiàn)在,連在家鋪床這件事也被包含在內(nèi)了。
人們常常把 AI 的沖擊描述為「機(jī)器會取代知識工作者」,但現(xiàn)在最普通、最不被算作技能的那些動作也在被采集。如果連這些都可以變成訓(xùn)練數(shù)據(jù),那「什么是人的勞動」這個問題,就不再是哲學(xué)思辨,而變成了一個非常實(shí)際的政治問題。
Zeus 是尼日利亞中部高地一座城市里的醫(yī)學(xué)生。他每天下班后把手機(jī)固定在額頭上,然后開始給自己的床鋪床單。
他說,他覺得這是「留下印記的機(jī)會」。他不覺得自己只是在被使用,他覺得自己在參與一件重要的事。
這也許是對的,但它同時并不妨礙另一件事,那就是他留下的那個印記,最終的形狀將是他自己鋪床動作的運(yùn)動軌跡,由一家他叫不出名字的公司買走,用來訓(xùn)練一臺他將來不一定負(fù)擔(dān)得起的機(jī)器。
波蘭尼說,所有的知識都是個人的,是由具體的人、在具體的處境里、通過具體的實(shí)踐產(chǎn)生的。把這種知識從人身上剝離出來,讓它在人離開之后繼續(xù)運(yùn)轉(zhuǎn),那么現(xiàn)在,人作為知識的承載者,究竟擁有什么?
這個問題現(xiàn)在還沒有答案。但它已經(jīng)在尼日利亞的公寓里、印度的廚房里、菲律賓的院子里,以每小時 15 美元的價格,被悄悄地問著。
參考資料:
https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.