![]()
作者:彭堃方
編輯:呂鑫燚
出品:具身研習(xí)社
一段時間里,具身智能行業(yè)最熱鬧的敘事幾乎都落在模型上。
應(yīng)接不暇的新概念,不斷推高行業(yè)對“機器人大腦”的想象。某種程度上,這是必然的。當(dāng)本體能力已經(jīng)邁過從“能不能站起來、走起來”,進入到“能不能真正理解世界、完成任務(wù)”的階段,模型當(dāng)然會成為下一輪產(chǎn)業(yè)競爭的中心。
但如果因此“重模型”而“輕硬件”,可能會誤判這一輪具身智能真正發(fā)生的變化。
一個越來越清晰的信號是:越是認真做模型的公司,越不敢輕視硬件。硬件不是模型的下游,恰恰相反,它正在以一種更底層的方式,重新進入具身智能的競爭核心。
因為機器人不是一個只活在云端的智能體。它要移動,要抓取,要感知力的變化,要承受摩擦、碰撞、溫度、負載和環(huán)境的不確定性。它每一次失敗,都不只是算法失敗,也可能是關(guān)節(jié)、傳感器、材料、結(jié)構(gòu)、手部自由度、驅(qū)動方式、通信延遲、續(xù)航、散熱、工藝一致性共同作用的結(jié)果。
這也是為什么,具身智能走到今天,行業(yè)部分前瞻者開始重新理解硬件的價值:硬件不是智能的外殼,而是智能進入現(xiàn)實世界的邊界。
在這條脈絡(luò)下,我們能看到幾個動作:模型廠商補強硬件、硬件廠商繼續(xù)釋放身體想象力、硬件交付周期大有可為。這些動作指向了同一個判斷:當(dāng)智能真正長出身體,硬件的價值不會變輕,只會變得更深。
![]()
人們習(xí)慣于把具身智能拆成兩個部分:模型負責(zé)“大腦”,硬件負責(zé)“本體”。
在這個分工里,硬件似乎更靠近制造、供應(yīng)鏈、工程執(zhí)行;模型則更靠近想象力、資本故事和技術(shù)上限。但真實產(chǎn)業(yè)不會按照這么干凈的邊界演進。機器人模型要想真正變強,首先需要高質(zhì)量數(shù)據(jù)。而高質(zhì)量數(shù)據(jù)從哪里來?可以肯定的是不只是從公開視頻里來,也不是只從仿真環(huán)境里來。作為混合數(shù)據(jù),它相當(dāng)一部分來自真實機器人、真實人類動作,來自一次次機器運轉(zhuǎn)、UMI開合、Ego 攝制的物理世界經(jīng)驗。
于是,硬件先于模型成為了數(shù)據(jù)質(zhì)量高低的入口,模型公司開始補硬件,就變成了一件順理成章的事。
Genesis AI是一個很典型的信號,大家在驚嘆其操作模型 GENE-26.5 成功率的厲害時,很少關(guān)注其信條——Manipulation is「A system problem, not just an AI problem」。它做的并不只是模型,也在同步補強靈巧手、數(shù)據(jù)采集套件,甚至控制中間件。靈巧手負責(zé)承接真實操作,數(shù)采套件負責(zé)把人的動作、觸覺和操作過程轉(zhuǎn)化為可訓(xùn)練的數(shù)據(jù),控制中間件則把模型輸出與真實硬件執(zhí)行之間的鏈路打通。換句話說,Genesis AI 并沒有把硬件視為模型能力的“展示終端”,而是把它放進了模型訓(xùn)練、數(shù)據(jù)回流和真實控制的完整閉環(huán)里。
![]()
這類動作的關(guān)鍵,不在于某一只靈巧手有多酷,也不在于某一套數(shù)據(jù)采集設(shè)備本身有多新奇,而在于它改變了模型與硬件之間的主從關(guān)系。過去的敘事里,模型像是高高在上的“大腦”,硬件負責(zé)執(zhí)行。但在具身智能里,執(zhí)行本身會反過來定義智能。一個沒有足夠觸覺、力覺和動作精度的手,采不到足夠細膩的數(shù)據(jù);一個沒有穩(wěn)定運動能力的本體,無法在真實場景里形成高質(zhì)量交互;一個沒有可靠部署能力的平臺,也很難支撐模型持續(xù)迭代。
這意味著,“硬件不是模型的下游”,而是模型能否進入物理世界的前提條件。如 Genesis AI 所說“通用機器人的發(fā)展之路始于操作,而操作必須作為一個全棧問題來解決”。
也正因為如此,新一輪具身智能創(chuàng)業(yè)公司很少再只講“我有一個模型”。它們往往會同時自研數(shù)據(jù)采集設(shè)備、本體、靈巧手、遙操作系統(tǒng)、仿真平臺,甚至把這些硬件能力直接綁定到模型能力上。模型廠商認真對待硬件,不是回頭補課,而是產(chǎn)業(yè)終于意識到:沒有身體的智能,很難真正成為具身智能。
更進一步說,硬件正在成為具身智能的數(shù)據(jù)入口、能力接口和場景入口。模型可以在仿真中快速迭代,可以從互聯(lián)網(wǎng)視頻里獲得世界知識,但一旦進入真實任務(wù),它仍然需要通過身體去觸碰世界、理解世界、修正自己。對于機器人來說,身體不是智能的終點,而是智能不斷進化的起點。
這種趨勢也出現(xiàn)在更大的產(chǎn)業(yè)動作中。Amazon 收購 Fauna Robotics,Skild AI 收購 Zebra Technologies 旗下機器人業(yè)務(wù),都釋放出一個相似信號:機器人從實驗室走向真實場景之后,競爭就不再只是模型能力的競爭,而是軟硬件、數(shù)據(jù)、場景和部署系統(tǒng)的綜合競爭。無論是面向人機共處空間的小型人形機器人,還是服務(wù)于倉儲制造體系的 AMR,越往真實世界走,硬件問題越不可能被繞開。
![]()
我們看到模型廠商補硬件,說明硬件重新回到智能競爭的視野;與此同時,硬件廠商不斷刷新身體性能,則說明另一件事:機器人并不是只能復(fù)刻人類,它正在把“身體”這件事推向更大的想象空間。
過去,人形機器人之所以成為行業(yè)焦點,是因為人類世界本身就是為人設(shè)計的。門把手、樓梯、工具、貨架、工位、廚房、工廠產(chǎn)線、辦公空間,都隱含著人類身體的尺度和動作習(xí)慣。所以,人形被認為是通用機器人最合理的一種答案。它的價值在于,不需要徹底改造環(huán)境,也有機會進入人類已經(jīng)建好的世界。
但“像人”只是起點,“超人”才是硬件真正打開想象力的地方。
今天的機器人,正在身體性能上不斷越過人類邊界。榮耀的馬拉松機器人“閃電”已經(jīng)開始全方位打破人類極限;大咖騏驥 T1000四足機器人能夠扛起以“噸”計的貨物保持穩(wěn)定行走;而更具力量感和科幻感的宇樹 GD01“高達,則把機器人的身體想象進一步推向力量、尺度和沖擊力的方向。
![]()
這類產(chǎn)品最重要的價值,正重新定義機器人身體的能力上限。人類身體有天然限制。人會疲勞,會受傷,會恐懼,會在高溫、低溫、高輻射、高粉塵、高負載環(huán)境中迅速接近極限。但機器人身體可以被重新設(shè)計。它可以更耐久、更穩(wěn)定、更有力量,也可以在危險環(huán)境里承擔(dān)人類不該承擔(dān)的風(fēng)險。一臺機器人如果跑得比人快、負重比人強,甚至在極端設(shè)想中擁有“一拳砸爛一面墻”的力量,那么它呈現(xiàn)出的就不只是一個自動化工具,而是一種“超人化”的身體能力。
這種超人化,并不意味著機器人要取代人類成為新的主體。更準(zhǔn)確地說,它是在把人類無法長期承擔(dān)、不適合承擔(dān)、或者不值得親自承擔(dān)的身體勞動,轉(zhuǎn)移給一個更強壯、更耐久、更可控的機器身體。機器人可以像人一樣進入人類世界,也可以在力量、速度、耐力、精度、尺度和環(huán)境適應(yīng)性上越過人類身體的限制。硬件的想象力,正是在這個過程中被釋放出來。
王興興曾經(jīng)表達過一個很有想象力的判斷:機器人可以很大,大到洪水來了,機器人能蹲下堵住洪水;也可以很小,小到進入血管做手術(shù)。這個說法聽起來像科幻,但它點出了硬件與模型不同的地方。模型可以讓機器人越來越聰明,但硬件決定了機器人能以什么樣的身體進入世界。當(dāng)它可以擁有超過人的力量,自然而然也可以完成超出人類身體能力邊界的任務(wù)。
更進一步看,硬件廠商釋放想象力的方式,也不只體現(xiàn)在“更大、更強、更快”上,還體現(xiàn)在構(gòu)型之間的能力遷移上。四足機器人的運動控制能力,可以遷移到人形機器人的動態(tài)平衡上;人形機器人的雙臂操作能力,也可能與輪式、四足、履帶式底盤結(jié)合。或者更簡單的說,“四足站起來就是人形,人形趴下就是四足”。過去,行業(yè)可能會爭議構(gòu)型。但現(xiàn)在看,真正重要的不是某一個構(gòu)型是否成為終局,而是機器人身體能否根據(jù)任務(wù)不斷重組能力邊界。
在這個意義上,硬件廠商們正在不斷回答一個更底層的問題:當(dāng)智能真正長出身體之后,這個身體到底有何種可供性(Affordance)?
這是模型無法單獨回答的問題。同一個模型,放在不同硬件上,能力邊界完全不同;同一套算法,面對不同關(guān)節(jié)、傳感器、負載和運動形態(tài),所能完成的任務(wù)也完全不同。硬件不是智能的外觀,而是智能抵達世界的方式。
所以,當(dāng)行業(yè)討論具身智能是不是進入模型時代時,另一個判斷也同樣成立:具身智能仍然處在硬件想象力快速釋放的階段。硬件并沒有被模型吞沒。它正在以自己的方式,打開具身智能真正進入物理世界后的能力邊界。
![]()
但硬件的價值,不只在研發(fā)階段,也不只在產(chǎn)品形態(tài)上。真正進入產(chǎn)業(yè)落地之后,硬件還會暴露出另一層更現(xiàn)實的價值:交付。
過去,很多人理解硬件,容易把它理解成“一臺機器賣出去”。賣出去,似乎就意味著商業(yè)閉環(huán)完成了。但機器人不是手機,也不是普通家電,更不是一個開箱即用的標(biāo)準(zhǔn)電子產(chǎn)品。機器人賣出去,往往只是開始。
它要進入各種場景,每一個場景都有自己的空間結(jié)構(gòu)、人群活動和安全邊界。機器人到現(xiàn)場之后,真正的工作才剛剛開始:調(diào)試、任務(wù)配置、接口打通、人員培訓(xùn)、異常處理、持續(xù)運維、軟件升級、硬件維修、數(shù)據(jù)回流、能力迭代...
這也是 DYNA 聯(lián)合創(chuàng)始人兼 CTO York Yang 所說的那個判斷:“硬件不等于渠道”。更進一步地說,硬件本身也不等于交付能力。
今天很多具身智能公司容易低估這一點。他們以為只要本體夠漂亮、模型夠先進、demo 夠震撼,就能自然進入規(guī)模化商業(yè)。但真實場景不會偏愛 demo。客戶購買的也不是一臺機器人,而是一套能穩(wěn)定解決問題的系統(tǒng)。
在工業(yè)場景里,客戶關(guān)心的是節(jié)拍、良率、安全、停機成本、維護周期和 ROI;在商業(yè)場景里,客戶關(guān)心的是人員替代效率、故障響應(yīng)和用戶體驗;在家庭場景里,客戶關(guān)心的則是安全、隱私、穩(wěn)定、價格和長期陪伴價值。這些問題,都不是一次性交付能解決的。
硬件的長交付周期,反而給具身智能公司留下了真正構(gòu)建壁壘的空間。
首先是服務(wù)和渠道,硬件公司如果只會制造,不會交付,就很難把機器人從樣機推向規(guī)模化。機器人越復(fù)雜,售后越重,交付鏈條越長。未來真正有競爭力的公司是能把產(chǎn)品、銷售、渠道、服務(wù)、運維和數(shù)據(jù)回流串成一個閉環(huán)。
渠道不是把機器賣給客戶的那條路徑,而是理解客戶、觸達客戶、服務(wù)客戶、持續(xù)創(chuàng)造價值的一整套能力。沒有渠道,硬件只能完成交易;有了渠道,硬件才能進入場景,形成復(fù)購、迭代和規(guī)模化。
其次是數(shù)據(jù)飛輪。機器人一旦部署到真實場景中,就不再只是產(chǎn)品,也會成為數(shù)據(jù)入口。它在現(xiàn)場遇到的每一次失敗、每一次異常、每一次人工接管、每一次成功完成任務(wù),都會反過來成為模型和系統(tǒng)迭代的燃料。機器人進入真實世界,它能積累最稀缺的物理交互數(shù)據(jù)。長期看,這可能會成為具身智能公司最重要的復(fù)利來源。
所以,硬件并不是一個“賣出去就結(jié)束”的生意。它更像是一張進入真實世界的門票。拿到這張門票之后,企業(yè)才真正開始面對客戶、面對場景、面對運維,也面對數(shù)據(jù)和能力的長期積累。
這些積累看起來不夠性感,卻是機器人真正產(chǎn)業(yè)化的底層工作。它不像模型發(fā)布那樣可以在短時間內(nèi)制造強烈聲量,也不像 Demo 視頻那樣能迅速調(diào)動公眾情緒。硬件的價值往往發(fā)生在更慢的地方:一臺機器在現(xiàn)場多跑一天,一個任務(wù)在復(fù)雜環(huán)境里多成功一次,一次故障被復(fù)盤成新的產(chǎn)品改進,一次交付經(jīng)驗變成下一批規(guī)模化部署的模板。
硬件沒有退場
它正在決定智能能抵達多遠
具身智能行業(yè)很容易被模型敘事吸引。
因為模型代表上限,代表想象力,代表通用智能的未來。但機器人終究不是只在屏幕里完成推理的系統(tǒng)。它要走到地面上,伸出手,碰到物體,進入人類空間,承擔(dān)真實任務(wù)。
所以,硬件的想象力一直都在。它藏在模型公司自研數(shù)據(jù)手套和靈巧手的動作里,藏在 Amazon、Skild 這些公司重新靠近機器人硬件的產(chǎn)業(yè)信號里,藏在人形、四足、輪足、柔性機器人不斷交叉融合的構(gòu)型變化里,也藏在一臺機器人賣出去之后漫長的部署、運維和場景打磨里。
當(dāng)行業(yè)重新理解硬件,就會發(fā)現(xiàn):硬件從來不是想象力的反面。它是想象力進入現(xiàn)實世界之后,必須擁有的形狀。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.