![]()
新智元報(bào)道
編輯:好困 桃子
【新智元導(dǎo)讀】一場全球峰會在硅谷引爆!不僅有圖靈獎(jiǎng)得主站臺,更有Big Seven巨頭的頂級科學(xué)家現(xiàn)身。這家成立近兩年中國公司,一口氣甩出三大新品。
美西時(shí)間4月28日,具身智能行業(yè)有史以來,第一場全球性峰會在硅谷落幕!
這場大會星光熠熠——
2015年圖靈獎(jiǎng)得主、公鑰密碼學(xué)奠基人Martin Hellman做開場主旨演講,主題是「安全、智能與物理世界的交匯」。
英偉達(dá)GEAR Lab高級研究科學(xué)家、亞馬遜前沿AI研究院科學(xué)家、斯坦福大學(xué)副教授同臺對談,上千名來自全球的AI學(xué)者、開發(fā)者和投資人到場。
![]()
張藝興也驚喜現(xiàn)身
在這場名為GEIS(全球具身智能創(chuàng)新大會)的峰會上,一口氣發(fā)布三款核心產(chǎn)品,覆蓋世界模型、靈巧手和人形機(jī)器人。
如此豪華的陣容,硬核的發(fā)布,倒像是硅谷本土巨頭的畫風(fēng)。
誰能想到,GEIS的發(fā)起方竟是一家成立剛滿兩年的中國公司——魔法原子(MagicLab)。
在硅谷辦會、請圖靈獎(jiǎng)得主站臺,具身智能賽道還從未有過這種先例。
機(jī)器人缺的不是胳膊腿,是腦子
過去兩年,人形機(jī)器人的關(guān)節(jié)扭矩越來越大,自由度越來越多,翻跟頭的姿勢越來越花。
但一個(gè)尷尬的事實(shí)始終沒變,絕大多數(shù)機(jī)器人離開預(yù)設(shè)好的demo場景,就「不會干活」了。
問題出在哪?
目前主流的VLA(視覺-語言-動作)大模型已經(jīng)能讓機(jī)器人聽懂指令、看見場景,但一旦進(jìn)入真實(shí)環(huán)境,光照變了、桌面材質(zhì)換了、物體擺放位置偏了幾厘米,泛化能力就開始崩。
說到底,機(jī)器人缺的不是更強(qiáng)的胳膊腿,是一個(gè)真正能理解物理世界的「大腦」。這才是核心瓶頸。
這正是魔法原子此次發(fā)布的世界模型Magic-Mix要解的題。
世界模型Magic-Mix,自己教自己
Magic-Mix由兩個(gè)核心引擎協(xié)同運(yùn)作。
第一個(gè)叫Magic-Mix WAM,負(fù)責(zé)物理環(huán)境理解、空間推演和動作決策。
通俗地說,它讓機(jī)器人在動手之前,先在「腦子里」模擬一遍接下來會發(fā)生什么。
抓一個(gè)杯子,手指接觸杯壁的瞬間會產(chǎn)生多大的力?杯子的重心在哪?如果桌面是濕的,摩擦系數(shù)怎么變?
這些物理常識層面的推演,是VLA模型不擅長的,而世界模型恰好補(bǔ)上了這塊。
第二個(gè)引擎叫Magic-Mix Creator,是一個(gè)離線數(shù)據(jù)生成器。
它的工作是大批量合成訓(xùn)練數(shù)據(jù)樣本,持續(xù)喂給WAM做訓(xùn)練和迭代。
以上兩個(gè)引擎組合在一起,形成了一個(gè)閉環(huán),海量數(shù)據(jù)生成→模型訓(xùn)練→訓(xùn)練結(jié)果反饋→數(shù)據(jù)再生成。
![]()
換言之,Magic-Mix是一個(gè)能「自我進(jìn)化」的動態(tài)系統(tǒng)。
機(jī)器人在真實(shí)場景中每執(zhí)行一次任務(wù),產(chǎn)生的數(shù)據(jù)都會回流到這個(gè)閉環(huán)里,驅(qū)動模型持續(xù)進(jìn)化。
在訓(xùn)練機(jī)制上,Magic-Mix有一個(gè)很硬核的設(shè)計(jì),視頻動作雙專家協(xié)同訓(xùn)練。
一個(gè)專家負(fù)責(zé)「看」,從視頻數(shù)據(jù)中學(xué)習(xí)物理世界的運(yùn)行規(guī)律;另一個(gè)專家負(fù)責(zé)「動」,把觀察到的規(guī)律轉(zhuǎn)化為具體的動作策略。
兩個(gè)專家共享底層信息,但梯度更新彼此隔離,避免互相干擾。
這套機(jī)制還引入了目標(biāo)圖像約束和失敗圖像特征輸入。系統(tǒng)不僅學(xué)習(xí)「成功長什么樣」,也學(xué)習(xí)「失敗長什么樣」,從而在執(zhí)行長線程任務(wù)時(shí)減少誤差累積。
而支撐這套系統(tǒng)運(yùn)轉(zhuǎn)的底層基礎(chǔ),是數(shù)據(jù)。
數(shù)據(jù),恰恰是當(dāng)前具身智能最大的瓶頸。真機(jī)數(shù)據(jù)采集成本高、周期長、場景覆蓋有限,這是全行業(yè)面臨的共性難題。
魔法原子給出的解法是「兩條腿走路」——
一方面,大力投入真機(jī)數(shù)據(jù)采集。日均采集約16000條,VLM層模型參數(shù)量達(dá)3B,已積累約36萬條真機(jī)數(shù)據(jù);
另一方面,通過Magic-Mix Creator大批量合成訓(xùn)練數(shù)據(jù),實(shí)現(xiàn)萬倍級別的數(shù)據(jù)體量擴(kuò)展。
其構(gòu)建的Robot Data Pool,高質(zhì)量數(shù)據(jù)集規(guī)模已超100萬小時(shí)。
這套「真機(jī)采集+合成擴(kuò)展」的數(shù)據(jù)飛輪,大幅降低了對純真機(jī)數(shù)據(jù)的依賴,也為模型訓(xùn)練提供了持續(xù)穩(wěn)定的彈藥補(bǔ)給。
從行業(yè)視角看,誰能率先跑通數(shù)據(jù)閉環(huán),誰就能在具身智能的下半場占據(jù)先機(jī)。
一個(gè)可以想象的場景是,如果這套世界模型率先在家庭環(huán)境中跑通,機(jī)器人就能在廚房里根據(jù)臺面上食材的擺放位置自主規(guī)劃切菜、裝盤的動作序列,而不需要人類預(yù)先編排每一步。
從水龍頭出水的角度到碗碟疊放的高度,這些細(xì)碎的物理變量都在世界模型的推演范圍內(nèi)。
家庭這種高度非結(jié)構(gòu)化的場景都能應(yīng)對,工業(yè)產(chǎn)線上相對標(biāo)準(zhǔn)化的任務(wù)就更不在話下。
這是世界模型真正的戰(zhàn)略意義:它是為所有場景提供底層能力支撐。
誰先把世界模型跑通,誰就拿到了具身智能規(guī)模化落地的「萬能鑰匙」。
靈巧手H01,比人手還「敏感」
有了「大腦」的決策能力,還需要足夠精密的執(zhí)行終端。
會上,同期發(fā)布的新一代靈巧手MagicHand H01,有幾個(gè)參數(shù)值得單獨(dú)拎出來看。
20個(gè)自由度,其中15個(gè)為主動自由度,整機(jī)重量僅1公斤,額定負(fù)載卻達(dá)到10公斤。
![]()
機(jī)器人的手越重,對整機(jī)負(fù)載的擠壓就越大,留給實(shí)際作業(yè)的有效載荷就越少。
H01把自重壓到了1公斤,幾乎不吃整機(jī)的負(fù)載預(yù)算。
44個(gè)高分辨率三維觸覺傳感器覆蓋手掌和指尖,力感知分辨率達(dá)到0.05牛頓。
要知道,人類指尖的力感知閾值大約在0.05到0.1牛頓之間。H01在力感知精度上,已經(jīng)摸到了人手的下限。
但H01最有辨識度的能力是「未觸先覺」。產(chǎn)品具備0到40mm的動態(tài)感知范圍,接近覺分辨率達(dá)到0.5毫米,能夠在真正接觸物體之前就完成動作預(yù)判。
配合5mm級的硬件閉環(huán)響應(yīng)系統(tǒng),機(jī)器人的手在離物體還有幾厘米的時(shí)候就已經(jīng)開始調(diào)整姿態(tài)和力度了。
這在護(hù)理、康復(fù)訓(xùn)練、家庭服務(wù)這類場景中尤其關(guān)鍵。機(jī)器人跟人近距離接觸時(shí),靠碰撞檢測做事后補(bǔ)救太晚了,H01能在接觸發(fā)生之前就完成力度和軌跡的調(diào)整。
1秒內(nèi)完成完整開合動作,響應(yīng)速度足以應(yīng)對工業(yè)產(chǎn)線節(jié)拍。同時(shí)支持適配市面上多款人形機(jī)器人本體,不綁定自家平臺。這個(gè)開放策略在靈巧手賽道并不常見。
更具實(shí)用價(jià)值的是,H01被設(shè)計(jì)為通用模塊,可適配市面上多款人形機(jī)器人本體。
這是一個(gè)明確的生態(tài)化信號:魔法原子不只想給自家機(jī)器人配上靈巧手,而是想讓H01成為行業(yè)的「標(biāo)準(zhǔn)件」。
MagicBot X1,7×24小時(shí)不下班
三款產(chǎn)品中的最后一塊拼圖是旗艦人形機(jī)器人MagicBot X1。
上一代Gen1,身高174cm、42個(gè)自由度、雙臂搬運(yùn)負(fù)重20公斤,是魔法原子在春晚和工廠產(chǎn)線上驗(yàn)證過的主力機(jī)型。
![]()
而這一次,X1在Gen1基礎(chǔ)上做了幾個(gè)關(guān)鍵升級。
第一是運(yùn)動能力大幅提升。
X1身高拉到180cm,體重70kg,全身31個(gè)主動自由度(Gen1是42個(gè)總自由度,但主動自由度數(shù)未公開披露),極限關(guān)節(jié)扭矩從Gen1的體系升級到450N·m。
整機(jī)運(yùn)動速度綜合提升30%以上,運(yùn)動范圍提升超過50%。
更高的扭矩和更大的運(yùn)動范圍組合起來,意味著X1能在更復(fù)雜的空間姿態(tài)下完成作業(yè)。
![]()
舉個(gè)栗子,工業(yè)場景中經(jīng)常需要機(jī)器人彎腰探進(jìn)設(shè)備內(nèi)部做檢測或取件,這類動作對軀干和肩關(guān)節(jié)的運(yùn)動范圍要求很高,Gen1在某些極限角度下會受限。
X1提升50%的運(yùn)動范圍,直接拓寬了它在柔性生產(chǎn)場景中的適用面。
第二是續(xù)航問題的根本解法。
Gen1綜合續(xù)航最高5小時(shí),對于需要兩班倒,甚至三班倒的工業(yè)場景來說不夠用。
X1沒有選擇堆更大的電池,而是做了雙電池?zé)岵灏蜗到y(tǒng),支持不斷電更換電池,直接實(shí)現(xiàn)7×24小時(shí)連續(xù)作業(yè)。
工廠不需要等機(jī)器人「下班充電」,運(yùn)維人員換塊電池就行。
這個(gè)設(shè)計(jì)思路比單純拼電池容量更務(wù)實(shí)。
第三是產(chǎn)品化程度。
X1一共有兩個(gè)SKU:開箱即用「標(biāo)準(zhǔn)版」,以及面向高校和開發(fā)者「科研版」,支持底層二次開發(fā)和外形定制。
Gen1在產(chǎn)品化層面更偏向定制項(xiàng)目交付,X1從一開始就是沖著標(biāo)準(zhǔn)化量產(chǎn)去的。
到這里,技術(shù)拼圖閉環(huán)了。Magic-Mix世界模型是「大腦」,H01靈巧手是「雙手」,X1人形機(jī)器人是「身體」。
從感知、決策到執(zhí)行,一口氣補(bǔ)齊。
行業(yè)拐點(diǎn)已至,誰在真正落地?
站在更宏觀的視角來看,GEIS上大會上的集中發(fā)布折射出的是,整個(gè)具身智能行業(yè)正在經(jīng)歷的結(jié)構(gòu)性轉(zhuǎn)折。
年初,智源研究院在發(fā)布的《2026十大AI技術(shù)趨勢》中指出,具身智能正迎來行業(yè)「出清」,中國已有超過230家具身智能企業(yè),其中人形機(jī)器人企業(yè)超過100家。
但這一輪競爭的技術(shù)難度、資金需求遠(yuǎn)超過往,當(dāng)前企業(yè)數(shù)量遠(yuǎn)超賽道的物理承載量與資本供給能力。
換言之,2026年,是具身智能從「百團(tuán)大戰(zhàn)」走向「諸侯割據(jù)」的分水嶺。
誰能從實(shí)驗(yàn)室走向量產(chǎn)交付,誰能打通從技術(shù)到產(chǎn)品再到商業(yè)的完整鏈路,誰就能在洗牌中存活并勝出。
從這個(gè)角度審視魔法原子的GEIS發(fā)布,其戰(zhàn)略意圖更加清晰——
世界模型提供理解世界的能力,靈巧手提供精細(xì)操作的能力,人形機(jī)器人提供全場景作業(yè)的身體平臺。
而「閉環(huán)」,恰恰是此次GEIS硅谷發(fā)布會的核心敘事。
全棧自研+全球押注
支撐這套閉環(huán)的底層,是魔法原子硬件自研率超過90%的全棧路線。
自研關(guān)節(jié)模組峰值扭矩525N·m,專利布局超150項(xiàng),自建數(shù)據(jù)采集工廠日產(chǎn)真機(jī)數(shù)據(jù)16000條。
這條路線的代價(jià)是研發(fā)投入大、周期長,但回報(bào)也擺在那里。
成立兩年內(nèi),從春晚百臺群控、蘇超近300臺戶外暴雨群控到香港論壇4.5小時(shí)零故障商務(wù)服務(wù),連續(xù)完成了一條跨場景驗(yàn)證鏈。拿下大健康領(lǐng)域1.5億元單筆訂單。業(yè)務(wù)覆蓋全球50個(gè)國家和地區(qū),海外收入占比超過60%。
GEIS大會上,魔法原子總裁顧詩韜首次對外披露長期目標(biāo)——
2036年沖刺140億美元營收,未來五年投入10億美元打造全球開發(fā)者生態(tài)。
![]()
大會現(xiàn)場與硅谷AI企業(yè)Openmind、PrismaX AI、Cosmicbrain AI、Physis完成簽約,基于「千景共創(chuàng)」計(jì)劃向生態(tài)伙伴開放硬件樣機(jī)、開發(fā)資金和核心技術(shù)支持。
當(dāng)全球具身智能行業(yè)還在為「大腦」和「身體」誰先誰后爭論不休時(shí),魔法原子選擇了一條更樸素也更難走的路徑——
兩手都要抓,兩手都要硬。
這家從江蘇走出來的公司,正在硅谷用一場發(fā)布會向全球宣告:中國具身智能的全棧時(shí)代,已經(jīng)到來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.