![]()
機(jī)器之心發(fā)布
剛剛,蔚藍(lán)科技發(fā)布了新款機(jī)器狗。
外表看起來(lái)像 "玩具",但性能堪比服務(wù)器。
它不翻跟頭,不跑障礙,過(guò)去五年行業(yè) "卷" 的炫技,它沒(méi)跟。
但它可能是消費(fèi)級(jí)具身智能第一次真正配得上 "智能" 兩個(gè)字的產(chǎn)品
![]()
早在 2023 年,這家公司就發(fā)布了全球首款家庭陪伴四足機(jī)器人 BabyAlpha,賣了 2.5 萬(wàn)多臺(tái)。
有人覺得酷,有人覺得雞肋。褒貶不一。
3 年后,他們把那些質(zhì)疑都用技術(shù)砸了回去。
這代產(chǎn)品干了一件非常底層的事 —— 給機(jī)器狗裝上一套超越人類的感知系統(tǒng),外加一套能撐起端側(cè)大模型的異構(gòu)算力架構(gòu),相較上一代算力提升 1000 倍,對(duì)標(biāo)英偉達(dá) 2,070 TFLOPS 算力的 Jetson AGX Thor T5000 芯片,但成本僅為英偉達(dá)的約 1/10
![]()
顛覆性創(chuàng)新之父 Clayton M. Christensen 曾說(shuō):"The next big thing will start out looking like a toy." (下一個(gè)顛覆時(shí)代的偉大事物,起初看上去都像一件玩具。)
今天,當(dāng)我們談?wù)摳兄c思考的突破時(shí),真正的指向并非一臺(tái)更具噱頭的機(jī)器狗,而是通用人工智能機(jī)器人的原點(diǎn) —— 人造勞動(dòng)力。
而這臺(tái)萬(wàn)元級(jí)機(jī)器狗的背后,或許藏著 “人造勞動(dòng)力” 從概念走向落地的關(guān)鍵一步。
國(guó)產(chǎn)算力方案如何撕開一道口子
先看行業(yè)現(xiàn)狀。
四足機(jī)器人常用的幾款芯片 ——RK3588、Orin NX、S100P—— 算力上限 6-128 TOPS(每秒萬(wàn)億次操作)。
單芯片要同時(shí)跑視覺感知、3D 建圖、運(yùn)動(dòng)控制、大模型交互、安全冗余,少說(shuō) 5-6 個(gè)任務(wù),根本分配不過(guò)來(lái)。
最直接的體現(xiàn)就是端側(cè)大模型。
行業(yè)產(chǎn)品跑個(gè) 15 億參數(shù)模型,TPS(每秒處理的 Token 數(shù))最高也就 20 幾;70 億參數(shù)的,大多數(shù)直接跑不動(dòng)。
參數(shù)稍微大一點(diǎn)就卡成 PPT,你跟它對(duì)話得等好幾秒才有反應(yīng),還談什么交互體驗(yàn)。可是參數(shù)要小的話,跑是跑得動(dòng)了,但智能表現(xiàn)宛如 "智障"。
BabyAlpha A3 是怎么破這個(gè)局的?
它沒(méi)有繼續(xù)沿用行業(yè)通用的單芯片方案,而是搞了一套自己的具身智能邊緣端混合異構(gòu)計(jì)算集群
![]()
簡(jiǎn)單說(shuō),就是6 顆芯片分布式協(xié)同:2 顆 5 納米 + 2 顆 8 納米 + 2 顆 3D 堆疊,一共 22 核 CPU。
核心邏輯:不同任務(wù)分配給最擅長(zhǎng)的芯片 ——5 納米跑大模型推理,8 納米處理感知數(shù)據(jù),3D 堆疊管運(yùn)動(dòng)控制。三者通過(guò)高速總線互聯(lián),任務(wù)切換延遲控制在毫秒級(jí)。
對(duì)比行業(yè)主流方案,不是同一個(gè)量級(jí)。
15 億參數(shù) TPS,從行業(yè)最高的 23 飆到 617,70 億參數(shù) TPS 能到 280,意味著端側(cè)大模型在消費(fèi)級(jí)產(chǎn)品上第一次真正可用
![]()
數(shù)據(jù)聲明
1: 以上參數(shù)均為各型號(hào)消費(fèi)級(jí)旗艦款規(guī)格參數(shù)。
2: 本表格數(shù)據(jù)來(lái)源于各品牌官方網(wǎng)站產(chǎn)品頁(yè)及技術(shù)文檔中心 (2026 年 5 月獲取)、第三方公開評(píng)測(cè)報(bào)告。如有誤差,請(qǐng)聯(lián)系更正。
3: 各產(chǎn)品持續(xù)迭代,配置以最新官方信息為準(zhǔn)。
關(guān)鍵的是:這套方案完全采用國(guó)產(chǎn)芯片設(shè)計(jì)與制造工藝,突破了美國(guó)高端芯片、先進(jìn)制程對(duì)國(guó)內(nèi)企業(yè)的封鎖。
對(duì)標(biāo)英偉達(dá) Jetson AGX Thor T5000(售價(jià)約 3000 美金),蔚藍(lán)用國(guó)產(chǎn)方案實(shí)現(xiàn)更高算力,成本僅 300 余美金。
而這條路線一旦跑通,帶來(lái)的不只是成本優(yōu)勢(shì)。
蔚藍(lán)自研算法模型架構(gòu) + 蔚藍(lán)自研算法模型架構(gòu) + 異構(gòu)計(jì)算架構(gòu),實(shí)現(xiàn)了對(duì)傳統(tǒng) GPU 路線的效率代際領(lǐng)先:更高算力下成本僅為英偉達(dá)的約 1/10,同等成本下算力大幅領(lǐng)先。
這個(gè)技術(shù)路徑的突破不止適用于機(jī)器人 ——它具備通用性,可以拓展到數(shù)據(jù)中心級(jí)大規(guī)模算力場(chǎng)景。
按照行業(yè) 12-18 個(gè)月算力成本下降一半的節(jié)奏,近 10 倍的成本效率優(yōu)勢(shì)意味著:把行業(yè) 3-4 年后的算力能力,提前拉到今天。
![]()
感知指標(biāo)超人類:比人更安全自主行動(dòng)的前提
算力突破是腦子,但光有腦子不夠。
機(jī)器人要在家庭場(chǎng)景里安全行動(dòng),感知能力必須超過(guò)人類
不是 "接近人類",是超過(guò)。
人靠常識(shí)兜底 —— 拖鞋是軟的、線纜不能踩、玻璃門要繞開,看不清也猜得到。
機(jī)器沒(méi)有常識(shí),感知不夠就真的看不見、聽不明,行動(dòng)如 “摸瞎”。
行業(yè)現(xiàn)在是什么水平?
視覺 100-300 萬(wàn)像素、HDR 不到 90db,逆光暗光就糊。空間靠 16 線激光雷達(dá),3-8 萬(wàn)點(diǎn) / 秒,相當(dāng)于馬賽克地圖導(dǎo)航。聽覺單麥或 4 麥,定位聲源基本做不到。
感知天花板太低,"看清" 都做不到,更別說(shuō) "看懂"。
BabyAlpha A3 是如何打破這一瓶頸的呢?
他們拿出了一套非常硬核的硬件配置:
![]()
數(shù)據(jù)聲明
1: 以上參數(shù)均為各型號(hào)消費(fèi)級(jí)旗艦款規(guī)格參數(shù)。
2: 本表格數(shù)據(jù)來(lái)源于各品牌官方網(wǎng)站產(chǎn)品頁(yè)及技術(shù)文檔中心 (2026 年 5 月獲取)、第三方公開評(píng)測(cè)報(bào)告。如有誤差,請(qǐng)聯(lián)系更正。
3: 各產(chǎn)品持續(xù)迭代,配置以最新官方信息為準(zhǔn)。
視覺:6600 萬(wàn)像素、HDR 140dB、480fps,多維度超過(guò)人眼
8K+4K+4K 三組高清攝像頭,360 度環(huán)視,總像素 6600 萬(wàn) —— 像素水平飆到行業(yè)平均水準(zhǔn)的 30 + 倍!
HDR 140dB,超過(guò)人眼 100-120dB 的動(dòng)態(tài)范圍,逆光窗邊、陰影交錯(cuò)處單幀內(nèi)同時(shí)捕捉高光和暗部細(xì)節(jié)。
幀率最高 480fps,遠(yuǎn)超人眼 60fps,這意味著 A3 能以極致慢鏡視野,清晰捕捉每一瞬的動(dòng)態(tài)細(xì)節(jié)。
人眼約 200 度視野,腦后和側(cè)面都是盲區(qū)。A3 能實(shí)現(xiàn) 360 度全覆蓋,不需要 "回頭" 就能感知身后環(huán)境。
![]()
空間感知:360° 環(huán)視面陣,從馬賽克地圖到厘米級(jí) 3D 地圖
5 組 3D TOF 和 3D 結(jié)構(gòu)光構(gòu)成 360° 環(huán)視面陣,點(diǎn)云密度 223.2 萬(wàn)點(diǎn) / 秒 —— 行業(yè)主流 3-8 萬(wàn),幾十倍差距。
8 萬(wàn)點(diǎn)看到模糊輪廓,223.2 萬(wàn)點(diǎn)能看清地板上的充電線、扁平的拖鞋、玻璃門半開的那條縫。
點(diǎn)云密度夠高,才能構(gòu)建厘米級(jí)精度的 3D 環(huán)境地圖 —— 這不是 "看到了",是 "看清了、測(cè)準(zhǔn)了、能導(dǎo)航了"。
自動(dòng)測(cè)距、實(shí)時(shí)標(biāo)注,自主導(dǎo)航的物理基礎(chǔ)全靠這個(gè)精度。
![]()
聽覺:12 麥立體陣列 —— 仿生貓頭鷹,360 度聲源精確定位
行業(yè)方案慣用 1-4 顆麥克風(fēng),只能判斷聲源大概方向。A3 用了 12 顆。
12 顆麥克風(fēng)按 3D Mesh 拓?fù)浞植荚陬^部,不是平面排列,而是立體覆蓋 —— 類似貓頭鷹雙耳左右不對(duì)稱的原理,通過(guò)空間 "錯(cuò)位" 產(chǎn)生時(shí)間差和音量差,同時(shí)解算聲源的方位角、俯仰角和距離,3D 空間中精確定位
定位之后是聚焦。波束成形在目標(biāo)方向形成極窄波束,只收目標(biāo)聲源,其他方向全部抑制 —— 電視聲、空調(diào)聲、旁邊人的聊天聲,不影響它聽你的。4~8kHz 兒童高頻段衰減更小,孩子的高音調(diào)呼喚也認(rèn)得準(zhǔn)。
配合超聲波雷達(dá)環(huán)形陣列,全球首次消費(fèi)級(jí)量產(chǎn)應(yīng)用
![]()
總之,感知系統(tǒng)的 “革命性” 創(chuàng)新,不是炫技,而是安全底線
機(jī)器沒(méi)有常識(shí)兜底,感知必須比人更強(qiáng),才可能在家庭里真正安全地自主行動(dòng)。
當(dāng)機(jī)器人的運(yùn)動(dòng)終于擺脫遙控和指令
行業(yè)過(guò)去五年卷的是運(yùn)動(dòng) —— 翻跟頭、跑障礙、后空翻,這些確實(shí)做到了。
但問(wèn)題從來(lái)不是 "跑不動(dòng)",而是 "不知道往哪跑"。
算力不夠,自主導(dǎo)航跑不了復(fù)雜算法;感知不夠,看不清環(huán)境細(xì)節(jié),遇到透明物體就懵、碰到細(xì)小障礙就繞不開。
結(jié)果就是:運(yùn)動(dòng)能力很強(qiáng),但只能用在遙控和簡(jiǎn)單場(chǎng)景下。用戶評(píng)價(jià) ——"不是不能用,是還不太好用"。
而從 "能跑" 到 "能用",差的不是運(yùn)動(dòng)參數(shù),是自主能力。
![]()
數(shù)據(jù)聲明
1: 以上參數(shù)均為各型號(hào)消費(fèi)級(jí)旗艦款規(guī)格參數(shù)。
2: 本表格數(shù)據(jù)來(lái)源于各品牌官方網(wǎng)站產(chǎn)品頁(yè)及技術(shù)文檔中心 (2026 年 5 月獲取)、第三方公開評(píng)測(cè)報(bào)告。如有誤差,請(qǐng)聯(lián)系更正。
3: 各產(chǎn)品持續(xù)迭代,配置以最新官方信息為準(zhǔn)。
A3 的運(yùn)動(dòng)能力 ——3.5 m/s 最高速度、45° 爬坡、28cm 越障,參數(shù)尚佳卻不咋稀奇,行業(yè)已經(jīng)卷了好幾年。
真正與眾不同的是:全天候全自主智能。
過(guò)去四足機(jī)器人的運(yùn)動(dòng)參數(shù)再漂亮,也得人操控。
A3 靠算力調(diào)度和感知精度,在家庭里自主判斷怎么過(guò)樓梯、過(guò)門檻、上斜坡。
![]()
行業(yè)里大多還停留在 “偽自主” 階段:
要么依賴 UWB 測(cè)距 + 用戶佩戴定位標(biāo)簽,一旦摘下標(biāo)簽,機(jī)器人就無(wú)法定位你;
要么是 “發(fā)指令→執(zhí)行” 的半自主模式,你不主動(dòng)操控,它就原地不動(dòng),和遙控玩具沒(méi)有本質(zhì)區(qū)別。
而 BabyAlpha A3,徹底告別了這些限制:
它不需要任何外部標(biāo)簽或基站,通過(guò) 360° 環(huán)視面陣,搭配超聲波近場(chǎng)避障,由端側(cè) Physical AI 算法獨(dú)立完成建圖、定位與路徑規(guī)劃 —— 真正實(shí)現(xiàn)“自己看、自己認(rèn)、自己走”,遇到障礙主動(dòng)躲避繞行。
跟隨體驗(yàn)也迎來(lái)了質(zhì)的飛躍:它不再被動(dòng)等待你的指令,而是主動(dòng)適配你的節(jié)奏 —— 你加快腳步它就提速,你轉(zhuǎn)彎它提前預(yù)判,始終跟在你身邊,隨需而動(dòng)。
這種 “真自主” 的背后,是行業(yè)首次在消費(fèi)級(jí)四足機(jī)器人上,打通感知、決策、運(yùn)動(dòng)三大子系統(tǒng)的全閉環(huán)。
安全不是加分項(xiàng),是準(zhǔn)入門檻
機(jī)器人進(jìn)家庭,用戶最關(guān)心的問(wèn)題永遠(yuǎn)只有一個(gè) ——安全嗎?
行業(yè)現(xiàn)有的安全思路,基本是做加法:加急停按鈕、加物理圍欄、加碰撞檢測(cè)。
本質(zhì)是能力不夠,用冗余來(lái)補(bǔ)。機(jī)器人看不清、想不明白,只能靠事后補(bǔ)救。
A3 的邏輯不同 —— 安全不是外掛的防護(hù)層,而是算力、感知、架構(gòu)一體化設(shè)計(jì)的自然結(jié)果。
不是一句 "我們承諾不泄露" 的空話,而是從架構(gòu)上讓你不需要信任任何人的承諾:
- 物理安全—— 形態(tài)上消除隱患。關(guān)節(jié)全隱藏,夾不到,撞不傷。獨(dú)立安全制動(dòng)系統(tǒng),故障時(shí)毫秒級(jí)響應(yīng)
- 系統(tǒng)安全—— 端云雙重守護(hù)。端側(cè) 360 安全大腦攔住攻擊,云端等保三級(jí) + 阿里云 + Azure 護(hù)航
- 數(shù)據(jù)和隱私安全—— 算力在本地,數(shù)據(jù)不外傳。每一步啟動(dòng)可驗(yàn)證,存著加密,傳著加密
![]()
七年前,蔚藍(lán)選擇發(fā)力家庭機(jī)器人賽道 ——不是 Demo,不是展廳款,而是面向普通家庭真實(shí)使用場(chǎng)景 —— 有老人、小孩、寵物的那種。
七年七代產(chǎn)品,目前已有超 1 萬(wàn)活躍家庭使用產(chǎn)品,累計(jì)運(yùn)行時(shí)長(zhǎng)超 1500 萬(wàn)小時(shí)。
所有安全設(shè)計(jì)均來(lái)自真實(shí)用戶反饋,突然竄出的貓、地上的拖鞋和線纜、蹣跚學(xué)步的小孩 —— 這些場(chǎng)景,實(shí)驗(yàn)室模擬不出來(lái)。
唯一的方法,是在真實(shí)家庭里一臺(tái)一臺(tái)跑,跑足夠長(zhǎng)的時(shí)間,積累足夠多的 corner case,然后用這些 case 反過(guò)來(lái)迭代安全設(shè)計(jì)。
為什么是這家公司
說(shuō)了這么多技術(shù)方案,一個(gè)自然的問(wèn)題:為什么是蔚藍(lán)科技先做到了?
行業(yè)或許不是不知道異構(gòu)架構(gòu)的潛力。
問(wèn)題在于,異構(gòu)計(jì)算集群沒(méi)法靠集成來(lái)做——6 顆芯片的分布式調(diào)度、不同制程之間的數(shù)據(jù)通路、算力任務(wù)在不同芯片間的實(shí)時(shí)分配,這些東西沒(méi)有現(xiàn)成方案可以買。
你得自己設(shè)計(jì)架構(gòu)、自己選芯片、自己寫調(diào)度、自己做底層集成。
任何一環(huán)外包,都調(diào)不通。這不是戰(zhàn)略選擇,是能力門檻。
這幫人干過(guò)類似的事。
創(chuàng)始人劉維超畢業(yè)于德國(guó)波恩大學(xué)人工智能機(jī)器人專業(yè),曾以隊(duì)長(zhǎng)身份拿下 RoboCup 人形機(jī)器人國(guó)際三連冠。其核心技術(shù)團(tuán)隊(duì)來(lái)自賓夕法尼亞 GRASP Lab、UIUC AI Lab、哈工大等頂尖機(jī)構(gòu)。
![]()
蔚藍(lán)科技創(chuàng)始人曾帶隊(duì)拿下 RoboCup 三連冠
蔚藍(lán)科技成立 7 年,機(jī)械、電子、執(zhí)行器、軟件、算法、智能體操作系統(tǒng) —— 關(guān)鍵領(lǐng)域全部自研。
2021 年,第 2 代工程機(jī) C200 打破美國(guó) MIT 四足機(jī)器人奔跑速度世界紀(jì)錄 —— 證明中國(guó)團(tuán)隊(duì)做得出頂尖運(yùn)動(dòng)控制
2022 年,國(guó)內(nèi)首個(gè)四足機(jī)器人量產(chǎn)工廠建成投產(chǎn),關(guān)鍵部件全部自主研發(fā)制造
2023 年,BabyAlpha 以手機(jī)價(jià)格帶上市 —— 全世界第一款真正進(jìn)入千家萬(wàn)戶的機(jī)器狗
2024 年,全國(guó)首家消費(fèi)級(jí)具身智能零售門店落地南京德基廣場(chǎng),產(chǎn)品完成規(guī)模化市場(chǎng)驗(yàn)證
2025 年,BabyAlpha 在家庭消費(fèi)市場(chǎng)始終保持銷量第一、使用時(shí)長(zhǎng)第一、用戶活躍度第一
![]()
初代 BabyAlpha 量產(chǎn)下線
這么多 "第一",蔚藍(lán)不是拿來(lái)炫耀。每一個(gè)第一,都是在回答同一個(gè)問(wèn)題:機(jī)器人怎么才能真正走進(jìn)家庭。
而 BabyAlpha A3,就是這些問(wèn)題走到今天給出的答案。
消費(fèi)級(jí)量產(chǎn),才是真正的 AI 煉金爐
蔚藍(lán)堅(jiān)定選擇從消費(fèi)級(jí)切入 —— 萬(wàn)元左右零售價(jià),不依賴 ToB/ToG 先跑規(guī)模。
這是最難的路。
ToB/ToG 訂單大、付款穩(wěn),但場(chǎng)景封閉、迭代慢。
消費(fèi)級(jí)意味著:技術(shù)必須便宜到普通人買得起、可靠到普通人敢放在家里、聰明到普通人愿意天天用。
行業(yè)很多公司還在 Demo 階段,蔚藍(lán)已經(jīng)賣出了 2.5 萬(wàn)多臺(tái)(其中家庭用戶占比 90%)。用戶累計(jì)使用時(shí)長(zhǎng)超9.5 億分鐘,累計(jì)交互次數(shù)超6,500 萬(wàn)次
這并不是簡(jiǎn)單的市場(chǎng)數(shù)據(jù),而是一個(gè)飛輪的起點(diǎn) ——
每賣出一臺(tái),真實(shí)場(chǎng)景數(shù)據(jù)就多一分,算法就迭代一步,產(chǎn)品就更聰明一程。
智能算法不是在實(shí)驗(yàn)室走廊里調(diào)的,是在真實(shí)家庭的拖鞋、線纜、玻璃門之間迭代出來(lái)的。
后發(fā)者要追趕的,不只是技術(shù),是上萬(wàn)臺(tái)設(shè)備先跑出來(lái)的真實(shí)世界經(jīng)驗(yàn)。
![]()
“The next big thing will start out looking like a toy”
三年前有人說(shuō) BabyAlpha 是玩具,三年后我們或許正在見證這句話的后半段。
感知、算力、自主能力,A3 把這三條線第一次在消費(fèi)級(jí)產(chǎn)品上擰成了一股繩。
不是實(shí)驗(yàn)室里的三個(gè) demo,是同一臺(tái)萬(wàn)元機(jī)器狗上的完整系統(tǒng)。
這意味著什么?
消費(fèi)級(jí)具身智能的臨界點(diǎn),不在實(shí)驗(yàn)室,在普通人的客廳。
不是 "看起來(lái)像智能" 的遙控玩具,不是 "參數(shù)很好看" 但跑不動(dòng)大模型的擺設(shè),是一個(gè)普通家庭買得起、放在家里真正有用、每天用會(huì)越來(lái)越懂你的智能伙伴。
![]()
Q3正式上市,到時(shí)候見真章。
關(guān)注官方渠道獲取更多新品資訊:
https://mp.weixin.qq.com/s/tVHOJiCf2Ot1qYVMP5sinA?scene=25#wechat_redirect
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.