自動駕駛和人形機器人,到底是什么關系?在主流的輿論場里,這似乎是兩條完全平行的科技賽道。但在砸下重金實干的企業家眼中,二者不僅同源,更是同一場殘酷淘汰賽的上下半場。
![]()
在羅永浩的播客對話中,理想汽車創始人李想拋出了一個極其冷酷的行業研判。那些還在純粹炒作人形機器人噱頭的初創公司,可能連真實商業化的門檻都摸不到。而真正決定下一代產業勝負的,是隱藏在鐵皮之下的底層算力架構與物理世界預訓練模型。
![]()
大眾對機器人的理解,往往停留在“雙足行走的人形鐵疙瘩”。但李想用《變形金剛》做了一個異常精準的類比:哪怕是汽車的形態,只要賦予了感知模型和計算芯片,它就是不折不扣的機器人。
汽車之所以沒有長成人的樣子,是因為在公路運輸這個特定場景下,四個輪子的效率遠遠高于雙足行走。
回到制造業的真實場景,目前資本熱捧的“人形機器人做咖啡”、“人形機器人擰螺絲”,在真正的制造業管理者看來,完全偏離了痛點。現代化的工廠早就實現了高精度的自動化生產,根本不需要復雜的軟臂機器人去干這種微米級精度的活。
![]()
真實的需求缺口在哪里?在于極其枯燥的“上下料”與“搬運”。
以一座萬人規模的汽車工廠為例,流水線上真正執行生產的是精密機器,但卻需要足足三千多名工人,專門負責把零配件搬運并放到AGV小車上。即便是在高端商業寫字樓里的幾百臺全自動咖啡機,日常維護依然需要專人一包一包地去補充咖啡豆和牛奶。
這才是機器人商業化落地的第一站。那些裝配著機械臂的輪式底盤機器人,只要能解決物流搬運的泛化能力,其市場需求量每年都是數以萬計的,這也將是機器人賽道最先跑通商業閉環的領域。
![]()
如果說工廠里的搬運機器人只是前菜,那么汽車行業的自動駕駛,才是具身智能最核心的上半場。李想將這場技術演進劃分為了三個壁壘森嚴的階段。
第一階段,是2017年到2022年左右的輔助駕駛。這一時期的技術底層基于CNN二維視覺和規則算法,配合幾十TOPS的算力來執行控制。如今,這已經成為中國一個幾千億規模的基礎產業,不具備該功能的車型基本已被市場邊緣化。
第二階段,是從2023年開啟,并在接下來的五年內走向L3級自動駕駛。技術棧在這一刻發生了質變。車輛的感知系統從傳統的二維視覺升級為基于Transformer架構的二維視覺大模型(2DViT)。控制系統也從原本的規則代碼,轉向了視覺到軌跡的端到端直接控制。只要芯片算力達到2000TOPS左右,模型參數量來到4B到7B的規模,就能實現穩定的L3級自動駕駛。
真正決定生死的,是預計在2028年到2029年到來的第三階段——L4級完全無人駕駛。在這個階段,汽車徹底剝離了人類駕駛員,變成了純粹的自動化機器人。
![]()
L4級對底層技術提出了極其苛刻的要求。
感知層面,必須跨越到三維視覺(3DViT),像人類一樣理解立體的物理世界。決策層面,簡單的“模仿學習”將徹底失效,取而代之的是真正具備邏輯理解能力的“物理世界預訓練模型”。而在執行層面,機器的反應速度必須絕對碾壓人類。
普通人從看到障礙物到踩下剎車,反應時間通常在350到400毫秒之間。而通過全線控底盤和電子制動,機器能夠將這一響應時間壓縮到驚人的200多毫秒甚至更低。其中電子制動更是將原本機械制動的六七十毫秒大幅縮短至13毫秒。在線控制動技術的加持下,即便是在一側冰面一側柏油的極端路況下,系統也能通過四個輪子的獨立制動保持車身絕對平穩。
為了支撐這種毫秒級的物理響應和龐大的三維數據處理,L4級無人駕駛的單車算力需求將暴漲至接近10000TOPS。這絕不是簡單地往主板上堆疊芯片就能解決的,過度堆疊帶來的數據傳輸帶寬受限,將成為致命的硬件瓶頸。
![]()
面對未來萬級TOPS的算力黑洞,傳統的計算架構已經觸碰到了效率天花板。
這也正是頭部智能車企不惜重金下場自研芯片的根本原因。理想在旗艦SUVL9Levis上,搭載了自研的馬赫M100芯片。這并非是對傳統GPU架構的平庸模仿,而是采用了全球首個動態數據流架構。
![]()
在極其吃算力的AI推理中,最耗費資源的過程并非計算本身,而是龐大數據在內存和處理器之間的反復搬運。動態數據流架構在端側推理時,其數據流轉效率遠超傳統GPU。兩顆馬赫M100芯片疊加,為單車提供了高達2560TOPS的實際算力,不僅支撐了現有的智能駕駛和擁有1600公里續航能力的5C增程系統優化,更為后續向完全無人駕駛演進留出了戰略級的算力冗余。
![]()
在車內座艙,過去的智能交互僅僅是簡單接入大語言模型,常常因為執行緩慢而導致極差的體驗。真正的AI重構,需要將用戶的需求進行極其精確的物理拆解。
當自動駕駛在2028年左右決出勝負,具身智能的下半場——通用人形機器人,才會真正起步。
業內研判,2030年的人形機器人產業成熟度,大概只相當于2015年的智能電動車,僅僅完成了從0到1的技術驗證期。其演進路線將嚴格遵循人類的心智發育:首先具備相當于6歲孩童的基礎物理泛化能力,隨后進階至12歲水平,最終在未來15到20年間達到無限逼近于通用人工智能(AGI)的18歲成人狀態。
![]()
耗費數百億資金,在極其難啃的硬科技泥潭里鏖戰,資本與實業家的最終訴求極其清晰。
在過去的社會結構中,只有處于財富金字塔尖的頂層階級,才能長期雇傭專職司機接送,并供養家政團隊料理起居。而具身智能技術演進的終局,就是將這種極其昂貴、壟斷性的階層服務進行物理降維。
讓龐大基數的普通人,只需支付幾萬元或幾十萬元的硬件成本,就能終身擁有一套不知疲倦的機器司機與家庭助理。讓先進的算力代替血肉之軀去承受勞役,這才是科技狂奔的終極坐標。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.