“自動駕駛是具身智能的上半場,通用人形機(jī)器人是具身智能的下半場。”近日,理想汽車董事長兼CEO李想針對具身智能提出了清晰的階段性判斷。在他的論述中,具身智能并非一個遙遠(yuǎn)的概念,而是一場已經(jīng)進(jìn)入“上半場”深水區(qū)的產(chǎn)業(yè)變革——自動駕駛汽車和通用人形機(jī)器人,是這場變革中的主體,兩者之間不是并列關(guān)系,而是遞進(jìn)關(guān)系。上半場在自動駕駛領(lǐng)域積累的感知、決策和控制等核心技術(shù),將直接成為下半場的技術(shù)底座。
![]()
![]()
國務(wù)院發(fā)展研究中心發(fā)布的《中國發(fā)展報告2025》顯示,中國具身智能產(chǎn)業(yè)市場規(guī)模有望在2030年達(dá)到4000億元、在2035年突破萬億元。
從頂層設(shè)計到產(chǎn)業(yè)共識,一個問題正變得愈發(fā)迫切:具身智能如何從概念走向規(guī)模化落地?演進(jìn)路徑是什么?
“具身”不等于“人形”,一場關(guān)乎產(chǎn)業(yè)方向的認(rèn)知校準(zhǔn)
當(dāng)前,公眾對具身智能的理解存在一個普遍誤區(qū)——將其等同于人形機(jī)器人。這一窄化認(rèn)知,正在被逐步校準(zhǔn)。工信部裝備工業(yè)發(fā)展中心曾刊發(fā)文章指出,具身智能是指智能體(如機(jī)器人、無人機(jī)、智能汽車等)通過物理實體與環(huán)境實時交互,實現(xiàn)感知、認(rèn)知、決策和行動一體化。
李想對具身智能給出了更具象的描述:“物理世界里所有的機(jī)器,給了它傳感器、模型和芯片,也就是眼睛、大腦和心臟,讓它能夠自主工作,這就是具身智能。”按照這一定義,一輛能夠自主駕駛、理解乘客需求并主動提供服務(wù)的汽車,同樣是具身智能——它有“眼睛”感知周圍環(huán)境,有“大腦”做出決策判斷,有“心臟”提供算力支撐,有“手腳”執(zhí)行轉(zhuǎn)向和制動。從產(chǎn)業(yè)規(guī)模和技術(shù)成熟度來看,汽車恰恰是具身智能當(dāng)前更大、更成熟的商業(yè)化載體。
![]()
產(chǎn)業(yè)界對此形成高度共識:具身智能的規(guī)模化落地不會一蹴而就,而是遵循從成熟場景向復(fù)雜場景遞進(jìn)的路徑。在這一共識基礎(chǔ)上,李想提出的“上下半場”框架擁有了更清晰的產(chǎn)業(yè)邏輯:自動駕駛作為“上半場 ”,是具身智能在成熟商業(yè)場景中率先驗證核心技術(shù)的過程;而通用人形機(jī)器人作為“下半場”,則需要上半場積累的核心能力的遷移和迭代。
上半場攻堅:全棧突破的產(chǎn)業(yè)挑戰(zhàn)
李想將具身智能上半場——自動駕駛的演進(jìn)劃分為三個階段:第一階段(2018-2023年)是L2級組合駕駛輔助,車輛在特定場景下輔助駕駛員操作;第二階段(2023-2028年)是L3級有條件自動駕駛,車輛在更多場景下接管駕駛?cè)蝿?wù);第三階段(2028-2033年)是L4級高度自動駕駛,車輛能夠在絕大多數(shù)場景下實現(xiàn)完全自主駕駛。當(dāng)前,中國汽車產(chǎn)業(yè)正處于邁入第二階段的關(guān)鍵跨越期。
這一跨越面臨的核心挑戰(zhàn),恰恰也是整個具身智能產(chǎn)業(yè)的共性難題。換言之,無論是自動駕駛汽車還是通用人形機(jī)器人,具身智能的規(guī)模化落地都指向同一個底層命題:實現(xiàn)感知、模型、芯片、操作系統(tǒng)、執(zhí)行機(jī)構(gòu)五大核心技術(shù)層面的全棧突破與高效協(xié)同,才能打造真正可靠的具身智能產(chǎn)品。理想汽車是少數(shù)選擇全棧自研五大核心技術(shù)的中國企業(yè)之一,2021年,理想汽車自研感知系統(tǒng)量產(chǎn)上車;2022年,芯片、操作系統(tǒng)、底盤三大核心項目幾乎同時立項;2023年,大模型研發(fā)啟動。這些投入正在逐一結(jié)出成果:2024年自研操作系統(tǒng)星環(huán)OS量產(chǎn)落地,2025年VLA司機(jī)大模型交付上車,2026年自研馬赫M100芯片論文入選計算機(jī)體系結(jié)構(gòu)頂級學(xué)術(shù)會議ISCA 2026工業(yè)分區(qū)——這是該評選設(shè)立以來,全球首家入選的汽車企業(yè)。“理想汽車做AI,不是冒險。不做才是冒險。”李想說。
![]()
當(dāng)具身智能技術(shù)集合于一輛汽車
技術(shù)自研的價值,最終要通過產(chǎn)品接受市場的檢驗。
理想汽車旗下具身智能旗艦SUV——全新理想L9 Livis于2026年5月15日發(fā)布,這是行業(yè)首款將具身智能技術(shù)全棧落地的量產(chǎn)車型。感知層面,全新理想L9 Livis的視覺感知從2D ViT感知模型進(jìn)化至3D ViT感知模型,能夠?qū)崿F(xiàn)對三維物理世界的深度理解,“真正像人一樣感知世界”。算力層面,搭載兩顆理想自研5納米馬赫M100芯片,有效算力達(dá)2560 TOPS,采用更適合AI計算的動態(tài)數(shù)據(jù)流架構(gòu),通過芯片與模型的聯(lián)合設(shè)計,突破了傳統(tǒng)芯片“算力足夠但架構(gòu)不匹配”的瓶頸。控制層面,全球首個“完全體”線控底盤涵蓋線控轉(zhuǎn)向、后輪轉(zhuǎn)向與線控機(jī)械制動,配合800V主動懸架,構(gòu)成了具身智能的“手腳”。這意味著全新理想L9 Livis從看懂世界、理解世界到做出反應(yīng)的全過程,速度能夠達(dá)到甚至超越人類駕駛員。
![]()
一輛車同時具備了看得懂世界的眼睛、能思考決策的大腦、提供強(qiáng)大計算能力的心臟、反應(yīng)超越人類的手腳,以及貫通全身的神經(jīng)系統(tǒng)。這正是具身智能從概念走向現(xiàn)實的一次完整驗證。
下半場啟幕:從自動駕駛到通用人形機(jī)器人
上半場奠基,下半場啟幕。李想將通用人形機(jī)器人的演進(jìn)劃分為三個階段:第一階段(2030-2035年)具備相當(dāng)于6歲兒童的泛化能力;第二階段(2035-2040年)達(dá)到12歲水平;第三階段(2040年至AGI實現(xiàn)前后)具備18歲成人水平。李想坦言:“這是一個15到20年的過程。” 通用人形機(jī)器人將于2030年前后進(jìn)入市場初期——這一時間節(jié)點(diǎn)相當(dāng)于2015年的電動汽車,是一個從0到1的歷史性窗口。
![]()
![]()
理想汽車已經(jīng)在為這一窗口做準(zhǔn)備,目前已立項兩款機(jī)器人產(chǎn)品:一款輪式機(jī)器人定位工廠與商業(yè)場景,另一款人形機(jī)器人專攻硬件控制精度與耐久性。2026年年初,理想完成了一場深刻的研發(fā)體系變革——從按軟硬件功能劃分,轉(zhuǎn)變?yōu)榘凑铡霸炀呱碇悄堋钡姆绞街貥?gòu),打通了傳統(tǒng)研發(fā)中軟硬件團(tuán)隊之間的壁壘。變革成效已經(jīng)初步顯現(xiàn):智能輔助駕駛模型訓(xùn)練迭代周期從兩周縮短至一天。
“雇一個司機(jī),家里有家政有保姆,過去這是極少數(shù)人的生活。我們要做的,是讓幾億人、幾十億人也能消費(fèi)得起。這是科技進(jìn)步帶來的最大好處。”李想的這句話,揭示了具身智能最深層的社會價值——不是替代多少人的工作崗位,而是讓多少人享受到更好、更便捷的生活服務(wù)。
從信息世界到物理世界,從自動駕駛到通用人形機(jī)器人,從上半場到下半場——中國企業(yè)正在以全棧自研的技術(shù)實力和長期主義的戰(zhàn)略定力,為全球具身智能產(chǎn)業(yè)發(fā)展貢獻(xiàn)中國方案。
具身智能的時代序幕,已經(jīng)拉開。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.