<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      為什么很多車企都青睞VLA模型?

      0
      分享至

      [首發(fā)于智駕最前沿微信公眾號(hào)]就在最近,小鵬發(fā)布了第二代視覺—語言—?jiǎng)幼鳎╒LA)模型。其實(shí)隨著自動(dòng)駕駛技術(shù)的發(fā)展,行業(yè)正處于從手工規(guī)則體系向物理世界大模型的深層跨越。早期的自動(dòng)駕駛方案高度依賴于模塊化的架構(gòu)設(shè)計(jì),將感知、預(yù)測(cè)與規(guī)劃拆分為獨(dú)立的環(huán)節(jié)。

      但隨著行駛場(chǎng)景復(fù)雜度的增加,模塊間信息流失和規(guī)則局限導(dǎo)致的瓶頸日益凸顯。其實(shí)不僅僅是小鵬,理想、吉利等車企也都將VLA模型用于量產(chǎn)車,為何那么多車企都依賴VLA模型?

      相較于模塊化,VLA有何優(yōu)勢(shì)?

      傳統(tǒng)的自動(dòng)駕駛架構(gòu)采用級(jí)聯(lián)設(shè)計(jì)。傳感器采集數(shù)據(jù)后,由感知模塊進(jìn)行目標(biāo)檢測(cè)與語義分割,輸出物體標(biāo)簽;隨后,預(yù)測(cè)模塊計(jì)算周圍參與者的可能軌跡;規(guī)劃模塊再根據(jù)預(yù)設(shè)的數(shù)學(xué)模型生成車輛的行駛路線。

      在這種模式下,任何前端感知的微小誤差都會(huì)在后續(xù)環(huán)節(jié)中被放大,且由于各模塊之間采用的是預(yù)定義的手工接口,系統(tǒng)很難捕捉到環(huán)境中微妙的非結(jié)構(gòu)化信息。



      模塊化架構(gòu)示意圖,圖片源自:網(wǎng)絡(luò)

      VLA模型的引入徹底改變了這一流程。視覺—語言—?jiǎng)幼髂P停╒ision-Language-Action,VLA)本質(zhì)上是一種端到端的智能系統(tǒng),它通過統(tǒng)一的神經(jīng)網(wǎng)絡(luò)將多模態(tài)感知與高層邏輯推理、底層動(dòng)作執(zhí)行融為一體。

      其核心價(jià)值是將原本相互獨(dú)立的感知模塊(看)、邏輯模塊(想)與執(zhí)行模塊(做)在同一個(gè)語義空間內(nèi)完成了對(duì)齊。與傳統(tǒng)的自動(dòng)駕駛系統(tǒng)相比,VLA不僅能夠識(shí)別環(huán)境中的像素點(diǎn)或幾何結(jié)構(gòu),更能理解這些信號(hào)背后的語義邏輯。

      VLA模型由視覺編碼器、大語言模型(LLM)骨干網(wǎng)絡(luò)以及動(dòng)作解碼器三個(gè)核心組件構(gòu)成。視覺編碼器將攝像頭采集的多視角圖像轉(zhuǎn)化為高維的特征向量,這些向量包含了環(huán)境的空間布局與物體特征;LLM骨干網(wǎng)絡(luò)則作為決策中心,利用預(yù)訓(xùn)練過程中積累的海量世界知識(shí)對(duì)視覺特征進(jìn)行邏輯加工;動(dòng)作解碼器則將這些抽象的推理結(jié)果轉(zhuǎn)化為如轉(zhuǎn)向角度、加減速數(shù)值等具體的物理動(dòng)作。



      VLA架構(gòu)示意圖,圖片源自:網(wǎng)絡(luò)

      這種一體化的映射方式使得系統(tǒng)能夠以一種更接近人類認(rèn)知的方式來處理駕駛?cè)蝿?wù)。在人類駕駛過程中,大腦并不會(huì)先在意識(shí)里標(biāo)出每一個(gè)行人的精確坐標(biāo)再進(jìn)行計(jì)算,而是基于對(duì)場(chǎng)景的整體理解(如“這個(gè)行人可能要過馬路”)直接產(chǎn)生避讓動(dòng)作。VLA模型通過共享的Transformer架構(gòu),對(duì)語言、視覺和動(dòng)作模態(tài)進(jìn)行協(xié)同編碼,構(gòu)建了統(tǒng)一的語義空間,實(shí)現(xiàn)了從感知理解到動(dòng)作決策的無縫銜接。

      語言轉(zhuǎn)譯重要嗎?

      看到諸多文章介紹小鵬第二代VLA模型時(shí),都提及其去掉了“語言轉(zhuǎn)譯”這一環(huán)節(jié),那語言轉(zhuǎn)譯到底有什么作用?對(duì)于自動(dòng)駕駛來說重要嗎?

      所謂語言轉(zhuǎn)譯,是指將視覺信號(hào)“翻譯”成自然語言描述(例如“前方路口有交警在指揮”),然后再根據(jù)這段文字描述推導(dǎo)出動(dòng)作指令。這種設(shè)計(jì)在早期是為了借用大語言模型的邏輯推理能力,但隨著技術(shù)向量產(chǎn)端推進(jìn),其弊端也愈發(fā)明顯。

      自然語言雖然適合表達(dá)抽象邏輯,但在描述極其復(fù)雜的三維物理世界時(shí),其精度可能不足。將高維的、連續(xù)的視覺流壓縮成離散的文字標(biāo)簽,不可避免地會(huì)丟失大量的空間細(xì)節(jié)和運(yùn)動(dòng)趨勢(shì)。

      此外,在VLA的訓(xùn)練中,研發(fā)人員需要為海量的視頻數(shù)據(jù)配上詳盡的人工旁白,告訴模型畫面中發(fā)生了什么,以及為什么要做這個(gè)動(dòng)作。這種“保姆式”的監(jiān)督學(xué)習(xí)不僅成本高昂,且標(biāo)注的速度遠(yuǎn)遠(yuǎn)無法滿足模型進(jìn)化的需求。



      圖片源自:網(wǎng)絡(luò)

      小鵬第二代VLA模型之所以拆掉語言這根“拐杖”,轉(zhuǎn)向了更極致的自監(jiān)督學(xué)習(xí)模式,是因?yàn)樵谶@種體系下,模型可以直接從原始視頻和真實(shí)的駕駛軌跡中學(xué)習(xí),只要有視頻輸入和對(duì)應(yīng)的物理動(dòng)作輸出,模型就能自主學(xué)習(xí)其中的因果關(guān)系,無需人工中間介入。

      去語言化還可以大幅提升系統(tǒng)的實(shí)時(shí)性。在自動(dòng)駕駛中,毫秒級(jí)的延遲決定了安全性。VLA模型因?yàn)榇嬖诙嗖酵评恚ㄒ曈X->語言->動(dòng)作),計(jì)算鏈路長,有時(shí)難以滿足毫秒級(jí)的響應(yīng)要求。若將視覺信號(hào)直接映射為動(dòng)作,則可以消除中間解碼和生成的耗時(shí)。

      為了實(shí)現(xiàn)這一目標(biāo),動(dòng)作的表征方式也將發(fā)生變化,將連續(xù)的軌跡預(yù)測(cè)轉(zhuǎn)化為離散的動(dòng)作Token,并整合進(jìn)大模型的詞表,是目前可行的路徑之一。通過這種方式,動(dòng)作生成就像語言預(yù)測(cè)下一個(gè)單詞一樣,能夠充分復(fù)用大模型已有的序列建模能力。

      這種從“語言理解”向“物理直覺”的轉(zhuǎn)變,實(shí)際上是自動(dòng)駕駛向更高級(jí)智能形式的演化。它可以讓模型變成一個(gè)擁有多年駕齡、通過肌肉記憶進(jìn)行決策的老司機(jī)。

      VLA的優(yōu)勢(shì)在哪里?

      自動(dòng)駕駛的技術(shù)發(fā)展,已經(jīng)讓自動(dòng)駕駛系統(tǒng)在高速路或城市路段有了較好的表現(xiàn),現(xiàn)在最難處理的其實(shí)是“長尾場(chǎng)景”。所謂長尾,是指那些在正常行駛中極少出現(xiàn)、難以通過窮舉規(guī)則覆蓋的極端情況,像是馬路上突然出現(xiàn)的異形掉落物、復(fù)雜的施工路障、交警不規(guī)范的手勢(shì)指揮等都屬于長尾場(chǎng)景。

      在傳統(tǒng)架構(gòu)中,遇到此類未見過的場(chǎng)景,感知模塊可能會(huì)報(bào)錯(cuò),或者規(guī)控模塊會(huì)因?yàn)闆]有匹配的規(guī)則而采取僵硬的緊急制動(dòng)。

      VLA模型的優(yōu)勢(shì)在于它將“理解”引入駕駛決策。基于大規(guī)模預(yù)訓(xùn)練的大模型擁有強(qiáng)大的知識(shí)庫和情景理解能力。舉個(gè)例子,即便模型沒有在訓(xùn)練集中見過某種特定形狀的施工圍欄,但它通過在互聯(lián)網(wǎng)海量數(shù)據(jù)中學(xué)習(xí)到的通識(shí)知識(shí),能夠理解“紅白相間的物體通常代表障礙物”或者“身穿反光背心的人通常是工作人員”。



      圖片源自:網(wǎng)絡(luò)

      這種基于知識(shí)的決策模式,使得VLA能夠處理復(fù)雜的交互邏輯。在潮汐車道或無圖小路等場(chǎng)景下,VLA可以分析周圍車輛的意圖和環(huán)境的細(xì)微變化,做出更擬人化的規(guī)劃。它不會(huì)僅是避讓障礙物,而是能夠理解“此時(shí)前車減速可能是為了禮讓行人”,從而提前做出預(yù)判,避免了傳統(tǒng)系統(tǒng)常見的頻繁急剎或頓挫感。

      VLA模型還具備“雙系統(tǒng)思維”的能力。它既能通過快速路徑實(shí)現(xiàn)類似于本能的駕駛反應(yīng)(快思考),也能在遇到極端復(fù)雜情況時(shí),調(diào)動(dòng)增強(qiáng)的推理邏輯進(jìn)行深度分析(慢思考)。這種靈活性確保了系統(tǒng)在保證效率的同時(shí),擁有處理高難度決策的上限。

      為了解決長尾數(shù)據(jù)的稀缺性,有些技術(shù)方案還引入了“世界模型”(World Models)。世界模型可以被看作是自動(dòng)駕駛系統(tǒng)的“模擬大腦”,它能夠預(yù)測(cè)動(dòng)作對(duì)未來的影響,并仿真出大量極端的、在現(xiàn)實(shí)中難以收集的危險(xiǎn)場(chǎng)景進(jìn)行自我訓(xùn)練。VLA與世界模型的結(jié)合,可以讓自動(dòng)駕駛從“在現(xiàn)實(shí)中試錯(cuò)”轉(zhuǎn)向“在想象中進(jìn)化”。

      這種能力的提升,意味著自動(dòng)駕駛系統(tǒng)正在從一個(gè)“稱職的司機(jī)”向“智慧的駕駛專家”轉(zhuǎn)變。VLA不僅解決了“怎么開”的問題,更在底層邏輯上解決了“為什么這么開”的理解問題。

      VLA落地的難點(diǎn)在哪里?

      大模型一般需要擁有數(shù)十億甚至數(shù)百億的參數(shù),要在車載嵌入式平臺(tái)上實(shí)現(xiàn)毫秒級(jí)的推理響應(yīng),需要非常多的工程優(yōu)化。

      混合專家架構(gòu)(MoE)可以將模型拆分為多個(gè)專業(yè)領(lǐng)域的小模塊,在每一時(shí)刻僅激活最相關(guān)的部分專家,可以在不犧牲模型容量的前提下,大幅降低推理時(shí)的計(jì)算量。理想就將32B的大模型蒸餾為3.2B的MoE架構(gòu),成功部署在Thor芯片上。



      圖片源自:網(wǎng)絡(luò)

      推理步數(shù)的壓縮也很關(guān)鍵,傳統(tǒng)的路徑生成需要多次迭代(如Diffusion模型),而通過引入流匹配(Flow Matching)等算法,可以將原本10步的推理過程壓縮至2步甚至1步,從而在10Hz的幀率下實(shí)現(xiàn)完整的交互響應(yīng)。此外,混合精度推理(如INT8/FP8/FP4)和底層算子魔改,也可以進(jìn)一步利用硬件的有效性能。

      雖然VLA模型作為“大腦”負(fù)責(zé)復(fù)雜的認(rèn)知決策,但行業(yè)普遍共識(shí)是需要保留一個(gè)經(jīng)過嚴(yán)格驗(yàn)證的傳統(tǒng)控制系統(tǒng)作為“安全基座”。這種混合架構(gòu)確保了即使大模型在某些罕見情況下出現(xiàn)幻覺或推理錯(cuò)誤,底層的安全網(wǎng)也能守住最后一道防線。

      最后的話

      VLA的普及標(biāo)志著自動(dòng)駕駛數(shù)據(jù)競(jìng)爭(zhēng)重心的轉(zhuǎn)移。以前,企業(yè)比拼的是人工標(biāo)注的數(shù)據(jù)量;而現(xiàn)在,競(jìng)爭(zhēng)的核心變成了算力儲(chǔ)備、世界模型的仿真效率以及對(duì)大規(guī)模無標(biāo)簽視頻數(shù)據(jù)的利用能力。

      VLA從邏輯理解到物理行動(dòng)的閉環(huán),不僅加速了端到端技術(shù)的成熟,也讓自動(dòng)駕駛系統(tǒng)距離真正的“擬人化”更近了一步。隨著算法、算力和數(shù)據(jù)三要素的持續(xù)提升,基于VLA架構(gòu)的物理人工智能將在更廣泛的移動(dòng)場(chǎng)景中展現(xiàn)其價(jià)值,重塑未來出行的安全與效率標(biāo)準(zhǔn)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      穆里尼奧狂喜!哈蘭德正式攤牌曼城:終身合同作廢,非皇馬不去

      穆里尼奧狂喜!哈蘭德正式攤牌曼城:終身合同作廢,非皇馬不去

      奶蓋熊本熊
      2026-05-22 01:01:17
      花生再次被關(guān)注!調(diào)查發(fā)現(xiàn):糖尿病常吃花生不過半年或有4好處

      花生再次被關(guān)注!調(diào)查發(fā)現(xiàn):糖尿病常吃花生不過半年或有4好處

      芹姐說生活
      2026-05-15 23:37:01
      中方壓根不認(rèn)!白宮貿(mào)易顧問:美國要賣給中國的不是牛排而是下水

      中方壓根不認(rèn)!白宮貿(mào)易顧問:美國要賣給中國的不是牛排而是下水

      王藁侃世界
      2026-05-22 23:57:25
      上海為何能逆轉(zhuǎn)?盧偉哽咽給出答案,楊鳴一針見血,許利民或下課

      上海為何能逆轉(zhuǎn)?盧偉哽咽給出答案,楊鳴一針見血,許利民或下課

      萌蘭聊個(gè)球
      2026-05-22 22:21:21
      公開認(rèn)罪后,人民日?qǐng)?bào)對(duì)許家印稱呼變了,11字之差釋放信號(hào)不一般

      公開認(rèn)罪后,人民日?qǐng)?bào)對(duì)許家印稱呼變了,11字之差釋放信號(hào)不一般

      歷史人文2
      2026-04-17 19:29:02
      主角大結(jié)局:易青娥成名,封瀟瀟失去,楚嘉禾紛爭(zhēng),胡三元續(xù)前緣

      主角大結(jié)局:易青娥成名,封瀟瀟失去,楚嘉禾紛爭(zhēng),胡三元續(xù)前緣

      生活新鮮市
      2026-05-23 01:30:11
      絕美御姐,顏值身材依舊出眾的女神—京香JULIA

      絕美御姐,顏值身材依舊出眾的女神—京香JULIA

      吃瓜黨二號(hào)頭目
      2026-05-21 07:15:28
      媽媽醫(yī)院生二胎,5歲兒子在家去世后續(xù):爸爸崩潰,譴責(zé)爺爺奶奶

      媽媽醫(yī)院生二胎,5歲兒子在家去世后續(xù):爸爸崩潰,譴責(zé)爺爺奶奶

      阿鳧愛吐槽
      2025-11-27 02:51:08
      央媒發(fā)文力挺,張嘉益再破天花板,和王海燕離婚傳聞早已真相大白

      央媒發(fā)文力挺,張嘉益再破天花板,和王海燕離婚傳聞早已真相大白

      手工制作阿殲
      2026-05-23 00:42:32
      這行情極端的,歷史罕見!

      這行情極端的,歷史罕見!

      新浪財(cái)經(jīng)
      2026-05-22 17:49:39
      一分鐘暴跌17%!黃金830閃崩,一場(chǎng)精心策劃的資本屠殺

      一分鐘暴跌17%!黃金830閃崩,一場(chǎng)精心策劃的資本屠殺

      小蜜情感說
      2026-05-22 15:57:47
      轉(zhuǎn)會(huì)杜塞多爾夫前,德國名宿銳評(píng)樊振東,只字不提球技卻一針見血

      轉(zhuǎn)會(huì)杜塞多爾夫前,德國名宿銳評(píng)樊振東,只字不提球技卻一針見血

      阿雹娛樂
      2026-05-23 02:15:02
      我的NAS吃灰三年,Docker讓它起死回生

      我的NAS吃灰三年,Docker讓它起死回生

      Ping值焦慮
      2026-05-17 02:00:53
      絕大部分工作不需要什么能力,你之所以找不到好工作,是你進(jìn)不去

      絕大部分工作不需要什么能力,你之所以找不到好工作,是你進(jìn)不去

      富書
      2026-05-22 08:50:16
      媒體人:四川若留狀元簽大概率選石奎 考慮其財(cái)務(wù)狀況可能會(huì)交易

      媒體人:四川若留狀元簽大概率選石奎 考慮其財(cái)務(wù)狀況可能會(huì)交易

      畫夕
      2026-05-22 18:58:35
      520官宣離婚,牛!

      520官宣離婚,牛!

      阿訊說天下
      2026-05-20 12:21:29
      國產(chǎn)顯卡LX 7G100實(shí)測(cè):性能追平GTX 1660,但定價(jià)讓人沉默

      國產(chǎn)顯卡LX 7G100實(shí)測(cè):性能追平GTX 1660,但定價(jià)讓人沉默

      霧野尋蹤2
      2026-05-22 00:40:58
      70歲知名演員米雪自曝患“過度活躍癥”:從不午休 精力旺盛

      70歲知名演員米雪自曝患“過度活躍癥”:從不午休 精力旺盛

      大象新聞
      2026-05-19 16:58:25
      79歲特朗普放話:2028年我還在,2032年也可能

      79歲特朗普放話:2028年我還在,2032年也可能

      淺遇時(shí)光
      2026-05-22 00:23:48
      女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來上班

      女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來上班

      梅子的小情緒
      2025-12-19 14:04:18
      2026-05-23 04:19:00
      智駕最前沿
      智駕最前沿
      自動(dòng)駕駛領(lǐng)域?qū)I(yè)的技術(shù)、資訊分享平臺(tái)。我們的slogan是:聚焦智能駕駛 ,緊盯行業(yè)前沿。
      455文章數(shù) 11關(guān)注度
      往期回顧 全部

      汽車要聞

      11萬級(jí)直接上四驅(qū) 銀河星耀7限時(shí)權(quán)益價(jià)9.88萬起

      頭條要聞

      伊朗前總統(tǒng)內(nèi)賈德被指是"最大內(nèi)鬼" 其目前下落不明

      頭條要聞

      伊朗前總統(tǒng)內(nèi)賈德被指是"最大內(nèi)鬼" 其目前下落不明

      體育要聞

      最糟糕裁判?他想要退役當(dāng)市長

      娛樂要聞

      周也戀情曝光!對(duì)象身份不簡(jiǎn)單

      財(cái)經(jīng)要聞

      富途擬被罰18.5億元 老虎 長橋也回應(yīng)了

      科技要聞

      雷軍:輸給特斯拉不丟人

      態(tài)度原創(chuàng)

      旅游
      數(shù)碼
      健康
      家居
      藝術(shù)

      旅游要聞

      楚雄雙柏愛尼山鄉(xiāng)觀鳥經(jīng)濟(jì)帶動(dòng)生態(tài)旅游開門紅

      數(shù)碼要聞

      OPPO Enco Air5s耳機(jī)規(guī)格公布,5月25日發(fā)布

      外泌體 ≠ 生長因子!它們之間究竟有何區(qū)別?

      家居要聞

      低調(diào)傳承 溫潤沉靜

      藝術(shù)要聞

      高315米、北京“彩虹之門”為什么15年未建?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 全免费又大粗又黄又爽少妇片| 久热香蕉av在线爽青青| 五月综合网亚洲乱妇久久| 99福利一区二区视频| 亚洲无码免费在线观看| 久久天天躁夜夜躁狠狠820175| 黑人videos特大hd粗暴| 97人人干| 人人妻人人澡人人爽欧美一区双| 国产蜜臀在线一区二区三区| 亚洲精品A| 欧美日韩在线第一页| 七台河市| 久久香蕉国产线看精品| 亚洲精品一品二品av| 蜜臀久久99精品久久久酒店新书| 成人裸男自慰gv网站| 女人国产香蕉久久精品| 99久久国语露脸国产精品| 日日噜噜噜夜夜爽爽狠狠视频| 国产午夜精品久久久久99| 久久精品噜噜噜成人| cosplay女黄网站| 日韩人妻熟女中文字幕a美景之屋| 黑人VideOS特大粗暴| 久久国产精品成人影院| 国产日韩一区二区三区免费高清 | 末成年娇小性色xxxxx| 精品国产亚洲一区二区三区在线观看| 久草热久草热线频97精品| 欧美性生交大片免费看| 无码精品一区二区免费AV| 免费A级毛片免费观看视频| 性夜夜春夜夜爽aa片a| 人妻系列中文字幕精品| 中文字幕在线天堂| 色吊丝av中文字幕| 国产亚洲aⅴ在线电影| 精品成人免费一区二区不卡| 亚洲综合无码无在线观看| 丰满少妇被猛烈进入无码|