<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      CVPR 2026 | 1000萬段駕駛視頻,教會模型如何估計相機位姿

      0
      分享至



      不用百萬級 3D 標注,模型也能從普通駕駛視頻中學會「自己是怎么動的」。Wayve 的 LA-Pose 試圖把未標注視頻里的運動信號,轉化為自動駕駛系統(tǒng)所需的相機位姿估計能力。

      一輛車駛過一段路,它該如何知道自己剛才在三維空間中怎樣移動?

      對人來說,答案似乎很自然:看一段行車視頻,道路、車輛、路燈和建筑如何在畫面中移動,幾乎就能判斷相機是在直行、轉彎、減速,還是停下。但對自動駕駛系統(tǒng)來說,這是一項核心幾何感知能力。系統(tǒng)不僅要看見場景,還要知道相機在連續(xù)幀之間發(fā)生了怎樣的平移和旋轉。

      過去,訓練這類模型往往依賴高質量 3D 真值標注。為了得到這些標注,通常需要 LiDAR、精密標定、重建管線或仿真系統(tǒng)。數(shù)據(jù)越準,成本越高;成本越高,覆蓋的城市、天氣和道路類型就越有限。模型最后也容易繼承這些數(shù)據(jù)集本身的邊界。

      Wayve 的最新研究 LA-Pose 換了一個切入點:先不要求模型直接學習精確 3D 位姿,而是讓它從海量未標注駕駛視頻里理解「運動長什么樣」。這篇論文已被 CVPR 2026 接收,完整題目是 LA-Pose: Latent Action Pretraining Meets Pose Estimation。

      論文標題:LA-Pose: Latent Action Pretraining Meets Pose Estimation

      • 項目地址:https://la-pose.github.io/
      • 論文地址:https://arxiv.org/abs/2604.27448
      • Wayve 博客:https://wayve.ai/thinking/la-pose/
      • 作者:Zhengqing Wang, Saurabh Nair, Prajwal Chidananda, Pujith Kachana, Samuel Li, Matthew Brown, Yasutaka Furukawa
      • 機構:Wayve、Simon Fraser University
      • 會議:CVPR 2026

      一句話概括這篇論文

      LA-Pose 先從約 1000 萬段未標注駕駛視頻中自監(jiān)督學習「潛在動作」表示,再用少量 3D 標注訓練一個輕量級位姿預測頭,把視頻里的運動規(guī)律轉化為準確、高效、可泛化的相機位姿估計能力。

      為什么這件事難

      相機位姿估計要回答的是:相機從上一幀到下一幀,到底移動了多遠、轉了多少角度?這聽起來像一個幾何問題,但在真實道路上,情況遠比干凈數(shù)據(jù)集復雜。夜間、雨天、隧道、擁擠城市道路、山路和鄉(xiāng)村道路都會出現(xiàn),視覺外觀變化很大,傳統(tǒng)監(jiān)督訓練很難靠有限標注覆蓋所有情況。

      LA-Pose 的出發(fā)點是,真實駕駛視頻本身已經(jīng)包含了大量運動線索。車輛向前開、轉彎、減速、駛入隧道,畫面都會隨時間發(fā)生規(guī)律變化。問題不一定是「怎樣標更多 3D 數(shù)據(jù)」,也可以是「怎樣讓模型先從普通視頻里學會運動」。

      核心方法:先學運動,再學位姿



      圖:LA-Pose 的兩階段方法。

      LA-Pose 分成兩個階段。

      第一階段是 Latent Action Pretraining。研究團隊用約 1000 萬段未標注駕駛視頻片段進行自監(jiān)督預訓練,讓模型學習一種「潛在動作」表示。可以把它理解為相鄰畫面之間運動變化的緊湊編碼:車輛是否在左轉、右轉、直行、減速,畫面結構如何隨時間變化,這些信息不需要人工寫成標簽,而是天然藏在視頻序列里。

      具體來說,LA-Pose 訓練了一個逆向 - 正向動力學系統(tǒng)。模型看到連續(xù)視頻幀后,需要捕捉「當前畫面如何變化到下一幀」的規(guī)律。它不知道車輛的精確速度、航向角或 3D 位姿,也沒有被提供位姿標簽;它只是通過觀看大量駕駛視頻,逐漸學會哪些視覺變化對應哪些運動模式。

      第二階段再把這種運動表示用于位姿估計。研究者凍結預訓練得到的運動編碼器,只在其上接一個輕量級位姿預測頭,并用少量高質量 3D 標注微調。這個預測頭會把潛在動作轉換為相機位姿,包括相對平移、旋轉、視場角和尺度。整個推理過程仍然是前饋式的,因此更接近實際部署對效率的要求。

      沒有位姿標簽,也能長出運動結構



      圖:潛在動作空間中自然浮現(xiàn)的運動結構。

      這篇論文里最直觀的結果之一,是潛在動作空間自己長出了結構。

      當研究者把學到的潛在動作可視化到二維空間后,相似動作會自然聚在一起,不同區(qū)域對應直行、左轉、右轉、停止等駕駛行為。這說明模型并不只是記住畫面外觀,而是在沒有 3D 標注的情況下,學到了具有幾何意義的運動先驗。

      另一個有意思的發(fā)現(xiàn)是:表示并不是越大越好。LA-Pose 的實驗顯示,一個 50 維的潛在空間瓶頸,雖然不一定最擅長重建畫面細節(jié),卻比更高維的表示更適合后續(xù)位姿估計。壓縮迫使模型丟掉一部分外觀信息,留下更關鍵的運動結構。

      結果:更少標注,更高精度

      實驗結果顯示,LA-Pose 在 Waymo 和 PandaSet 等自動駕駛基準上,相比近期前饋式方法取得超過 10% 的位姿精度提升,同時所需標注數(shù)據(jù)少了多個數(shù)量級。

      更重要的是,在沒有參與訓練的 PandaSet 上,LA-Pose 依然超過基線方法,展示出較強的跨數(shù)據(jù)集泛化能力。對于自動駕駛來說,這一點很關鍵:系統(tǒng)不能只在熟悉數(shù)據(jù)集里表現(xiàn)穩(wěn)定,也要能面對新的城市、道路形態(tài)和天氣條件。

      意義:把未標注視頻變成幾何能力

      為了更直觀看到這種泛化能力,Wayve 還展示了 LA-Pose 與 VGGT 在不同真實道路場景中的對比:雨天高速出口與環(huán)島、德國鄉(xiāng)村窄路。 LA-Pose 的價值在于,它把「未標注視頻規(guī)模」轉化成了幾何視覺能力。車輛每天在真實世界中產(chǎn)生的視頻,本身就包含豐富的運動信息。只要模型能從中學到緊湊、可遷移的運動表示,再用少量標注把這種表示落到真實尺度上,就有可能改變幾何感知系統(tǒng)的訓練成本和擴展路徑。

      當然,LA-Pose 還不是終點。Wayve 在博客中提到,模型目前在倒車運動上仍會出現(xiàn)退化,一個原因是倒車在后訓練數(shù)據(jù)中相對少見。團隊認為,下一步需要繼續(xù)擴大預訓練和后訓練數(shù)據(jù),并把這種逆向動力學預訓練拓展到機器人采集視頻、手持視頻等更廣泛的動態(tài)視覺場景。

      但這篇工作的信號已經(jīng)很清楚:幾何視覺不一定只能從昂貴標注開始。運動本身就是監(jiān)督信號,而真實世界的視頻中到處都有運動。

      結語:運動本身就是信號

      如果 LA-Pose 的方向繼續(xù)成立,未來的自動駕駛系統(tǒng)也許可以更少依賴為每個城市、每類場景重新構建昂貴 3D 標注集,而是從不斷增長的真實駕駛視頻中學習更通用的幾何先驗。

      這也是「Latent Action Pretraining Meets Pose Estimation」這個題目的意義:潛在動作不再只是世界模型或策略網(wǎng)絡里的動作條件,它也可以成為連接視頻規(guī)模與 3D 幾何理解的一座橋。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      我定居泰國15年,娶過3個妻子,發(fā)現(xiàn)泰國的女人都有一個共同特點

      我定居泰國15年,娶過3個妻子,發(fā)現(xiàn)泰國的女人都有一個共同特點

      千秋文化
      2026-05-26 19:45:23
      四年一到必須走人,這才是中國最“狠”的鐵飯碗

      四年一到必須走人,這才是中國最“狠”的鐵飯碗

      復轉這些年
      2026-05-26 19:09:41
      多地接連關店、100萬打水漂!網(wǎng)紅地方小吃批量收割創(chuàng)業(yè)者

      多地接連關店、100萬打水漂!網(wǎng)紅地方小吃批量收割創(chuàng)業(yè)者

      財經(jīng)八卦
      2026-05-26 17:32:55
      中國被曝限制AI人才出境,阿里DeepSeek核心人員出國要先獲批

      中國被曝限制AI人才出境,阿里DeepSeek核心人員出國要先獲批

      桂系007
      2026-05-26 23:43:08
      網(wǎng)友將問界新車路測畫面發(fā)給國家反詐中心,被認定為AI生成

      網(wǎng)友將問界新車路測畫面發(fā)給國家反詐中心,被認定為AI生成

      西虹市閑話
      2026-05-26 16:43:17
      山東部分村干部盜采泰山石,稱年賺二十萬,泰山石有何特別之處?

      山東部分村干部盜采泰山石,稱年賺二十萬,泰山石有何特別之處?

      貴重物品愛美食
      2026-05-26 22:34:37
      張雪太給館長面子!拿出珍貴的冠軍香檳喝一半,館長雙手合十感謝

      張雪太給館長面子!拿出珍貴的冠軍香檳喝一半,館長雙手合十感謝

      火山詩話
      2026-05-27 06:23:41
      懷特塞德涉嫌興奮劑退賽?盧偉回應,名記透露內(nèi)情,這下有好戲了

      懷特塞德涉嫌興奮劑退賽?盧偉回應,名記透露內(nèi)情,這下有好戲了

      萌蘭聊個球
      2026-05-27 09:47:52
      方媛狀態(tài)不對勁!被懷疑產(chǎn)后抑郁,對外溝通困難像極了重度解離

      方媛狀態(tài)不對勁!被懷疑產(chǎn)后抑郁,對外溝通困難像極了重度解離

      萌神木木
      2026-05-26 13:59:49
      大連一商場樓頂部分垮塌,當?shù)胤Q無人受傷,正現(xiàn)場處置,商場影城全天暫停放映

      大連一商場樓頂部分垮塌,當?shù)胤Q無人受傷,正現(xiàn)場處置,商場影城全天暫停放映

      極目新聞
      2026-05-27 12:21:30
      央視緊急預警!將有大事發(fā)生?應急儲備別亂囤,這4類才是剛需

      央視緊急預警!將有大事發(fā)生?應急儲備別亂囤,這4類才是剛需

      黑翼天使
      2026-05-27 07:34:09
      真有bug?懷特塞德重新出現(xiàn)在CBA官網(wǎng)上海隊名單中

      真有bug?懷特塞德重新出現(xiàn)在CBA官網(wǎng)上海隊名單中

      懂球帝
      2026-05-27 09:50:27
      泳渡賽女選手隱私照被直播,當事人最新發(fā)聲:正處于哺乳期,很震驚

      泳渡賽女選手隱私照被直播,當事人最新發(fā)聲:正處于哺乳期,很震驚

      19樓
      2026-05-27 08:16:56
      王欣瑜法網(wǎng)2-0-2-1連勝晉級16強,沖擊150萬獎金

      王欣瑜法網(wǎng)2-0-2-1連勝晉級16強,沖擊150萬獎金

      吳蛛旅行ing
      2026-05-27 06:43:24
      最高領袖下場后,伊朗反擊打響,特朗普也沒想到,小哈梅會這么狠

      最高領袖下場后,伊朗反擊打響,特朗普也沒想到,小哈梅會這么狠

      健身狂人
      2026-05-27 05:49:46
      9塊9包郵的盡頭,可能是38倍抗生素

      9塊9包郵的盡頭,可能是38倍抗生素

      走讀新生
      2026-05-27 00:05:12
      德國華人連環(huán)迷奸案,“體面人”的惡劣性暴力

      德國華人連環(huán)迷奸案,“體面人”的惡劣性暴力

      中國新聞周刊
      2026-05-26 23:01:52
      盒馬“貴妃粉耳”翻車!粉木耳配上女性剪影,網(wǎng)友怒批:低俗擦邊

      盒馬“貴妃粉耳”翻車!粉木耳配上女性剪影,網(wǎng)友怒批:低俗擦邊

      烏娛子醬
      2026-05-26 16:31:28
      孫興慜:以為韓國比賽會在美國所以來了美職聯(lián);沒想到三場都在墨西哥

      孫興慜:以為韓國比賽會在美國所以來了美職聯(lián);沒想到三場都在墨西哥

      懂球帝
      2026-05-27 12:00:10
      在北京!武契奇談北約轟炸中國駐南聯(lián)盟使館

      在北京!武契奇談北約轟炸中國駐南聯(lián)盟使館

      看看新聞Knews
      2026-05-27 01:41:50
      2026-05-27 13:44:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      13091文章數(shù) 142653關注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數(shù) 華為換了一把尺子

      頭條要聞

      258畝薺菜地遭數(shù)百人哄搶造成損失約70萬 種植戶發(fā)聲

      頭條要聞

      258畝薺菜地遭數(shù)百人哄搶造成損失約70萬 種植戶發(fā)聲

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      小S曬歸寧宴舊照,大S穿吊帶裙扎丸子頭

      財經(jīng)要聞

      ST巖石退市背后:A股“炒殼”時代終結

      汽車要聞

      極狐問道V9今日將正式上市 搭載華為雪鸮增程系統(tǒng)

      態(tài)度原創(chuàng)

      本地
      教育
      數(shù)碼
      房產(chǎn)
      手機

      本地新聞

      用剪紙的方式,打開江蘇揚州

      教育要聞

      江西現(xiàn)代職業(yè)技術學院:值得填報嗎?熱門專業(yè)就業(yè)現(xiàn)狀及報考分析#搜索千校視頻計劃

      數(shù)碼要聞

      水月雨發(fā)布Armature Art 24二十四單元純動鐵入耳式耳機,6999元

      房產(chǎn)要聞

      終極塔尖資產(chǎn)!這可能是海南今年最出圈的豪宅!

      手機要聞

      非洲Q1排名:傳音持續(xù)稱王,小米第三,榮耀第四

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产真实自在自线免费精品| av亚洲一区| 天堂69亚洲精品中文字幕| 内射一区二区精品视频在线观看| 就去色综合| 久久国产精品一国产精品| 伊人久久av| 国产欧美精品aaaaaa片| 99免费精品视频| 亚洲一页| 亚洲大成色www永久网站注册| 国产鲁鲁视频在线观看| 少妇被弄到高潮喷水抽搐| 色偷偷亚洲女人天堂观看| 国产精品流白浆在线观看| 中文字幕人妻av蜜臀| 国产欧美在线一区二区三区| 国产手机在线小视频免费观看| 精品久久久久久久无码| 日韩视频a| 亚洲AV乱码一区二区三区按摩| 黑人玩弄漂亮少妇高潮大叫| 国产性夜夜春夜夜爽免费下载| 六月丁香婷婷色狠狠久久| 国产乱淫av免费| 人妻放荡乱h文| 国产精品厕所| 伊人久久综合精品无码AV专区 | 狠狠躁日日躁人人爽| 中文无码精品a∨在线观看| yy111111少妇无码理论片| 日本午夜在线视频| 国产 字幕 制服 中文 在线| 在线观看潮喷失禁大喷水无码| 一级毛片在线免费看| 亚洲综合精品香蕉久久网97| 久久综合精品国产一区二区三区无码 | 国产主播喷水| 天堂在线www天堂在线| 亚洲avav| 亚洲成AV人片一区二区|