<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      引入幾何約束后,VLM跨越了「空間推理」的認知鴻溝

      0
      分享至



      現有的視覺大模型普遍存在「語義-幾何鴻溝」(Semantic-to-Geometric Gap),不僅分不清東南西北,更難以處理精確的空間量化任務。例如問「你坐在沙發上時,餐桌在你的哪一側?」,VLM 常常答錯。

      這種「語義?幾何鴻溝」源自于視覺大模型的語義空間無法承載高保真的幾何細節,導致其在空間推理時是在「憑空瞎猜」,這使得模型讀懂了畫面的語義,卻停留在「語言的世界」中,不具備現實世界賴以運行的幾何直覺,導致空間判斷漏洞百出。



      • 論文標題:Geometrically-Constrained Agent for Spatial Reasoning
      • 論文鏈接:https://arxiv.org/pdf/2511.22659
      • 作者團隊:Zeren Chen, Xiaoya Lu, Zhijie Zheng, Pengrui Li, Lehan He, Yijin Zhou, Jing Shao, Bohan Zhuang, Lu Sheng
      • 通訊單位:北京航空航天大學,上海人工智能實驗室
      • 項目主頁:https://gca-spatial-reasoning.github.io
      • 項目代碼:https://github.com/gca-spatial-reasoning/gca

      針對這一痛點,北京航空航天大學上海人工智能實驗室的研究團隊創新提出了幾何約束智能體(Geometrically-Constrained Agent, GCA),開創了「先形式化約束,后確定性計算」的空間推理新范式。GCA 不依賴海量數據微調,而是通過構建形式化任務約束,強制 VLM 從「模糊直覺」轉向「精確求解」,通過視覺工具調用和編寫計算代碼進行參數化計算,為空間推理搭建了一座可驗證、確定性的幾何橋梁。

      GCA 直接帶領 Qwen、Gemini 等基座模型實現「能力躍遷」。在公認高難度的 MMSI-Bench 測試中,GCA 將模型性能提升近 50%,擊敗現有 Training-based 及 Tool-integrated 方法,并在多個主流空間推理測試中確立了空間推理領域的新 SOTA。



      核心挑戰:跨越「語義 - 幾何」的認知鴻溝

      視覺語言模型(VLM)在圖像描述與通用語義理解上表現卓越,然而,當任務轉向需要高精度幾何計算的空間推理時 —— 例如判斷物體的精確朝向、測量距離或進行視角變換 —— 其表現卻顯著下滑。

      研究團隊指出,這種能力斷層的根源在于「語義 - 幾何鴻溝」。具體表現為:

      • 視覺 & 幾何信息的有損壓縮:VLM 將豐富的像素信息壓縮為抽象的語義特征,這一過程如同將一幅詳細地圖簡化為幾個地標名稱,導致物體精確位置、朝向、尺度等高保真幾何細節大量丟失。
      • 幾何想象的缺失:以「坐在沙發上」這一場景為例,VLM 僅能調用模糊的空間常識(知道人與沙發通常同向),卻無法在腦海中精確構建出「從沙發視角看去」的三維場景。這種幾何想象力的匱乏,使其在面對復雜空間推理時力不從心。

      ? 核心方法:基于形式化約束的兩階段推理





      1. 任務形式化 —— 從「模糊指令」到「精確規則」

      VLM 首先扮演「語義分析師」的角色,利用其強大的語義理解能力,將模糊的自然語言指令轉化為明確的數學約束。這一步驟不涉及具體計算,而是確立規則:



      • 基于物體的參考系 (Object-based Frame):利用物體自身的坐標系。例如指令「當你在洗手時...」隱含了觀察者必須「面對洗手池」,因此參考系由洗手池的朝向決定。
      • 基于相機的參考系 (Camera-based Frame):即標準的視圖坐標系。例如「從圖 1 的視角來看...」,此時參考系直接綁定為相機的基于方向的參考系 (Direction-based Frame):由兩個物體的位置關系定義。例如「烤箱在水槽的北面」,此時「北」的方向由從水槽指向烤箱的向量嚴格定義。





      2. 幾何計算 —— 在規則內進行「確定性求解」



      • 智能工具調度與綁定:VLM 像指揮官一樣,調度 3D 重建等感知工具獲取數據,并能智能地將「最左邊的椅子」等模糊描述,精準綁定到具體的幾何對象上,消除語義歧義。
      • 感知與計算的無縫銜接:感知工具負責將視覺世界參數化為高保真 3D 表示,計算工具則負責執行代碼、完成坐標轉換,二者在統一框架下協同,實現從「看到」到「算準」的閉環。
      • 檢索增強的可靠計算:采用類似 RAG 的策略,VLM 從一個已驗證的幾何公式庫中檢索正確模型來生成代碼,從根本上杜絕「幻覺」,確保每項計算都基于可靠的物理原理。

      實驗結果:全新的空間推理 SOTA

      在 MMSI-Bench、MindCube-tiny、OmniSpatial 等多個主流空間推理基準上,GCA 證明了其有效性,構建了一個全新的空間智能 SOTA。

      綜合性能提升

      GCA 取得了 65.1% 的平均準確率,顯著超越了現有基于訓練的方法與工具集成的方法。特別是在極具挑戰性的多圖空間推理基準 MMSI-Bench 中,面對復雜的視角變換與相對方位推斷,現有主流模型往往只能徘徊在 25%~30% 左右的「隨機猜測」水平線。

      而基于 Qwen3-VL-Thinking 構建的 GCA,準確率從 32.6% 躍升至 47.6%。這一數據證明,GCA 成功讓 VLM 擺脫了「蒙答案」的困境,向具備可靠的空間推理能力邁出了關鍵一步。

      強大的通用性

      GCA 并非特定模型的「專屬補丁」,而是一種無需訓練(Training-free)的通用推理范式,可直接賦能各類基座模型。

      實驗顯示,在搭載 GCA 架構后,受測模型在 MMSI-Bench 上的性能平均實現了約 37% 的相對提升。其中,基于 Gemini-2.5-Pro 構建的 GCA 表現尤為驚艷,其準確率從 36.9% 飛躍至 55.0%,有效地激發了頂級模型的空間推理潛力。





      通過系統的消融實驗與歸因分析,研究進一步證實了 GCA 架構的前瞻性:



      • 可解釋的錯誤歸因:得益于 GCA 架構的模塊化設計,研究團隊能夠對推理鏈路進行精確的錯誤歸因。分析顯示,VLM 在「任務形式化」階段的準確率已高達~70%,當前主要錯誤來源于下游感知工具(如 3D 重建失敗或遮擋)。這表明,GCA 的推理邏輯是穩健的,其性能將隨著感知模型的進步而持續提升。



      總結與意義

      GCA 提出了一種「語言定義約束,幾何執行計算」的新范式。通過將模糊的空間查詢轉化為帶約束的數學問題,GCA 有效避免了 VLM 在有損語義空間中進行不可靠的空間想象。這不僅大幅提升了推理的準確性,也讓機器向擁有「幾何直覺」邁出了關鍵一步,回應了攀登「空間智能」高峰的核心挑戰。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      講真,這是我本周見過的唯一滿分戶型,沒有之一

      講真,這是我本周見過的唯一滿分戶型,沒有之一

      首席樓盤分析師
      2026-05-06 19:17:27
      價格敲定!巴薩7500萬歐元可拿下英超全能前鋒,性價比拉滿

      價格敲定!巴薩7500萬歐元可拿下英超全能前鋒,性價比拉滿

      夜白侃球
      2026-05-08 09:02:06
      趙麗穎馮紹峰一同牽著兒子手去學校,疑似小腹隆起,被質疑懷二胎

      趙麗穎馮紹峰一同牽著兒子手去學校,疑似小腹隆起,被質疑懷二胎

      花哥扒娛樂
      2026-05-08 08:33:03
      斯諾克元老賽:衛冕冠軍0-4慘敗,10冠王1日2賽輸球,卡特開門紅

      斯諾克元老賽:衛冕冠軍0-4慘敗,10冠王1日2賽輸球,卡特開門紅

      劉姚堯的文字城堡
      2026-05-08 07:41:11
      公安部提醒警惕網絡水軍:好評如潮可能都是刷的!

      公安部提醒警惕網絡水軍:好評如潮可能都是刷的!

      中國能源網
      2026-05-07 10:39:04
      老照片還原格瓦拉被捕遇害全過程:身體被肢解,遇害47年后才曝光

      老照片還原格瓦拉被捕遇害全過程:身體被肢解,遇害47年后才曝光

      史之銘
      2026-05-05 17:49:57
      特斯拉4680電池實測翻車:續航縮水52公里

      特斯拉4680電池實測翻車:續航縮水52公里

      全棧遛狗員
      2026-05-08 01:07:01
      不管有錢沒錢,盡快扔掉家里的這7樣東西!不是瞎說,有科學依據

      不管有錢沒錢,盡快扔掉家里的這7樣東西!不是瞎說,有科學依據

      家居設計師宅哥
      2026-05-04 12:45:59
      納賽爾:恩里克第一年幾乎每晚都睡在訓練基地,研究球隊發展

      納賽爾:恩里克第一年幾乎每晚都睡在訓練基地,研究球隊發展

      懂球帝
      2026-05-07 23:44:38
      12 萬億遺產稅結清!三星豪門全員湊錢,只為保住下一代“王位”

      12 萬億遺產稅結清!三星豪門全員湊錢,只為保住下一代“王位”

      毒sir財經
      2026-05-07 21:38:07
      張雪新王炸!剛拿世界冠軍就要造五缸,不是瘋了是四缸路被國外專利堵死了

      張雪新王炸!剛拿世界冠軍就要造五缸,不是瘋了是四缸路被國外專利堵死了

      三農老歷
      2026-05-07 20:58:21
      血賺!大巴黎5000萬撿漏登貝萊,逆襲成歐冠+金球雙核心!

      血賺!大巴黎5000萬撿漏登貝萊,逆襲成歐冠+金球雙核心!

      田先生籃球
      2026-05-07 14:17:42
      記者:巴爾韋德的聲明很荒唐,整件事怎么聽都說不通

      記者:巴爾韋德的聲明很荒唐,整件事怎么聽都說不通

      懂球帝
      2026-05-08 08:05:08
      再戰前法網冠軍!鄭欽文羅馬站第3輪對手確定,交戰記錄3-0領先

      再戰前法網冠軍!鄭欽文羅馬站第3輪對手確定,交戰記錄3-0領先

      全景體育V
      2026-05-08 06:04:26
      沒想到,勇奪世界冠軍不到48小時,吳宜澤竟因一個舉動再口碑暴漲

      沒想到,勇奪世界冠軍不到48小時,吳宜澤竟因一個舉動再口碑暴漲

      白面書誏
      2026-05-07 15:06:59
      美媒曝KD與申京存裂痕!名嘴暗示將貨架 模擬一套三方涉及7人交易

      美媒曝KD與申京存裂痕!名嘴暗示將貨架 模擬一套三方涉及7人交易

      顏小白的籃球夢
      2026-05-08 09:35:35
      國際足聯急了!三次降價求央視轉播世界杯,6200 萬多一分免談

      國際足聯急了!三次降價求央視轉播世界杯,6200 萬多一分免談

      貍花小咪
      2026-05-08 01:33:06
      佛說:當你看懂這段文字,你的人生真的會越來越順

      佛說:當你看懂這段文字,你的人生真的會越來越順

      金沛的國學筆記
      2026-05-05 12:29:12
      爭議拉滿!庫里索要球隊股權!球迷:打工仔也敢跟老板要股份?

      爭議拉滿!庫里索要球隊股權!球迷:打工仔也敢跟老板要股份?

      聽我說球
      2026-05-08 09:22:00
      29項全球第一!比亞迪大唐預售訂單突破10萬臺

      29項全球第一!比亞迪大唐預售訂單突破10萬臺

      快科技
      2026-05-07 20:56:31
      2026-05-08 10:19:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12939文章數 142645關注度
      往期回顧 全部

      科技要聞

      追趕星艦:中國商業火箭離SpaceX有多遠?

      頭條要聞

      牛彈琴:一覺醒來美伊又打起來了 阿聯酋被指首次參戰

      頭條要聞

      牛彈琴:一覺醒來美伊又打起來了 阿聯酋被指首次參戰

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      Lisa主持!寧藝卓觀看脫衣秀風波升級

      財經要聞

      一覺醒來,美伊又打起來了

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發

      態度原創

      手機
      親子
      數碼
      公開課
      軍事航空

      手機要聞

      蘋果在英國被起訴,用戶可能獲賠70英鎊?

      親子要聞

      :自閉癥與性格安靜的區別,快來了解一下吧~

      數碼要聞

      被博主質疑套取國補資金!胖東來發長文否認:不存在 產品均明碼標價

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗:最高領袖穆杰塔巴全面掌控局勢

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 超碰人人插| 一本色道久久综合狠狠躁| 人妻在线日韩免费视频| 一区二区三区无码免费看| 亚洲欧洲美色一区二区三区| 日本免费人成视频在线观看| 免费av网站亚洲| 国产精品成人观看视频国产奇米 | 亚洲国产精选| 成人午夜亚洲影视在线观看| 夜夜躁狠狠躁日日躁2022| 1精品啪国产在线观看免费牛牛| 双腿张开被9个男人调教| 久草精彩视频| 亚洲一区二区日韩综合久久| 欧美丰满熟妇bbbbbb百度| 日韩成人A级毛片| 日本高清成本人视频一区| 制服丝袜有码中文字幕在线| 久久狠色噜噜狠狠狠狠97| 中文字幕丰满乱子伦无码专区| 国产婬妇无码无遮挡A片在线观看| 国产亚洲精品久久久久5区| 精品蜜桃av一区二区三区| 久久香蕉国产线看观看乱码| 无套内谢孕妇毛片免费看| 亚洲国产精品成人无码区| 国产精品久久久久不卡绿巨人| 亚洲色涩| 麻豆91蜜桃一区乱码| 一级内射片在线网站观看视频| 精品国产av无码一道| 国产在线不卡人成视频| 黄a无码片内射无码视频| 超碰人人摸| 人人妻人人狠人人爽天天综合网 | 在线麻豆精东9制片厂av影现网 | 开心婷婷五月激情综合社区 | 亚洲www啪成人一区二区| a级免费视频| 国产精品午夜福利导航导|