<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AAAI 2026 Oral|LENS:基于統一強化推理的分割大模型

      0
      分享至



      文本提示圖像分割(Text-prompted image segmentation)是實現精細化視覺理解的關鍵技術,在人機交互、具身智能及機器人等前沿領域具有重大的戰略意義。這項技術使機器能夠根據自然語言指令,在復雜的視覺場景中定位并分割出任意目標。

      然而,當前主流的技術路徑,如基于監督式微調(Supervised Fine-Tuning, SFT)的方法,正面臨著根本性的瓶頸。這些方法本質上是靜態的模式匹配,雖然在特定數據集上表現優異,但其泛化能力往往受限,形成了一個難以逾越的 “能力天花板”。尤其是在處理需要多步、復雜推理的未知指令時,性能會顯著下降,其根源在于 SFT 方法在訓練中忽略了動態的、顯式的推理過程。

      為了 shatter 這一能力天花板,我們引入了 LENS(Learning to Segment Anything with Unified Reinforced Reasoning)框架。LENS 摒棄了靜態的 SFT,轉而采用端到端的強化學習(Reinforcement Learning, RL)機制,將高層次的 “思考” 過程(即思維鏈推理)與像素級的 “執行” 過程(即圖像分割)進行動態的聯合優化。通過這種設計,LENS 旨在賦予分割模型真正的、上下文感知的推理能力,從而在根本上提升其在復雜任務中的魯棒性和泛化性。

      本文將深入介紹一下我們 AAAI 榮獲 Oral 的工作,“會思考的分割大模型 LENS”。有幸在這次 AAAI 2026 得到了審稿人們一致正面的評價,并被 AC 和 PC 一致同意推薦為 Oral 論文。



      • 論文標題:LENS: Learning to Segment Anything with Unified Reinforced Reasoning
      • 論文鏈接:https://arxiv.org/abs/2508.14153
      • 代碼鏈接:https://github.com/hustvl/LENS

      LENS 框架概覽:推理與分割的協同進化

      在這個工作中,我們研究了分割大模型領域的一大一小兩個關鍵問題,大問題就是老生常談的 “泛化能力”,傳統分割大模型對未見過的提示和領域的泛化能力往往有限;小問題則是隱藏的 “信息瓶頸”,此前的分割大模型從 “大腦思考”(MLLM)到 “分割解碼”(SAM)之間往往只通過單一的分割 Token 傳遞信息,存在隱形的 “信息輸送瓶頸”。



      LENS 框架的核心設計在于通過端到端的聯合優化,徹底打破傳統模型中 “思考”(推理)與 “執行”(分割)之間的信息壁壘。

      以往的方法,例如同期的優秀工作 Seg-Zero,采用的是非端到端的設計,即先由推理模型生成邊界框和點提示,再交由現成的(off-the-shelf)SAM 進行分割。這種分離式流程的主要缺陷在于誤差的單向傳播。這意味著像 Seg-Zero 這樣的非端到端模型是根本上脆弱的;它們的性能上限被其初始猜測的準確性所鎖定。一旦推理階段的定位出現偏差,下游的分割模型將無法糾正,最終必然導致分割失敗。相比之下,LENS 通過其端到端的反饋閉環,具備了即便從不完美的初步定位中也能自我糾正的能力。



      LENS 的整體架構由三大核心組件構成,它們協同工作,實現了從高級語義理解到精確像素輸出的無縫銜接:

      • 多模態大語言模型 (MLLM) - 推理核心:作為系統的 “大腦”,LENS 采用先進的 MLLM(如 Qwen2.5-VL-3B-Instruct)來處理輸入的圖像和文本指令。它負責生成詳盡的思維鏈(Chain-of-Thought, CoT)推理過程,并給出一個初步的目標邊界框。這一過程不僅是定位,更是對指令的深度理解。





      • 上下文模塊 (Context Module) - 信息橋梁:這是 LENS 的關鍵創新,它充當了 MLLM 和分割模型之間的信息高速公路。該模塊由一組可學習的上下文查詢(Context Queries)和一個連接器(Connector)組成,其任務是將 MLLM 生成的豐富推理軌跡和定位信息,轉化為分割模型能夠高效利用的、信息密集的分割提示





      • 分割模型 (SAM-2) - 像素解碼器:作為系統的 “雙手”,LENS 采用高性能的分割模型(SAM2-Large)。它接收來自上下文模塊的復雜指令,并結合原始圖像信息,執行精準的像素級掩碼生成任務,將推理結果精確地體現在圖像上。

      通過這種 “推理 - 橋接 - 分割” 三位一體的緊密耦合架構,LENS 實現了推理質量和分割精度的同步提升。這種設計使得最終的分割性能可以直接反作用于推理過程的優化,形成一個完整的閉環,為實現更高水平的通用分割能力奠定了基礎。

      LENS 框架同時在 “思考推理” 端也做出了改進,我們基于 Group Relative Policy Optimization(GRPO)方法構建了統一強化學習獎勵機制(Unified Rewards Scheme)。該獎勵機制是多維度的,同時監督以下三個層級的線索:

      1. 格式獎勵(Format Reward):確保 MLLM 的輸出(包括推理過程和定位結果)遵循預期的結構和格式一致性。
      2. 邊界框 IoU 獎勵(Box IoU Reward):衡量預測邊界框與真實邊界框之間的定位準確性。
      3. 分割掩碼 IoU 獎勵(Segment IoU Reward):評估像素級分割掩碼的質量。



      通過我們提出的聯合優化(將統一的 GRPO 目標與監督分割損失相結合),LENS 能夠從獎勵驅動的推理改進和直接的分割監督中同時受益。值得一提的是,LENS 的端到端特性解決了定位錯誤(Grounding Error)向下游傳播的問題,如上圖右一右二所示,哪怕有些情況定位框是錯的,強大的上下文查詢(Context Query)也能帶領分割模型走向正確。

      性能評估與分析



      核心結果方面,LENS 取得了文本提示分割任務的最先進性能(SoTA):LENS 在 RefCOCO 系列的基準測試中取得了 81.2% 的平均 cIoU,達到了世界最高水平。在 GroundingSuite-Eval 這類更具挑戰性的零樣本基準測試中,LENS 展現出卓越的域外泛化能力,cIoU 達到 78.3%,超越第二優方法接近 10%。



      這些成果表明,LENS 這一類基于統一強化學習獎勵驅動的 CoT 推理方法,能夠顯著提升文本提示下的分割能力。我們相信,LENS 為強化學習與視覺分割的無縫集成提供了新的思路,并有望推動更通用、更穩健的視覺 - 語言系統的研究。代碼和預訓練權重已開源(https://github.com/hustvl/LENS),感興趣的朋友們歡迎研究和使用。我們也期待在 AAAI 2026 與學術界同行進行深入交流。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中央定調城市更新,20年老房2026年后或迎價值重估

      中央定調城市更新,20年老房2026年后或迎價值重估

      徐云流浪中國
      2026-05-06 00:52:15
      俄羅斯國防部:烏克蘭的“蜘蛛網”行動,俄羅斯損失高達20億盧布

      俄羅斯國防部:烏克蘭的“蜘蛛網”行動,俄羅斯損失高達20億盧布

      飛狼
      2026-05-06 01:18:14
      巴拿馬徹底傻眼了!搶完港口后,卻發現全世界都沒人敢接盤

      巴拿馬徹底傻眼了!搶完港口后,卻發現全世界都沒人敢接盤

      南宗歷史
      2026-05-03 01:35:25
      研究表明:性生活越頻繁,射精和勃起問題越少!

      研究表明:性生活越頻繁,射精和勃起問題越少!

      黯泉
      2026-04-05 20:40:12
      拼爹還是拼自己?父親是前外交部長,他哈佛畢業卻擠公交搬啤酒箱

      拼爹還是拼自己?父親是前外交部長,他哈佛畢業卻擠公交搬啤酒箱

      南宗歷史
      2026-05-05 17:00:11
      心內科主任:心臟病最危險信號,不是嘴唇發紫,是頻繁出現4異常

      心內科主任:心臟病最危險信號,不是嘴唇發紫,是頻繁出現4異常

      醫學科普匯
      2026-05-05 20:55:11
      日本走投無路,購買俄油救急!美國發現,中方已悄悄拿下全球第一

      日本走投無路,購買俄油救急!美國發現,中方已悄悄拿下全球第一

      原來仙女不講理
      2026-05-04 15:27:59
      這是迄今為止,我見過身材最美的女人之一,不接受反駁

      這是迄今為止,我見過身材最美的女人之一,不接受反駁

      小椰的奶奶
      2026-04-11 12:33:07
      澤連斯基反將一軍:無人機或參加勝利日閱兵!莫斯科可能會斷網

      澤連斯基反將一軍:無人機或參加勝利日閱兵!莫斯科可能會斷網

      鷹眼Defence
      2026-05-05 17:24:35
      四年戰爭帶給普京的副作用最終爆發。。。

      四年戰爭帶給普京的副作用最終爆發。。。

      西樓飲月
      2026-05-05 22:50:03
      亞洲杯太殘酷了:隨著比分定格0-1,中國男足爆冷不敵東南亞球隊

      亞洲杯太殘酷了:隨著比分定格0-1,中國男足爆冷不敵東南亞球隊

      側身凌空斬
      2026-05-06 02:37:50
      國民黨中將走長征到延安,偉人卻出乎意料地對他說:“你回去吧”

      國民黨中將走長征到延安,偉人卻出乎意料地對他說:“你回去吧”

      磊子講史
      2026-01-12 15:09:43
      即日起,未經同意不得發送這類短信!

      即日起,未經同意不得發送這類短信!

      豐川大地
      2026-05-05 22:38:21
      紅墻下的寒蟬:紹伊古成“政變嫌疑人”,普京的恐慌藏不住了

      紅墻下的寒蟬:紹伊古成“政變嫌疑人”,普京的恐慌藏不住了

      老馬拉車莫少裝
      2026-05-06 01:04:16
      A股“分紅王”出爐,總派息1105億元

      A股“分紅王”出爐,總派息1105億元

      新浪財經
      2026-05-05 20:42:15
      警告三次不如動真格一次!中國下達逐客令,巴拿馬反應出乎意料

      警告三次不如動真格一次!中國下達逐客令,巴拿馬反應出乎意料

      黑哥講現代史
      2026-05-04 23:15:22
      吳宜澤父親朋友圈曝光:連續10年記錄兒子奪冠歷程,曾賣掉房子陪孩子打球,決賽前為他整理衣冠,賽后向球迷連聲道謝

      吳宜澤父親朋友圈曝光:連續10年記錄兒子奪冠歷程,曾賣掉房子陪孩子打球,決賽前為他整理衣冠,賽后向球迷連聲道謝

      極目新聞
      2026-05-05 13:02:11
      我家樓下有個少婦,離婚有一年了,長得非常漂亮,我想把她追到手

      我家樓下有個少婦,離婚有一年了,長得非常漂亮,我想把她追到手

      那年秋天
      2026-05-05 18:00:07
      陳翔六點半惹離職潮猜疑!新增多位陌生演員,球球曬合照再起波瀾

      陳翔六點半惹離職潮猜疑!新增多位陌生演員,球球曬合照再起波瀾

      裕豐娛間說
      2026-05-05 18:06:53
      鄧文迪三母女閃耀紐約紅毯,高定禮服很東方美,倆女兒又瘦又優秀

      鄧文迪三母女閃耀紐約紅毯,高定禮服很東方美,倆女兒又瘦又優秀

      攬星河的筆記
      2026-05-05 16:55:54
      2026-05-06 03:20:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12919文章數 142642關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      教育
      本地
      家居
      公開課
      軍事航空

      教育要聞

      告別焦慮!南師附中官方:11位特長生上岸者首度分享:試題難在哪?如何準備?

      本地新聞

      用青花瓷的方式,打開西溪濕地

      家居要聞

      靈動實用 生活藝術場

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普威脅伊朗不要向美國船開火

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕久久久久久久系列| 男女裸交免费无遮挡全过程| 日本亚洲精品色婷婷在线影院| 亚洲AV无码久久精品成人| 亚洲欧美日韩国产综合专区| 少妇高潮惨叫在线播放| 亚洲人成在线精品| 久久精品久久免费懂色| 国内精品久久久久影院免费| 久久99精品国产麻豆婷婷洗澡| 国产免费丝袜调教视频| 精品av熟女一区二区偷窥海滩 | 少妇人妻在线视频| 亚洲精品456在线播放| 亚洲国产精品综合久久20| 黄色三级视频| 欧洲亚洲欧美国产日本高清| 体育| 性与欲视频免费播放的| 人妻av在线| 久久久精品人妻一区二区三区蜜桃| 337p日本大胆欧美裸体艺术| 国产高清精品软件丝瓜软件| 国产成人三级在线观看视频| 欧美日韩另类国产| 日本熟女Va视频| 一级欧美牲交大片免费观看| 青青青国产免费全部免费观看| 亚洲欧美乱综合图片区小说区| 免费人成视网站在线不卡| 人妻熟妇乱又伦精品视频app| 日韩精品中文字幕无码一区 | 国产精品免费看久久久青青| 国产精品美女久久久久av爽 | 亚洲日韩AV在线| 精品国产女同疯狂摩擦2| av美女网站| 久久综合激情网| 亚洲日本不卡一区二区三区| 精品一区二区av天堂| 午夜成人激情视频|