<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      國(guó)產(chǎn)多模態(tài)Agent拿下醫(yī)學(xué)分割SOTA!不用改模型、不加token

      0
      分享至

      這個(gè)生物醫(yī)學(xué)視覺(jué)推理框架,被CVPR 2026接收了!



      人類(lèi)專(zhuān)家在標(biāo)注醫(yī)學(xué)圖像時(shí),從不是“看一眼就畫(huà)出來(lái)”。

      他們會(huì)先掃視全圖、鎖定可疑區(qū)域,隨后在分割工具上反復(fù)點(diǎn)擊正負(fù)樣本,根據(jù)每一步生成的mask形態(tài)重新判斷,不斷調(diào)整策略——

      這是一個(gè)多輪交互、邊看邊想、邊想邊做的迭代推理過(guò)程。

      然而,現(xiàn)有的醫(yī)學(xué)多模態(tài)大模型普遍采用“單次前向推理”范式:

      輸入圖像,輸出mask,一步到位。

      這種方式面對(duì)生物醫(yī)學(xué)圖像中細(xì)微的病灶邊界、復(fù)雜的解剖結(jié)構(gòu)、模糊的視覺(jué)語(yǔ)義時(shí)往往力不從心。

      更深層的問(wèn)題在于,為了賦予MLLM分割能力,現(xiàn)有方法普遍引入隱式分割token(如

      )并與外部pixel decoder聯(lián)合微調(diào)——

      這一設(shè)計(jì)破壞了大模型原有的文本輸出空間,導(dǎo)致語(yǔ)言推理能力退化,泛化能力大打折扣。

      上述范式存在四個(gè)核心瓶頸:

      • 單次推理無(wú)法自我糾錯(cuò):一旦第一步定位出現(xiàn)偏差,錯(cuò)誤持續(xù)累積,最終影響分割質(zhì)量。
      • 隱式token破壞推理能力
      • 等token侵占文本空間,導(dǎo)致災(zāi)難性遺忘,細(xì)粒度視覺(jué)推理被嚴(yán)重壓制。
      • 缺乏自主決策機(jī)制:模型只能被動(dòng)執(zhí)行單次指令,無(wú)法像人類(lèi)專(zhuān)家一樣主動(dòng)觀(guān)察、反思、調(diào)整。
      • 訓(xùn)練數(shù)據(jù)瓶頸:現(xiàn)有數(shù)據(jù)集只有最終mask,缺乏逐步交互的推理軌跡,難以直接監(jiān)督多步行為。

      鑒于上述問(wèn)題,浙江大學(xué)蔡鈺祥教授、上海人工智能實(shí)驗(yàn)室研究員江彥開(kāi)等人聯(lián)合提出了IBISAgent——

      一個(gè)將分割重新定義為多步視覺(jué)決策過(guò)程的Agentic MLLM框架。

      具體方法

      概括而言,IBISAgent的主要?jiǎng)?chuàng)新點(diǎn)如下:

      • 將分割任務(wù)建模為多步馬爾可夫決策過(guò)程(MDP) ,以交錯(cuò)的文本推理與點(diǎn)擊動(dòng)作替代隱式token,保留MLLM完整的語(yǔ)言推理能力,同時(shí)實(shí)現(xiàn)自主多輪迭代精化。
      • 提出兩階段訓(xùn)練框架。首先通過(guò)冷啟動(dòng)SFT在自動(dòng)生成的推理軌跡上建立像素級(jí)推理先驗(yàn);隨后引入Agentic強(qiáng)化學(xué)習(xí),以細(xì)粒度獎(jiǎng)勵(lì)信號(hào)驅(qū)動(dòng)模型自主探索更優(yōu)決策策略,超越對(duì)軌跡的簡(jiǎn)單模仿。
      • 構(gòu)建包含456K條高質(zhì)量推理軌跡的冷啟動(dòng)數(shù)據(jù)集,覆蓋正常標(biāo)注與自我反思糾錯(cuò)兩類(lèi)軌跡,為多步視覺(jué)推理提供系統(tǒng)化的訓(xùn)練基礎(chǔ)。

      具體方法為,IBISAgent將整個(gè)分割過(guò)程建模為一條多步推理軌跡,每一步由三個(gè)核心元素構(gòu)成閉環(huán):

      • 推理(Textual Thinking) :模型對(duì)當(dāng)前分割圖像的狀態(tài)進(jìn)行推理分析,如“當(dāng)前mask偏左,需要在右側(cè)腫瘤邊緣補(bǔ)充正向點(diǎn)擊”。
      • 行動(dòng)(Action) :模型輸出結(jié)構(gòu)化的空間點(diǎn)擊指令,包含三個(gè)要素:分割目標(biāo)類(lèi)別(Target)、點(diǎn)擊屬性(正/負(fù),Attribute)、歸一化圖像坐標(biāo)(Coordinate_2d)。模型可在一步中同時(shí)輸出多個(gè)點(diǎn)擊。
      • 觀(guān)測(cè)(Observation) :點(diǎn)擊被傳入交互式分割工具M(jìn)edSAM2,生成更新后的mask,并疊加到原圖上作為下一步的視覺(jué)輸入反饋給模型。

      這一設(shè)計(jì)的關(guān)鍵在于:

      模型每一步都能“看到”自己上一步分割的結(jié)果,形成視覺(jué)感知與語(yǔ)言推理的閉環(huán)。

      整個(gè)過(guò)程不引入任何新的模型組件或隱式token,分割能力完全從MLLM內(nèi)在的視覺(jué)推理中涌現(xiàn),并天然支持從頭分割與mask精化兩類(lèi)任務(wù)。



      與此同時(shí),IBISAgemt采用兩階段訓(xùn)練方案:

      第一階段:冷啟動(dòng)SFT

      現(xiàn)有生物醫(yī)學(xué)分割數(shù)據(jù)集只有最終mask,沒(méi)有逐步點(diǎn)擊軌跡。

      研究團(tuán)隊(duì)利用BiomedParseData(340萬(wàn)圖像-mask對(duì), 9種成像模態(tài))開(kāi)發(fā)了自動(dòng)軌跡生成算法:

      通過(guò)規(guī)則化的點(diǎn)擊模擬策略自動(dòng)推導(dǎo)點(diǎn)擊序列,再用Gemini- 2.5-Pro為每步生成對(duì)應(yīng)的自然語(yǔ)言推理。

      為增強(qiáng)魯棒性,額外合成兩類(lèi)自我反思軌跡:

      (1)錯(cuò)誤自糾正——檢測(cè)到錯(cuò)誤動(dòng)作后回溯并重新推理;

      (2)指令不一致糾正——遇到與初始mask不符的指令時(shí)主動(dòng)丟棄并重新分割。最終構(gòu)建出包含456K樣本的高質(zhì)量冷啟動(dòng)數(shù)據(jù)集。

      第二階段:Agentic強(qiáng)化學(xué)習(xí)

      SFT之后模型仍在模仿已有軌跡,研究團(tuán)隊(duì)進(jìn)一步引入RL,設(shè)計(jì)細(xì)粒度獎(jiǎng)勵(lì)框架在每個(gè)交互步驟提供密集反饋:



      其中區(qū)域點(diǎn)擊獎(jiǎng)勵(lì)與漸進(jìn)式分割改進(jìn)獎(jiǎng)勵(lì)是核心創(chuàng)新——

      前者引導(dǎo)模型將每次點(diǎn)擊落在語(yǔ)義有效的區(qū)域,后者強(qiáng)制每步行動(dòng)必須帶來(lái)實(shí)質(zhì)性的分割改善,從而徹底杜絕冗余操作與來(lái)回震蕩。

      RL訓(xùn)練使用GRPO算法,在888KVQA樣本上進(jìn)行優(yōu)化。



      實(shí)驗(yàn)結(jié)果

      實(shí)驗(yàn)結(jié)果顯示,IBISAgemt在域內(nèi)測(cè)試集、域外泛化集(MeCOVQA-G+,涵蓋5種成像模態(tài))和自建私有數(shù)據(jù)集(1K CT/MRI/病理, 7類(lèi)癌癥)三個(gè)benchmark上, 均大幅領(lǐng)先所有對(duì)比方法。

      相比醫(yī)學(xué)專(zhuān)用MLLM基線(xiàn),平均IoU提升35.13%, DSC提升37.58%, F1提升29.79%

      值得注意的是, Citrus-V和UniBiomed均在比本方法更大規(guī)模的數(shù)據(jù)集上訓(xùn)練, IBISAgent仍能一致超越,說(shuō)明性能提升來(lái)自方法設(shè)計(jì)本身,而非數(shù)據(jù)優(yōu)勢(shì)。



      與工具增強(qiáng)Agent的對(duì)比實(shí)驗(yàn)

      相比同樣調(diào)用MedSAM2的工具增強(qiáng)型Agent(GPT-4o 、LLaVA-Med 、HuatuoGPT-Vision等), IBISAgent在域外集和私有數(shù)據(jù)集上仍保持顯著領(lǐng)先,充分說(shuō)明多輪交互式推理帶來(lái)的增益遠(yuǎn)超簡(jiǎn)單的工具調(diào)用。



      兩階段訓(xùn)練消融實(shí)驗(yàn)

      消融實(shí)驗(yàn)證明,冷啟動(dòng)SFT、自我反思軌跡和RL三個(gè)方案缺一不可,逐級(jí)疊加均帶來(lái)明顯收益。

      RL階段提供最大的性能躍升,說(shuō)明強(qiáng)化學(xué)習(xí)的探索-利用機(jī)制對(duì)激發(fā)真正自主的像素級(jí)推理至關(guān)重要。



      細(xì)粒度獎(jiǎng)勵(lì)設(shè)計(jì)消融實(shí)驗(yàn)

      對(duì)于RL階段的獎(jiǎng)勵(lì)設(shè)計(jì),研究團(tuán)隊(duì)同樣進(jìn)行了逐項(xiàng)驗(yàn)證。

      以?xún)H使用格式獎(jiǎng)勵(lì)與答案獎(jiǎng)勵(lì)為基線(xiàn),在域外集MeCOVQA-G+上的IoU僅為73.77;

      逐步引入?yún)^(qū)域點(diǎn)擊獎(jiǎng)勵(lì)后, IoU提升至76.60, mask定位準(zhǔn)確性顯著改善;

      加入漸進(jìn)式分割改進(jìn)獎(jiǎng)勵(lì)后進(jìn)一步躍升至80.61,同時(shí)平均交互步數(shù)從11.29步壓縮至8.12步,模型學(xué)會(huì)了更高效的分割路徑;

      最終疊加軌跡長(zhǎng)度獎(jiǎng)勵(lì)后,交互效率繼續(xù)提升,步數(shù)降至4.26步,同時(shí)分割質(zhì)量維持在最高水平。

      這一結(jié)果表明,細(xì)粒度的逐步反饋信號(hào)是驅(qū)動(dòng)模型在質(zhì)量與效率之間取得最優(yōu)平衡的關(guān)鍵,單純依賴(lài)最終結(jié)果獎(jiǎng)勵(lì)無(wú)法達(dá)到同等效果。



      小結(jié)一下

      這項(xiàng)研究將生物醫(yī)學(xué)圖像分割從“單次推理輸出”推進(jìn)到“自主多輪交互決策”。

      針對(duì)現(xiàn)有方法依賴(lài)隱式token導(dǎo)致的推理能力退化問(wèn)題, IBISAgent以交錯(cuò)的文本推理與點(diǎn)擊動(dòng)作完全替代

      token,保留了MLLM完整的語(yǔ)言能力,并通過(guò)多步MDP建模實(shí)現(xiàn)真正的自主迭代精化。

      進(jìn)一步地,冷啟動(dòng)SFT結(jié)合自動(dòng)軌跡生成建立穩(wěn)健的推理先驗(yàn),Agentic強(qiáng)化學(xué)習(xí)與細(xì)粒度獎(jiǎng)勵(lì)驅(qū)動(dòng)模型超越模仿、探索最優(yōu)決策策略,最終實(shí)現(xiàn)了細(xì)粒度的視覺(jué)推理。

      廣泛的實(shí)驗(yàn)驗(yàn)證了IBISAgent在多模態(tài)、多疾病場(chǎng)景下的一致性?xún)?yōu)勢(shì),為未來(lái)面向真實(shí)臨床的智能醫(yī)學(xué)圖像分析系統(tǒng)奠定了重要基礎(chǔ)。

      論文鏈接:
      https://arxiv.org/abs/2601.03054
      代碼鏈接:
      https://github.com/Yankai96/IBISAgent

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      金士頓推出U盤(pán)“DTXG2”,59.9元起

      金士頓推出U盤(pán)“DTXG2”,59.9元起

      IT之家
      2026-05-01 15:17:07
      .離世前3天還發(fā)動(dòng)態(tài),4月27日慘烈車(chē)禍,帶走了新疆這位傳奇大佬

      .離世前3天還發(fā)動(dòng)態(tài),4月27日慘烈車(chē)禍,帶走了新疆這位傳奇大佬

      荷蘭豆愛(ài)健康
      2026-05-02 01:04:05
      別再吹天生美貌!朱珠真實(shí)原生臉曝光,整容前后差距一目了然

      別再吹天生美貌!朱珠真實(shí)原生臉曝光,整容前后差距一目了然

      小娛樂(lè)悠悠
      2026-04-27 09:21:13
      42歲王寶強(qiáng)為配女友拼了!整容轉(zhuǎn)型當(dāng)偶像,金絲框白襯衫撞臉汪小菲

      42歲王寶強(qiáng)為配女友拼了!整容轉(zhuǎn)型當(dāng)偶像,金絲框白襯衫撞臉汪小菲

      八卦王者
      2026-05-01 14:29:08
      粵超肇慶隊(duì)美女隊(duì)醫(yī)回應(yīng)走紅:我會(huì)努力做好本職工作

      粵超肇慶隊(duì)美女隊(duì)醫(yī)回應(yīng)走紅:我會(huì)努力做好本職工作

      懂球帝
      2026-05-01 15:32:26
      史上首次3-0被翻盤(pán)?名嘴熱議潛在恥辱:詹姆斯歷史地位恐受影響

      史上首次3-0被翻盤(pán)?名嘴熱議潛在恥辱:詹姆斯歷史地位恐受影響

      越嶺尋蹤
      2026-05-01 06:45:59
      公牛集團(tuán)第一季營(yíng)收40.6億:扣非后凈利9.8億 同比增15%

      公牛集團(tuán)第一季營(yíng)收40.6億:扣非后凈利9.8億 同比增15%

      雷遞
      2026-05-01 20:49:18
      地位不穩(wěn)了,掘金約基奇季后賽數(shù)據(jù)或?qū)⒂绊懫錃v史最佳球員的討論

      地位不穩(wěn)了,掘金約基奇季后賽數(shù)據(jù)或?qū)⒂绊懫錃v史最佳球員的討論

      好火子
      2026-05-02 00:57:59
      15年前在“中國(guó)黃金”買(mǎi)的20克金條,檢測(cè)發(fā)現(xiàn)僅有9克且不含一點(diǎn)黃金……女子呼吁:快檢查家中投資金條;商場(chǎng)回應(yīng)

      15年前在“中國(guó)黃金”買(mǎi)的20克金條,檢測(cè)發(fā)現(xiàn)僅有9克且不含一點(diǎn)黃金……女子呼吁:快檢查家中投資金條;商場(chǎng)回應(yīng)

      深圳晚報(bào)
      2026-05-01 22:52:48
      太震撼了!五一凌晨的泰山,大堂、走廊、臺(tái)階被游客擠得水泄不通

      太震撼了!五一凌晨的泰山,大堂、走廊、臺(tái)階被游客擠得水泄不通

      火山詩(shī)話(huà)
      2026-05-01 10:33:48
      未來(lái)十年十大科技龍頭曝光!抓住就能踩中下一輪科技大牛市

      未來(lái)十年十大科技龍頭曝光!抓住就能踩中下一輪科技大牛市

      Thurman在昆明
      2026-05-01 00:49:38
      機(jī)器人+算力:2026年A股最強(qiáng)雙主線(xiàn)!這5只龍頭股被機(jī)構(gòu)集體看好

      機(jī)器人+算力:2026年A股最強(qiáng)雙主線(xiàn)!這5只龍頭股被機(jī)構(gòu)集體看好

      小白鴿財(cái)經(jīng)
      2026-05-01 20:30:03
      世錦賽戰(zhàn)報(bào):組合球一炮雙響,希金斯三度反超被扳平了8-8墨菲

      世錦賽戰(zhàn)報(bào):組合球一炮雙響,希金斯三度反超被扳平了8-8墨菲

      求球不落諦
      2026-05-01 20:32:05
      是否支持彈劾賴(lài)清德?8.6萬(wàn)名臺(tái)灣網(wǎng)友參與投票,結(jié)果一面倒

      是否支持彈劾賴(lài)清德?8.6萬(wàn)名臺(tái)灣網(wǎng)友參與投票,結(jié)果一面倒

      海峽導(dǎo)報(bào)社
      2026-05-01 21:56:06
      好萊塢女星前男友爆隱私:“胸很大”“天天拽我上床”

      好萊塢女星前男友爆隱私:“胸很大”“天天拽我上床”

      情感大頭說(shuō)說(shuō)
      2026-05-01 18:39:45
      東風(fēng)導(dǎo)彈泄密案!間諜郭萬(wàn)鈞一家三口,全部被處以死刑

      東風(fēng)導(dǎo)彈泄密案!間諜郭萬(wàn)鈞一家三口,全部被處以死刑

      番外行
      2026-03-31 08:28:28
      南開(kāi)大學(xué)成立調(diào)查組

      南開(kāi)大學(xué)成立調(diào)查組

      第一財(cái)經(jīng)資訊
      2026-05-01 13:29:02
      陳芋汐/盧為奪得跳水世界杯總決賽女子雙人10米臺(tái)冠軍

      陳芋汐/盧為奪得跳水世界杯總決賽女子雙人10米臺(tái)冠軍

      新浪財(cái)經(jīng)
      2026-05-01 15:54:23
      官方:米內(nèi)羅競(jìng)技與胡爾克協(xié)商解約,將為他舉行告別儀式

      官方:米內(nèi)羅競(jìng)技與胡爾克協(xié)商解約,將為他舉行告別儀式

      懂球帝
      2026-05-02 05:39:08
      失眠原因找到了!北京大學(xué)研究:睡不好的人,身體缺這種營(yíng)養(yǎng)物質(zhì)

      失眠原因找到了!北京大學(xué)研究:睡不好的人,身體缺這種營(yíng)養(yǎng)物質(zhì)

      路醫(yī)生健康科普
      2026-04-30 13:05:07
      2026-05-02 07:23:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12567文章數(shù) 176459關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek發(fā)布多模態(tài)論文又連夜刪除

      頭條要聞

      美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買(mǎi)中國(guó)車(chē)"教程瘋傳

      頭條要聞

      美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買(mǎi)中國(guó)車(chē)"教程瘋傳

      體育要聞

      無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

      娛樂(lè)要聞

      馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶(hù)外直播

      財(cái)經(jīng)要聞

      GPU神話(huà)松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

      汽車(chē)要聞

      限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

      態(tài)度原創(chuàng)

      教育
      數(shù)碼
      旅游
      健康
      公開(kāi)課

      教育要聞

      高考地理中的機(jī)制問(wèn)題

      數(shù)碼要聞

      索尼推出HT-A7100回音壁:搭60智能穹頂聲場(chǎng)2.0技術(shù),5282元

      旅游要聞

      暢游“寶藏城市” 品味多元中國(guó)(外國(guó)游客感受“中國(guó)之美”)

      干細(xì)胞治燒燙傷面臨這些“瓶頸”

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 熟女丰满老熟女熟妇| 无码国产乱人伦偷精品视频| 色悠久久久久综合先锋影音下载| 国产愉拍精品手机| 91性爱视频| 国产精品亚洲色婷婷99久久精品| 内射白嫩少妇超碰| 丁香五月激情图片| www.com国产| 天堂资源中文最新版在线一区 | 中文字幕在线亚洲二区 | 影音先锋中文字幕无码资源站| 精品无码一区在线观看| 亚洲午夜福利精品一二飞| 亚洲AV日韩精品| 国产精品久久久久久久久软件| 国产自偷自偷免费一区| 久久久久亚洲AV成人网人人软件| 国产在线精品熟女 | 伊人久久大香线蕉综合影视| 久久精品国产亚洲夜色av网站| 久久大香伊蕉在人线国产h| 少妇爆乳无码专区av无码 | 国产一区二区三区视频| 丁香五月天堂| 无码精品一区二区三区超碰| 亚洲熟女精品中文字幕m| 日本老熟妇乱| 国产精品自偷一区在线观看| 色婷久久| 538任你爽精品视频国产| 国产精品1区| 国产在线不卡精品网站| 国产人妖xxxx做受视频| 超碰97人人做人人爱少妇| 乱码精品一区二区亚洲区| 国产又粗又猛又爽又黄AV| av手机版天堂网免费观看| 亚洲精品aⅴ无码精品丝袜足| 国产成人h在线观看网站站| 亚洲人成网站在线播放影院在线|