<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      哈佛、MIT Broad研究所發布MEDEA:組學智能體缺的是自知之明

      0
      分享至



      作者:論文團隊

      編輯丨ScienceAI

      在靶點篩選、合成致死判斷與免疫治療響應預測等治療發現場景中,AI 智能體需要串聯多個組學數據源、調用多種機器學習模型并檢索文獻來完成多步分析。但現有智能體普遍面臨兩個問題:一是大模型在長鏈分析中會逐步丟失用戶指定的生物學上下文(如把「初始型 CD4+ αβ T 細胞」模糊成「CD4+ T 細胞」),導致下游分析在錯誤粒度上進行卻不觸發任何報警;二是面對多源證據沖突時缺乏調和機制 —— 工具輸出、文獻檢索與大模型參數化知識給出矛盾結論時,系統無法做出可追溯的取舍。

      為此,哈佛醫學院隋芃瑋 / 高尚華 / Marinka Zitnik 團隊提出 MEDEA,一個在分析流程每一步都嵌入驗證機制的組學 AI 智能體。MEDEA 在靶點發現、合成致死推理、免疫治療響應預測三個場景上完成了 5,679 次完整分析,比單獨使用大模型的準確率最高提升 45.9%,且消融實驗表明性能提升的主要來源不是骨干模型的能力差異,而是驗證模塊的有無。



      論文地址:https://medea.openscientist.ai

      開源地址:https://github.com/mims-harvard/Medea

      方法設計

      MEDEA 接受自然語言描述的研究目標,使用 20 個專業工具執行多步分析,核心設計原則是在流程每一步嵌入驗證,而非僅在最終輸出時判斷對錯。

      系統由四個協同模塊組成。研究規劃模塊將自然語言目標轉化為分步研究計劃后,進行上下文驗證(每個步驟中的細胞類型、疾病等生物學實體是否與所選工具兼容)和完整性驗證(計劃的技術可行性與邏輯一致性)。例如,當用戶要求分析肝星狀細胞的靶點,但所選單細胞基礎模型的預訓練數據不包含該細胞類型時,上下文驗證會檢測到不兼容,引導智能體從可用的近似細胞類型中選擇替代方案并記錄替代理由。



      分析執行模塊在代碼執行前后各加一層驗證:執行前檢查語法與接口兼容性,執行后審計數據來源與輸出和計劃的一致性。即使代碼運行成功,如果輸出偏離研究計劃預期,也會被標記并觸發修正。

      文獻推理模塊在檢索完成后,先對每篇論文在物種、疾病、細胞類型等維度做相關性篩選,過濾不相關文獻后再進行證據綜合,避免「檢索到什么就用什么」的問題。

      多輪討論模塊以三個模型組成的評審團,對工具分析、文獻推理、骨干模型三條證據通路的輸出做加權投票與多輪辯論。證據收斂時給出結論,分裂或不足時選擇校準棄權 —— 即不回答。

      工具空間中有 4 個機器學習模型(PINNACLE、TranscriptFormer、COMPASS、OpenScholar),它們是被智能體調用的工具而非骨干模型。智能體根據疾病上下文動態選擇調用哪個模型。受限工具實驗表明,PINNACLE 在類風濕關節炎等疾病上更優,TranscriptFormer 在肝母細胞瘤等場景上更優,反映了蛋白質互作網絡拓撲與基因表達動態兩類信號的互補性。

      MEDEA 在三個開放式治療發現任務上跑了 5,679 次完整組學分析,覆蓋精準靶點發現(2,400 次,涵蓋 5 種疾病,29 個細胞類型)、合成致死推理(2,385 次,7 個癌細胞系)、以及患者級別的免疫治療響應預測(894 次,298 名膀胱癌患者)。





      細胞類型特異性靶點發現

      2,400 次分析,覆蓋類風濕關節炎、1 型糖尿病、干燥綜合征、肝母細胞瘤、濾泡性淋巴瘤五種疾病及 29 種細胞類型。MEDEA 比單獨使用大模型的準確率最高提升 45.9%。

      該場景的核心挑戰在于細胞類型粒度。大模型在多步分析中會逐步模糊細胞類型 —— 將用戶指定的「初始型 CD4+ αβ T 細胞」簡化為「CD4+ T 細胞」。在類風濕關節炎中,初始型與效應記憶型 CD4+ αβ T 細胞的致病角色截然不同,混淆會導致靶點推薦指向錯誤的生物學邏輯。加入上下文驗證后,MEDEA 在髓樣樹突細胞上的準確率提升 28.9%,在初始型 CD4+ αβ T 細胞上提升 21.7%—— 這些恰恰是上下文粒度直接決定靶點推薦質量的細胞類型。



      消融實驗揭示了一個結構性矛盾。大模型單獨使用時幾乎從不放棄回答(棄權率僅 1.8%),但跨五種疾病的平均錯誤率高達 69.2%—— 在 1 型糖尿病上甚至達到 80%。文獻檢索配置方向相反:77.6% 的分析選擇放棄回答,因為細胞類型特異性的靶點文獻確實太過稀缺。大模型的參數化知識覆蓋面廣但可靠性低,文獻證據可靠性高但覆蓋面窄,任何單一通路都無法同時滿足兩者,只有多條通路互相校驗才能兼顧。 完整 MEDEA 達到最高準確率和最低失敗率。



      合成致死推理:糾錯、補漏、止損

      2,385 次分析,覆蓋 MCF7、MCF10A、MDAMB231、CAL27、CAL33、A549、A427 七個癌細胞系。MEDEA 比骨干大模型最高提升 21.7%(MCF7)。

      MEDEA 在該場景下展現出三種行為模式。在至少 323 個大模型答錯的案例中給出了正確判斷(糾錯);在 175 個大模型棄權的案例中給出了正確答案(補漏);在 141 個大模型犯錯的案例中選擇棄權而非跟著錯(止損)。在藥物發現場景中,止損可能比糾錯更有價值 —— 一個錯誤的合成致死預測可能觸發昂貴的實驗跟進,而一個校準的棄權只會讓研究者多花時間尋找其他證據。



      系統整合了 DepMap 基因共依賴分數與通路富集分析,對基因對聯合抑制是否會選擇性殺死癌細胞做出可追溯的判斷。

      免疫治療響應預測

      894 次患者級別分析,基于 IMvigor210 膀胱癌隊列的 298 名患者。MEDEA 比大模型最高提升 23.9%。在高腫瘤突變負荷且非炎癥型微環境這一最困難的亞組中,MEDEA 修正了底層機器學習模型 50.9% 的誤分類。



      論文中的一個患者案例清晰展示了多源證據沖突時的決策過程。一名腫瘤突變負荷為 19.0 的男性患者,GPT-4o 和 Claude 3.7 Sonnet 均基于高突變負荷預測「響應」。MEDEA 調用 COMPASS 分析腫瘤轉錄組后發現 T 細胞耗竭嚴重(評分 0.5067)、B 細胞浸潤極低(0.0260),微環境整體呈功能失調;而文獻檢索恰恰支持「高突變負荷→好響應」的關聯 —— 兩條證據直接矛盾。經多輪討論調和后,MEDEA 判定微環境功能障礙信號優先于突變負荷的統計關聯,預測「不響應」?;颊邔嶋H結局為疾病進展。整個決策鏈路可追溯。



      驗證機制的貢獻大于骨干模型的選擇

      消融實驗中最核心的發現:MEDEA 的性能提升并非來自更強的骨干大模型。 無論使用 GPT-4o 還是 Claude 3.7 Sonnet 作為骨干,加入驗證模塊后性能顯著提升,去掉后顯著下降。這意味著當前組學智能體的性能瓶頸可能不在推理能力,而在過程可靠性。

      MEDEA 的輸出不是一個標簽或分數,而是一份包含完整推理鏈路的分析報告 —— 研究計劃、每步工具調用與輸出、文獻檢索與相關性評分、證據調和的決策過程。對于需要向團隊解釋「為什么推薦這個靶點」或「為什么判斷該患者不響應」的場景,這種可審計的輸出形態具有直接的實際價值。

      代碼、評測基準和全部工具配置均已開源,模塊化設計支持選擇性集成。論文同時指出局限性:評測基準依賴已有單細胞圖譜和特定患者隊列,部分評測依賴大模型評審,工具本身編碼了細胞類型粒度等假設,評審團式共識模塊存在關聯錯誤風險。

      在藥物發現中,一個自信的錯誤答案往往比一句誠實的「我不確定」代價更高。MEDEA 的校準棄權 —— 在證據不足時選擇不回答 —— 或許是這項工作中最具實際價值的設計。

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      廣汽本田新款皓影上市 售價13.79-17.99萬元

      廣汽本田新款皓影上市 售價13.79-17.99萬元

      車質網
      2026-05-21 09:22:52
      轉會傳聞:皇馬計劃引進凱恩,切爾西得知姆巴佩最終態度

      轉會傳聞:皇馬計劃引進凱恩,切爾西得知姆巴佩最終態度

      林子說事
      2026-05-21 15:32:29
      明朝23歲女道士王燾貞,宣告自己將羽化,近10萬人圍觀,結局如何

      明朝23歲女道士王燾貞,宣告自己將羽化,近10萬人圍觀,結局如何

      史之銘
      2026-05-19 21:04:23
      假賭黑處罰追加扣除梅州客家6分 負3分暫墊底中甲

      假賭黑處罰追加扣除梅州客家6分 負3分暫墊底中甲

      體壇周報
      2026-05-21 16:06:12
      烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

      烏克蘭通過法律程序,將“俄烏戰爭”,命名為“烏克蘭獨立戰爭”

      我心縱橫天地間
      2026-01-22 18:41:25
      罕見!近70萬球迷打分,馬刺好評不斷雷霆全員低分,裁判低到離譜

      罕見!近70萬球迷打分,馬刺好評不斷雷霆全員低分,裁判低到離譜

      球盲百小易
      2026-05-21 12:48:44
      人到中年,能“還在上班”已是高配!網友:我過年回家都穿工作服

      人到中年,能“還在上班”已是高配!網友:我過年回家都穿工作服

      火山詩話
      2026-05-21 10:48:46
      布達諾夫稱“俄羅斯就是烏克蘭,烏克蘭人應該統治俄羅斯”

      布達諾夫稱“俄羅斯就是烏克蘭,烏克蘭人應該統治俄羅斯”

      山河路口
      2026-05-21 20:38:45
      公然拒掛國旗,訂單全給日韓,長榮如今的結局早已注定

      公然拒掛國旗,訂單全給日韓,長榮如今的結局早已注定

      瀲滟晴方DAY
      2026-05-11 06:31:37
      德乒教練不再隱瞞!正面回應張本智和棄日赴德傳聞,真相徹底曝光

      德乒教練不再隱瞞!正面回應張本智和棄日赴德傳聞,真相徹底曝光

      有范又有料
      2026-05-21 09:44:46
      國行Switch徹底斷網:驗證服務器下線,WiFi成擺設

      國行Switch徹底斷網:驗證服務器下線,WiFi成擺設

      宇宙來信發
      2026-05-20 17:52:31
      女性太久無"房事",竟會給身體帶來這3個后果,可別不當回事!

      女性太久無"房事",竟會給身體帶來這3個后果,可別不當回事!

      醫學科普匯
      2026-05-21 22:25:06
      等了30年,東城這片老街終于騰退,老街坊卻左右為難!

      等了30年,東城這片老街終于騰退,老街坊卻左右為難!

      家住東西城
      2026-05-21 19:42:57
      上不了臺面?方媛凌晨2點硬剛全網,8年天王嫂遮羞布被徹底撕開

      上不了臺面?方媛凌晨2點硬剛全網,8年天王嫂遮羞布被徹底撕開

      手工制作阿殲
      2026-05-15 18:49:16
      爭議!進決賽僅1天 國際足聯犯錯:U17世界杯遭針對 分檔無中國隊

      爭議!進決賽僅1天 國際足聯犯錯:U17世界杯遭針對 分檔無中國隊

      大秦壁虎白話體育
      2026-05-21 13:16:50
      中國差點變印度?黃巢讓中國躲過千年災難,毛主席的評價一針見血

      中國差點變印度?黃巢讓中國躲過千年災難,毛主席的評價一針見血

      掠影后有感
      2026-05-08 10:20:21
      你至少必須擁有一個不良嗜好,真的,能續命!

      你至少必須擁有一個不良嗜好,真的,能續命!

      貓大夫醫學科普
      2026-05-16 06:49:56
      老特一語道破天機

      老特一語道破天機

      明人明察
      2026-05-20 21:17:50
      大蒜被關注!醫生發現:肺結節病人吃大蒜,不用多久或迎來5變化

      大蒜被關注!醫生發現:肺結節病人吃大蒜,不用多久或迎來5變化

      阿兵科普
      2026-05-17 22:37:24
      3年8700萬美金!聯盟第1!NBA新惡人把話挑明,文班亞馬沒有退路

      3年8700萬美金!聯盟第1!NBA新惡人把話挑明,文班亞馬沒有退路

      世界體育圈
      2026-05-21 21:58:43
      2026-05-21 23:52:49
      ScienceAI incentive-icons
      ScienceAI
      關注人工智能與其他前沿技術
      1307文章數 227關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

      頭條要聞

      叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      后驅+閃充+激光雷達 第三代元PLUS上市售11.99萬元起

      態度原創

      藝術
      時尚
      親子
      健康
      教育

      藝術要聞

      崔雪冬 2026年油畫新作

      今年夏天最流行的4組搭配,誰穿誰好看!

      親子要聞

      5歲小女孩來月經,竟是因為這件事情!

      外泌體與干細胞竟是“快遞”與“工廠”的關系?

      教育要聞

      一個方法讓孩子擁有解決問題能力

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩精品| 亚洲一区乱码精品中文字幕| 久久永久免费人妻精品直播| 亚洲精品综合久中文字幕| 国产成人精品麻豆| 拍国产真实乱人偷精品| 日日碰日日摸日日澡视频播放| 十八禁午夜福利免费网站| 日韩一区二| 久久久久人妻精品区一三寸| 日韩中文字幕在线不卡| 中国女人熟毛茸茸A毛片| 狠狠操在线观看| 精河县| 亚洲国产麻豆综合一区| 国产女人40精品一区毛片视频| 人人妻人人狠人人爽天天综合网| 国产成人精品午夜二三区波多野 | 精品国产午夜理论片不卡精品| 国产亚洲一区二区av| 亚洲成av人片在线播放无码 | 亚洲AV无码一区东京热久久| 亚洲国产日韩在线视频| 99福利性视频日韩| 依依成人精品无v国产| 亚洲精品国产综合麻豆久久99| 中文字幕大屁股熟女乱| 日韩成人极品在线内射3p蜜臀| 国产美女久久久久| 无翼乌口工全彩无遮挡h全彩 | 凌云县| 久久久亚洲色| 99久久精品午夜一区二区| 男女性爽大片视频免费看| 亚洲av永久无码天堂影院| 在线观看亚洲国产| 亚洲丰满熟女一区二区V| 久久人人爽人人人人片av| 一本之道高清乱码少妇 | 日本极品少妇xxxx| 亚洲无码av一区二区|