![]()
【免費】創新多組學隊列研究學術論壇
![]()
想象一下,十年后當你走進急診室,迎接你的除了醫護團隊,還可能有一位特殊的助手:一套人工智能系統。它能在你候診時通過自動監測設備收集數據,在醫患交流時實時聆聽癥狀描述,隨時準備提示醫生可能出現的疏漏或建議下一步診療方向。這一愿景或許很快將成為現實。最新發表于《Science》雜志的研究顯示,一種大型語言模型在復雜、甚至危及生命疾病的診斷中,其表現已頻頻超過醫生——即使在信息有限、節奏緊張的急診環境下也是如此。在早期急診病例中,該模型的診斷準確或接近準確的比率約為67%,而醫生的對應比率約為50%至55%。
臨床決策的多維度測試
研究團隊對OpenAI的o1模型進行了多項診斷準確性測試。其中五項任務要求模型閱讀人工篩選的病例資料,并給出診斷建議、確定后續步驟或評估特定健康轉歸概率。在所有任務中,o1的表現均與醫生相當或更優。
“模型與人類醫生在所有任務中的表現差距如此顯著,以至于我們擔心沒人會相信這個結果,”論文合著者、貝斯以色列女執事醫療中心的內科醫生亞當·羅德曼表示。在其中一項評估臨床推理能力的任務中(基于對診斷思路和后續步驟的解釋能力),o1在98% 的病例中獲得了滿分,而主治醫師的這一比例僅為35%。
模擬真實急診場景:復雜數據下的挑戰
該研究的最后一項測試——被哈佛大學計算機科學家、合著者托馬斯·巴克利稱為“最重要”的部分——要求模型在患者急診護理的三個不同時間點進行診斷。患者進入急診室后,需先向分診護士描述癥狀,再由醫生評估,最后醫生決定治療方案。每個環節都可能出現差錯:患者可能難以清晰描述癥狀,醫生可能同時處理多個高壓病例。
研究人員使用了貝斯以色列醫院真實急診患者的病例,并按患者描述病情的三個時間點逐步向o1提供信息。巴克利指出,與其他實驗不同,這項測試直接探究了LLM如何與“真實世界中可能不完整或存在偏見的混亂數據”進行交互。
結果顯示,在急診流程早期(患者剛入院、信息有限時),o1做出準確或接近準確診斷的比例達到67%,比處理相同病例的兩位醫生高出10%以上。即使隨著信息增加,這一差距略有縮小,但在后續護理階段,LLM的表現仍比醫生高出2%至10%。
專家評價:現實場景測試意義重大
未參與該研究的丹娜—法伯癌癥研究所計算機科學家施雷亞·喬赫里表示:“評估醫學人工智能需要在不同臨床任務和場景中兼顧深度與廣度,而這項研究的作者成功做到了兩者兼顧。”但她同時指出,這些AI系統在醫療健康領域的廣泛應用,關鍵在于明確其最可靠的使用情境。
谷歌計算機科學家丹尼爾·麥克達夫也對研究表示贊賞:“看到模型在現實環境中接受測試……令人興奮。”喬赫里同樣認為,作者對o1診斷和推理能力的評估方式“是任何單一實驗無法比擬的”。
研究局限與未來展望
盡管結果令人振奮,但研究也存在明顯局限。研究未分析LLM在面對超過數小時病程信息時的表現——許多病例需要這樣的長時間信息。急診留院時間相對較短,因此即使是真實世界實驗,也無法與其他場景(如住院患者)的診斷過程相比。此外,研究僅向o1提供了文本病例信息,未包含影像等非文本輸入——這對于血栓、癌癥等許多真實診斷至關重要。研究團隊已在開展新實驗,要求模型使用更長期、更廣泛的真實世界信息評估患者。專家們認為,下一個挑戰是確定這些系統能否在受控測試之外改善真實患者的護理。
https://www.science.org/content/article/ai-starting-beat-doctors-making-correct-diagnoses
免費論壇
創新多組學隊列研究學術論壇
干細胞前沿創新與臨床轉化研討會
第八屆上海國際癌癥大會
第二屆西部單細胞與空間組學論壇
【關于投稿】
轉化醫學網(360zhyx.com)是轉化醫學核心門戶,旨在推動基礎研究、臨床診療和產業的發展,核心內容涵蓋組學、檢驗、免疫、腫瘤、心血管、糖尿病等。如您有最新的研究內容發表,歡迎聯系我們進行免費報道(公眾號菜單欄-在線客服聯系),我們的理念:內容創造價值,轉化鑄就未來!
轉化醫學網(360zhyx.com)發布的文章旨在介紹前沿醫學研究進展,不能作為治療方案使用;如需獲得健康指導,請至正規醫院就診。
責任聲明:本稿件如有錯誤之處,敬請聯系轉化醫學網客服進行修改事宜!
微信號:zhuanhuayixue
★ 4月份熱門內容 ★
01
葛均波院士領銜!系統闡述心血管衰老的十二大特征與“重返青春”干預策略
02
重磅綜述!中國醫學科學院吳晨/林東昕/張少森團隊描繪食管癌從發病機制到精準治療的全景圖與未來展望
03
Cell重磅發布!科學家發現癌癥良惡性轉變的關鍵窗口與攔截新策略
04
重磅研究!上海交通大學醫學院附屬第九人民醫院吳皓團隊首次繪制小鼠耳蝸核的高分辨率分子與細胞圖譜
05
Nature里程碑研究!西湖大學楊劍&溫州醫科大學沈賢團隊構建迄今為止規模最大的中國人群泛基因組參考圖譜
06
清華大學董家鴻院士領銜!首次系統揭示胰腺導管腺癌神經浸潤的關鍵機制,鎖定關鍵藥物靶點
點擊查看更多熱門內容
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.