你能想象AI像老醫(yī)生一樣"看懂"手術(shù)視頻嗎?
3月24日,中科院發(fā)布了"術(shù)影"手術(shù)視頻大模型,它用3658小時真實手術(shù)視頻訓(xùn)練,學(xué)會了理解13種器官、6類手術(shù)任務(wù),17項國際測試全部第一。
![]()
這和以前有什么不同?
以前AI只能"認圖"——告訴你畫面里有什么。現(xiàn)在AI能"理解"——知道醫(yī)生在做什么、器械怎么配合、操作規(guī)不規(guī)范。術(shù)影”基于V-JEPA架構(gòu),引入三項關(guān)鍵技術(shù)革新,讓AI首次學(xué)會“閱讀”手術(shù)視頻的動態(tài)敘事:
- 運動引導(dǎo)的隱空間預(yù)測:模型自動聚焦于關(guān)鍵運動信息和中高層語義,如器械與組織的精細交互、手術(shù)步驟的流暢銜接。
- 特征多樣性保持:訓(xùn)練中強制保留特征多樣性,確保捕捉手術(shù)場景中的細微變化與異常。
- 模型穩(wěn)定性保持:通過動態(tài)調(diào)整學(xué)習(xí)策略,保障長序列視頻理解中的穩(wěn)定性。
這三重革新共同構(gòu)成能夠理解手術(shù)行為背后意圖與邏輯的通用視覺感知底座,為手術(shù)AI的“GPT時刻”奠定技術(shù)基礎(chǔ)。
![]()
它能幫醫(yī)生做什么?
簡單說,就是成為醫(yī)生的"智能助手"。新手醫(yī)生可以跟著它學(xué),老醫(yī)生可以用它復(fù)盤,醫(yī)院可以用它評估技術(shù)水平。
最重要的是,它已經(jīng)開源了,全球醫(yī)療團隊都能免費用。
研發(fā)團隊說得很清楚:AI是來幫忙的,不是來取代醫(yī)生的。決策權(quán)永遠在醫(yī)生手里。
科技進步的意義,從來不是替代人類,而是讓人類做得更好。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.