![]()
作者丨上智院「女?huà)z」團(tuán)隊(duì)、復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院、臨港實(shí)驗(yàn)室等
編輯丨ScienceAI
在數(shù)字病理分析中,細(xì)胞實(shí)例分割是不可或缺的基礎(chǔ)工具,其精度直接影響細(xì)胞計(jì)數(shù)、形態(tài)分析、空間組織學(xué)研究乃至腫瘤分級(jí)等關(guān)鍵臨床與科研任務(wù)的可靠性。生物組織中細(xì)胞往往呈現(xiàn)高密度堆疊和形態(tài)多樣的特征,精準(zhǔn)區(qū)分每個(gè)細(xì)胞實(shí)例的邊界與歸屬,是長(zhǎng)期困擾領(lǐng)域的核心挑戰(zhàn)。
然而,面對(duì)復(fù)雜的病理圖像數(shù)據(jù),現(xiàn)有基于檢測(cè)、輪廓預(yù)測(cè)或距離映射的方法雖各有進(jìn)展,卻普遍存在核心局限,難以滿足臨床對(duì)高密度重疊場(chǎng)景的分析需求。
為此,上海科學(xué)智能研究院(下稱(chēng)上智院)與復(fù)旦大學(xué)、上海交通大學(xué)、臨港實(shí)驗(yàn)室等機(jī)構(gòu)聯(lián)合提出了首個(gè)鄰接感知的細(xì)胞實(shí)例分割框架(Disco)。該框架從細(xì)胞鄰接圖的拓?fù)浔举|(zhì)出發(fā),通過(guò)「顯式標(biāo)記」與「隱式消歧」雙機(jī)制協(xié)同,實(shí)現(xiàn)了從特征學(xué)習(xí)到分割推理的全流程優(yōu)化。
實(shí)驗(yàn)表明,Disco 方法在四個(gè)異質(zhì)性數(shù)據(jù)集上平均性能提升達(dá) 2.72%,在高密度挑戰(zhàn)性場(chǎng)景中 PQ 指標(biāo)更是實(shí)現(xiàn) 7.08% 的顯著突破,為開(kāi)發(fā)高性能 AI 輔助病理分析工具開(kāi)辟了新路徑。
![]()
現(xiàn)有方法的兩大核心局限
既往細(xì)胞實(shí)例分割方法雖在特定場(chǎng)景取得進(jìn)展,但面向真實(shí)臨床病理圖像時(shí),存在兩個(gè)關(guān)鍵短板:
一是缺乏全局拓?fù)浣?/strong>:主流方法依賴(lài)局部像素或幾何信息推斷細(xì)胞歸屬,卻忽視了細(xì)胞間的全局拓?fù)浼s束。檢測(cè)類(lèi)方法受限于邊界框表示和非極大值抑制的啟發(fā)式邏輯,在密集重疊場(chǎng)景易漏檢;輪廓類(lèi)方法對(duì)二值化閾值高度敏感,易出現(xiàn)欠分割或過(guò)分割;距離映射類(lèi)方法則依賴(lài)復(fù)雜后處理重構(gòu)實(shí)例,易導(dǎo)致誤差傳播。這些方法的決策本質(zhì)上是局部最優(yōu),面對(duì)高密度細(xì)胞集群的全局復(fù)雜性時(shí)極易失效。
二是著色方案適配性不足:基于圖著色理論的新方法雖具備全局拓?fù)涓兄芰Γ嬖凇窯oldilocks 困境」:簡(jiǎn)單 2 色著色模型基于二分圖假設(shè),無(wú)法處理真實(shí)細(xì)胞圖中普遍存在的奇環(huán)結(jié)構(gòu);而 4 色著色等高階模型又會(huì)引入不必要的表征冗余和優(yōu)化難題,未能匹配真實(shí)細(xì)胞拓?fù)涞膹?fù)雜特性。
為解決這些問(wèn)題,研究團(tuán)隊(duì)從細(xì)胞鄰接拓?fù)浞治龊团R床病理需求雙重視角出發(fā),構(gòu)建了 Disco 框架,實(shí)現(xiàn)從信號(hào)表征到分割推理的全流程優(yōu)化。該框架與病理分析的知識(shí)體系對(duì)齊,使得研究者不僅能獲得精準(zhǔn)的分割結(jié)果,更能通過(guò)沖突圖理解細(xì)胞拓?fù)鋸?fù)雜性,推動(dòng)病理 AI 分析更具可解釋性。
![]()
圖示:主流方法對(duì)比。
Disco的雙機(jī)制創(chuàng)新設(shè)計(jì)
Disco 框架以「分而治之」為核心原則,包含「顯式標(biāo)記」與「隱式消歧」兩大核心機(jī)制,形成從拓?fù)浞治龅椒指顑?yōu)化的完整技術(shù)閉環(huán)。
1. 顯式標(biāo)記:拓?fù)錄_突的結(jié)構(gòu)化建模
通過(guò)廣度優(yōu)先搜索(BFS)提取細(xì)胞鄰接圖中的最大二分子圖,將絕大多數(shù)簡(jiǎn)單結(jié)構(gòu)的細(xì)胞節(jié)點(diǎn)分為兩組,對(duì)應(yīng)兩種基礎(chǔ)顏色;同時(shí)將剩余構(gòu)成「沖突集群」的非二分結(jié)構(gòu)節(jié)點(diǎn)整合為沖突集,分配專(zhuān)屬?zèng)_突顏色。這種動(dòng)態(tài)適配策略既避免了 2 色著色的理論不足,又摒棄了高階著色的冗余,生成兼具效率與拓?fù)湫畔⒌谋O(jiān)督信號(hào)。
2. 隱式消歧:連續(xù)空間的特征分離
構(gòu)建解耦的約束損失系統(tǒng),通過(guò)損失組件協(xié)同優(yōu)化,實(shí)現(xiàn)復(fù)雜場(chǎng)景下的實(shí)例清晰分離:
- 基礎(chǔ)損失:分別監(jiān)督前景、背景分割和多類(lèi)著色任務(wù),確保細(xì)胞區(qū)域識(shí)別與標(biāo)記準(zhǔn)確性;
- 正則化損失:形成「推拉」機(jī)制,抑制二分區(qū)域的沖突顏色誤用,同時(shí)強(qiáng)化沖突區(qū)域的精準(zhǔn)預(yù)測(cè);
- 鄰接約束損失:通過(guò)最小化相鄰細(xì)胞實(shí)例的特征余弦相似度,在連續(xù)特征空間強(qiáng)制實(shí)例分離,有效解決沖突節(jié)點(diǎn)間的二次沖突問(wèn)題。
圖示:Disco 雙機(jī)制設(shè)計(jì)。
在四大數(shù)據(jù)集上超越現(xiàn)有最優(yōu)方法
研究團(tuán)隊(duì)在 PanNuke、DSB2018、CryoNuSeg 及 GBC-FS 2025 四大異質(zhì)性數(shù)據(jù)集開(kāi)展系統(tǒng)評(píng)估,結(jié)果全面超越現(xiàn)有最優(yōu)方法(SOTA),展現(xiàn)出卓越的泛化能力與魯棒性:
平均性能顯著提升:在所有數(shù)據(jù)集上平均PQ指標(biāo)提升 2.72%,在高密度復(fù)雜場(chǎng)景中 PQ 提升達(dá) 7.08%,AJI 指標(biāo)達(dá)到52.09%,較 SOTA 實(shí)現(xiàn) 6.91% 的絕對(duì)提升,優(yōu)勢(shì)尤為突出;
全場(chǎng)景自適應(yīng)適配:在完全二分圖的簡(jiǎn)單場(chǎng)景中,自動(dòng)退化為高效2色著色模型,AJI 和 PQ 指標(biāo)均居首位;在高密度重疊的復(fù)雜場(chǎng)景中,仍能精準(zhǔn)分離緊密聚類(lèi)的細(xì)胞實(shí)例,實(shí)現(xiàn)全復(fù)雜度場(chǎng)景的高效覆蓋;
多模態(tài)高效兼容:在 H&E 染色、熒光成像等不同模態(tài),以及不同組織類(lèi)型的數(shù)據(jù)集上均保持領(lǐng)先性能,適配臨床多樣化病理圖像需求;
此外,模型生成的「沖突圖」可直觀呈現(xiàn)不同組織區(qū)域的拓?fù)鋸?fù)雜性,為病理學(xué)家量化組織異質(zhì)性、識(shí)別關(guān)鍵病變區(qū)域提供了全新工具,間接提升了研究的臨床適配價(jià)值。
![]()
圖示:細(xì)胞拓?fù)浣Y(jié)構(gòu)分析。
核心組件的必要性驗(yàn)證
為驗(yàn)證 Disco 框架中各核心組件的貢獻(xiàn),研究團(tuán)隊(duì)在高密度復(fù)雜場(chǎng)景下開(kāi)展系統(tǒng)消融實(shí)驗(yàn),遵循控制變量原則量化各模塊貢獻(xiàn):
拓?fù)浣5挠行裕杭?2 色著色基線模型 AJI 僅 37.85%,而 Disco 的顯式標(biāo)記策略通過(guò)沖突集建模,顯著提升了復(fù)雜結(jié)構(gòu)的處理能力;
鄰接約束損失的關(guān)鍵作用:?jiǎn)为?dú)加入鄰接約束損失即可使 PQ 指標(biāo)從 42.57% 提升至 48.26%,證明其在解決二次沖突、強(qiáng)化實(shí)例分離中的決定性作用;
動(dòng)態(tài)著色的優(yōu)勢(shì):相較于靜態(tài) 3 色著色和 4 色著色方案,Disco 的「2+1」動(dòng)態(tài)策略避免了表征冗余,PQ 指標(biāo)分別領(lǐng)先 9.65% 和 7.08%,驗(yàn)證了其適配真實(shí)拓?fù)涞暮侠硇浴?/p>
這些實(shí)驗(yàn)從多個(gè)維度證實(shí),顯式標(biāo)記與隱式消歧兩大核心機(jī)制協(xié)同發(fā)力,共同支撐了模型在各類(lèi)場(chǎng)景中的性能突破,尤其在高密度重疊場(chǎng)景中展現(xiàn)出不可替代的優(yōu)勢(shì)。
總結(jié)與展望
Disco 的成功,核心在于對(duì)病理場(chǎng)景本質(zhì)的深刻洞察與算法創(chuàng)新——通過(guò)精準(zhǔn)捕捉細(xì)胞鄰接拓?fù)涞暮诵奶卣鳎瑢?shí)現(xiàn)了對(duì)不同復(fù)雜度場(chǎng)景的自適應(yīng)高效處理。
首先,模型從細(xì)胞鄰接拓?fù)涞奈锢砼c生物學(xué)特性出發(fā),揭示了真實(shí)細(xì)胞圖「近二分但富含沖突集群」的核心特征,使特征學(xué)習(xí)更貼合病理本質(zhì);其次,通過(guò)動(dòng)態(tài)著色與約束損失系統(tǒng),將模型流程與病理分析的邏輯深度對(duì)齊,在提升性能的同時(shí)顯著增強(qiáng)了結(jié)果的可解釋性;此外,其對(duì)高密度、噪聲場(chǎng)景的適應(yīng)能力,兼顧了效率與臨床實(shí)用性。與此同時(shí),團(tuán)隊(duì)也同步開(kāi)源了 GBC-FS 2025 數(shù)據(jù)集與相關(guān)評(píng)測(cè)資源,為后續(xù)方法迭代與公平對(duì)比提供了統(tǒng)一基準(zhǔn)。
該研究不僅為細(xì)胞實(shí)例分割提供了新的技術(shù)路徑,也印證了 AI 醫(yī)療發(fā)展的關(guān)鍵方向——唯有將領(lǐng)域知識(shí)與人工智能技術(shù)深度融合,才能開(kāi)發(fā)出真正賦能臨床的實(shí)用工具。
展望未來(lái),研究團(tuán)隊(duì)計(jì)劃將本框架擴(kuò)展至更多病理分析場(chǎng)景,包括多組織類(lèi)型適配、多模態(tài)病理數(shù)據(jù)融合等,為智能病理的落地持續(xù)注入新動(dòng)力。
論文信息:
該研究成果已被 ICLR 2026 接收。上智院實(shí)習(xí)生、復(fù)旦大學(xué)博士生孫瑞和上智院實(shí)習(xí)生、上海交通大學(xué)博士生楊逸文,為共同第一作者。上智院實(shí)習(xí)生郭凱與、徐東籬,上海交通大學(xué)附屬仁濟(jì)醫(yī)院博士生劉照南,上智院實(shí)習(xí)生、復(fù)旦大學(xué)博士生潘覃,復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院(下稱(chēng)復(fù)旦大學(xué) AI3 院)副院長(zhǎng)韓麗妹,復(fù)旦大學(xué)生醫(yī)工創(chuàng)新學(xué)院教授江雪,為共同作者。上智院生命科學(xué)方向負(fù)責(zé)人、復(fù)旦大學(xué) AI3 院研究員程遠(yuǎn),臨港實(shí)驗(yàn)室研究員魏武,上智院生命科學(xué)方向研究員蔣晨,為共同通訊作者。
研究項(xiàng)目由星河啟智科學(xué)智能開(kāi)放平臺(tái)(https://aistudio.ai4s.com.cn/)和復(fù)旦大學(xué) CFFF 智算平臺(tái)提供技術(shù)和算力支持。
論文題目:Disco: Densely-overlapping Cell Instance Segmentation via Adjacency-aware Collaborative Coloring
論文地址:https://arxiv.org/abs/2602.05420
代碼地址:https://github.com/SR0920/Disco
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.