![]()
空間轉錄組技術的發展,使研究者能夠在組織原位解析基因表達的空間分布,為刻畫腫瘤微環境提供了前所未有的分辨率。然而,盡管該領域在技術與應用層面快速發展,如何將空間 組學有效服務于臨床決策, 仍是 一個 尚未解決的核心問題。
針對這一關鍵問題, 近日,上海交通大學系統生物醫學研究院段斌課題組在空間組學與臨床數據整合分析方向取得重要進展,相關成果以SpaPheno: Linking Spatial Transcriptomics to Clinical Phenotypes with Interpretable Machine Learning為題,于近日 在Genome Medicine在線發表。
![]()
具體而言,空間組學臨床轉化主要面臨三方面挑戰:( 1 )生存預后、腫瘤分期及免疫治療反應等臨床表型通常來源于缺乏空間分辨率的 bulk RNA-seq 隊列,使得空間分子特征與臨床結局之間的直接映射關系難以建立;( 2 )空間轉錄組數據普遍存在信號稀疏、噪聲較高以及跨平臺異質性顯著等問題,限制了模型在不同樣本與組織區域中的穩健性;( 3 )臨床應用不僅依賴預測性能,更強調模型的生物學可解釋性,以支持潛在機制發現及可干預靶點識別。
針對上述難點問題, 研 究團隊提出了一種面向臨床轉化的可解釋機器學習框架—— SpaPheno 。 該方法構建了空間轉錄組與臨床表型之間的統一可解釋建模體系,將特征構建、稀疏學習與解釋歸因在同一框架內協同優化,從而實現多尺度生物學信息的系統建模與解釋。
具體而言, SpaPheno 首先融合細胞類型組成與局部空間上下文信息,構建具有生物學可解釋性的低維特征表示,使空間轉錄組數據與 bulk RNA-seq 數據能夠嵌入到細胞類型分辨的共享特征空間中,實現跨模態的一致表征。在此基礎上,方法采用彈性網絡回歸( Elastic Net ),在處理高維且強相關特征結構的同時引入稀疏性約束,以提升模型穩定性并增強可解釋性。進一步地, SpaPheno 結合 Shapley Additive Explanations ( SHAP ),為不同空間與細胞層面的特征貢獻分配可量化的重要性評分,從而實現對局部生物學信號的精細定位與解釋。
![]()
圖 1. SpaPheno 框架
值得強調的是,與傳統 “ 黑箱 ” 模型不同, SpaPheno 不僅能夠對患者生存預后與腫瘤分期等臨床結局進行有效預測,還能夠從空間區域、細胞類型乃至單細胞 等多尺度 解析其對疾病表型的貢獻,從而將模型輸出轉化為具有明確生物學意義的可解釋信號,為腫瘤微環境機制研究提供新的分析路徑。這一框架進一步凸顯了可解釋人工智能在生物醫學研究中的關鍵價值,并推動空間組學分析從 “ 模式識別 ” 向 “ 機制解析與臨床關聯 ” 的轉變。
此外,該研究還系統整合并標準化了來自 The Cancer Genome Atlas ( TCGA )的泛癌種生存與分期數據,并結合統一整理的泛癌單細胞參考圖譜,構建了可復用的分析資源體系。相關代碼與數據已在 GitHub 開源( https://github.com/Duan-Lab1/SpaPheno ),為空間轉錄組數據的臨床解釋與方法推廣提供了重要基礎支撐。
該工作是課題組圍繞 “ 腫瘤系統生物學與可解釋人工智能 ” 研究體系的重要進展,未來將進一步發展面向腫瘤系統狀態識別、機制建模與干預策略設計的一體化方法。
本研究由上海交通大學系統生物醫學研究院助理教授段斌擔任通訊作者,段斌、程小桔和鄒華為共同第一作者。
原文鏈接:https://link.springer.com/article/10.1186/s13073-026-01645-7
歡迎對單細胞與空間組學、人工智能及腫瘤生物醫學交叉研究感興趣的碩博士生、博士后及本科實習生加入課題組,共同開展相關研究。
制版人:十一
BioArt
Med
Plants
人才招聘
學術合作組織
(*排名不分先后)
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.