![]()
染色質(zhì)三維結(jié)構通過 構建 遠端調(diào)控元件之間的空間互作精細調(diào)控基因 轉(zhuǎn)錄 , 在 決定細胞身份、組織發(fā)育和疾病發(fā)生 等生物學過程 中 扮演重要角色【1–3】。基于染色體構象捕獲( 3C )的 Hi-C 技術實現(xiàn)了全基因組尺度染色質(zhì)互作圖譜的繪制,并陸續(xù)揭示了 A/B compartment 、拓撲關聯(lián)結(jié)構域( TAD )以及染色質(zhì)環(huán)( chromatin loop )等 人類基因組折疊的基本規(guī)律 及其在 發(fā)育、 疾病 和衰老過程 中的作用【4,5】。然而,高質(zhì)量 Hi-C 圖譜的產(chǎn)出對樣本量、測序深度和實驗成本均有較高要求,尤其在單細胞與空間尺度上, Hi-C 數(shù)據(jù)的 獲取仍 存在顯著瓶頸。
為緩解這一問題,近年來相繼出現(xiàn)了多種基于深度學習的 Hi-C 圖譜預測方法,如 Akita 、 C.Origami 、 Epiphany 、 ChromaFold 等。然而,當面向單細胞與空間組學數(shù)據(jù)時,現(xiàn)有方法仍存在 多方面的 局限:( 1 ) 訓練需要 同一樣本同時具備 ATAC-seq 、 CTCF ChIP -seq 等多組學輸入;( 2 )難以 泛化到未見過的 細胞類型;( 3 )未充分考慮單細胞與空間數(shù)據(jù)中固有的稀疏性和測序深度的高度異質(zhì)性。
針對上述挑戰(zhàn), 2026 年 4 月 14 日 , 北京大學臨床醫(yī)學高等研究院(細胞穩(wěn)態(tài)與衰老性重大疾病北京研究中心) / 北京大學腫瘤醫(yī)院 吳華君 、北京大學第三醫(yī)院 徐明 和北京大學腫瘤醫(yī)院 王玉娟 共同通訊 在 Nature Communications 上發(fā)表了題為 Hi-Compass: a depth-aware deep learning framework for predicting cell-type-specific 3D genome organization from single-cell to spatial resolution 的研究論文,提出了一個跨測序深度的三維基因組預測深度學習框架Hi-Compass,能夠從ATAC-seq數(shù)據(jù)出發(fā),跨bulk、單細胞、空間等多尺度預測細胞類型特異性的Hi-C接觸圖譜。
![]()
文中提出的 Hi-Compass 是一個基于 CNN-Transformer 架構的深度學習框架,以 ATAC-seq 信號 為唯一的細胞類型特異性輸入,結(jié)合 DNA 序列、泛細胞類型 CTCF 結(jié)合 譜以及 ATAC-seq 的測序深度,預測細胞類型特異性的 Hi-C 接觸圖譜。為兼容 bulk 、單細胞和空間組學中差異極大的測序深度,作者在訓練階段引入多種測序深度的 ATAC-seq 輸入,并通過深度嵌入( depth embedding )將當前輸入的測序深度告知模型,使其在不同數(shù)據(jù)尺度下均可生成合理預測。
![]()
在此基礎上,作者將 Hi-Compass 與 Akita 、 C.Origami 、 Epiphany 、 ChromaFold 等代表性方法進行了系統(tǒng)性 benchmark 比較,在 Hi-C 圖譜整體相關性、高置信染色質(zhì)環(huán)的恢復、以及 TAD 邊界與 insulation score 一致性等多個維度上評估了各方法的預測性能,結(jié)果顯示 Hi-Compass 在跨細胞類型泛化場景中的預測精度優(yōu)于現(xiàn)有方法。 在多細胞類型聯(lián)合訓練策略下, Hi-Compass 對訓練集之外的細胞類型同樣具備 zero-shot 預測能力。
進一步地,作者將 Hi-Compass 應用于外周血單核細胞( PBMC ) 的 scATAC -seq 和胚胎心臟發(fā)育的 multiome 數(shù)據(jù)集,解析了不同免疫細胞亞群與發(fā)育階段細胞類型特異性的染色質(zhì)互作圖譜。基于所預測的細胞類型特異性染色質(zhì)環(huán)信息, Hi-Compass 進一步支持將 GWAS 非編碼變異 系統(tǒng)性地連接到其候選靶基因,為復雜疾病的功能解讀提供了三維基因組學視角。
在空間尺度 上 ,作者將 Hi-Compass 接入 spatial ATAC-seq 數(shù)據(jù),在 人類 海馬組織 中實現(xiàn)了空間分辨的染色質(zhì)互作預測,刻畫了組織空間位置與細胞類型特異性三維基因組結(jié)構的對應關系。此外,作者通過對小鼠基因組的 fine-tuning 進一步展示了 Hi-Compass 的 跨物種應用能力 。
綜上,該研究工作為細胞類型特異性三維基因組預測提供了一個覆蓋bulk—單細胞—空間多尺度并支持跨物種應用的統(tǒng)一深度學習框架。Hi-Compass 的提出將有力推動三維基因組學在發(fā)育、免疫、神經(jīng)及疾病研究中的廣泛應用,并為非編碼遺傳變異的功能解讀提供 新 的工具。
本論文的 共同通訊作者 為北京大學臨床醫(yī)學高等研究院(細胞穩(wěn)態(tài)與衰老性重大疾病北京研究中心) / 北京大學腫瘤醫(yī)院 吳華君 研究員、北京大學第三醫(yī)院 徐明 教授 和北京大學腫瘤醫(yī)院 王玉娟 博士 ;北京大學腫瘤醫(yī)院 孫源辰 、北京大學第三醫(yī)院蔣文杰和北京大學腫瘤醫(yī)院蔡康文為本文的共同第一作者。
原文鏈接:https://www.nature.com/articles/s41467-026-71877-z
制版人: 十一
參考文獻
1. Bonev B, Cavalli G. Organization and function of the 3D genome.Nature Reviews Genetics2016, 17: 661–678.
2. Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication.Cell2016, 164: 1110–1121.
3. Hafner A, Boettiger A. The spatial organization of transcriptional control.Nature Reviews Genetics2023, 24: 53–68.
4. Lieberman-Aiden E, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome.Science2009, 326: 289–293.
5. Rao SSP, et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping.Cell2014, 159: 1665–1680.
學術合作組織
(*排名不分先后)
![]()
戰(zhàn)略合作伙伴
(*排名不分先后)
![]()
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權歸文章作者所有,歡迎個人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權利,違者必究。
BioArt
Med
Plants
人才招聘
點擊主頁推薦活動
關注更多最新活動!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.