![]()
認(rèn)知神經(jīng)科學(xué)前沿文獻(xiàn)分享
![]()
基本信息
Title:Cross-species prediction reveals chromatin regions with increased accessibility in humans
發(fā)表時(shí)間:2026-04-15
發(fā)表期刊:Science Advances
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
引言
人與黑猩猩等近緣靈長類在基因組上高度相似,卻在腦體積、骨骼形態(tài)、體脂分布以及部分疾病易感性上表現(xiàn)出清晰差異。正因?yàn)榈鞍拙幋a區(qū)差異并不大,越來越多研究把目光轉(zhuǎn)向非編碼調(diào)控區(qū)域:真正推動(dòng)人類特異性狀出現(xiàn)的關(guān)鍵變化,可能并不主要來自“基因?qū)懥耸裁础保莵碜浴盎蚝螘r(shí)、何地、以多大強(qiáng)度被打開”。開放染色質(zhì)區(qū)域(open chromatin regions, OCRs)正是這類調(diào)控活動(dòng)的重要入口,因?yàn)樗鼈兺鶎?duì)應(yīng)啟動(dòng)子、增強(qiáng)子等活躍調(diào)控元件。
不過,這個(gè)問題長期受制于一個(gè)現(xiàn)實(shí)瓶頸。傳統(tǒng)比較基因組學(xué)擅長利用保守性和進(jìn)化速率尋找候選區(qū)域,例如人類加速區(qū)域,但它難以直接說明這些序列究竟在哪些細(xì)胞類型中發(fā)揮作用,也無法直接判斷它們是否真的改變了染色質(zhì)可及性。另一條更直接的路,是跨物種比較 ATAC-seq 等功能組學(xué)數(shù)據(jù),但非人靈長類樣本本就稀缺,組織與細(xì)胞類型覆蓋也有限,已有工作往往集中在少數(shù)腦組織,難以擴(kuò)展到更廣泛的人體細(xì)胞圖譜。
![]()
實(shí)驗(yàn)設(shè)計(jì)與方法邏輯
作者的設(shè)計(jì)分成遞進(jìn)的三步。前一層是驗(yàn)證跨物種預(yù)測是否成立:利用人、黑猩猩、獼猴的 bulk ATAC-seq 數(shù)據(jù),以及腦 Brodmann 區(qū) 6 類細(xì)胞的 single-cell ATAC-seq 聚合數(shù)據(jù),比較“各物種獨(dú)立訓(xùn)練模型”和“僅用人類訓(xùn)練后跨物種預(yù)測”的表現(xiàn),并結(jié)合 integrated gradients 分析模型學(xué)到的轉(zhuǎn)錄因子基序是否跨物種一致。中間一層是把模型分?jǐn)?shù)與真實(shí)差異對(duì)接:在人類 OCR 的同源序列上計(jì)算人類與猿類之間的預(yù)測差值 ΔPr,并檢驗(yàn)其對(duì)實(shí)驗(yàn)定義的人類可及性升高區(qū)域的富集。
![]()
核心發(fā)現(xiàn)
發(fā)現(xiàn)一:僅用人類數(shù)據(jù)訓(xùn)練的 CNN,在近緣靈長類中仍能穩(wěn)定預(yù)測染色質(zhì)可及性
全文最關(guān)鍵的前提,是跨物種預(yù)測本身足夠可靠。Figure 1A-B 顯示,在淋巴母細(xì)胞系和前額葉膠質(zhì)細(xì)胞等 bulk ATAC-seq 數(shù)據(jù)中,各物種獨(dú)立訓(xùn)練模型在整條測試染色體上的 AUROC 多數(shù)高于 0.9,而僅用人類訓(xùn)練的模型拿去預(yù)測黑猩猩和獼猴時(shí),AUROC 與 AUPRC 幾乎沒有明顯下降;在單細(xì)胞聚合數(shù)據(jù)上,F(xiàn)igure 3A 也呈現(xiàn)出相近結(jié)論。這說明模型捕捉到的并不只是人類樣本的局部特征,而是近緣靈長類共享的調(diào)控序列規(guī)律。
![]()
Figure 1. Cross--species prediction of chromatin accessibility by CNNs
![]()
Figure 3. Cross--species predictive performance of the CNN on single--cell ATAC--seq
發(fā)現(xiàn)二:跨物種預(yù)測差值 ΔPr,與實(shí)驗(yàn)測得的人類可及性升高存在穩(wěn)定統(tǒng)計(jì)關(guān)聯(lián)
模型能跨物種預(yù)測,并不自動(dòng)意味著它能反映物種間真正的調(diào)控差異。Figure 2A 的價(jià)值就在于把“預(yù)測分?jǐn)?shù)”與“實(shí)驗(yàn)差異”接了起來:在人類 OCR 的同源序列比較中,人類特異 peak 的 ΔPr 明顯高于共同 peak。以淋巴母細(xì)胞系為例,人-黑比較中人類特異 peak 的平均 ΔPr 為 0.03,而共同 peak 為 0.004;人-獼猴比較分別為 0.11 與 0.01。
![]()
Figure 2. Prediction performance of the CNNs on orthologous sequences
發(fā)現(xiàn)三:作者在 111 種細(xì)胞類型中系統(tǒng)識(shí)別出 hPICAs,這些區(qū)域更偏向核心調(diào)控元件并呈現(xiàn)選擇信號(hào)
在前兩步基礎(chǔ)上,論文真正的核心產(chǎn)出體現(xiàn)在 Figure 4。作者基于 111 種成人人類細(xì)胞類型分別訓(xùn)練模型,并將人類序列與推斷的人類-黑猩猩祖先序列比較,結(jié)合 1000 次中性模擬評(píng)估顯著性,最終以 ΔPr > 0.3 且 adjusted P < 0.05 定義 hPICA。Figure 4B-C 說明各細(xì)胞類型模型整體表現(xiàn)穩(wěn)定,也給出了 ΔPr 的總體分布背景;Figure 4D-F 則展示了這些區(qū)域的生物學(xué)性質(zhì)。
![]()
Figure 4. Identification and characteristics of hPICAs
發(fā)現(xiàn)四:hPICAs 中的人類特異變異更可能通過改變潛在轉(zhuǎn)錄因子結(jié)合位點(diǎn)影響可及性,并與部分人類性狀相關(guān)
論文最后把分析從“區(qū)域?qū)用妗蓖七M(jìn)到“變異層面”和“表型線索層面”。Figure 5A 顯示,與 non-hPICAs 相比,hPICAs 中的人類特異單核苷酸變異和插入更常落在潛在細(xì)胞類型特異轉(zhuǎn)錄因子結(jié)合位點(diǎn)上,而刪除不顯著;Figure 5B 進(jìn)一步表明,這種位點(diǎn)重疊在 hPICAs 中甚至高于傳統(tǒng)由保守性定義的人類加速區(qū)域(HARs),提示 hPICAs 更偏向捕捉可能真正改寫調(diào)控輸出的變異。
![]()
Figure 5. Features of genetic variants from ancestors to humans within hPICAs
![]()
歸納總結(jié)和點(diǎn)評(píng)
這項(xiàng)研究最突出的貢獻(xiàn),不只是證明“人類數(shù)據(jù)訓(xùn)練的模型可以跨靈長類預(yù)測染色質(zhì)可及性”,而是把這種可遷移性真正轉(zhuǎn)化為一套可用于人類演化研究的發(fā)現(xiàn)框架:作者在 111 種細(xì)胞類型中系統(tǒng)識(shí)別出 23,414 個(gè) hPICAs,顯示這些區(qū)域更具細(xì)胞類型特異性,更偏向啟動(dòng)子和增強(qiáng)子,并帶有統(tǒng)計(jì)上的選擇信號(hào);同時(shí),區(qū)域內(nèi)的人類特異變異更可能落在潛在轉(zhuǎn)錄因子結(jié)合位點(diǎn)上,并與骨量、體脂等性狀相關(guān)區(qū)域相連。它的意義在于,為非人靈長類表觀組數(shù)據(jù)稀缺這一長期難題提供了一條現(xiàn)實(shí)可行的替代路徑,把深度學(xué)習(xí)、祖先序列推斷和功能注釋整合起來,用于定位可能參與人類特異性狀形成的非編碼調(diào)控變化。但邊界也同樣清楚:hPICAs、本體變異效應(yīng)以及與具體表型的聯(lián)系,目前仍主要建立在計(jì)算預(yù)測和統(tǒng)計(jì)關(guān)聯(lián)之上,距離“已被證明的功能機(jī)制”還有一步,后續(xù)仍需要報(bào)告基因、CRISPR 擾動(dòng)和等位基因比較等實(shí)驗(yàn)進(jìn)一步驗(yàn)證。
![]()
請(qǐng)打分
這篇?jiǎng)倓偟巧?Science Advances 的研究,是否實(shí)至名歸?我們邀請(qǐng)您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評(píng)論區(qū)分享您的深度見解。
分享人:BQ
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認(rèn)知神經(jīng)科學(xué)的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級(jí)大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場探索未知的長跑,但你無需獨(dú)行。歡迎加入PsyBrain 學(xué)術(shù)社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點(diǎn)擊卡片進(jìn)群,歡迎你的到來
一鍵關(guān)注,點(diǎn)亮星標(biāo) ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.