![]()
體細(xì)胞結(jié)構(gòu)變異( Somatic Structural Variations, SVs )是癌癥基因組中重要的變異類型,涵蓋缺失、插入、倒位、重復(fù)和易位等多種形式,對基因表達、拷貝數(shù)變異及染色質(zhì)三維結(jié)構(gòu)具有顯著調(diào)控作用。然而,由于人類基因組中串聯(lián)重復(fù)序列、低復(fù)雜度區(qū)域及著絲粒等高度重復(fù)區(qū)域的存在,長讀長測序數(shù)據(jù)在這些區(qū)域的比對仍面臨挑戰(zhàn),導(dǎo)致體細(xì)胞 SV 檢測存在較高的假陽性和假陰性率。
近日,四川大學(xué)華西醫(yī)院謝丹研究員 團隊、東北師范大學(xué)黃偉副 教授團隊聯(lián)合在Genome Biology在線發(fā)表了題為SVScopeimproves somatic structural variations detection via graph-genome optimization的研究論文。該研究開發(fā)了 SVScope 算法框架,通過整合全長讀長序列信息與局部圖基因組優(yōu)化策略,顯著提升了體細(xì)胞SV的檢測精度,并通過PCR實驗驗證了新發(fā)現(xiàn)的SV事件,為腫瘤基因組學(xué)研究提供了高準(zhǔn)確性的新工具。
![]()
針對現(xiàn)有算法在重復(fù)區(qū)域 比對 斷裂點定位模糊的瓶頸, SVScope 的核心策略是:針對候選 SV 區(qū)間,提取腫瘤和正常樣本中所有跨越讀長的全長序列,利用 偏序 比對 圖 ( s POA -graph )構(gòu)建局部圖基因組,并進一步通過多類別序列混合模型解析不同基因組組分,從而精準(zhǔn)識別體細(xì)胞 SV 特異路徑。這一策略直接利用讀長全長序列信息而非僅依賴比對坐標(biāo),有效規(guī)避了比對器在重復(fù)區(qū)域引入的系統(tǒng)誤差。此外, SVScope 還訓(xùn)練了基于局部比對特征的隨機森林模型,對著絲粒、端粒和片段重復(fù)區(qū)域引入的假陽性進行過濾。
![]()
研究團隊在 7 對腫瘤 - 配對永生化正常 細(xì)胞系共 15 組 ONT 和 PacBio HiFi 全基因組測序數(shù)據(jù)中進行了系統(tǒng)評估。結(jié)果顯示, SVScope 的平均 F1-score 顯著優(yōu)于 nanomonsv 、 SAVANA 、 Severus 等現(xiàn)有方法,在 H1437 細(xì)胞系 ONT 數(shù)據(jù)中最高提升達 23.64% 。基于 SVScope 在 HCC1395 細(xì)胞系中的檢測結(jié)果,研究團隊鑒定出 486 個現(xiàn)有金標(biāo)準(zhǔn)數(shù)據(jù)集中未收錄的體細(xì)胞 SV ,并通過 PCR 凝膠電泳結(jié)合單倍型分相讀長可視化,嚴(yán)格驗證并確認(rèn)了 32 個高置信度體細(xì)胞 SV 。
不同于其他體細(xì)胞 SV 檢測算法圍繞讀長比對信息建模、專注于定位體細(xì)胞 SV 位置。 SVScope 算法框架揭示了讀長序列信息建模在提高體細(xì)胞 SV 檢測表現(xiàn)中的作用。同時,得益于局部圖基因組最優(yōu)化策略,該算法框架精準(zhǔn)的讀長來源聚類能力為腫瘤單倍型基因組研究提供了更高精度的分析工具,也為未來整合長讀長單分子測序的甲基化、染色質(zhì)可及性等多維表觀遺傳信息,乃至訓(xùn)練 DNA 大語言模型預(yù)測體細(xì)胞 SV 的功能后果奠定了基礎(chǔ)。 SVScope 及配套可視化工具 ScopeVIZ 已開源發(fā)布于 GitHub ( https://github.com/Goatofmountain/SVScope )。
四川大學(xué) 華西醫(yī)院 助理研究員 ( 現(xiàn)任成都市第三人民醫(yī)院助理研究員 ) 屠凱嶺 和四川大學(xué)博士生 張 琦 琳 是本文的 并列 第一作者。 謝丹 研究員、 黃偉 副教授為該研究論文的共同通訊作者。
原文鏈接:https://link.springer.com/article/10.1186/s13059-026-04076-0
制版人:十一
BioArt
Med
Plants
人才招聘
學(xué)術(shù)合作組織
(*排名不分先后)
![]()
轉(zhuǎn)載須知
【非原創(chuàng)文章】本文著作權(quán)歸文章作者所有,歡迎個人轉(zhuǎn)發(fā)分享,未經(jīng)作者的允許禁止轉(zhuǎn)載,作者擁有所有法定權(quán)利,違者必究。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.