網易首頁 > 網易號 > 正文申請入駐

千萬級 MPRA 數據訓練深度模型，系統性解碼人類啟動子的調控語法

2026-02-10 14:10:11　來源: ScienceAI

河北舉報

分享至

編輯丨&

人類基因表達調控研究中，啟動子（promoter）一直處在一個微妙的位置：它們在功能上至關重要，但在方法上卻長期被「簡化處理」。傳統模型往往依賴表觀組信號（如染色質開放性、組蛋白修飾）來推斷啟動子活性，本質上捕捉的是相關性而非序列層面的因果規則。

這導致一個根本問題始終懸而未決：如果只給 DNA 序列本身，研究者是否真的能預測啟動子的轉錄驅動能力？

來自荷蘭 Oncode 研究所等的研究者們提出了一種名為PARM（Promoter Activity Regression Model）的深度學習框架。該模型在實驗和計算上都很輕量，因此可以生成針對細胞類型和條件的模型，僅憑DNA序列就能可靠預測基因組中的自主啟動子活性。

相關研究內容以「Regulatory grammar in human promoters uncovered by MPRA-based deep learning」為題，于 2026 年 2 月 4 日刊登在《Nature》。

論文鏈接：https://www.nature.com/articles/s41586-025-10093-z

MPRA × 深度學習

PARM 的技術路線并不復雜，但非常「克制」。研究的基礎數據來自大規模MPRA（大規模平行報告基因實驗）：研究團隊系統性地合成并測試了超過 1000 萬條啟動子及其變體序列，在統一實驗條件下測量其轉錄活性。

這些數據的關鍵價值在于兩點：第一，MPRA 將序列與表達輸出直接綁定，天然具有因果屬性；第二，規模足夠大，允許模型學習到超越單一 motif 的高階調控模式。

在模型設計上，PARM 采用的是結構相對簡潔的一維卷積神經網絡（CNN），參數量控制在約 72 萬，遠低于當前主流的基因調控大模型。研究團隊明確強調，他們的目標并非「參數規模競賽」，而是驗證：高質量因果數據是否足以支撐高精度啟動子建模。

圖 1：PARM 原理及驗證。

通過該平臺，數據生成和計算建模的成本都有所降低，這一進展使研究團隊能夠構建十種不同細胞類型中所有人類啟動子的序列到活性模型，并在細胞暴露于多種刺激后進行。

功能與驗證

在多個獨立測試集上，PARM 對啟動子活性的預測與實驗測量結果之間的相關系數最高可達R ≈ 0.9。這一性能并非是訓練集的功勞，而是建立在未見過的天然人類啟動子序列、合成啟動子、含有系統性突變的序列庫之上，該模型在多種場景驗證下，均保持了相當不錯的穩定性。

圖 2：PARM 的單核苷酸功能預測。

團隊主要采用的是基于捕獲的策略，創建了對人類基因組文庫中啟動子重疊片段高度富集（90%）的新 MPRA 文庫。這一思考建立在團隊僅使用啟動子重疊片段的數據來訓練 PARM 的推論之上。

一個文庫包含 400 萬個足夠代表的獨特片段，約比全基因組文庫少 600 倍。后續的所有實驗均采用該文庫作為實驗來源。當應用于 K562 和 HepG2 細胞時，PARM 的啟動子活性和整體預測力均與全基因組 MPRA 數據相當。

當研究者將 PARM 與依賴 ATAC-seq、ChIP-seq 等表觀組輸入的模型進行比較時發現：在啟動子層面，純序列模型已經可以達到相當、甚至更穩定的預測能力。

圖 3：RS的明顯優先定位。

此外，模型還揭示了激活型與抑制型調控元件在空間分布上的系統性差異，這些規律并未完整記錄在現有注釋數據庫中。在此基礎上，研究團隊進一步測試了 PARM 的生成能力。他們利用模型進行序列優化，生成了一批并不存在于人類基因組中的合成啟動子。

去表觀組依賴

PARM 補充了其他深度學習方法，可用于建模增強子元素的語法或設計人工啟動子。它證明了在小型功能基因組數據集上訓練的輕量級模型，是大規模建模工作的可行且強大的替代方案。

未來的優化中，進一步優化聚焦的MPRA庫和深度學習方法論，可能會提升性能。團隊強調，PARM應被視為一種還原主義模型，能夠洞察啟動子的基本特性。這為后續研究留下了一個明確方向——不是一味擴大模型規模，而是思考：哪些生物學層級，真的需要多模態；哪些層級，序列本身已經包含足夠信息？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

滿嘴“基本盤”，不過是“盤中餐”

團結湖參考 2026-05-21 08:05:21
29148 跟貼 29148
海南一兒童吃手撕肉干碎渣掉地上，螞蟻群啃食后短時間內集體死亡，“零食配料中有亞硝酸鈉對螞蟻來說超量”

大象新聞 2026-05-20 20:46:05
691 跟貼 691

桂林一米粉店"本地人7元游客13元" 官方回應來了

看看新聞Knews 2026-05-21 10:55:25
408 跟貼 408

河南一景區現“爬不動了吧哈哈哈哈”標語，游客感覺不被尊重，景區：已撤除，本意是緩解爬山壓力

極目新聞 2026-05-19 14:48:26
11787 跟貼 11787
廣東茂名一段“荔枝在水池中加工”視頻引熱議，網友擔憂是在“浸泡藥水”，專家回應：浸泡冰水是荔枝采后預冷的正常操作，并非化學處理

紅網 2026-05-21 10:40:00
1231 跟貼 1231

剛剛！深圳福田初中生登頂珠穆朗瑪峰，成為中國最年輕登頂者

南方都市報 2026-05-21 07:42:29
951 跟貼 951

利好突襲！剛剛，暴漲20%！34萬億巨頭，大消息

證券時報 2026-05-21 14:52:12
77 跟貼 77
極目調查丨50余畝大蒜歉收疑云：22家農戶使用同款菌肥，最高減產率達94%，經銷商找廠家討說法反被毆

極目新聞 2026-05-21 18:33:42
106 跟貼 106

NBA | 哈騰夾臂扯發引爭議，亞歷山大：他是我們的脊梁

澎湃新聞 2026-05-21 14:36:32
98 跟貼 98
國家電投集團科學技術研究院發布聲明：上海交大處分學生樊同學和該院董事長無親屬關系

現代快報 2026-05-21 14:59:41
32 跟貼 32
女子在高鐵靜音車廂連打20分鐘電話乘客：乘務員一直舉牌勸阻卻被忽視

封面新聞 2026-05-21 12:12:47
0 跟貼 0
張雪回應成德比斯榜一大哥：掏空家底，今天夠給你面子吧

瀟湘晨報 2026-05-21 22:41:14
6 跟貼 6
小學網購45把雨傘全損退貨記者采訪門衛稱領導都不在

大風新聞 2026-05-21 14:18:05
750 跟貼 750
兩部門：禁止直接或間接從菲律賓輸入豬、野豬及其相關產品

新京報 2026-05-21 16:29:13
73 跟貼 73
俄戰機危險攔截英偵察機最近僅6米

新京報 2026-05-21 11:26:04
812 跟貼 812
商務部回應中國采購美國農產品問題

央視新聞客戶端 2026-05-21 15:21:10
58 跟貼 58
以軍攔截“全球堅韌船隊”畫面公布，愛爾蘭總統的妹妹遭以軍扣留，愛爾蘭總統：我很擔心她，全球多地抗議以軍行徑

每日經濟新聞 2026-05-21 11:17:36
9 跟貼 9
滬指跌逾1% 下跌個股近4300只

財聯社 2026-05-21 14:24:07
1443 跟貼 1443
瑞幸咖啡酒精特調上架初中生輕松買到

界面新聞 2026-05-19 22:04:05
357 跟貼 357
再獲國際殊榮！郎朗獲授劍橋大學榮譽院士

現代快報 2026-05-21 11:08:17
183 跟貼 183
涉柳州地震，這些信息是謠言（2026·05·21）

今日辟謠 2026-05-21 18:38:26
80 跟貼 80
暴雨致校車水中拋錨開平巡特警蹚水推車救全車幼童

新快報新聞 2026-05-22 00:16:17
0 跟貼 0
戒手機24小時后，我發現自己被偷走的生活

云朵偷喝奶茶 2026-05-22 00:13:42
0 跟貼 0
那個搞砸保險的丈夫，教會我怎么開口說壞消息

晚風寄溫柔 2026-05-22 00:14:45
0 跟貼 0
河南鄭州一男子買“足金項鏈”給女友送驚喜，誰料女友稱這是k金！男子看發票發現異常，“520”又買了足金手鏈表真心

臺州交通廣播 2026-05-22 00:13:16
0 跟貼 0

汽車要聞

手機 / 數碼

房產 / 家居

千萬級 MPRA 數據訓練深度模型，系統性解碼人類啟動子的調控語法

小米YU7 GT正式發布：售價38.99萬元

叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

叔侄倆將溺亡男子送回家離開 3天后男子被發現已腐爛

常住人口7000的小鎮，擁有了一支德甲球隊

反轉！金秀賢與金賽綸未成年時交往不實

潮水退去，裸泳的一定不止五糧液

專訪雷軍：YU7標準版回歸對特斯拉更有競爭力

態度原創

順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學之約

5歲小女孩來月經，竟是因為這件事情！

高考地理核心題型及“解題密碼”

4799 小米17 Max發布 耳機手環全家桶亮相!

外泌體與干細胞竟是“快遞”與“工廠”的關系？

4799 小米17 Max發布耳機手環全家桶亮相!