網易首頁 > 網易號 > 正文申請入駐

Protenix-v1發布：首個超越AlphaFold 3性能的開源結構預測模型

2026-02-11 17:05:54　來源: ScienceAI

河北舉報

分享至

編輯丨@

在 AlphaFold 3 (AF3) 問世后，盡管開源社區迅速跟進（如 Chai-1, Protenix, Boltz-1 等），但在嚴格對齊訓練數據和模型規模的前提下，開源模型與AF3之間始終存在著「性能鴻溝」。

近日，字節跳動 ByteDance Seed 團隊發布了最新技術報告，推出了 Protenix-v1。這是一項里程碑式的工作：Protenix-v1 是首個在嚴格限制訓練數據截止時間（2021 年 9 月 30 日）、模型參數量和推理預算的情況下，性能達到甚至超越 AlphaFold 3 的完全開源模型。

打破「復刻魔咒」：嚴格對齊下的 SOTA 性能

目前的開源復刻模型往往難以進行公平比較——有的使用了更多的數據，有的使用更多參數。為了證明開源模型與 AF3 之間不存在根本性的技術壁壘，Protenix-v1 采取了極其嚴格的對照實驗設計：

數據截止時間嚴格鎖定在 2021 年 9 月 30 日（與 AF3 一致）；
模型規模與推理預算完全對齊。

在這一「受控條件」下，Protenix-v1 在多個基準測試中表現強勁。

技術報告指出，現有的 FoldBench 基準存在數據覆蓋不全和統計方差大的問題，導致跨模型比較不可靠。Protenix 團隊構建了一個 FoldBench-Corrected 子集，確保所有模型在相同的樣本交集上進行評估。

結果顯示：在 FoldBench 修正集上，Protenix-v1 在蛋白質-蛋白質（Protein-Protein）和抗體-抗原（Ab-Ag）復合物預測上均優于 AlphaFold 3，同時大幅領先于 Chai-1、Boltz-1、Protenix-v0.5.0 等現有的開源模型。

圖示：模型在樣本交集上的評估結果。

關鍵突破：Inference-Time Scaling（推理時擴展）

Protenix-v1 最引人注目的特性之一，是其推理時 Scaling 行為。

在 LLM 領域，Scaling Law 已是共識。而在結構預測領域，AF3 曾展示過通過增加采樣數量（seeds）來提升性能的特性，但此前的開源模型大多未能復現這一能力。

Protenix-v1 成功解鎖了這一技能點。報告數據顯示，隨著采樣預算從基線水平增加到數百個候選樣本，Protenix-v1 的預測準確率呈現出一致的、近似對數線性的提升。

抗體-抗原復合物（Ab-Ag）預測是當下最有挑戰的結構預測問題之一。當使用多個 seeds 進行推理時，Protenix-v1 的 DockQ 成功率從單 seed 的 36.01% 飆升至 42.92%，80 Seeds 時更達到 47.68%。這意味著，用戶獲得了一個可調節的「控制旋鈕」：在計算成本和預測精度之間進行權衡，這對于藥物發現等高價值場景至關重要。

雙版本策略：學術對標 vs 實戰應用

為了解決「學術復刻」與「實際應用」之間的矛盾，Protenix 采取了明智的雙版本發布策略：

Protenix-v1 (標準版本)：

定位：學術基準對齊。
數據截止：和 Alphafold 3 對齊，2021 年 9 月 30 日。
作用：證明模型架構和算法的有效性，確保與 AF3 的公平比較。

Protenix-v1-20250630 (數據擴展版本)：

定位：真實世界應用（如藥物發現）。
數據截止：2025 年 6 月 30 日，包含了最近幾年發布的新結構。
優勢：利用了最新的結構數據（包括 2022-2025 年發布的新靶點），在 PXM-2025H2 等新數據集上表現更佳，特別是在抗體-抗原任務上顯著優于標準版本。

這一策略讓研究人員既能驗證算法，又能直接上手最新的模型處理當前的實際問題。

全面升級的新 feature

除了模型本身，Protenix-v1 還提供了有價值的新 feature：

蛋白質模板（Templates）：采用了類似 AF3 的策略，整合了模板信息，不僅提升了準確率，還使訓練過程中的模型激活更加穩定。
支持RNA MSA：集成了 RNA 多序列比對，顯著提升了 RNA 相關任務的表現。消融實驗顯示，移除 RNA MSA 會導致蛋白質-RNA 接口預測性能下降。

建立更充分、更透明的評估標準：PXMeter

針對當前生物分子結構預測領域基準測試（Benchmark）混亂、數據覆蓋不一致等問題，Protenix 團隊不僅發布了模型，還推出了一套完整的評估工具和數據集——PXMeter。

團隊構建了按年份劃分的測試集PXM-2024和PXM-2025，可以用于評測模型在不同年度數據的表現。針對數據稀疏的抗體、小分子任務，構建了橫跨 4 年的評測集PXM-22to25-AntibodyandPXM-22to25-Ligand。在這些更全面、數據量更大的測試集上，Protenix-v1 均展現出了優于 Chai-1 和 Boltz-1 的 SOTA 性能。

更多探索：Protenix-Mini 系列的「輕量級」突圍

在追求極致精度的同時，Protenix 團隊并沒有忽視高通量場景的需求。他們之前發布的技術報告中還披露了在輕量化模型上的探索——Protenix-Mini和Protenix-Mini+。

針對需要極高推理速度的場景，Protenix-Mini 系列進行了大膽的架構瘦身：

極致輕量：通過精簡模型結構和引入Linear Attention（線性注意力機制），大幅降低了計算復雜度。
極速推理：在保持一定精度的前提下，實現了推理速度的質變，特別適合大規模篩選任務。
單序列推理：使用蛋白質語言模型替代 MSA 特征，避免了 MSA 搜索引入的巨大時間開銷。
設計領域的「篩選器」：在蛋白質結合體（Binder）設計的驗證中，Protenix-Mini 系列展現出了不俗的篩選能力（Filtering Capability）。

報告中的 Filter Results 顯示，Protenix-Mini 系列在區分「結合」與「不結合」設計時的 AUC 分數甚至優于部分大模型。這意味著在 binder 設計篩選環節，研究人員可以利用 Mini 版本快速過濾海量候選序列，再用 Protenix-v1 進行精細驗證，打出一套高效的「組合拳」。

總結

Protenix-v1 的發布，標志著開源生物分子結構預測模型正式進入了「后 AlphaFold 3 時代」。它不僅是首個在嚴格限制條件下性能對標 AF3 的開源模型，更關鍵的是，它成功將 AF3 核心的「推理時 Scaling」能力帶入了開源世界，為結構預測開源領域填補了最后一塊拼圖。

對于致力于 AI for Science、特別是大分子藥物設計的社區來說，Protenix-v1 提供了一個強大、透明且實用的新基座。

相關鏈接：https://www.biorxiv.org/content/10.64898/2026.02.05.703733v1

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.