![]()
編輯丨@
在 AlphaFold 3 (AF3) 問世后,盡管開源社區迅速跟進(如 Chai-1, Protenix, Boltz-1 等),但在嚴格對齊訓練數據和模型規模的前提下,開源模型與AF3之間始終存在著「性能鴻溝」。
近日,字節跳動 ByteDance Seed 團隊發布了最新技術報告,推出了 Protenix-v1。這是一項里程碑式的工作:Protenix-v1 是首個在嚴格限制訓練數據截止時間(2021 年 9 月 30 日)、模型參數量和推理預算的情況下,性能達到甚至超越 AlphaFold 3 的完全開源模型 。
打破「復刻魔咒」:嚴格對齊下的 SOTA 性能
目前的開源復刻模型往往難以進行公平比較——有的使用了更多的數據,有的使用更多參數。為了證明開源模型與 AF3 之間不存在根本性的技術壁壘,Protenix-v1 采取了極其嚴格的對照實驗設計:
- 數據截止時間嚴格鎖定在 2021 年 9 月 30 日(與 AF3 一致);
- 模型規模與推理預算完全對齊。
在這一「受控條件」下,Protenix-v1 在多個基準測試中表現強勁。
技術報告指出,現有的 FoldBench 基準存在數據覆蓋不全和統計方差大的問題,導致跨模型比較不可靠 。Protenix 團隊構建了一個 FoldBench-Corrected 子集,確保所有模型在相同的樣本交集上進行評估。
結果顯示: 在 FoldBench 修正集上,Protenix-v1 在蛋白質-蛋白質(Protein-Protein)和抗體-抗原(Ab-Ag)復合物預測上均優于 AlphaFold 3,同時大幅領先于 Chai-1、Boltz-1、Protenix-v0.5.0 等現有的開源模型 。
![]()
圖示:模型在樣本交集上的評估結果。
關鍵突破:Inference-Time Scaling(推理時擴展)
Protenix-v1 最引人注目的特性之一,是其推理時 Scaling 行為。
在 LLM 領域,Scaling Law 已是共識。而在結構預測領域,AF3 曾展示過通過增加采樣數量(seeds)來提升性能的特性,但此前的開源模型大多未能復現這一能力。
Protenix-v1 成功解鎖了這一技能點。報告數據顯示,隨著采樣預算從基線水平增加到數百個候選樣本,Protenix-v1 的預測準確率呈現出一致的、近似對數線性的提升。
抗體-抗原復合物(Ab-Ag)預測是當下最有挑戰的結構預測問題之一。當使用多個 seeds 進行推理時,Protenix-v1 的 DockQ 成功率從單 seed 的 36.01% 飆升至 42.92%,80 Seeds 時更達到 47.68%。這意味著,用戶獲得了一個可調節的「控制旋鈕」:在計算成本和預測精度之間進行權衡,這對于藥物發現等高價值場景至關重要。
![]()
雙版本策略:學術對標 vs 實戰應用
為了解決「學術復刻」與「實際應用」之間的矛盾,Protenix 采取了明智的雙版本發布策略 :
- Protenix-v1 (標準版本):
- 定位:學術基準對齊。
- 數據截止:和 Alphafold 3 對齊,2021 年 9 月 30 日。
- 作用:證明模型架構和算法的有效性,確保與 AF3 的公平比較。
- Protenix-v1-20250630 (數據擴展版本):
- 定位:真實世界應用(如藥物發現)。
- 數據截止:2025 年 6 月 30 日,包含了最近幾年發布的新結構。
- 優勢:利用了最新的結構數據(包括 2022-2025 年發布的新靶點),在 PXM-2025H2 等新數據集上表現更佳,特別是在抗體-抗原任務上顯著優于標準版本 。
這一策略讓研究人員既能驗證算法,又能直接上手最新的模型處理當前的實際問題。
全面升級的新 feature
除了模型本身,Protenix-v1 還提供了有價值的新 feature:
- 蛋白質模板(Templates):采用了類似 AF3 的策略,整合了模板信息,不僅提升了準確率,還使訓練過程中的模型激活更加穩定。
- 支持RNA MSA:集成了 RNA 多序列比對,顯著提升了 RNA 相關任務的表現。消融實驗顯示,移除 RNA MSA 會導致蛋白質-RNA 接口預測性能下降。
建立更充分、更透明的評估標準:PXMeter
針對當前生物分子結構預測領域基準測試(Benchmark)混亂、數據覆蓋不一致等問題,Protenix 團隊不僅發布了模型,還推出了一套完整的評估工具和數據集——PXMeter。
團隊構建了按年份劃分的測試集PXM-2024和PXM-2025,可以用于評測模型在不同年度數據的表現。針對數據稀疏的抗體、小分子任務,構建了橫跨 4 年的評測集PXM-22to25-AntibodyandPXM-22to25-Ligand。在這些更全面、數據量更大的測試集上,Protenix-v1 均展現出了優于 Chai-1 和 Boltz-1 的 SOTA 性能。
更多探索:Protenix-Mini 系列的「輕量級」突圍
在追求極致精度的同時,Protenix 團隊并沒有忽視高通量場景的需求。他們之前發布的技術報告中還披露了在輕量化模型上的探索——Protenix-Mini和Protenix-Mini+。
針對需要極高推理速度的場景,Protenix-Mini 系列進行了大膽的架構瘦身:
- 極致輕量:通過精簡模型結構和引入Linear Attention(線性注意力機制),大幅降低了計算復雜度。
- 極速推理:在保持一定精度的前提下,實現了推理速度的質變,特別適合大規模篩選任務。
- 單序列推理:使用蛋白質語言模型替代 MSA 特征,避免了 MSA 搜索引入的巨大時間開銷。
- 設計領域的「篩選器」:在蛋白質結合體(Binder)設計的驗證中,Protenix-Mini 系列展現出了不俗的篩選能力(Filtering Capability)。
報告中的 Filter Results 顯示,Protenix-Mini 系列在區分「結合」與「不結合」設計時的 AUC 分數甚至優于部分大模型 。這意味著在 binder 設計篩選環節,研究人員可以利用 Mini 版本快速過濾海量候選序列,再用 Protenix-v1 進行精細驗證,打出一套高效的「組合拳」。
總結
Protenix-v1 的發布,標志著開源生物分子結構預測模型正式進入了「后 AlphaFold 3 時代」。它不僅是首個在嚴格限制條件下性能對標 AF3 的開源模型,更關鍵的是,它成功將 AF3 核心的「推理時 Scaling」能力帶入了開源世界,為結構預測開源領域填補了最后一塊拼圖。
對于致力于 AI for Science、特別是大分子藥物設計的社區來說,Protenix-v1 提供了一個強大、透明且實用的新基座。
相關鏈接:https://www.biorxiv.org/content/10.64898/2026.02.05.703733v1
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.