![]()
編譯丨王聰
編輯丨王多魚
排版丨水成文
自然界中的蛋白質執行著令人眼花繚亂的多種功能,這些功能是生物體非凡能力的基礎。例如,蛋白質介導 DNA 和 RNA 的模板定向合成,參與光合作用中將太陽能轉化為化學鍵能的過程,以及多細胞生物中復雜的細胞間相互作用和信號級聯反應。
天然蛋白質的復雜功能是在數億年的自然選擇中進化而來的,以解決生物進化過程中至關重要的問題。然而,人類如今面臨著新的問題:我們的壽命更長了,老齡化也隨之而來,因此癌癥和阿爾茨海默病等疾病已成為重大挑戰,而且我們正在讓全球變暖并造成污染。
自然界中蛋白質的顯著功能性和多樣性表明,新型蛋白質可能為許多此類問題提供解決方案,而且這些新型蛋白質可能在數百萬年的進化和自然選擇中產生,但我們沒有這么多時間等待,因此人們對生成具有新功能的蛋白質產生了極大興趣。
近日,諾貝爾化學獎得主、蛋白質設計先驅David Baker教授作為通訊作者(楊為、王順智等為共同第一作者),在國際頂尖學術期刊Nature上發表了題為:The past, present and future of de novo protein design 的綜述論文。楊為博士已全職加入深圳醫學科學院,任特聘研究員,成立蛋白質藥物設計課題組。
該綜述論文描述了從頭蛋白質設計(de novo protein design)的當前狀態。盡管在成功率和活動方面仍有改進的空間,但設計新型蛋白質結構、組裝體和蛋白質結合劑這一長期存在的難題已接近解決。這些領域當前的關鍵問題不是如何設計,而是設計什么,開源設計方法如 RFdiffusion 和 ProteinMPNN 以及蛋白質結構預測工具使生物化學家和分子生物學家能夠廣泛探索可能的應用。在從頭設計小分子靶點結合劑、酶和多態蛋白質系統方面也取得了相當大的進展。方法開發目前面臨的挑戰包括設計用于克服高能壘反應的催化劑,以及更廣泛地說,設計將結合、構象變化和催化整合在一起的開關和納米機器。在接下來的 5-10 年里,預計會設計出復雜的蛋白質納米機器和材料,其功能遠遠超出自然進化所產生的功能,應用于醫學、技術和可持續性等廣泛領域。
![]()
在這篇綜述論文中,David Baker團隊為我們展望了一個激動人心的新時代——未來十年內,蛋白質從頭設計將解決人類面臨的重大難題,并在醫學、可持續發展和生物技術領域發展成為一項基礎性工具。我們可以利用這些工具設計出可能成為攻克癌癥、阿爾茨海默病的利器,制造出高效環保的工業催化劑,甚至能組裝成微小的“納米機器”,執行特定的任務。
什么是蛋白質從頭設計?
蛋白質是生命的核心執行者。從催化化學反應、傳遞信號到構成細胞結構,幾乎所有的生命活動都離不開蛋白質。自然界的蛋白質是億萬年進化的結果,但人類面臨的新挑戰——例如老齡化帶來的疾病、環境污染和氣候變化——需要新的解決方案,而我們沒有數百萬年的時間去等待自然進化。
蛋白質從頭設計(de novo protein design),顧名思義,就是完全從零開始,設計出具有全新結構和功能的蛋白質,而不是改造現有的天然蛋白質。這就像不是修改現有的汽車,而是從畫圖紙開始,設計一輛前所未有的概念車。
方法論革命:從物理模型到生成式 AI
該綜述指出,蛋白質設計領域正經歷一場深刻的范式轉變。
過去(1990 年代-2020 年):基于物理的“計算”時代
早期的計算蛋白質設計,基于“安芬森法則”(Anfinsen's dogma)——蛋白質的折疊狀態是其序列的全局自由能最低狀態。David Baker團隊開發了 Rosetta 軟件,通過復雜的物理化學力場計算,嘗試尋找能折疊成目標結構的氨基酸序列。這個過程就像在巨大的可能性海洋中,用數學公式去“猜”哪個序列最穩定。雖然成功設計出了像 Top7 這樣的全新折疊蛋白質,證明了概念的可行性,但整個過程耗時耗力,成功率有限。
現在(2020 年至今):基于 AI 的“生成”時代
深度學習徹底改變了游戲規則。AlphaFold、RoseTTAFold 等 AI 工具的出現,實現了從蛋白質的氨基酸序列高精度預測其 3D 結構,這為 AI 方法提供了強大的訓練數據。
新一代的蛋白質設計方法,借鑒了圖像生成 AI 模型(例如 DALL·E)的思路。以 RFdiffusion 為例,它就像一位蛋白質“畫家”:研究人員先給模型“看”大量已知的蛋白質結構(來自蛋白質數據庫 PDB),訓練它學會如何從一團“噪聲”中逐步還原出一個合理的蛋白質結構。訓練完成后,只需從隨機噪聲開始,讓模型反復“去噪”,就能生成全新的、合理的蛋白質骨架。這個過程可以受“條件”引導,例如,在去噪過程中始終呈現一個小分子藥物的形狀,模型就會生成一個能結合該藥物的蛋白質口袋。
與此同時,像 ProteinMPNN 這樣的工具,則專門負責為設計好的蛋白質骨架“填充”最優的氨基酸序列,確保其能穩定折疊。
“生成骨架”+“設計序列”+“結構驗證”,這套組合拳使得蛋白質設計變得前所未有的高效和可控。
我們已經能設計什么?
該綜述論文系統梳理了蛋白質從頭設計已經攻克的幾大挑戰,基本是按照從易到難的順序實現的:
1、全新的蛋白質結構(單體折疊):這是基礎。現在,設計一個自然界不存在的、穩定折疊的蛋白質單體,已接近成為“已解決的問題”。科學家們設計出了各種新穎的螺旋、折疊桶等結構。
2、復雜的蛋白質組裝體:讓多個蛋白質像樂高積木一樣,自動組裝成預設的對稱結構(例如二十面體納米籠)。這帶來了革命性的應用——全球首款完全從頭設計的藥物“SKYCovione”新冠疫苗正是基于此技術(于 2022 年在韓國獲批上市)。該技術正在被用于開發通用流感疫苗等。
3、蛋白質結合劑:設計能精準結合特定靶點蛋白的“分子膠水”。這為開發新一代的靶向療法(例如針對癌癥、自身免疫疾病的藥物)提供了全新工具。
4、小分子結合劑與酶:設計能結合特定小分子(例如激素、藥物)的蛋白質,甚至是從頭設計具有催化功能的酶。目前已經成功設計出具有催化活性的水解酶、熒光素酶等,盡管其效率與天然酶還有差距。
5、多狀態功能系統:這是當前的前沿領域,旨在設計能像機器一樣“工作”的蛋白質系統。例如,設計一種“邏輯門”蛋白質,只在同時存在兩種信號時才被激活;或設計一種“籠狀”藥物,只有在腫瘤微環境中才釋放活性成分。
![]()
蛋白質設計的挑戰及蛋白質折疊與組裝的設計
![]()
蛋白質靶點的結合設計
![]()
小分子結合劑和酶的設計
![]()
具有新功能的蛋白質的設計
未來的挑戰
蛋白質從頭設計領域已成就斐然,但真正的“硬骨頭”還在前面。該綜述論文指出了幾個核心挑戰——
設計高能壘反應的催化劑:目前設計的酶大多催化相對簡單的反應,設計能高效催化復雜、高能量障礙反應的酶(類似自然界最頂尖的酶),仍是巨大挑戰。
設計整合多種功能的“納米機器”:未來的蛋白質不應只是靜態結構或單一功能分子,而應是將結合、構象變化、催化、運動等功能集成一體的智能機器。比如,能感知環境并行走的“分子機器人”,或能按序執行多步化學反應的“分子流水線”。
展望:未來五到十年
最后,David Baker團隊預測,在未來五到十年,我們將看到——
1、功能遠超自然進化范圍的復雜蛋白質納米機器和材料被設計出來。
2、開源的設計方法(例如 RFdiffusion、ProteinMPNN)將像今天的編程工具一樣,被廣大生物學家和化學家使用,極大地拓展應用探索的邊界。
3、這些技術將在醫學(精準療法、疫苗、診斷)、技術(新材料、生物傳感器)和可持續發展(綠色化學、碳捕獲)等領域帶來顛覆性應用。
蛋白質從頭設計,正從一門高深莫測的科學,轉變為一種強大的工程學。AI 的加入,讓我們從費力地“計算”可能性,轉向高效地“生成”解決方案。我們正在從一個觀察和利用自然的時代,邁入一個設計和創造自然的時代。這不僅是生物技術的飛躍,更將重新定義我們解決健康、環境、能源等全球性問題的能力。
論文鏈接:
https://www.nature.com/articles/s41586-026-10328-7
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.