![]()
撰文丨王聰
編輯丨王多魚
排版丨水成文
眾所周知,細胞利用 20 種標準氨基酸來構建蛋白質,這是當今地球上所有生命共有的保守特性。盡管翻譯后修飾和非標準氨基酸的擴展可以增加構建蛋白質的氨基酸種類,但目前尚未發現任何已知的自由生活生物使用少于 20 種氨基酸“字母表”。
這引發了一個根本性問題:能否用簡化的氨基酸“字母表”創建出一個可行的細胞?創建這樣的細胞能夠闡明塑造早期進化的關鍵生化限制,并使由更簡單成分構成的合成生命成為可能。
2026 年 5 月 1 日,哥倫比亞大學Harris H. Wang團隊(Liu Liyuan等人為論文第一作者)在國際頂尖學術期刊Science上發表了題為:Toward life with a 19–amino acid alphabet through generative artificial intelligence design 的研究論文。
該研究利用生成式人工智能,系統性替換了大腸桿菌核糖體中的所有 382 個異亮氨酸(Ile),并將 21 個重新設計的不含異亮氨酸的核糖體亞基整合到了大腸桿菌基因組中,從而生成了一個可行且在進化上穩定的細胞——Ec19。這項研究為自早期進化以來創建首個 19 種氨基酸的生物體提供了路線圖。
研究團隊表示,這項研究為設計出具備超越自然界細胞能力的細胞提供了藍圖,同時也暗示了進化早期生命依賴更有限的構建模塊。
![]()
長期以來,科學家們一直試圖重寫生命的遺傳密碼,既為了拓展細胞的功能,也為了探究生命的基本法則。例如,科學家們通過去除那些與其它序列編碼相同氨基酸的序列來精簡 DNA。但都未曾對“標準”的 20 種氨基酸進行改動,原因在于,改變蛋白質的氨基酸序列就如同修改精密儀器的核心部件——即使微小的變動,也極有可能導致其整體功能喪失。
實際上,已有證據支持生命有可能由更簡化的氨基酸“字母表”構成,幾種標準氨基酸具有相似的生化特性,它們可能在功能上存在冗余。例如,全局進化序列分析表明,異亮氨酸(Ile)是保守性最低的氨基酸之一,常常被功能相似的纈氨酸(Val)所替代。此外,計算蛋白質建模也表明,原則上僅用 9-12 種氨基酸就可能實現所有蛋白質折疊。
從構成蛋白質的氨基酸“字母表”中去掉一個“字母”的挑戰吸引了Harris H. Wang的注意,最初,他將大腸桿菌中的 39 種必需或高表達的蛋白質中的所有異亮氨酸替換為大小和形狀略有不同的纈氨酸或亮氨酸,但結果表明,只有約 43% 的替換后的蛋白質仍能在大腸桿菌中發揮功能,這表明簡單的全局氨基酸替換方案是不夠的。
最初不成功的嘗試讓Harris H. Wang把這個項目擱置了好幾年。直到新一代的人工智能(AI)工具的出現,例如AlphaFold2能夠預測蛋白質三維結構,而各種蛋白質語言模型能夠從頭設計出與天然序列有很大差異但仍具功能的全新蛋白質。這些 AI 工具或許能夠幫助找到使用哪些氨基酸來替代異亮氨酸,同時又不會影響蛋白質性能。
接下來,研究團隊使用最先進的蛋白質結構預測模型和蛋白質設計模型來提出異亮氨酸替代方案。研究團隊部署了基于序列的語言模型(ESM2和MSA Transformer)以及基于結構的模型(ProteinMPNN和AlphaFold2)來生成從頭設計的不含異亮氨酸的蛋白質變體,這些變體能夠保持結構和功能。
不過,對大腸桿菌的 4000 多種蛋白質進行重新設計,顯然是一項過于艱巨的任務。于是,研究團隊選擇了更具針對性但依然雄心勃勃的目標——核糖體。核糖體是由 50 多種蛋白質和具有催化作用的 RNA 組成的復合體,其在細胞中發揮著核心作用——將遺傳指令轉化為蛋白質,是細胞的蛋白質合成機器。如果這樣一個系統能夠在沒有異亮氨酸的情況下運行,那么同樣的方法或許也能應用于其他蛋白質組。
因此,研究團隊專注于重新設計構成大腸桿菌核糖體的 52 種核糖體蛋白(其中 50 種含有異亮氨酸),通過迭代設計-構建-測試(DBT)框架,研究團隊證明了在每種核糖體蛋白中成功重新設計并替換所有 382 個異亮氨酸,同時與野生型相比,保持相對細胞適應性在 90% 以上。值得一提的是,對異亮氨酸的替換的同時,需要進行必要的補償性突變,因為單純替換異亮氨酸可能會導致蛋白質局部結構失衡或功能缺陷,這就需要對異亮氨酸附近或遠處有結構關聯的其他氨基酸進行協同修改,以穩定結構和功能。這些由 AI 提出的補償性突變,往往是人類設計者難以憑經驗和直覺想到的。這也意味著著這項研究并非簡單的氨基酸替換,而是整個蛋白質序列的協同重新設計。
然后,研究團隊將 21 個不含異亮氨酸的核糖體亞基整合到大腸桿菌的單個基因組位點中以支持細胞生長。這種 Ec19 大腸桿菌菌株在實驗室連續傳代超過 450 代后,基因組仍保持穩定,全基因組測序未發現異亮氨酸回復突變。
![]()
這是自地球上所有現存生命的最后一個共同祖先(LUCA)確立 20 種標準氨基酸的“通用語言”以來,人類首次成功、穩定地簡化了這套基礎語法。這不是修改一個“字母”,而是永久性地從字母表中剔除一個“字母”,并讓生命體在新的語法規則下穩定運行。
這項研究不僅證明了一個深刻的生物學原理(生命的氨基酸“字母表”具有可塑性),更展示了一套強大的技術工具包,它標志著合成生物學從“模仿和修飾自然”邁向了“按工程學原理重新編碼生命基礎”的新階段,為創造具有定制化功能的下一代合成生物體鋪平了道路。
論文鏈接:
https://www.science.org/doi/10.1126/science.aeb5171
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.