![]()
如果生物學(xué)不再只是我們研究的對(duì)象,而是成為我們主動(dòng)設(shè)計(jì)的材料,會(huì)怎樣?這正是Adrian Woolfson新書《物種的未來:借助人工生物智能創(chuàng)作生命》的核心命題。該書于4月28日由MIT出版社出版。他認(rèn)為,AI與DNA合成技術(shù)的進(jìn)步正在推動(dòng)生物學(xué)走向一種工程化范式——科學(xué)家可以生成全新的基因序列,并最終按需構(gòu)建生命體。他將這種新興能力稱為"人工生物智能"(ABI),這是一個(gè)涵蓋設(shè)計(jì)、構(gòu)建并最終"啟動(dòng)"生命體的系統(tǒng)的統(tǒng)稱。
然而,這一愿景面臨一個(gè)根本性難題:進(jìn)化并沒有產(chǎn)生整潔、模塊化的系統(tǒng),而是經(jīng)過數(shù)十億年的漸進(jìn)變化,塑造出功能相互交疊、結(jié)構(gòu)混亂的基因組,與工程師所依賴的清晰架構(gòu)相去甚遠(yuǎn)。部分合成生物學(xué)研究者已嘗試對(duì)遺傳密碼進(jìn)行"重構(gòu)"——就像工程師重組計(jì)算機(jī)代碼一樣,對(duì)基因組進(jìn)行重新整理,使其更易于理解和操控。但這種方法能走多遠(yuǎn)?要讓生物學(xué)變得足夠可預(yù)測(cè)以供工程化應(yīng)用,又需要什么條件?在與IEEE Spectrum的對(duì)話中,Woolfson闡述了設(shè)計(jì)生命的前景與局限。
您將基因組描述為進(jìn)化產(chǎn)生的"意大利面條代碼"。是什么讓生物學(xué)天然與傳統(tǒng)工程原則格格不入?
Adrian Woolfson:在人造機(jī)器中,各組件通常是相互獨(dú)立的,每個(gè)組件都有預(yù)定功能。一旦某個(gè)組件損壞,你可以直接替換,或在某些情況下修復(fù)它。但遺憾的是,生物學(xué)并非如此。生物學(xué)涉及的是一個(gè)具有涌現(xiàn)行為的復(fù)雜網(wǎng)絡(luò),這些行為建立在無數(shù)組件的微小貢獻(xiàn)之上。
生物系統(tǒng)需要具備魯棒性,能夠高效應(yīng)對(duì)損傷,而且它始終必須在已有架構(gòu)的基礎(chǔ)上繼續(xù)構(gòu)建,永遠(yuǎn)無法從頭重新發(fā)明。生物機(jī)器是歷史積淀與當(dāng)前設(shè)計(jì)的復(fù)雜交織,其中包含許多工程師看來荒謬的設(shè)計(jì)組件。如果你從工程學(xué)角度審視人類基因組,你會(huì)說:"天哪,這簡(jiǎn)直是一團(tuán)亂麻。"因?yàn)樗且詸C(jī)會(huì)主義、漸進(jìn)式的方式構(gòu)建起來的,沒有任何預(yù)見性或主動(dòng)設(shè)計(jì)。
合成生物學(xué)家如何改進(jìn)這套"代碼"?研究人員是如何對(duì)基因組進(jìn)行重構(gòu)的?
Woolfson:Drew Endy是這一領(lǐng)域的先驅(qū)。他以一種噬菌體為對(duì)象,提出:"如果我們把它當(dāng)作一段意大利面條代碼,對(duì)其進(jìn)行清理、重構(gòu),重新整理成更易用的形式,會(huì)怎樣?"遺憾的是,他提出這個(gè)想法的時(shí)候,相關(guān)技術(shù)還遠(yuǎn)未成熟,無法輕松實(shí)現(xiàn)。但他開創(chuàng)了將計(jì)算機(jī)代碼思維應(yīng)用于基因組的先河,提出了基因組可以被重構(gòu)的理念。基因組已經(jīng)大約四十億年沒有經(jīng)過重構(gòu)了——想象一下,如果有一段計(jì)算機(jī)代碼四十億年都沒有被重構(gòu)過,會(huì)是什么狀態(tài)。
這項(xiàng)工作目前進(jìn)展如何?
Woolfson:最好的例子可能是由Jef Boeke在紐約主導(dǎo)的合成酵母基因組項(xiàng)目Sc2.0。這個(gè)項(xiàng)目歷時(shí)約15年,他一直在將各條合成染色體逐步組裝進(jìn)同一個(gè)生命體中。他所做的不僅僅是重構(gòu),更是真正意義上的重新設(shè)計(jì)。例如,酵母菌有16條染色體,而他構(gòu)建了一條全新的第17條合成染色體。在另一項(xiàng)獨(dú)立研究中,他還證明可以將這16條染色體合并為兩條超大染色體,這是對(duì)遺傳物質(zhì)存儲(chǔ)方式的重大重組。
但當(dāng)你開始對(duì)這些基因組進(jìn)行改動(dòng)和重新配置時(shí),不可避免地會(huì)引入代碼錯(cuò)誤,而這些錯(cuò)誤往往會(huì)損害功能和生長。這并不意味著重新設(shè)計(jì)必然會(huì)造成生長障礙,只是需要投入時(shí)間去找到最優(yōu)方案。當(dāng)然,Boeke起步時(shí)AI還不存在,而AI的出現(xiàn)讓這一切變得容易得多。AI將對(duì)我們把DNA轉(zhuǎn)化為可預(yù)測(cè)工程材料的能力產(chǎn)生深遠(yuǎn)影響。
說到AI,您提出了"人工生物智能"(ABI)這一概念。AI將賦予我們哪些目前尚不具備的能力?
Woolfson:在AI出現(xiàn)之前,我們沒有能力大規(guī)模設(shè)計(jì)DNA,無法憑空創(chuàng)造出能在生命體層面執(zhí)行功能的全新DNA序列。現(xiàn)在,我們有了所謂的基因組語言模型,它有點(diǎn)像我們用來處理文本的聊天機(jī)器人,但操作的不是英文字母表的26個(gè)字母,而是DNA語言的4個(gè)堿基字母。
在操控DNA語言時(shí),我們需要非常寬的上下文窗口,因?yàn)榕c文本不同——文本的大部分含義集中在句子或段落中——DNA中相距遙遠(yuǎn)的區(qū)域之間也可以相互"對(duì)話"。因此,我們需要能夠識(shí)別這種遠(yuǎn)程作用關(guān)系的AI。以基因組語言模型Evo 2為例,它采用的架構(gòu)擁有一百萬個(gè)堿基對(duì)的上下文窗口,這意味著它能夠識(shí)別相距一百萬個(gè)堿基的堿基對(duì)之間的相互作用。
設(shè)計(jì)代碼只是成功的一半。研究人員如何解決大規(guī)模物理合成DNA的瓶頸問題?
Woolfson:另一個(gè)過去所缺乏的關(guān)鍵能力,是以低成本、高速度、高效率大規(guī)模合成任意復(fù)雜度DNA的能力。當(dāng)設(shè)計(jì)與構(gòu)建這兩種能力結(jié)合在一起,你就成為了一名工程師。一項(xiàng)名為Sidewinder的技術(shù)實(shí)現(xiàn)了成本的大幅降低,它能夠以高度并行的方式構(gòu)建DNA,從而極大地降低了DNA合成的成本,并提升了可擴(kuò)展性。僅憑這一點(diǎn),就使得將DNA作為工程材料的設(shè)想變得更加可行。
完成DNA的設(shè)計(jì)與合成之后,如何"啟動(dòng)"一個(gè)活的生命體?
Woolfson:這可能是最困難的部分。因?yàn)槟壳拔覀兺耆恢廊绾螛?gòu)建一個(gè)人工細(xì)胞。Craig Venter曾證明,可以破壞細(xì)菌中的基因組并植入一個(gè)新的基因組——換句話說,細(xì)胞的行為類似于一臺(tái)納米計(jì)算機(jī),而基因組則類似于軟件。但將基因組導(dǎo)入細(xì)胞并非易事。
ABI這一概念涵蓋了設(shè)計(jì)能力和構(gòu)建能力,同時(shí)也包括將其啟動(dòng)為活體生命的能力。如果你同時(shí)具備這三種能力,你就完全掌握了作為技術(shù)的生物學(xué)。到那時(shí),DNA將成為一種可編程材料,可以以可預(yù)測(cè)的方式加以操控。
如果研究人員真正掌握了這種能力,將會(huì)實(shí)現(xiàn)什么?
Woolfson:我的預(yù)測(cè)是,在未來50年內(nèi),生物學(xué)將成為首選的工程材料,許多讀到這篇文章的人將成為生物工程師。生物學(xué)能夠?qū)崿F(xiàn)大多數(shù)材料所具備的功能,例如蜘蛛絲的抗拉強(qiáng)度堪比鋼鐵。當(dāng)我們用AI對(duì)其進(jìn)行重新設(shè)計(jì)后,其抗拉強(qiáng)度或許能達(dá)到鋼鐵的五倍。而且生物學(xué)還有一個(gè)額外優(yōu)勢(shì)——它能夠生成智能材料。試想,如果你能擁有一種智能形態(tài)的鋼鐵,工程師將如何在建筑中加以應(yīng)用?
從零開始設(shè)計(jì)一個(gè)功能性多細(xì)胞生命體,最難突破的技術(shù)瓶頸是什么?
Woolfson:我認(rèn)為是我們對(duì)"生命語法"的認(rèn)知還遠(yuǎn)遠(yuǎn)不夠。AI恰好是解析這些語法規(guī)則的利器,它能夠分析海量數(shù)據(jù)庫,從中識(shí)別規(guī)律。在我們能夠更流利地"說"DNA語言之前,我們無法設(shè)計(jì)出復(fù)雜的多細(xì)胞生命體;而要做到這一點(diǎn),我們需要理解其語法;要理解語法,我們需要挖掘更復(fù)雜、更細(xì)致的數(shù)據(jù)庫。我們需要成為"語法獵人"。每當(dāng)我們讓一個(gè)物種滅絕,就是在銷毀這本語法書中的一頁。我們需要將所有信息匯聚成一本完整的語法書。
最后,在踏上工程化生命這段旅程之初,現(xiàn)實(shí)中可能出現(xiàn)哪些失敗模式?
Woolfson:我可以從兩個(gè)角度來理解"失敗模式"。一是機(jī)械性失敗:當(dāng)你剝離掉所有這些非正交性時(shí),系統(tǒng)會(huì)變得脆弱,因?yàn)樯餀C(jī)器本是為了不失敗而設(shè)計(jì)的,內(nèi)置了大量相互重疊的故障保護(hù)機(jī)制。
另一種失敗方式是變得危險(xiǎn)。我們對(duì)生態(tài)系統(tǒng)的理解還遠(yuǎn)遠(yuǎn)不夠,它們極難進(jìn)行計(jì)算模擬。如果我們將工程化生命體釋放到復(fù)雜的生態(tài)系統(tǒng)中,可能會(huì)造成嚴(yán)重破壞。而且,這些技術(shù)本身一旦落入錯(cuò)誤的手中,就具有內(nèi)在的危險(xiǎn)性。因此,我們需要學(xué)會(huì)以安全、負(fù)責(zé)任、合乎倫理、透明且公平的方式使用它們,使其真正造福社會(huì)。
Q&A
Q1:什么是人工生物智能(ABI)?它和普通AI有什么區(qū)別?
A:人工生物智能(ABI)是Adrian Woolfson提出的概念,指能夠設(shè)計(jì)、構(gòu)建并最終"啟動(dòng)"活體生命的系統(tǒng)。與通用AI不同,ABI專門針對(duì)生物學(xué)領(lǐng)域,結(jié)合了基因組語言模型、大規(guī)模DNA合成技術(shù)以及將基因組導(dǎo)入細(xì)胞的能力。普通AI處理文本或圖像,而ABI操控的是DNA的四個(gè)堿基字母,目標(biāo)是讓生物學(xué)成為像軟件一樣可編程的工程材料。
Q2:合成酵母基因組項(xiàng)目Sc2.0取得了哪些成果?
A:Sc2.0由Jef Boeke在紐約主導(dǎo),歷時(shí)約15年。項(xiàng)目不僅對(duì)酵母基因組進(jìn)行了重構(gòu),更實(shí)現(xiàn)了真正意義上的重新設(shè)計(jì):在原有16條染色體的基礎(chǔ)上,構(gòu)建了全新的第17條合成染色體;另一項(xiàng)研究還證明可以將16條染色體合并為兩條超大染色體,實(shí)現(xiàn)了遺傳物質(zhì)存儲(chǔ)方式的重大重組。但重新配置基因組不可避免地會(huì)引入錯(cuò)誤,影響功能和生長,需要持續(xù)優(yōu)化。
Q3:基因組語言模型Evo 2有什么特別之處?
A:Evo 2是一種專門處理DNA序列的AI模型,其最大特點(diǎn)是擁有一百萬個(gè)堿基對(duì)的超大上下文窗口。這一設(shè)計(jì)至關(guān)重要,因?yàn)镈NA中相距遙遠(yuǎn)的區(qū)域之間也存在相互作用,普通的小上下文窗口無法捕捉這種遠(yuǎn)程調(diào)控關(guān)系。Evo 2能夠識(shí)別相距一百萬個(gè)堿基的堿基對(duì)之間的相互作用,為大規(guī)模基因組設(shè)計(jì)提供了關(guān)鍵的技術(shù)支撐。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.