![]()
編輯丨%
過(guò)去,科學(xué)的相關(guān)領(lǐng)域已經(jīng)見(jiàn)證過(guò)數(shù)學(xué)、物理等領(lǐng)域快速發(fā)展的 AI,這些領(lǐng)域下的想法往往可以在不涉及物理世界的情況下被評(píng)估。但生物學(xué)則不同。它需要在實(shí)驗(yàn)室內(nèi)不斷推進(jìn),這其中需要消耗科學(xué)家大量的時(shí)間與預(yù)算。
好在這種情況有所改善。Frontier 模型現(xiàn)在可以直接連接實(shí)驗(yàn)室自動(dòng)化,提出實(shí)驗(yàn)方案,大規(guī)模運(yùn)行,從結(jié)果中學(xué)習(xí),并決定下一步行動(dòng)。在生命科學(xué)的許多領(lǐng)域,瓶頸是迭代,自主實(shí)驗(yàn)室的建設(shè)正是為了消除這一限制。
在早期的研究中 ,OpenAI 展示了 GPT-5 能夠改進(jìn)濕實(shí)驗(yàn)室流程通過(guò)閉環(huán)實(shí)驗(yàn)。而現(xiàn)在,他們以同樣的方法展示了如何降低蛋白質(zhì)生產(chǎn)成本。
相關(guān)鏈接:https://openai.com/zh-Hans-CN/index/accelerating-biological-research-in-the-wet-lab/
OpenAI 與 Ginkgo 生物工廠將 GPT-5 連接到云實(shí)驗(yàn)室——一個(gè)通過(guò)軟件遠(yuǎn)程運(yùn)行的自動(dòng)化濕實(shí)驗(yàn)室,機(jī)器人執(zhí)行實(shí)驗(yàn)并返回?cái)?shù)據(jù)——并利用這種實(shí)驗(yàn)室在環(huán)路的配置優(yōu)化了廣泛使用的生物過(guò)程:無(wú)細(xì)胞蛋白合成(CFPS)。
![]()
圖 1:Ginkgo 官網(wǎng)。
經(jīng)過(guò)六輪閉環(huán)實(shí)驗(yàn),系統(tǒng)在 580 個(gè)自動(dòng)化板塊上測(cè)試了超過(guò) 36,000 種獨(dú)特的 CFPS 反應(yīng)組。在獲得計(jì)算機(jī)、網(wǎng)頁(yè)瀏覽器和相關(guān)論文訪問(wèn)權(quán)限后,GPT-5 經(jīng)過(guò)三輪實(shí)驗(yàn),確立了低成本 CFPS 的新技術(shù)水平,實(shí)現(xiàn)了蛋白質(zhì)生產(chǎn)成本降低 40%(試劑成本提升 57%),包括對(duì)自主實(shí)驗(yàn)室常見(jiàn)反應(yīng)條件更具穩(wěn)健性的新型反應(yīng)組分。
游細(xì)胞蛋白合成
游細(xì)胞蛋白合成(CFPS)是一種無(wú)需培養(yǎng)活細(xì)胞即可制造蛋白質(zhì)的方法。CFPS 不是將 DNA 放入細(xì)胞等待它們產(chǎn)生蛋白質(zhì),而是在受控的混合物中運(yùn)行蛋白質(zhì)制造機(jī)制。這使得它成為快速原型制作和測(cè)試的實(shí)用工具,科學(xué)家得以快速進(jìn)行多個(gè)實(shí)驗(yàn),并在當(dāng)天測(cè)量結(jié)果。
而無(wú)細(xì)胞蛋白合成需要復(fù)雜且相互作用的成分:編碼被造蛋白的 DNA 模板、細(xì)胞裂解液(細(xì)胞內(nèi)部的細(xì)胞機(jī)制混合物),以及大量生化成分,從能源來(lái)源到鹽類(lèi)。要對(duì)整個(gè)系統(tǒng)進(jìn)行理性分析極其困難,而且許多不同的制作工藝應(yīng)用了不同類(lèi)型的機(jī)器學(xué)習(xí)以降低蛋白質(zhì)生產(chǎn)成本。
標(biāo)準(zhǔn)的無(wú)細(xì)胞蛋白合成(CFPS)制劑和商業(yè)試劑盒通常定價(jià)適合人類(lèi)配速工作。自主實(shí)驗(yàn)室可以在人類(lèi)團(tuán)隊(duì)運(yùn)行數(shù)十次的時(shí)間內(nèi)運(yùn)行數(shù)千種反應(yīng)。在那個(gè)規(guī)模下,試劑成本成為限制因素。
CFPS也很難僅靠直覺(jué)優(yōu)化。它是許多相互作用成分的混合。細(xì)微的變化可能很重要,但效果的方向并不總是明顯的,而且最好的組合往往很難找到,除非做大量實(shí)驗(yàn)。以往的方法降低了成本,但進(jìn)展往往是漸進(jìn)式的,因?yàn)閺氐滋剿骺臻g需要大量勞動(dòng)。
將 GPT-5 與機(jī)器人實(shí)驗(yàn)室連接起來(lái)
OpenAI 將 GPT-5 與 Ginkgo 的云實(shí)驗(yàn)室結(jié)合,構(gòu)建了一個(gè)閉環(huán)自治系統(tǒng),用于游細(xì)胞蛋白合成(CFPS)優(yōu)化。GPT-5 設(shè)計(jì)了一批實(shí)驗(yàn),交予實(shí)驗(yàn)室處理,并把結(jié)果反饋給模型。模型利用這些數(shù)據(jù)提出了下一輪。該循環(huán)共計(jì)重復(fù)六次。
![]()
圖 2:AI 驅(qū)動(dòng)的自主實(shí)驗(yàn)室。
為了讓環(huán)路扎實(shí)于自主實(shí)驗(yàn)室的能力,OpenAI 在任何實(shí)驗(yàn)運(yùn)行前都加入了嚴(yán)格的程序驗(yàn)證。該驗(yàn)證確保 AI 設(shè)計(jì)的實(shí)驗(yàn)在自動(dòng)化平臺(tái)上是可物理執(zhí)行的。它阻止了那些在文字中看似合理但無(wú)法在機(jī)器人工作流程中完成的“紙上實(shí)驗(yàn)”。
在整個(gè)運(yùn)行過(guò)程中,系統(tǒng)在 580 個(gè)自動(dòng)化板塊上執(zhí)行了超過(guò) 36,000 次 CFPS 反應(yīng)。在生物學(xué)中,單一實(shí)驗(yàn)具有較大噪聲干擾,為了將信號(hào)與隨機(jī)噪聲分開(kāi),需要引入吞吐量和迭代。一旦 GPT-5 獲得了相關(guān)論文和工具,經(jīng)過(guò)三輪實(shí)驗(yàn)和兩個(gè)月的時(shí)間,就建立了新的技術(shù)水平:蛋白質(zhì)生產(chǎn)成本比最佳先前基線降低了 40%。
![]()
圖 3:Ginkgo 的可重構(gòu)自動(dòng)化卡帶。
一些發(fā)現(xiàn)
OpenAI 發(fā)現(xiàn)這些改進(jìn)來(lái)自于高效高質(zhì)量的識(shí)別協(xié)同且在高通量自動(dòng)化現(xiàn)實(shí)中經(jīng)得起考驗(yàn)的組合。
此外,他們還發(fā)現(xiàn):
- GPT-5 識(shí)別出了人類(lèi)此前未曾在此配置中測(cè)試過(guò)的低成本反應(yīng)組成;
- 高通量、基于板的實(shí)驗(yàn)通常與手動(dòng)的臺(tái)式實(shí)驗(yàn)不同;
- 緩沖、能量再生成分和聚胺的微小變化相對(duì)于其成本影響更大;
- 成本結(jié)構(gòu)本身決定了什么才是關(guān)鍵。
不過(guò),這些結(jié)果只在一種蛋白質(zhì)、sfGFP和一種游細(xì)胞蛋白合成(CFPS)系統(tǒng)上得到了驗(yàn)證。仍需證明其推廣到其他蛋白質(zhì)及其他CFPS系統(tǒng)。含氧和反應(yīng)幾何形狀會(huì)強(qiáng)烈影響產(chǎn)率,這些因素在不同尺度上也可能有所影響。有些改善可能對(duì)這些條件敏感,理解這些敏感性是接下來(lái)要做的部分。
相關(guān)鏈接:https://openai.com/index/gpt-5-lowers-protein-synthesis-cost/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.