![]()
圖片來源:Stuart March-DNDi
來源:https://www.eurekalert.org/news-releases/1126456
由英國主導(dǎo)的OpenBind計劃迎來重大里程碑,發(fā)布了首個公開數(shù)據(jù)集和預(yù)測性人工智能模型,這是利用人工智能加速新藥研發(fā)的突破性一步。此次發(fā)布表明,構(gòu)建可用于人工智能的數(shù)據(jù)不僅可行,而且對于發(fā)展人工智能工具至關(guān)重要,尤其是在數(shù)據(jù)匱乏的科學(xué)領(lǐng)域。通過此次OpenBind發(fā)布,高質(zhì)量的標準化實驗數(shù)據(jù)和新訓(xùn)練的預(yù)測模型OpenBind v1將免費向全球研究人員開放,可立即用于治療藥物的發(fā)現(xiàn),并推動下一代人工智能模型的發(fā)展。
盡管人工智能在蛋白質(zhì)結(jié)構(gòu)預(yù)測精度方面取得了突破性進展,但其對藥物研發(fā)的影響仍然有限,這主要是由于全球范圍內(nèi)缺乏可靠的實驗數(shù)據(jù),無法精確測量藥物分子與疾病相關(guān)蛋白的結(jié)合方式(以原子級精度)。OpenBind 旨在填補這一關(guān)鍵空白。該項目由Diamond Light Source牽頭,匯集了結(jié)構(gòu)生物學(xué)家和人工智能專家,并在其創(chuàng)立初期得到了英國科學(xué)、創(chuàng)新和技術(shù)部 (DSIT)的支持。OpenBind 是首個以工業(yè)規(guī)模、開放且持續(xù)的方式生成這些關(guān)鍵數(shù)據(jù)集,并專門為人工智能設(shè)計的項目。
此次首批數(shù)據(jù)的發(fā)布表明,OpenBind 的流程現(xiàn)已投入運行,僅用了七個月就生成了 800 個高質(zhì)量測量數(shù)據(jù)——過去,如此龐大的數(shù)據(jù)集需要數(shù)年時間才能生成和發(fā)布。這一集成流程結(jié)合了 Diamond 公司 XChem 片段篩選中心的自動化化學(xué)分析、穩(wěn)健的結(jié)合測量和高通量晶體學(xué)技術(shù),以及精心設(shè)計的數(shù)據(jù)發(fā)布流程和利用英國 Isambard-AI 計算集群進行的 AI 模型訓(xùn)練。它為藥物發(fā)現(xiàn)領(lǐng)域的變革性進展奠定了基礎(chǔ),未來計劃分批次發(fā)布數(shù)據(jù),以應(yīng)對 COVID-19、瘧疾、登革熱、寨卡病毒和癌癥等全球健康挑戰(zhàn),在這些領(lǐng)域,快速開發(fā)新療法仍然至關(guān)重要。
哥倫比亞大學(xué)的穆罕默德·阿爾庫拉伊希教授表示:“AlphaFold2 利用 PDB 中數(shù)十年來積累的蛋白質(zhì)結(jié)構(gòu)實驗數(shù)據(jù),徹底革新了蛋白質(zhì)結(jié)構(gòu)預(yù)測。目前尚不存在類似的蛋白質(zhì)-藥物復(fù)合物數(shù)據(jù)集,但 OpenBind 的目標是創(chuàng)建這樣的數(shù)據(jù)集,并在此過程中開發(fā)出用于模擬藥物與蛋白質(zhì)相互作用的新一代計算工具。”
初始數(shù)據(jù)集也反映了該項目早期實驗階段積累的寶貴經(jīng)驗。標準化的工作流程、完善的元數(shù)據(jù)管理以及高度自動化已被證明對確保人工智能所需的一致性和可復(fù)現(xiàn)性至關(guān)重要,同時也凸顯了進一步簡化數(shù)據(jù)處理和提高發(fā)布頻率的機會。
牛津大學(xué)的弗格斯·伊姆里博士表示:“高質(zhì)量的實驗數(shù)據(jù)對于開發(fā)新型和改進型人工智能模型至關(guān)重要,而此次首次數(shù)據(jù)發(fā)布表明,OpenBind 已經(jīng)具備了這一基礎(chǔ)。我們正在利用人工智能來提升模型性能并指導(dǎo)未來的實驗,從而加速科學(xué)發(fā)現(xiàn)。這些早期實驗周期中的經(jīng)驗教訓(xùn)已經(jīng)幫助我們提高了流程的速度、一致性和可復(fù)現(xiàn)性,這對于 OpenBind 的發(fā)展至關(guān)重要。”
鉆石光源首席光束線科學(xué)家弗蘭克·馮·德爾夫特教授表示:“如果沒有聯(lián)盟成員和運營團隊的貢獻,我們不可能取得如此迅速的進展。他們的專業(yè)知識和奉獻精神使我們能夠達到這一雄心勃勃的里程碑。現(xiàn)在,我們將把這一基礎(chǔ)階段的經(jīng)驗教訓(xùn)應(yīng)用到長期運營中,從而將人工智能數(shù)據(jù)的大規(guī)模生產(chǎn)與活躍的探索項目聯(lián)系起來。”
在此基礎(chǔ)上,OpenBind 將擴展至涵蓋更多靶點、更大的化合物系列和更深入的數(shù)據(jù)集,同時還將舉辦社區(qū)盲測挑戰(zhàn)賽,以驗證人工智能模型對新生成的實驗數(shù)據(jù)的適用性。最終,OpenBind 的目標是創(chuàng)建一個全球開放的數(shù)據(jù)引擎,以支持更快、更精準、更公平地開發(fā)治療方法。
閱讀最新前沿科技趨勢報告,請訪問21世紀關(guān)鍵技術(shù)研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀關(guān)鍵技術(shù)研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.