![]()
編輯 | 心悅
今年以來,以 OpenClaw 為代表的「助手型」智能體引爆了科技圈。這類智能體已不再局限于簡單的對話交互,而是進化為能夠理解復(fù)雜指令、自主調(diào)用工具、檢索信息并執(zhí)行任務(wù)的「AI 同事」。「人人皆有賈維斯」的科幻愿景正加速照進現(xiàn)實。
在科學(xué)智能領(lǐng)域,對「AI 同事」的要求遠不止于簡單的任務(wù)調(diào)度。面向嚴謹?shù)目茖W(xué)探索,我們需要的是一個擁有系統(tǒng)級專業(yè)能力的科研智能體 —— 它能夠深度融入科研流程,承擔(dān)起文獻挖掘、實驗設(shè)計、方案優(yōu)化乃至自動化執(zhí)行等一系列高強度、高精度的「苦活」,讓科學(xué)家將更多精力聚焦于創(chuàng)造性思考和科學(xué)品味,在人機協(xié)同之下探索更前沿的研究方向。
最近,上海科學(xué)智能研究院(下稱上智院)聯(lián)合復(fù)旦大學(xué)、無限光年宣布全面升級星河啟智科學(xué)智能開放平臺,其核心載體「超級科研合伙人」——「大圣」閃亮登場。
「大圣」是一個融合多模態(tài)基礎(chǔ)模型、長周期多線程的群體記憶、專家級科學(xué) Skills、自驅(qū)動實驗室與安全可信方案的系統(tǒng)級科研智能體。這個高能動性智能體正面向真實科研場景不斷進化,推動科研范式變革。
![]()
科學(xué)始于假設(shè),成于驗證。這意味著任何科學(xué)模型的預(yù)測都要接受真實實驗的檢驗 —— 物理世界是科學(xué)假設(shè)的唯一終極裁判。作為「超級科研合伙人」,僅有模型工具的調(diào)度能力是遠遠不夠的,科研的價值最終要落在物理世界的反饋。
![]()
為此,上智院深度定制了物理設(shè)施,致力于讓「大圣」通過自驅(qū)動實驗室「上天入體」,實現(xiàn)與物理世界的全面鏈接。
具體來說,生命實驗室負責(zé)「入體」層面,為「大圣」打造了干濕一體的智能化閉環(huán)體系,推動包括藥物設(shè)計在內(nèi)的生物醫(yī)藥研究邁入全新的自進化階段;天算實驗室負責(zé)「上天」層面,構(gòu)建了星地協(xié)同的實時計算和物理鏈接能力,致力于在軌完成數(shù)據(jù)解析與氣象實時推理。
干濕閉環(huán) —— 在生命世界「動手」
2024 年,上智院生命科學(xué)團隊與復(fù)旦大學(xué)生命科學(xué)學(xué)院合作開展了核酸適配體研發(fā)項目。項目初期,基于上智院自研的女媧模型,適配體的「干計算」設(shè)計順利完成。
但很快,新的問題出現(xiàn)了:AI 模型可以在短短數(shù)小時內(nèi)便高效設(shè)計出上千條核酸序列,但這些預(yù)測結(jié)果存在良莠不齊的可能,需要通過濕實驗驗證甄別;而實驗端的每一次驗證,一方面需要數(shù)天甚至數(shù)周時間,導(dǎo)致大量候選序列在驗證環(huán)節(jié)積壓排隊;另一方面,依賴人工的實驗環(huán)節(jié)由于不同實驗人員、不同批次導(dǎo)致的結(jié)果難以穩(wěn)定復(fù)現(xiàn),進一步加劇了驗證的困難……
這也是當(dāng)前科學(xué)智能面臨的典型瓶頸:計算與驗證之間存在顯著的「效率錯配」——AI 計算以近乎「光速」的效率源源不斷地輸出海量設(shè)計,而傳統(tǒng)濕實驗卻停留在「龜速」般的驗證節(jié)奏上。這種生成速度與反饋周期之間的巨大反差,導(dǎo)致 AI 模型陷入「空轉(zhuǎn)」困境:模型在云端高速運轉(zhuǎn),卻無法及時獲得真實數(shù)據(jù)的校驗與修正。研發(fā)鏈條在「設(shè)計」與「驗證」的接口處形成嚴重阻塞,空有高速計算能力,卻難以轉(zhuǎn)化為實質(zhì)性的創(chuàng)新加速。
研究團隊發(fā)現(xiàn),這種困境源于干實驗與濕實驗很大程度上處于「各自為戰(zhàn)」的割裂狀態(tài),未能形成閉環(huán)。如果可以大幅提升濕實驗運行速度與結(jié)果的穩(wěn)定性,再將實驗所得真值數(shù)據(jù)反哺給模型,用以微調(diào)來提升其預(yù)測能力,那么原本被「算得快、驗得慢」所禁錮的研發(fā)閉環(huán)便能真正轉(zhuǎn)動起來。
為此,上智院聯(lián)合行業(yè)伙伴建設(shè)了全球首個自驅(qū)動的生命實驗室,專為核酸藥的智能化研發(fā)服務(wù)。該實驗室將人工實驗升級為智能化實驗,用機器的「并行」執(zhí)行替代傳統(tǒng)人工的「串行」操作,支持 7×24 小時無人值守的高通量運行。其中,機械臂能以 0.1 微升的精度執(zhí)行加樣,可實現(xiàn) 96 例樣本在同一時間完成稀釋、混合、轉(zhuǎn)染等步驟,徹底消除了人工操作的時間差誤差,保證濕實驗具備極高的標準化與一致性。
在智能化實驗的基礎(chǔ)上,生命實驗室還搭載了AI 大腦 —— 自驅(qū)動的智能體實驗集群,由規(guī)劃、執(zhí)行、監(jiān)控、分析等多個智能體組成中樞系統(tǒng)。其中,「AI 費米」智能體負責(zé)智能調(diào)度,該智能體能夠理解干實驗上下文,自動提取并生成最優(yōu)轉(zhuǎn)染方案,將其直接編譯為可供自動化島臺執(zhí)行的機器代碼,無需人工設(shè)計固定腳本,即可實現(xiàn)實驗方案的個性化、科學(xué)化。
在此基礎(chǔ)上,「大圣」打造出「執(zhí)行 — 反饋 — 優(yōu)化」的敏捷迭代機制,該機制具體包含三個核心階段:
首先是計算排序。在云端的虛擬世界中,女媧等預(yù)測模型對數(shù)千個乃至上萬個候選序列進行高通量計算,并根據(jù)預(yù)測活性等指標對序列進行排序,挑出最具潛力的「種子選手」。
其次是驗證測試。自動化物理實驗室將無縫接管后續(xù)流程,僅對排名最高的少量序列(約 200 條)進行高保真、高通量的合成與濕實驗驗證。機械臂以 0.1 微升的精度執(zhí)行加樣、轉(zhuǎn)染、培養(yǎng)、檢測等步驟,在真實物理世界中檢驗序列的基因敲低(Gene knockdown)能力。
值得注意的是,實驗過程進行了全流程的數(shù)據(jù)追溯。每一個樣本都被賦予唯一的「sample ID」,這個標簽將貫穿實驗的始終。樣本經(jīng)歷了哪些處理步驟;加了多少樣品;細胞的培養(yǎng)溫度是多少;培養(yǎng)了多長時間…… 所有這些過程數(shù)據(jù),都被完整地記錄。
最后是微調(diào)更新。實驗測得的真實數(shù)據(jù)將實時同步回云端,通過強化學(xué)習(xí)重新微調(diào)現(xiàn)有模型。尤為重要的是,不僅陽性結(jié)果被記錄,陰性結(jié)果同樣被完整保留。而這些曾被傳統(tǒng)實驗?zāi)J胶鲆暤摹甘?shù)據(jù)」,恰恰為模型提供了「什么是對的」與「什么是錯的」的雙重標尺。借助這種強化學(xué)習(xí)思路,模型得以在軟件與硬件構(gòu)成的閉環(huán)中持續(xù)迭代,在下一輪設(shè)計中更精準地規(guī)避錯誤路徑,加速收斂至最優(yōu)解。
如上智院生命科學(xué)方向 AI 科學(xué)家郭昕所說:「AI 模型很有可能會輸出幻覺,我們非常需要來自真實世界的反饋,以糾正模型,尤其是那些錯誤樣本(負反饋)。」隨著實驗的不斷開展,科研數(shù)據(jù)的持續(xù)積累,模型的學(xué)習(xí)能力與設(shè)計能力將不斷提升。
如此,當(dāng)科研人員有了靈感,只需將研究設(shè)想告知「大圣」,「大圣」便會自動調(diào)度這一整套機制。上智院星河啟智高級產(chǎn)品專家楊真奇表示:「我們希望引入「「大圣」」去調(diào)度多智能體系統(tǒng),并通過自驅(qū)動實驗室實現(xiàn)自主化、標準化、高通量的實驗驗證,最終讓 AI 真正加速科研發(fā)現(xiàn)。」
這套干濕閉環(huán)體系很快在小干擾核酸(siRNA)藥物研發(fā)上取得了成效。例如,針對 AGT 靶點的 siRNA 藥物設(shè)計,「大圣」可以迅速分析出 AGT 靶點的核心信息,并根據(jù)設(shè)計需求調(diào)度女媧大模型生成了對應(yīng)的 siRNA 序列;在實驗驗證環(huán)節(jié),「大圣」快速完成了針對 H7 細胞系的實驗 Protocol 設(shè)計,并調(diào)度「AI 費米」完成實驗操作。
![]()
濕實驗完成后,實驗數(shù)據(jù)被同步回云端,以優(yōu)化模型,使其能夠在高維設(shè)計空間中,設(shè)計出更優(yōu)質(zhì)的 siRNA 序列。
從應(yīng)用效果看,這一閉環(huán)的敏捷迭代體系,助力 siRNA 藥物研發(fā)在多個靶點中都實現(xiàn)了超過 50% 的有效序列比例提升。
同時,通過用自動化實驗室替代人工實驗,整體實驗人效提升了 3-4 倍,實驗結(jié)果的穩(wěn)定性也大大提升。例如,在 qPCR、細胞裂解和轉(zhuǎn)染等耗時步驟中,傳統(tǒng)模式需要 2 人高強度工作才能完成 3 塊 96 孔板 / 天,而現(xiàn)在僅需 1 人監(jiān)控機器即可完成 6 塊 96 孔板 / 天。
![]()
星地協(xié)同 —— 在太空跑通端到端大模型
在與物理世界的鏈接中,有一種鏈接是向上延伸、直抵蒼穹。
隨著人工智能技術(shù)的爆發(fā)式發(fā)展,電力短缺已成為制約算力擴張的關(guān)鍵瓶頸。為此,科技巨頭開始將目光投向太空,尋求算力的新邊疆。例如,SpaceX 正在規(guī)劃一套被稱為「軌道數(shù)據(jù)中心系統(tǒng)」的衛(wèi)星網(wǎng)絡(luò),擬在近地軌道部署最多 100 萬顆衛(wèi)星,搭建太空數(shù)據(jù)中心,為 AI 模型供算力。多家創(chuàng)業(yè)公司迅速跟進,將數(shù)據(jù)中心送入太空的構(gòu)想迅速引爆商業(yè)航天領(lǐng)域。
在這一前沿探索中,上智院進一步聚焦于科學(xué)智能與太空計算的深度融合,并率先在氣象預(yù)報領(lǐng)域找到了關(guān)鍵的應(yīng)用場景。
2023 年起,上智院聯(lián)合復(fù)旦大學(xué)開展伏羲氣象大模型的開發(fā)研究。項目早期采用 Cascade 技術(shù),在歐洲中期天氣預(yù)報中心(ECMWF)包含 DeepMind GraphCast、英偉達 FourCastNet 等模型的業(yè)務(wù)評測中綜合精度領(lǐng)先。以此為起點,「伏羲」團隊陸續(xù)取得了一系列研究成果,包括在預(yù)報時間尺度上不斷突破:從短臨預(yù)報(0-24 小時),到中期預(yù)報(0-10 天),再到次季節(jié)預(yù)報(30-40 天)乃至更長的季節(jié)尺度,逐步構(gòu)建起覆蓋全時間維度的預(yù)報能力。
去年,「伏羲」又迎來了一項里程碑式突破 —— 研發(fā)出端到端預(yù)報模型。此前發(fā)布的 AI 模型均基于數(shù)值預(yù)報系統(tǒng)產(chǎn)生的「分析場」這一中間產(chǎn)物進行訓(xùn)練和推理,而端到端模型徹底打破了這一依賴:它可以直接輸入原始觀測數(shù)據(jù) —— 包括氣象探空氣球、雨量計、海上浮標、衛(wèi)星遙感數(shù)據(jù)。這意味著,伏羲氣象大模型能夠獨立于傳統(tǒng)數(shù)值預(yù)報系統(tǒng)運行,直接從真實的地球觀測出發(fā),自主生成天氣預(yù)報結(jié)果。
然而,研究團隊意識到,僅靠模型層面的迭代已不足以實現(xiàn)質(zhì)的飛躍。從數(shù)據(jù)層面看,傳統(tǒng)數(shù)值預(yù)報對公共觀測數(shù)據(jù)的利用率僅為 10%-20%,而伏羲氣象大模型可以將利用率提升至接近 100%。但公共數(shù)據(jù)有其上限,要想實現(xiàn)更精準、更及時的氣象預(yù)報,尤其是針對極端天氣、短臨預(yù)警、自然災(zāi)害等場景,伏羲項目需要擁有自主的、為專門場景定制的物理觀測數(shù)據(jù)源。
因此,上智院提出建設(shè)天算實驗室,搭建全球首個專為氣象大模型定制的 AI 觀測星座 —— 伏羲氣象衛(wèi)星星座,構(gòu)建星地協(xié)同的物理鏈接能力。同時,他們還計劃把 AI 模型送入太空,部署到數(shù)據(jù)產(chǎn)生端,即衛(wèi)星之上。
天算實驗室的運行邏輯圍繞觀測層、傳輸層與計算層三個層級展開:
- 在觀測層,實驗室采用雷達載荷作為核心觀測源,以精準捕捉降水信息,補充現(xiàn)有對地觀測系統(tǒng)的短板;
- 在傳輸層,依托衛(wèi)星星網(wǎng)星座,實現(xiàn)全球觀測數(shù)據(jù)的實時匯總;
- 在計算層,在星上部署人工智能服務(wù)器與端到端大模型,通過星載計算機完成實時計算。
伏羲氣象衛(wèi)星星座將不僅是數(shù)據(jù)觀測平臺,更是搭載著 AI 模型的智能計算節(jié)點:衛(wèi)星在采集地球觀測數(shù)據(jù)的同時,能夠直接在軌運行伏羲大模型,完成數(shù)據(jù)處理與天氣預(yù)報的實時推理。從數(shù)據(jù)獲取到預(yù)報產(chǎn)出,全鏈路在太空中閉環(huán),實現(xiàn)「數(shù)據(jù)在哪里產(chǎn)生,計算就在哪里完成」的范式突破。
![]()
目前,上智院已與復(fù)旦大學(xué)、之江實驗室完成「空地數(shù)據(jù)互聯(lián) - 伏羲模型上天 - 星上計算」閉環(huán)鏈路驗證,并在軌運行一個月,接下來計劃與業(yè)界伙伴合作共建 AI 氣象星座。
上智院地球科學(xué) AI 科學(xué)家孫修宇表示:「我們的最終目標,是構(gòu)建基于衛(wèi)星星座的『觀測 - 計算 - AI』一體化系統(tǒng),因此,下一階段的核心工作是發(fā)射更多衛(wèi)星,組建衛(wèi)星星座,完成天算實驗室的全鏈路驗證。同時,這一體系將對現(xiàn)有地球觀測系統(tǒng)形成有效補充,讓伏羲模型能夠為全球提供更低時效、更準確的天氣預(yù)報服務(wù)。」
科學(xué)智能新布局
無論是生命實驗室實現(xiàn)干濕閉環(huán),還是天算實驗室構(gòu)建星地協(xié)同,其背后的邏輯一脈相承 —— 物理世界,是檢驗科學(xué)智能的唯一試金石,是科學(xué)智能不可或缺的核心。
「在科學(xué)智能底層,我們始終堅持兩個核心理念:一是獲取物理世界的真實數(shù)據(jù),二是接受物理世界的終極驗證」,郭昕說道。
這呼應(yīng)著一個更大的時代命題:科學(xué)智能正在成為全球共識。
從工業(yè)革命的蒸汽與電力,到硅基革命帶來的計算機與互聯(lián)網(wǎng),每一次生產(chǎn)力的躍升,都源自科學(xué)理論的突破。但過去數(shù)十年中,基礎(chǔ)科學(xué)的突破肉眼可見地放緩。科學(xué)智能,正是對這一時代困局的回應(yīng)。它試圖將 AI 視為激活科學(xué)發(fā)現(xiàn)的新工具,用這個時代最強大的技術(shù),去推動科學(xué)本身的前進。
然而,當(dāng)前科學(xué)智能的實踐模式,大多是「AI 團隊」與「科學(xué)團隊」的淺層合作 ——AI 公司提供模型工具,科學(xué)家拿來使用;AI 不懂科學(xué)問題,科學(xué)家不懂模型優(yōu)化,虛擬計算與物理世界處于相對割裂的狀態(tài),難以深入科學(xué)發(fā)現(xiàn)的底層邏輯。
在這一全球浪潮中,上智院找到了自己獨特的生態(tài)位。其特殊優(yōu)勢在于匯聚了兩支團隊:一支是科學(xué)發(fā)現(xiàn)團隊 —— 在生命科學(xué)、地球科學(xué)、物質(zhì)科學(xué)等領(lǐng)域深耕的研究者;另一支則是頂尖的 AI 算法與工程團隊。更重要的是,這兩支團隊不是「合作」關(guān)系,而是「融合」關(guān)系。在上智院,科學(xué)家與 AI 專家、工程師一起,共同定義問題、共同迭代模型、共同解讀結(jié)果。這種深度融合,讓其能夠為科學(xué)發(fā)現(xiàn)量身打造「大圣」—— 一位懂科學(xué)的「超級科研合伙人」。
當(dāng)「大圣」在地球表面調(diào)度生命實驗室的機械臂協(xié)同作業(yè),又通過天算實驗室在太空中實時處理觀測數(shù)據(jù),我們看到的不僅是技術(shù)的突破,更是一種全新科研范式的誕生 ——AI 的生成能力與真實的物理反饋深度耦合,科學(xué)家得以從重復(fù)勞動中解放出來,將智慧傾注于更具創(chuàng)造性的探索。
這也是一種極具前瞻性的科學(xué)智能新布局:以物理世界為錨點,讓 AI 不再局限于虛擬推演,而是深度耦合真實數(shù)據(jù)與實驗驗證;以智能體為橋梁,打通從干實驗設(shè)計到濕實驗執(zhí)行的完整閉環(huán),實現(xiàn)模型的自主迭代與進化。我們期待,在不遠的將來,科學(xué)智能將推動人類文明駛向下一個生產(chǎn)力躍升的星辰大海。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.