![]()
編輯丨%
20 世紀初,蘋果聯合創始人史蒂夫·喬布斯將計算機形容為“我們大腦的自行車”。他的靈感來自小時候看到的《Scientific American》 雜志上的一幅圖紙,圖片顯示騎自行車的人比任何動物都更節能。
相比之下,AI 可能被稱為飛機更為恰當些——它們比自行車更快,但更難控制,犯錯后果可能尤其嚴重。科學家或將從中獲利,因為科學研究究其本質是一場探索未知的旅程,但在全新的工作環境中,挑戰與挫折接踵而至。
為了高效且安全地駕馭這新時代的發展工具,學者們需要一套操作手冊。真正的問題從來不是機器是否會取代科學家,而是學者們掌握它們時,會成為怎樣的存在。
這些表述來自 SciSciGPT 的開發團隊,那是一個由多個專業 AI 分工協作進行研究的工作流程。其核心是 ResearchManager 代理。它協調工作流程,將研究人員通過聊天界面輸入的自然語言查詢劃分為任務,然后委派給專門從事文獻綜述、數據提取或分析的代理。
![]()
圖 1:SciSciGPT 模塊化設計的示意圖。
在他們的案例研究中,SciSciGPT 創建了一組大學合作的可視化,并測試論文中的某一圖形是否能從其存儲庫中的數據中復制。它完成這些研究任務的速度更快,結果也比經驗豐富的研究人員使用 AI 工具更高效。
在此基礎上,該團隊總結了從構建一個以研究為導向的人工智能代理中學到的經驗教訓,以及科學家在使用代理進行科學時應考慮的原則。
協作>自動化
現如今的環境發展趨勢其實是將科學研究完全自動化,轉向“AI 科學家”或者是“自動實驗室”。這些流程可能會讓人覺得復雜,但科學并不是流水線,這一切建立在解釋、爭論與責任之上,人類的判斷至關重要。
以牛頓棱鏡實驗打個比方。一個全自動系統可以進行牛頓棱鏡實驗,測量白光通過棱鏡時的分裂情況,并將這些數據擬合到模型中。但牛頓做了截然不同的事:他顛倒了這一設定,將彩色光束重新組合回白光,果斷地表明顏色屬于光本身,而非玻璃。
![]()
圖 2:牛頓棱鏡實驗。
這一行為——決定一個表面上的異常是現象,而非應消除的錯誤——是解釋上的跳躍,而非計算。自動化工作流程設計上是平滑異常并優化以適應,相比之下,科學家利用了意外的力量。
隨著 AI 逐漸成為研究的核心,科學將同時面臨技術與公民信任的轉折點。在公眾對科學信心本已脆弱的時代,正是加強支撐科學基礎、通過將透明度、可追溯性和問責性嵌入發現基礎設施來更新這一契約的時刻。全面自動化或許能帶來一些答案,但會削弱賦予這些答案意義的公信力。
研究團隊始終認為,人類科學家應保留對問題框架、驗證路徑和對結論簽署的權威和責任。縱觀人類歷史,其實不難發現這是一段不斷發現的旅程。隨著 AI 能夠為發現做出貢獻,核心問題不再是機器單獨能做什么,而是如何設計機器,以保持科學的問責性和可重復性。
速度意味著變革
當失敗成本不復往日那般高昂,所有冒險的計劃都變得理性起來,過去使得測試曾經過于昂貴或耗時的問題變得切實可行。
基因組學展示了這一轉變:解碼第一個人類基因組花費了十多年和數十億美元;如今,測序成本低于 1000 美元,耗時數小時,將該領域從單基因研究轉變為對整個基因組的廣泛探索。隨著轉變,帶來了新的視角,使研究人員能夠看到科學領域中原本難以察覺的聯系。
速度也將影響發文的聲音。降低的技術門檻和時間壁壘使小型實驗室、新手甚至個人研究人員能夠完成曾經需要大型團隊和數月協調的分析。但加速發現的同樣力量也可能放大錯誤。沒有反思的快速科學有可能在大規模上匯聚錯誤。這進一步凸顯了人機協作的重要性,而非完全自動化。
代理應當更專業
SciSciGPT 是一個自然的首個測試案例:科學科學數據豐富,方法論多樣,研究發現本身的運作方式。但同樣的觀點在不同學科中同樣適用。每個領域都有其基礎——其教材、數據集、工具和標準。
AI 研究代理在不同領域表現不同,但應遵循相同的基本規則:結果應可追溯,方法可驗證,職責明確分配。制定這些規則需要多方協調,目標是建立一個共享的公私互作框架——例如,建立日志代理決策的統一標準,使得在一個實驗室運行的分析可以被另一個實驗室審計或復現。
![]()
圖 3:一些實驗室正試圖通過“AI 科學家”從頭到尾完成項目來自動化研究工作。
SciSciGPT 團隊表明,AI 對于科學的裨益廣泛存在于各種學科之中,但他們在分析大學課程大綱時,卻察覺到了系統性不匹配:人工智能教育主要集中在計算機科學、數學和工程領域,而那些本可以同樣受益的學科——從醫學、心理學到經濟學——提供的培訓遠少得多 。
而與這種現象共同存在的,是學術界依然圍繞著各系的壁壘組織,隨著知識負擔的增加,交流的鴻溝逐步加深。科學政策制定者應認識到這些,支持跨學科、促進人工智能專家與領域科學家持續合作的機構式結構。
信任必須樹立
自行車與飛機遇難的后果各不相同——這就是人們在 AI 代理面前面臨的規模差異。當 AI 發展,失敗不僅會給單個研究者帶來不便;它們可能誤導領域,轉移資金,削弱公眾對科學的信任。
大型語言模型(LLM)的一個關鍵優勢是它們能夠寫作。這意味著 LLM 可以用純文字記錄所做的一切。在 SciSciGPT 項目中,系統生成的每一步、每行代碼和每一個決策都被 LLM 自動記錄。結果是大量數據,但卻具有變革性。即使其中最優秀的學生做實驗,也無法期望看到或重建每一步操作所導致的結果。
但這也帶來了另一個問題:信息過多。
正確的設計可以包括結構化的來源,突出決策的初衷,而不僅僅是做了什么,并通過分層總結,使關鍵偏差和決策一目了然。
想要足夠的透明度?那可能需要自行構建。AI 需要配備嚴謹的科學來源記錄和審計追蹤工具。如果做得好,AI 代理能為科學最深層的挑戰之一——可重復性——提供強有力的回應。
AI 帶來的機遇
飛機帶來了對飛行員的需求,AI 自然也是。
AI 代理人可能會提出一些想法——無論是理論構建、異常顯現還是假設設計——起初看起來很陌生。問題在于科學家是否受過訓練,將這些視為噪音,還是從中學習。結果可能是人機共進化:適應最快的科學家可能成為明天發現的節奏。
但這對科學家和整個科學界都構成風險。對科學家來說,風險在于技能流失。借助 GPS 導航工具開車很方便,但會讓司機對路線記憶變得模糊。智能體可能讓研究人員提高生產力,但卻讓他們對挑戰 AI 的準備不足。
相關鏈接:https://www.nature.com/articles/s41586-025-09922-y
在這種環境下,如果許多研究者依賴相同的藥物堆棧,科學就面臨同質化的風險。人們時常擔心,雖然 AI 可能提升個體的質量或表現,但可能會減少集體多樣性。除非研究者們有意抵消,否則產出將會極大程度上趨于收斂。
從長遠來看,設計多樣化的思維和方法至關重要,這需要培養多種模型——采用不同的框架或思維方式——從多元視角和獎勵異議的制度規范來解決問題。
重塑科學視角
像 SciSciGPT 這樣的系統仍然模仿當前的發現模式,加快了其進程,拓寬了所提問的問題范圍。但人類與 AI 共發現的未來不必遵循熟悉的形式。
比如,當鋼筋混凝土出現時,建筑師最初用它們模仿砌體,將新結構隱藏在舊設計背后。真正的突破在于他們認識到墻壁不再需要承重:建筑物可以被玻璃包裹,催生了紐約聯合國秘書處和巴黎的維爾之家等現代主義標志。
這是一種重要的思想轉變,在逐漸充滿 AI 代理的當下必須牢記。
還記得 SciSciGPT 團隊打的兩個比方嗎?將交通成本與體重進行對比,顯示騎自行車的人站在底部——最高效的移動者。坐飛機卻是:成本高昂、效率低下卻大膽,開辟了曾經難以想象的領域。前者提醒我們要設計以效率和超越為目標;后者則警示一套完善的信任體系與操作規則的必要性。
原文鏈接:https://www.nature.com/articles/d41586-026-00665-y
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.