<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      上海團隊用對抗式多智能體框架破解代碼可靠生成難題

      0
      分享至



      作者 |聯合研究團隊

      編輯丨ScienceAI

      在大語言模型的助推之下,從模擬仿真到數據分析,AI 正在幫助科研人員自動寫代碼。但現實是,領域科學家往往缺乏計算機背景,寫出的提示詞模糊不清、隱含大量專業假設;科學計算流程復雜,一個小錯誤就能引發連鎖反應;更致命的是,大模型會產生「幻覺」—— 輸出看起來合理,實則暗藏致命缺陷。

      在多智能體協作中,一個環節的錯誤會被下游無條件接受,層層放大。現有的提示優化和自我修正技術面對這種微妙的錯誤模式往往束手無策。科學家們迫切需要可靠的代碼,卻困在「不會寫好提示詞」的尷尬境地。這一困境直接制約了 AI4S(AI for Science, 科學智能)研究的普惠化進程,大量關鍵科學問題因較高的技術門檻而無法被 AI 有效賦能。

      為此,復旦大學、上海科學智能研究院(下稱上智院)、上海創智學院的聯合研究團隊提出了一種貝葉斯對抗式多智能體框架,用一種全新的思路解決上述難題。該框架不依賴單一模型的自我修正能力,而是通過多角色分工與對抗博弈,讓系統在持續的「攻防演練」中自發涌現出更高的代碼質量。



      論文標題:AI-for-Science Low-code Platform with Bayesian Adversarial Multi-Agent Framework

      論文地址:https://openreview.net/forum?id=Cug26Y0RlT

      相關論文已被 ICLR 2026 接收。復旦大學及上海創智學院博士生曾子航、張家銓,為共同第一作者;復旦大學人工智能創新與產業研究院教授、上智院 AI 科學家陳曦,為本文通訊作者;上智院首席科學家、復旦大學特聘教授漆遠,及復旦大學博士生李朋澤,為本文共同作者。

      出題人 vs 答題人:對抗循環驅動的貝葉斯迭代機制

      框架的核心是一個「出題人 vs 答題人」的對抗循環。任務管理器(TM)扮演「出題人」,負責設計具有挑戰性的測試用例,不斷探測當前代碼的邊界;方案生成器(SG)扮演「答題人」,根據測試反饋持續改進代碼;評估器(Eval)則擔任「裁判」,對雙方表現進行客觀打分。兩者在對抗中共同進化,出題人越出越精,答題人越答越好。

      更關鍵的是,框架引入了貝葉斯更新機制。每一次迭代后,系統會根據得分動態調整測試用例和代碼方案的概率分布,自動聚焦最有價值的探索方向。通俗來講就是,每一次迭代都讓系統更聰明地選擇最有價值的測試和代碼組合,而不是盲目嘗試。這種機制將「試錯」轉化為了「有指導的探索」—— 系統不會在已經驗證無效的方向上浪費時間,而是像經驗豐富的研究者一樣,根據已有證據不斷縮小搜索范圍,逐步逼近最優解。



      該框架的第一大貢獻在于:提出了一種面向 AI4S 的低代碼平臺,結合貝葉斯對抗式遞歸代碼生成機制,顯著提升 AI4S 項目的代碼生成可靠性。與傳統多智能體系統完全依賴大模型做決策不同,本低代碼平臺采用非大模型的對抗性評分機制,從根本上降低了對基礎模型智能水平的依賴。同時,框架讓不懂編程的科學家只需用自然語言描述研究需求,系統即可輔助生成更高質量的科研代碼。

      小模型逆襲大模型:基準測試驗證框架有效性

      實驗結果令人振奮:

      • 在 SciCode 基準測試中,8B 模型使用該框架后性能相對提升87.1%(子問題求解率從 13.2% 躍升至 24.7%);
      • 32B 開源模型配合該框架,在 SciCode 上達到 33.0% 的求解率,直接超越了 235B 模型的基線表現(30.6%)—— 小模型逆襲大模型;
      • 在 ScienceAgentBench 上,框架達到90.2%的有效執行率,刷新當前最佳(SOTA)紀錄。

      這些數字背后反映的是一個關鍵趨勢:通過合理的框架設計,開源小模型完全可以在特定科學任務上匹敵甚至超越商業大模型,這為科研團隊降低算力成本提供了切實可行的路徑。



      更值得注意的是,框架對提示詞質量展現出極強的魯棒性。研究團隊對比了「基礎提示」和「專家精心編寫提示」兩種條件下的表現:基線模型的性能差距巨大,嚴重依賴提示詞質量;而使用該框架后,這一差距被大幅壓縮。即使用戶只提供基礎描述,框架的表現依然大幅超越專家提示詞的基線模型。

      這驗證了框架的第二大貢獻:顯著提升編碼智能體性能,且不受基礎模型能力限制。未來,該框架有望擴展至更多科學計算場景,為 AI4S 生態提供更廣泛且可靠的技術支撐。

      展望:AI4S 普惠化的可行路徑

      在這種貝葉斯對抗式多智能體框架的助力之下,更多領域專家能夠借助 AI 工具高效開展科研工作。比如,當一位海洋學家只需用自然語言描述研究問題,系統就能通過多輪對抗迭代生成更可靠的科研代碼。隨著這一范式的推廣,更多領域的研究者能夠專注于科學問題核心,而非陷入編程細節,從而加速 AI 與基礎科學的深度融合。

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      柳州地震捐款名單曝光,年入上億明星“集體沉默”,郭晶晶沒說錯

      柳州地震捐款名單曝光,年入上億明星“集體沉默”,郭晶晶沒說錯

      動物奇奇怪怪
      2026-05-22 00:22:37
      一張合影右邊朱珠,中間萬茜,左邊這位美女是誰,有誰認識她嗎

      一張合影右邊朱珠,中間萬茜,左邊這位美女是誰,有誰認識她嗎

      草莓解說體育
      2026-05-22 02:57:26
      莫雷托:小蜘蛛和馬競續約仍未達成協議,若離隊更傾向去巴薩

      莫雷托:小蜘蛛和馬競續約仍未達成協議,若離隊更傾向去巴薩

      懂球帝
      2026-05-22 06:13:05
      一場國宴讓老外集體破防:原來中方的美,才是世界級的頂流

      一場國宴讓老外集體破防:原來中方的美,才是世界級的頂流

      趣味萌寵的日常
      2026-05-19 13:02:47
      上節目三連丟臉,方媛連夜跑路,如今的她真被郭富城說中了

      上節目三連丟臉,方媛連夜跑路,如今的她真被郭富城說中了

      日落于西
      2026-05-21 15:33:02
      1971年,馬斯克在襁褓里被母親緊抱,日后竟登頂世界首富?

      1971年,馬斯克在襁褓里被母親緊抱,日后竟登頂世界首富?

      娛你同歡
      2026-05-21 21:28:14
      180萬賣房款,卻困在惠州海景房?我用兩年血淚,撕開“逃離北上廣”的5大認知陷阱

      180萬賣房款,卻困在惠州海景房?我用兩年血淚,撕開“逃離北上廣”的5大認知陷阱

      靚仔情感
      2026-05-21 15:48:02
      今年榴蓮為啥這么便宜?不是商超良心發現,而是東南亞供應鏈崩了

      今年榴蓮為啥這么便宜?不是商超良心發現,而是東南亞供應鏈崩了

      嘴角上翹的弧度
      2026-05-19 03:18:52
      男子買1萬多元榴蓮錯付成11萬多元,幾個月后才發現,原是銷售員謊稱辦退款偷偷侵占,商家:員工已被警方抓獲,自己先墊付了10萬余元給買家

      男子買1萬多元榴蓮錯付成11萬多元,幾個月后才發現,原是銷售員謊稱辦退款偷偷侵占,商家:員工已被警方抓獲,自己先墊付了10萬余元給買家

      極目新聞
      2026-05-21 17:07:16
      外媒:印度成功破解霹靂-15E源代碼,將為“陣風”帶來電子戰優勢

      外媒:印度成功破解霹靂-15E源代碼,將為“陣風”帶來電子戰優勢

      零度Military
      2026-05-22 01:05:03
      多家國產手機品牌宣布降價,最高降價2000元

      多家國產手機品牌宣布降價,最高降價2000元

      都市快報橙柿互動
      2026-05-21 13:35:27
      被禁多年的云南鴕鳥肉事件:20多名青少年被殺,兇手曾多次殺人

      被禁多年的云南鴕鳥肉事件:20多名青少年被殺,兇手曾多次殺人

      年代回憶
      2026-05-18 20:56:44
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      健康科普365
      2026-05-09 21:05:04
      68歲杜德偉聚餐梁朝偉近照曝光!狀態仿佛30歲,網友:好萊塢級逆生長

      68歲杜德偉聚餐梁朝偉近照曝光!狀態仿佛30歲,網友:好萊塢級逆生長

      阿廢冷眼觀察所
      2026-05-22 02:45:12
      55歲瞿穎在泰國面包店被偶遇,她的禮服好黑,臉上法令紋有點深

      55歲瞿穎在泰國面包店被偶遇,她的禮服好黑,臉上法令紋有點深

      星Xin辰大海
      2026-05-20 00:25:43
      定調成功!普京訪華后終于確認:俄羅斯要學中國,事關國家安全

      定調成功!普京訪華后終于確認:俄羅斯要學中國,事關國家安全

      白日追夢人
      2026-05-22 03:30:42
      福登落選世界杯名單,圖赫爾做出最終決定

      福登落選世界杯名單,圖赫爾做出最終決定

      晚風知我意21
      2026-05-22 01:11:08
      日本同事從北京密云回來后,一直搖頭說,中國已經是超一等國家了

      日本同事從北京密云回來后,一直搖頭說,中國已經是超一等國家了

      石辰搞笑日常
      2026-05-21 13:23:19
      黃仁勛的指甲沖上熱搜!高清鏡頭曝光,網友吵翻!醫生:這6種情況都可能

      黃仁勛的指甲沖上熱搜!高清鏡頭曝光,網友吵翻!醫生:這6種情況都可能

      上觀新聞
      2026-05-18 22:12:55
      雪上加霜!法院出手后,王健林傳壞消息,原來他和許家印處境一樣

      雪上加霜!法院出手后,王健林傳壞消息,原來他和許家印處境一樣

      林輕吟
      2026-04-18 07:46:46
      2026-05-22 06:51:00
      ScienceAI incentive-icons
      ScienceAI
      關注人工智能與其他前沿技術
      1307文章數 227關注度
      往期回顧 全部

      科技要聞

      小米YU7 GT正式發布:售價38.99萬元

      頭條要聞

      特朗普再威脅伊朗交出濃縮鈾 稱到手后或銷毀

      頭條要聞

      特朗普再威脅伊朗交出濃縮鈾 稱到手后或銷毀

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      反轉!金秀賢與金賽綸未成年時交往不實

      財經要聞

      潮水退去,裸泳的一定不止五糧液

      汽車要聞

      雷軍:YU7首戰Model Y八敗兩勝 輸給全球銷冠不丟人

      態度原創

      游戲
      房產
      藝術
      親子
      公開課

      一個前妻味兒拉滿的重女莊方宜,讓終末地的角色設計再次封神

      房產要聞

      順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學之約

      藝術要聞

      海市蜃樓水中樹

      親子要聞

      孩子晚上餓一餓, 真的能長高嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人无号精品一区二区三区| 国产一区二区内射最近更新| 亚洲精品久久久久国色天香| 国内成人免费自拍视频| 中文字幕 日韩 人妻 无码| 色wwwww| 亚洲精品成人一二三专区| 国产尤物视频网址导航| 国产日韩久久久久无码精品| 麻豆人妻| 夜夜躁狠狠躁日日躁视频| 欧美黄色一级视频a片| 香蕉久久久久久av综合网成人| 黑人粗硬进入过程视频| 亚洲综合另类小说色区一| 98久免费精品视频在线观看| 不卡一区二区视频日本| 亚洲中文字幕无码人在线| 国产精品内射后入合集| 成人AV毛片| 无码专区 人妻系列 在线| 曰本极品少妇videossexhd| 97久久精品人人做人人爽| 久国产精品久久精品国产四虎| 色妺妺视频网| 女女女女女裸体处开bbb| 亚洲成a人片77777kkkk| 爆乳日韩尤物无码一区| 中文字幕亚洲一区一区| 精品国精品国自产在国产| 麻豆一区二区三区精品视频| 六区久久| 色综合久久久久8天国| 亚洲男人AV天堂午夜在| 国产乱人偷精品人妻a片| 久久国产avjust麻豆| 中文字幕大香视频蕉免费| 九九热视频精品在线播放| 午夜成人福利| 亚洲中文字幕在线爆乳| 无码丰满少妇2在线观看|