<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      RouteMoA:無需預推理的動態路由,實現高效多智能體混合

      0
      分享至



      本篇論文已被 ACL 2026 接收,主要作者來自上海交通大學自動化與感知學院 IWIN 中心團隊。團隊負責人為關新平教授,指導老師為陳彩蓮教授和樂心怡教授,合作作者還包括南洋理工大學陶大程教授。其他作者來自騰訊、上海人工智能實驗室、香港中文大學等機構。第一作者王驥澤為上海交通大學博士生,研究方向為大模型智能體。

      近年來,大語言模型的發展,正在從 “單模型能力提升” 走向 “多模型協作”。這是一個很自然的方向:既然不同模型各有所長,有的擅長數學,有的擅長代碼,有的更懂醫學,那為什么不讓它們協同起來,共同解決更復雜的問題?

      Mixture-of-Agents(MoA)正是在這樣的背景下提出的。它通過讓多個模型并行生成、逐層交互、反復融合,往往能夠得到比單一模型更強的結果。問題也很明顯:性能提升的同時,成本和延遲也隨之迅速上升。

      在標準 MoA 中,每一輪通常都要調用多個模型,再基于它們的輸出進行篩選和融合。但究竟該讓哪些模型參與、哪些模型可以跳過,往往缺乏明確的選擇機制。模型越多、層數越深,整體開銷就越高,在大規模模型池場景下,系統效率和可擴展性都會面臨很大挑戰。

      也正因如此,研究者開始嘗試讓 MoA 變稀疏。例如,一些方法如 Sparse MoA 會先讓模型池中的所有模型生成回答,再通過額外的評審模型進行打分和篩選,只保留一部分模型進入后續協作。這樣雖然減少了后續融合的負擔,但本質上仍然繞不開一個問題:為了決定該選誰,系統還是得先讓所有模型都推理一遍。

      于是,這篇工作的核心問題就變得非常直接:我們真的需要先讓所有模型都回答一遍,才能決定該選誰嗎?



      • 論文標題:RouteMoA: Dynamic Routing without Pre-Inference Boosts Efficient Mixture-of-Agents
      • 論文鏈接:https://arxiv.org/abs/2601.18130
      • 代碼鏈接:https://github.com/Jize-W/RouteMoA

      一句話總結:RouteMoA 的核心思想是,通過在推理前進行模型能力預測,避免對所有模型進行無效推理。





      現有方法的問題:

      效率瓶頸不在融合,而在全量推理

      當前 MoA 系列方法的一個共同假設是:要判斷哪個模型更好,必須先看到它的輸出。因此,無論是經典 MoA,還是引入 judge 的 Sparse MoA,本質上都繞不開一個步驟:所有模型先推理 -> 再篩選 -> 再融合。

      這帶來兩個問題:

      第一,計算成本無法下降。即使最后只用少數模型,前面已經為所有模型付出了推理代價。

      第二,難以擴展到大模型池。當模型數量增加時,全量推理會迅速變得不可承受,甚至超出上下文限制。

      也就是說,瓶頸并不在 “如何選”,而在 “選之前已經太貴了”。

      RouteMoA:

      把 “選模型” 前移到推理之前



      RouteMoA 的關鍵創新,是把模型選擇從 “后驗判斷” 變成 “先驗預測 + 輕量修正”。

      整個流程可以分為三個步驟:

      1. 先驗篩選:不推理,也能判斷誰更可能做對

      RouteMoA 引入了一個輕量級 scorer,只根據用戶 query,就預測每個模型的潛在表現。這個過程不需要調用大模型推理,只做一個粗粒度打分,把模型池縮小到一個潛力子集。本質上,這是在做一件過去被忽略的事情:用 query 本身的信息,提前判斷模型能力匹配度。

      2. 后驗修正:用已有輸出做低成本評審

      初篩不可避免會有誤差,因此 RouteMoA 引入了 mixture-of-judges:

      • self-assessment:模型對自己的答案打分
      • cross-assessment:高質量模型評估其他模型

      關鍵在于:這些評估只基于已經生成的輸出,不引入額外推理調用。也就是說,系統通過已有信息進行糾錯,而不是再算一輪。

      3. 綜合排序:性能、成本、延遲一起優化

      最終,RouteMoA 在模型選擇時不僅僅考慮性能,而是同時考慮:

      • 輸出質量
      • token 成本
      • 推理延遲

      從而在實際系統中實現一個更接近工程最優的決策,而不是單純追求 accuracy。

      實驗結果:

      少花 90% 的錢,反而更強

      在包含 15 個模型的大規模模型池實驗中,RouteMoA 的結果非常直觀:

      • 成本降低 89.8%
      • 延遲降低 63.6%
      • 同時整體準確率相對 MoA 和 SMoA 有所提升

      這說明一件事:減少無效計算,不僅不會傷害性能,反而會讓系統更專注于對的模型。



      一個關鍵洞察:

      多模型系統的本質是稀疏的

      論文中一個非常重要的觀察是:在絕大多數 query 上,真正關鍵的模型只占少數。只要初始階段能把這些模型保留下來,后續協作就足以放大正確答案。實驗中,scorer 在 Top-3 內命中正確模型的概率接近 98%,這意味著:系統并不需要看所有答案,只需要別漏掉對的模型。

      進一步分析:

      失敗不在選錯模型,而在融合階段



      一個很有意思的發現是,在失敗案例中:

      • 超過 50% 的錯誤來自最終答案融合(aggregation drift)
      • 而真正因為選錯模型的比例要低得多

      可見,多模型系統的瓶頸正在發生轉移:從 “選誰來回答”,轉向 “如何整合多個答案”。

      總結:多模型時代,調度很重要

      RouteMoA 的意義,并不只是一個更高效的 MoA 變體,而是提供了一種新的范式:

      • 不再默認所有模型都要參與
      • 而是先判斷誰值得參與
      • 再用協作機制校正和放大正確答案

      換句話說,隨著多模型協作的興起,系統層的調度與協同,正變得與模型能力同樣重要。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      深圳光明龍湖觀萃苑項目首開售罄 成為區域年內首個“日光盤”

      深圳光明龍湖觀萃苑項目首開售罄 成為區域年內首個“日光盤”

      觀點機構
      2026-05-05 10:27:16
      離開國家隊后,她幫意大利實現八連冠,如今31歲緋聞不斷仍是單身

      離開國家隊后,她幫意大利實現八連冠,如今31歲緋聞不斷仍是單身

      林輕吟
      2026-04-28 14:25:49
      新款不知火舞性感手辦推出!前凸后翹難以抵擋!

      新款不知火舞性感手辦推出!前凸后翹難以抵擋!

      游民星空
      2026-05-03 23:45:02
      名記炮轟王皓區別對待球員:你是國乒主教練,不是某個人的私教

      名記炮轟王皓區別對待球員:你是國乒主教練,不是某個人的私教

      十點街球體育
      2026-05-04 18:28:55
      無懸念!無爭議!就是第一!就是無敵!

      無懸念!無爭議!就是第一!就是無敵!

      左右為籃
      2026-05-05 17:04:56
      公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

      公安部提醒:換身份證后別急著走!這3個關鍵步驟多數人忽略

      老特有話說
      2026-05-04 16:04:22
      瀏陽煙花圈水有多深?法人未必是老板,胡正平身份耐人尋味

      瀏陽煙花圈水有多深?法人未必是老板,胡正平身份耐人尋味

      觀星賞月
      2026-05-05 12:39:33
      “窒息時刻”:9700萬桶原油撐爆儲罐,特朗普“不戰而屈人之兵”

      “窒息時刻”:9700萬桶原油撐爆儲罐,特朗普“不戰而屈人之兵”

      民間胡扯老哥
      2026-05-05 06:43:13
      躺平網吧惹爭議,6毛一小時,10元飯管飽,有人直接待了一年

      躺平網吧惹爭議,6毛一小時,10元飯管飽,有人直接待了一年

      映射生活的身影
      2026-05-03 20:10:56
      隨著吳宜澤奪得世錦賽冠軍,獎金分配出爐,吳宜澤462萬,趙心童46萬,丁俊暉27萬,常冰玉獎金令人意外

      隨著吳宜澤奪得世錦賽冠軍,獎金分配出爐,吳宜澤462萬,趙心童46萬,丁俊暉27萬,常冰玉獎金令人意外

      體壇最前線66
      2026-05-05 05:39:45
      大伯老炫耀兒子是公務員,我就說自己年薪60w,是他的10倍!結果大伯說:你深圳掙60w正常!但要論生活質量,肯定還是我兒子高!

      大伯老炫耀兒子是公務員,我就說自己年薪60w,是他的10倍!結果大伯說:你深圳掙60w正常!但要論生活質量,肯定還是我兒子高!

      譚老師地理大課堂
      2026-05-04 00:06:09
      你拋美債,我拋中債!外資紛紛減持中國債,大量資金流向美國?

      你拋美債,我拋中債!外資紛紛減持中國債,大量資金流向美國?

      混沌錄
      2026-04-22 20:55:37
      1991年蘇聯解體后,當年叛逃蘇聯的開國少將馬爾果夫通過外交致信懇請歸國,我國如何處理的

      1991年蘇聯解體后,當年叛逃蘇聯的開國少將馬爾果夫通過外交致信懇請歸國,我國如何處理的

      花開無田
      2026-05-05 10:44:31
      饅頭立大功!研究發現:糖尿病患者常吃饅頭,或能降低7類并發癥

      饅頭立大功!研究發現:糖尿病患者常吃饅頭,或能降低7類并發癥

      阿兵科普
      2026-05-04 18:15:59
      埃及法老迎娶自己的女兒,還生下孩子,難道他們不覺得違背倫理?

      埃及法老迎娶自己的女兒,還生下孩子,難道他們不覺得違背倫理?

      歷史人文2
      2026-05-05 09:46:17
      任正非未料:前華為員工執掌全球AI命脈

      任正非未料:前華為員工執掌全球AI命脈

      徐云流浪中國
      2026-05-03 18:53:06
      普京真正接班人出現了,俄羅斯唯一能打敗北約的人:誰不服都不行

      普京真正接班人出現了,俄羅斯唯一能打敗北約的人:誰不服都不行

      春序娛樂
      2026-04-28 02:20:34
      首個00后斯諾克世錦賽冠軍,吳宜澤:我的父母才是真正的冠軍;其父親曾關停經營多年店鋪,賣掉全家唯一住房、打多份零工培養兒子

      首個00后斯諾克世錦賽冠軍,吳宜澤:我的父母才是真正的冠軍;其父親曾關停經營多年店鋪,賣掉全家唯一住房、打多份零工培養兒子

      極目新聞
      2026-05-05 09:25:55
      他是吳宜澤當下最關鍵的對手,拿下13個冠軍,選老婆的眼光也不錯

      他是吳宜澤當下最關鍵的對手,拿下13個冠軍,選老婆的眼光也不錯

      白面書誏
      2026-05-04 17:50:08
      爸爸吐槽褲子太短把女兒氣哭:這暴露個啥了!

      爸爸吐槽褲子太短把女兒氣哭:這暴露個啥了!

      另子維愛讀史
      2026-05-05 10:12:47
      2026-05-05 18:15:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12917文章數 142642關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      四川一企業盜采河水作飲用水售賣十年 當地回應

      頭條要聞

      四川一企業盜采河水作飲用水售賣十年 當地回應

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇25周年演唱會 張敬軒被救護車拉走

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      游戲
      手機
      家居
      藝術
      教育

      “百萬元”買不到國產大作的廁所!玩家:美少女不需要

      手機要聞

      十年來第一次!蘋果討論漲價:iPhone 18漲幅或超600元

      家居要聞

      靈動實用 生活藝術場

      藝術要聞

      有多少人知道,它曾是亞洲第一高樓?

      教育要聞

      新傳考研名詞解釋:數據投毒

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲小说图区综合在线| 呻吟国产av久久一区二区| 一区二区三区自拍| 精品久久久久久国产牛牛| 国产欧美va欧美va香蕉在| 亚洲国产中文在线有精品| 亚洲人成网站在线观看播放不卡| 欧美国产日韩在线播放| 国产超爽精品国语对白| 日韩AV无码一区二区三不卡| 精品熟女视频专区| 亚洲人成网线在线播放不卡 | 亚洲成人第一页| 亚洲a片成人无码久久精品色欲 | 国产黄色大片一区精品| 一区二区三区福利午夜| 思思久久96热在精品国产| xxxx国产| 精品人妻一区二区| 久久亚洲欧美日本精品| 成年女人碰碰碰视频播放| 手机看片1024人妻| 三上悠亚ssⅰn939无码播放| 国产精品久久国产三级| 日韩一区二区三区av在线| 99久久精品国产一区二区暴力| 国产精品内射久久久久欢欢| 成人一级黄色毛片| 天堂av一区二区三区| 色吊丝永久免费| 影音先锋日日狠狠久久| 欧美久久久精品中文字幕| 99色色网| 老妇肥熟凸凹丰满刺激| 国产成年无码久久久久下载| 国产免费羞羞视频| 中国www高清激情| 亚洲欧洲美洲在线观看| 亚洲国产精品久久精品成人网站| 成人国产欧美大片一区| 亚洲无人区码一二三区别|