<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI 協作重磅突破!斯坦福英偉達聯手消除AI溝通內耗,推理速度暴漲 2.4 倍

      0
      分享至


      想象一個場景:你讓三個AI助手協作完成一道數學題。

      傳統做法是——第一個AI把解題思路“寫”出來,第二個AI“讀”完再寫新的思路,第三個AI再“讀”再“寫”。

      這個過程,就像三個人輪流用對講機傳遞信息,每次都要先把腦子里的想法“翻譯”成語言,對方再把語言“翻譯”回想法。慢不慢?慢。費不費?費。更要命的是,這種“翻譯”過程會丟失信息——你腦子里想的,和你說出來的,往往不是一回事。

      這就是當前多智能體AI系統面臨的核心困境:“語言稅”。

      而最近,UIUC、斯坦福、英偉達、MIT聯合提出了一種新思路——RecursiveMAS。它讓AI們跳過“說話”這一步,直接用“思維”溝通。在實測中,推理速度提升了2.4倍,Token消耗削減了75%。

      (研究指路:https://arxiv.org/abs/2604.25917)

      AI開會的困境:效率都浪費在了“說話”上

      過去兩年,多智能體系統已經成為AI領域最熱門的研究方向之一。從OpenAI的Swarm到微軟的AutoGen,從LangGraph到CrewAI,各家都在探索如何讓多個AI協同工作以解決單個模型無法獨立完成的復雜任務。然而,在這些系統中,多個智能體的協作效率始終被一個基本假設所制約——智能體之間必須通過自然語言文本來交流。

      當你讓一個“數學專家”和一個“代碼審查員”協作時,整個流程看起來很“合理”,但拆解開來會發現問題很多:


      每一次信息傳遞,都伴隨著雙重轉換:內部思維→文字→內部思維。這個過程消耗的token不僅是金錢,更是寶貴的計算資源和時間。更關鍵的是,這種“寫出來再讀進去”的過程會丟失信息——模型在文本解碼時被壓縮進文字的豐富語義,下一個模型重新解碼時已經無法完全還原。在一個包含五個Agent的工作流中,文本編解碼的時間開銷往往占到總延遲的60%以上。

      更讓人頭疼的是,這種范式始終缺乏一個清晰的“旋鈕”來做系統性優化——增加更多智能體?邊際效益遞減,且通信開銷指數級增長。增加上下文窗口?Token成本爆炸。增加模型參數?單個Agent變強了,但協作效率并沒有本質提升——類似于給一群人每人配了更好的對講機,但他們依然要逐個念文字,溝通方式沒變,就算每個人都更聰明了,整體效率也無法有突破。行業內的應對方案,無論是提示詞工程還是LoRA微調,都只能在一定程度上緩解癥狀,無法根治這個根本性的架構問題。

      RecursiveMAS:用“心靈感應”替代“對講機”

      RecursiveMAS的核心思路非常巧妙:既然語言是瓶頸,那就不用語言。

      它借鑒了遞歸語言模型(Recursive Language Model)的思想。在傳統語言模型中,數據從第一層流向最后一層,線性前進,層數越多,參數越多;而遞歸語言模型反其道而行——不增加層數,而是把同一組層反復循環使用,讓數據在層之間來回“打轉”。數據每經過一次這組層,就相當于多了一輪“思考”,推理深度得以加深,但參數量卻不需要增加。

      RecursiveMAS把這個思路從“單模型內部”擴展到了“多智能體系統”:

      每個智能體就像遞歸語言模型中的一層,它們不再生成文字,而是傳遞“思想”——一種連續的、存在于潛空間(latent space)中的向量表征。

      研究者們用了一個詩意的比喻:“agents communicating telepathically as a unified whole”——智能體們像心靈感應一樣作為一個整體協作。

      具體來說,Agent A1處理后把自己的隱表征傳給Agent A2,A2處理后再傳給A3……直到最后一個Agent處理完,其隱輸出又被直接回傳給A1,開啟新一輪的遞歸迭代。整個過程完全在隱空間中進行,只有到了最后一輪的最后一個Agent,才將最終的隱表征解碼為文本輸出。這就好比一群專家圍坐一桌,不用說話,不用寫筆記,每個人只需默默思考,然后直接把自己腦中的“思維成果”傳給下一個人——整個過程既安靜又高效。


      圖:RecursiveMAS 架構示意——多Agent通過嵌入空間實現閉環遞歸協作(來源:arXiv)

      這個系統的關鍵組件叫做RecursiveLink,一個輕量級的兩層殘差模塊,負責把一個模型的隱層表征保留并轉換,然后傳遞到下一個模型的嵌入空間。語言模型最后一層的隱狀態,實際上已經編碼了豐富的語義推理信息,RecursiveLink要做的,就是把這些高維信息完整地“搬”過去,而不是先翻譯成文字再解讀。它分為內外兩個版本:



      圖:遞歸學習過程——內部鏈接與外部鏈接協同訓練(來源:arXiv)

      訓練策略上,RecursiveMAS有一個精妙的設計:主干模型權重完全凍結,只需訓練RecursiveLink模塊。這和LoRA(低秩適配)的精神有相似之處,但RecursiveLink更輕量:整個系統只需更新約1300萬個參數,僅占總可訓練參數的0.31%。峰值GPU顯存需求在所有對比方法中最低,訓練成本比全量微調降低50%以上。你可以把它理解為一個“輕量級轉接頭”,直接插在現有Agent生態上,無需從頭訓練新模型。如果多個Agent基于同一個基座模型(比如都用Qwen),它們甚至可以共享同一份模型權重,進一步節省顯存。

      訓練分兩階段進行:

      內層循環熱身: 各個智能體獨立訓練自己的Inner RecursiveLink,讓它們學會在潛空間里“想問題”而不是“寫問題”。這個階段可以并行進行,就像讓每個人先練習“內心獨白”。

      外層循環訓練: 將所有智能體串聯成完整的遞歸鏈路,以最終文本輸出質量為優化目標,通過共享梯度聯合優化所有RecursiveLink。這個階段解決的是“credit assignment”問題——如何把最終結果的成敗,準確歸因到每個Agent的貢獻。這種分階段策略避免了“一步到位”可能帶來的訓練不穩定問題。

      研究者們在理論上證明了遞歸訓練的梯度能夠保持穩定,不會出現RNN中常見的梯度爆炸或消失問題,同時在運行時復雜度上也優于傳統文本型MAS。

      實測效果:精度、速度、成本“三殺”

      理論說得再好,終歸要用數據說話。研究團隊在涵蓋數學、科學與醫學、代碼生成、搜索問答等領域的9個主流基準測試和4種協作模式(順序推理、混合專家、知識蒸餾、協商式工具調用)上進行了全面評估。實驗使用的開源模型陣容相當“豪華”——Qwen、Llama-3、Gemma3、Mistral,這些模型被分配了不同角色,組成了多種協作模式。

      對比基線陣容同樣硬核:LoRA微調、全量微調(SFT)、Mixture-of-Agents、TextGrad、LoopLM,以及使用相同遞歸循環結構但強制文本通信的Recursive-TextMAS。最后這個對照尤其關鍵——它證明了RecursiveMAS的優勢確實來自“跳過文本解碼”,而非來自遞歸結構本身。所有對比都在相同訓練預算下進行,公平公正。


      RecursiveMAS 核心性能指標

      結果顯示,RecursiveMAS在所有指標上都實現了一致性提升:

      精度: 平均準確率提升8.3%,在AIME2025數學競賽上比TextGrad高出18.1%,在AIME2026上高出13%。跳過文本解碼不僅沒有損失信息,反而讓模型保留了更豐富的隱層語義——畢竟,把思維壓縮成文字再解壓,這個過程中信息的損耗遠比我們想象的大。

      速度: 端到端推理速度提升1.2倍至2.4倍,且隨遞歸輪次增加而持續增長。這對實際應用場景意義重大:在需要實時響應的AI客服或代碼輔助系統中,2倍以上的速度提升意味著用戶體驗質的飛躍。

      成本: 與Recursive-TextMAS相比,Token消耗降低34.6%至75.6%。這不僅僅是成本的節省,更意味著在相同token預算下可以嘗試更深層次的推理。


      不同遞歸輪次下的推理加速倍數

      這里有一個關鍵洞察:遞歸深度越大,收益越高。加速效果隨遞歸輪次增長:第1輪平均1.2倍,第2輪1.9倍,第3輪2.4倍。原因很簡單——省掉的是每個Agent“把想法寫成文字”的時間,Agent越多、輪次越多,省的時間就越多。


      不同遞歸輪次下的Token節省比例

      在第三輪遞歸時,Token消耗降低了75.6%——這意味著同等性能下,運行成本可以壓縮到原來的約四分之一。對于需要復雜多步驟推理的生產環境,這無疑是巨大的吸引力。

      為什么這項研究值得關注?

      如果只是數字上的提升,這篇論文或許還不足以引起如此關注。真正讓它值得關注的,在于它可能重新定義多智能體系統的Scaling方向。

      過去幾年,多智能體領域的Scaling嘗試主要圍繞三條路:增加智能體數量、擴大上下文窗口、堆疊更大模型。但這些方法都面臨各自的瓶頸——智能體多了通信爆炸,窗口大了成本爆炸,模型大了訓練爆炸。

      RecursiveMAS提供了一條新路:加深遞歸深度。它把“多智能體協作”從并行的、文本交互的范式,轉化為深度的、潛空間遞歸的范式。就像遞歸語言模型通過反復處理同一個問題來深化推理,RecursiveMAS讓多個智能體能夠反復“推敲”彼此的“想法”,而不必每次都“說出來再聽回去”。

      研究者們在論文中提出的核心問題是:“智能體協作本身能否通過遞歸來擴展?”答案似乎是肯定的。

      當系統不再需要把內部表征“翻譯”成人類可讀的中間格式時,協作效率的上限就有望被進一步打開。

      當前的行業背景也為這項研究提供了切實的落地場景。百度2026開發者大會以“萬物一體(Agents at Scale)”為主題,Anthropic推出Claude Managed Agents,OpenAI持續推進GPT-5級推理的實時化——整個行業都在尋找讓Agent協作從demo走向生產環境的方法。而三座大山——計算成本、推理延遲、顯存限制——恰恰是RecursiveMAS試圖用0.31%的參數開銷來撬動的。

      當然,這項研究目前仍處于早期階段,有幾個問題值得關注:

      數據可信度待驗證。 目前的結果均為作者自報,尚未有獨立團隊完成復現。學術圈對新技術的態度往往是“大膽假設,小心驗證”。在這個“論文爆炸”的時代,獨立復現是檢驗技術真實價值的最佳方式。

      異構智能體的兼容性。 Outer RecursiveLink雖被設計用于連接不同架構的模型,但論文未詳細披露跨架構傳遞潛表征的細節。如果只能用于同構智能體,其實際應用范圍將大打折扣。畢竟,真實場景中很多時候我們需要混合使用GPT-4o、Claude等閉源API。

      可解釋性下降。 當Agent之間傳遞的不再是可讀的文本,而是一堆向量表征時,整個協作過程變成了“黑箱”。在需要對AI決策負責的生產環境中,這種不透明性可能帶來合規和審計挑戰。

      生產環境的復雜性。 論文測試的是相對干凈的協作場景,真實生產環境往往涉及外部工具調用、人機交互、動態工作流等復雜因素。

      RecursiveMAS的提出,本質上是將“遞歸”這一在單模型時代被證明有效的Scaling策略,引入到了多智能體時代,挑戰了“智能體之間必須通過自然語言傳遞信息”這一默認假設。如果數據可復現,MAS賽道下一階段的Scaling軸可能要從“堆智能體數量”轉向“加深遞歸深度”。

      當然,這項研究仍需在更多獨立基準上驗證,需要解決異構模型互聯的問題,需要在真實生產環境中證明自己。但至少,它讓我們看到了一個可能性——

      AI智能體之間的協作,可以不必總是“雞同鴨講”。

      (本文首發鈦媒體APP,作者 | 硅谷Tech_news,編輯 | 焦燕))

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      200萬!華為系“邁巴赫”,6月正式上市!

      200萬!華為系“邁巴赫”,6月正式上市!

      新浪財經
      2026-05-19 20:53:18
      中俄教育年啟動!雙向留學10萬人目標沒實現?你會留學俄羅斯嗎?

      中俄教育年啟動!雙向留學10萬人目標沒實現?你會留學俄羅斯嗎?

      留學觀察家
      2026-05-21 11:34:05
      與高市早苗保持距離,菲律賓總統喊出“不干涉”臺灣問題

      與高市早苗保持距離,菲律賓總統喊出“不干涉”臺灣問題

      海峽導報社
      2026-05-20 15:28:52
      24 歲短劇演員驟然離世!橫店拼命少年,永遠停在了山道晚風里

      24 歲短劇演員驟然離世!橫店拼命少年,永遠停在了山道晚風里

      南萬說娛26
      2026-05-21 09:35:36
      21號收評:滬指失守4100點!所有人都注意了,大盤后市或將這樣走

      21號收評:滬指失守4100點!所有人都注意了,大盤后市或將這樣走

      春江財富
      2026-05-21 15:20:31
      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      正常人可以偶爾偷吃一顆偉哥嗎?有什么副作用?本文為你講出實情

      健康科普365
      2026-05-09 21:05:04
      意大利人拆完張雪機車破防了:設計太激進,歐洲日本根本學不來!

      意大利人拆完張雪機車破防了:設計太激進,歐洲日本根本學不來!

      三農老歷
      2026-05-21 05:01:56
      3-0!維拉首奪歐聯杯+終結30年冠軍荒,54歲埃梅里5次奪冠創紀錄

      3-0!維拉首奪歐聯杯+終結30年冠軍荒,54歲埃梅里5次奪冠創紀錄

      我愛英超
      2026-05-21 06:36:09
      心臟支架裝上后還能活多少年?醫生說出大實話,這3點才是關鍵!

      心臟支架裝上后還能活多少年?醫生說出大實話,這3點才是關鍵!

      芹姐說生活
      2026-05-10 14:15:55
      “宇宙浩”要退網:終于“受了教育,得了經書的指引”?

      “宇宙浩”要退網:終于“受了教育,得了經書的指引”?

      穿透
      2026-05-21 11:33:16
      開撕!華裔女星痛批資本主義,馬斯克當場回懟:你為啥不去朝鮮?

      開撕!華裔女星痛批資本主義,馬斯克當場回懟:你為啥不去朝鮮?

      譚談社會
      2026-05-21 07:50:08
      福建楊梅“泡藥”風波下,浙江仙居姑娘一段視頻火了:父親種樹40年只為那7天的酸甜,“從小到大只見過我爸哭一次,因為楊梅樹倒了”

      福建楊梅“泡藥”風波下,浙江仙居姑娘一段視頻火了:父親種樹40年只為那7天的酸甜,“從小到大只見過我爸哭一次,因為楊梅樹倒了”

      極目新聞
      2026-05-20 18:30:13
      厲害了!張雪妻子在重慶第8家門店開業,一人身兼8店店長引熱議

      厲害了!張雪妻子在重慶第8家門店開業,一人身兼8店店長引熱議

      火山詩話
      2026-05-21 06:26:52
      天熱了,遇到這肉別手軟,比雞鴨魚便宜,比牛羊肉鮮美,營養解饞

      天熱了,遇到這肉別手軟,比雞鴨魚便宜,比牛羊肉鮮美,營養解饞

      阿龍美食記
      2026-05-19 12:26:36
      漲價潮,要來了!

      漲價潮,要來了!

      米筐投資
      2026-05-21 07:07:27
      24歲高齡網游有望加新地圖?好一個"老來得子"

      24歲高齡網游有望加新地圖?好一個"老來得子"

      游民星空
      2026-05-21 10:05:05
      何小鵬:激光雷達是個好東西 但汽車已不需要它了

      何小鵬:激光雷達是個好東西 但汽車已不需要它了

      快科技
      2026-05-21 13:54:06
      5年2.39億!傷了,又傷了!雷霆二當家轟然倒下

      5年2.39億!傷了,又傷了!雷霆二當家轟然倒下

      籃球實戰寶典
      2026-05-21 11:21:29
      年會上我當眾遞辭職信,董事長見年終獎只有99元,全場看向助理

      年會上我當眾遞辭職信,董事長見年終獎只有99元,全場看向助理

      曉艾故事匯
      2026-05-21 13:35:07
      綠營要在地鐵上用貼紙推銷沈伯洋?蔣萬安傻眼回應:不要亂丟垃圾

      綠營要在地鐵上用貼紙推銷沈伯洋?蔣萬安傻眼回應:不要亂丟垃圾

      海峽導報社
      2026-05-20 15:29:34
      2026-05-21 16:19:00
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨立財經科技媒體
      133923文章數 862181關注度
      往期回顧 全部

      科技要聞

      好到離譜也不夠!英偉達交出816億美元營收

      頭條要聞

      園區被指以電費賺差價:有斷電企業被要求繳納數十萬

      頭條要聞

      園區被指以電費賺差價:有斷電企業被要求繳納數十萬

      體育要聞

      常住人口7000的小鎮,擁有了一支德甲球隊

      娛樂要聞

      同行吐槽汪涵野心重 爆雷37萬人受損

      財經要聞

      英偉達業績超預!指引再新高仍不夠亮眼

      汽車要聞

      26.98萬起步 看小鵬GX如何詮釋一車多能以及滿配的科技與豪華

      態度原創

      家居
      手機
      游戲
      公開課
      軍事航空

      家居要聞

      風格碰撞 個性與藝術

      手機要聞

      三星開始向全球Galaxy S23系列手機推送One UI 8.5更新

      索尼PS發布會回歸線下直播!2018后首次 吃喝好享受

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗警告:任何新襲擊將促使戰場擴大到中東以外

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲天堂网在线视频| 久亚洲一线产区二线产区三线产区 | 亚洲精品熟女一区二区| 男女裸体做爰爽爽全过| 99精品视频精品精品视频| 人人人爽人人爽人人av| 男人天堂一区| 国产对白叫床清晰在线播放| 亚洲综合久久成人av| 无码成人aⅴ免费中文字幕| 国内精品美女a∨在线播放| 国产一国产一级新婚之夜| 免费看成人毛片无码视频| 91免费看视频| 国产免费网站看v片元遮挡| 青草青草久热国产精品| 亚洲日韩欧美内射姐弟| 国产精品爽爽ⅴa在线观看| 国产乱子伦无码精品小说 | 中文字幕乱码熟女人妻水蜜桃 | 日韩中文一区二区| 国产精品av中文字幕| 国产成人AV大片大片在线播放 | 青青草视频免费观看| 乱精品一区字幕二区| 亚洲MV国产MV在线MV综合试看| 久久久国产精品无码免费专区| 蜜臀久久精精品久久久久久噜噜 | 亚洲午夜福利精品久久| 天天躁夜夜躁狠狠躁躁88| 久久青草国产免费频观| 国产无套白浆一区二区三区| 性无码一区二区三区在线观看| 免费人妻无码不卡中文字幕18禁| 国产精品XXX| 久久中文字幕久久久久91| 老司机午夜精品视频无码| 日韩无码电影| 亚洲色一区二区三区四区| 中文字幕久久久久久久系列| 日韩人妻无码免费视频一二区|