<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      Anthropic 新工具:Sonnet 遇到難題可以請教 Opus 了

      0
      分享至

      PRODUCT

      Anthropic 發布了一個新的 API 工具,讓 Sonnet 或 Haiku 在跑任務的過程中,遇到搞不定的決策時自動請教 Opus,拿到指導后繼續干活。這個策略叫 Advisor Strategy,工具叫 Advisor Tool

      效果是:智能接近 Opus,成本接近 Sonnet


      Advisor 策略的工作方式:Sonnet 執行,遇到難題請教 Opus

      反過來的 Sub-Agent 模式

      行業里常見的多 Agent 模式是:大模型當指揮官,拆解任務分給小模型去執行。Advisor 策略把這個方向反過來了

      Sonnet(或 Haiku)作為 Executor 全程執行任務,調用工具、讀取結果、迭代推進。當它遇到一個自己判斷力不夠的決策點時,它會調用 Opus 作為 Advisor。Opus 拿到共享的上下文,返回一個計劃、一個糾正、或者一個停止信號。然后 Sonnet 繼續執行

      Advisor 不調用工具,不產出面向用戶的輸出,只提供指導。前沿級推理只在 Executor 需要的時候介入,其余時間全部按 Executor 的價格計費

      不是大模型指揮小模型干活,是小模型干活遇到難題請教大模型

      這個設計的好處是:不需要任務拆解邏輯,不需要 worker pool,不需要編排框架。Executor 自己判斷什么時候需要升級,整個過程在一次 API 調用里完成

      評測數據

      先看 Sonnet + Opus Advisor 的組合

      SWE-bench Multilingual

      Sonnet + Advisor 比 Sonnet 單獨跑提升了 2.7 個百分點,同時每個任務的成本降低了 11.9%。成本降低的原因是 Advisor 的介入讓 Executor 少走彎路,減少了總 token 消耗


      SWE-bench Multilingual:Sonnet + Advisor vs Sonnet Solo vs Opus Solo

      BrowseComp 和 Terminal-Bench 2.0

      在 BrowseComp 和 Terminal-Bench 2.0 上,Sonnet + Advisor 同樣超過了 Sonnet 單獨跑,而且每個任務的成本更低


      BrowseComp + Terminal-Bench:Sonnet + Advisor 的表現和成本

      再看 Haiku + Opus Advisor 的組合,這個更有趣

      在 BrowseComp 上,Haiku + Advisor 得分 41.2%,是 Haiku 單獨跑(19.7%)的兩倍多。跟 Sonnet 單獨跑比,分數低了 29%,但成本低了 85%


      BrowseComp:Haiku + Advisor vs Haiku Solo vs Sonnet Solo

      對于高吞吐、需要平衡智能和成本的場景,這個組合很有吸引力。用 Haiku 的價格拿到接近 Sonnet 水平的結果

      怎么用

      API 層面非常簡單。在 Messages API 請求的 tools 數組里加一個 advisor_20260301 類型的工具,指定 Advisor 模型是 Opus,設一個 max_uses 限制每次請求最多請教幾次

      整個模型交接在一次 /v1/messages 請求里完成,不需要額外的網絡來回,不需要自己管理上下文傳遞。Executor 決定什么時候調用 Advisor,Anthropic 負責把精選的上下文路由給 Advisor 模型,拿到計劃后 Executor 繼續執行

      計費方式:Advisor 的 token 按 Advisor 模型的價格算(Opus 的 $5/$25),Executor 的 token 按 Executor 模型的價格算(Sonnet 的 $3/$15 或 Haiku 的 $1/$5)。因為 Advisor 每次只生成一個短計劃(通常 400-700 個 token),整體成本遠低于全程跑 Opus

      可以通過 max_uses 限制 Advisor 調用次數來控制成本。Advisor 的 token 消耗在 usage 中單獨報告

      早期用戶怎么說

      在復雜任務上做出了更好的架構決策,在簡單任務上沒有任何額外開銷。計劃和執行軌跡完全是兩個級別

      Eric Simmons,Bolt CEO

      我們看到了 Agent 輪次、工具調用次數和整體分數的明確改善,比我們自己構建的 planning 工具效果更好

      Kay Zhu,Genspark 聯合創始人兼 CTO

      在結構化文檔提取任務上,Advisor 讓 Haiku 4.5 按需請教 Opus 4.6,達到了前沿模型的質量,成本低 5 倍

      Anuraj Pandey,Eve Legal 機器學習工程師

      幾個信號

      第一,這是 Anthropic 第一次在 API 層面提供模型間協作的原生支持。之前想讓 Sonnet 和 Opus 配合,你得自己寫編排邏輯、管理上下文傳遞、處理兩次 API 調用的狀態?,F在一個 tool 聲明就搞定

      第二,定價邏輯很巧妙。Advisor 每次只輸出 400-700 個 token 的短計劃,按 Opus 價格算也就幾分錢。但這幾分錢的指導可以讓 Executor 少走彎路,減少總 token 消耗。所以出現了「加了 Advisor 反而總成本更低」的現象

      花幾分錢請教一次 Opus,省下來的是 Sonnet 走彎路燒掉的幾毛錢

      第三,Haiku + Opus Advisor 的組合值得關注。BrowseComp 41.2% 的成績用 Haiku 的價格拿到,比 Sonnet 單獨跑便宜 85%。對于大規模、成本敏感的 Agent 部署場景,這個組合可能比 Sonnet 更合適

      第四,時間線繼續加密。Mythos、Managed Agents、Advisor Tool,Anthropic 在一周內連續發布了最強模型、Agent 基礎設施平臺、模型間協作工具,產品線的密度在快速增加

      參考材料

      The Advisor Strategy 官方博客
      https://claude.com/blog/the-advisor-strategy

      Advisor Tool API 文檔
      https://platform.claude.com/docs/en/agents-and-tools/tool-use/advisor-tool

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      高通、英特爾股價跌幅均擴大至5%以上

      高通、英特爾股價跌幅均擴大至5%以上

      每日經濟新聞
      2026-05-14 21:38:47
      河南17歲失聯男孩張志明已溺亡,曾被送去戒網機構,手指關節粗大

      河南17歲失聯男孩張志明已溺亡,曾被送去戒網機構,手指關節粗大

      魔都姐姐雜談
      2026-05-15 01:07:44
      丁海峰夫婦凌晨1點機場接娃,兒子身高超190,長相隨媽比爸爸還帥

      丁海峰夫婦凌晨1點機場接娃,兒子身高超190,長相隨媽比爸爸還帥

      八怪娛
      2026-05-14 11:08:39
      馬斯克幼子的虎頭包走紅,品牌方:少數民族繡娘手工縫制,優惠后每個338元,正緊急追加生產

      馬斯克幼子的虎頭包走紅,品牌方:少數民族繡娘手工縫制,優惠后每個338元,正緊急追加生產

      揚子晚報
      2026-05-14 22:32:00
      國臺辦回應“小艦長”呂禮詩遭調查

      國臺辦回應“小艦長”呂禮詩遭調查

      參考消息
      2026-05-13 13:25:06
      特朗普來華,外交學院專家臉被打腫了

      特朗普來華,外交學院專家臉被打腫了

      吃瓜體
      2026-05-14 13:37:12
      中美關系,有了新定位

      中美關系,有了新定位

      中國新聞周刊
      2026-05-14 16:01:38
      日媒:世乒賽賽制有問題!中國隊排名小組第三 其他隊伍故意輸球

      日媒:世乒賽賽制有問題!中國隊排名小組第三 其他隊伍故意輸球

      念洲
      2026-05-14 20:27:36
      FIFA妥協?世界杯轉播權談判迎進展,央視堅守底線,球迷松口氣

      FIFA妥協?世界杯轉播權談判迎進展,央視堅守底線,球迷松口氣

      祥談體育
      2026-05-14 11:13:18
      復旦大學最新研究,一線中產家庭正在給孩子尋找新出路

      復旦大學最新研究,一線中產家庭正在給孩子尋找新出路

      三個媽媽六個娃
      2026-05-12 21:08:39
      張雪宣布停產!博主:雷軍出問題你建議退款 自己出問題只補償

      張雪宣布停產!博主:雷軍出問題你建議退款 自己出問題只補償

      念洲
      2026-05-14 14:29:33
      一代人覺醒,三代人托舉:這篇文章,建議每個普通家庭都讀兩遍

      一代人覺醒,三代人托舉:這篇文章,建議每個普通家庭都讀兩遍

      心理觀察局
      2026-05-12 08:55:11
      被中國制裁6年的魯比奧,為何能隨特朗普訪華?真相來了

      被中國制裁6年的魯比奧,為何能隨特朗普訪華?真相來了

      燕梳樓頻道
      2026-05-14 19:54:33
      黃仁勛算不算中國人?血統追根溯源一目了然,下一代截然不同

      黃仁勛算不算中國人?血統追根溯源一目了然,下一代截然不同

      奇思妙想生活家
      2026-05-14 00:17:49
      一座天壇,橫跨51年:美國總統再次踏上中美交往的歷史現場

      一座天壇,橫跨51年:美國總統再次踏上中美交往的歷史現場

      澎湃新聞
      2026-05-14 13:34:30
      “只有我和黃仁勛在專機上”

      “只有我和黃仁勛在專機上”

      中國新聞周刊
      2026-05-14 12:27:23
      停更3年,千萬粉絲網紅改名宣布回歸,4小時漲粉240萬

      停更3年,千萬粉絲網紅改名宣布回歸,4小時漲粉240萬

      天津生活通
      2026-05-14 10:34:09
      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊看世界
      2026-05-14 14:06:24
      云南電工挫敗黑社會團伙,1人對抗120名混混,造成對方9死48傷

      云南電工挫敗黑社會團伙,1人對抗120名混混,造成對方9死48傷

      莫地方
      2026-05-15 01:30:04
      奧運冠軍官宣減重50斤,網友直呼“完全認不出”

      奧運冠軍官宣減重50斤,網友直呼“完全認不出”

      極目新聞
      2026-05-14 20:18:58
      2026-05-15 06:40:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      439文章數 53關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      數碼
      本地
      親子
      房產
      公開課

      數碼要聞

      與“AMD+AMG”賽道相見,英特爾、邁凱倫F1車隊達成戰略合作

      本地新聞

      用蘇繡的方式,打開江西婺源

      親子要聞

      孤獨癥特教老師的工作,遠不止“教說話”!(下)

      房產要聞

      海南樓市新政要出!擬調公積金貸款額度,最高可貸168萬!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产亚洲成av人片在线观看下载| 国产裸体美女视频全黄| 蜜臀亚洲AV永久无码精品老司机| 国产AV午夜精品一区二区三区| 免费无码黄动漫在线观看| 久久影院一区二区h| 久久精品国产88精品久久| 精品?国产区一区二| 中文字幕乱码日本道在线观看 | 国产91视频| 国产精品久久久久久久久久久久久吹 | 日韩精品久久久免费观看| 老熟妇Av| 成人电影c.cc| 国产亚洲一区二区三区夜夜骚| 天天躁日日躁狠狠躁视频2021| 国产成人久久婷婷精品流白浆| 欧美人与z0zoxxxx视频| 国产熟女老阿姨毛片看爽爽| 日本一区中文字幕| 91操碰| 天天做天天欢摸夜夜摸狠狠摸| 国产97人人超碰caoprom三级| 久久亚洲A?V| 日韩欧无码一区二区三区免费不卡| 3d动漫精品一区二区三区| 91肉丝| 内射老阿姨1区2区3区4区| 国内精品人妻无码久久久影院94| 国产口爆自拍| 精品少妇人妻av无码久久| 中国精品少妇hd| 日韩一区二区三区精品区| 免费精品美女久久久久久久久久| 午夜精品久久久久久久2023| 国产精品九九久久精品女同 | 色橹橹欧美在线观看视频高清| 自拍偷拍亚洲激情| 亚洲第一福利网站在线| 国产又大又粗又猛又爽的视频| 亚洲熟妇自偷自拍另类 |