<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      構建Claude Code的經驗教訓:從智能體的視角觀察

      0
      分享至


      作者 | Michael Redlich

      譯者 | 劉雅夢

      策劃 | 褚杏娟

      構建智能體工具帶中最困難的部分之一是構建其動作空間。

      Claude 通過工具調用來執行操作,但是在 Claude API 中有很多方法可以使用原語,比如 bash、skills 和最近添加的代碼執行來構造工具(閱讀 @RLanceMartin 的新文章,了解更多關于 Claude API 的編程工具調用)。

      考慮到所有這些選項,你如何設計智能體的工具?你是否只需要一個像代碼執行或 bash 這樣的工具嗎?如果你有 50 個工具,每個工具對應一個智能體可能遇到的用例,那會怎么樣?

      為了將自己置于模型的思維中,我喜歡想象被給予一個困難的數學問題。你想用什么工具來解它?這要看你自己的技術了!

      紙張是最基本的,但你將受限于手動計算。計算器會更好,但你需要知道如何操作更高級的選項。最快和最強大的選擇是計算機,但你必須知道如何使用它來編寫和執行代碼。

      這是一個設計智能體的有用框架。你想給它提供適合它自身能力的工具。但你怎么知道這些能力是什么呢?你要集中注意力,閱讀它的輸出,進行實驗。你要學著像智能體一樣看問題。

      以下是我們在構建 Claude Code 時從關注 Claude 中學到的一些經驗教訓。

      改進 Elicitation 和

      AskUserQuestion 工具


      在構建 AskUserQuestion 工具時,我們的目標是提高 Claude 提問的能力(通常稱為啟發)。

      雖然 Claude 可以直接問問題,但我們發現回答這些問題似乎花費了不必要的時間。我們怎樣才能降低這種摩擦,增加用戶和 Claude 之間的交流帶寬呢?

      嘗試 1:編輯 ExitPlanTool

      我們首先嘗試的是向 ExitPlanTool 添加一個參數,以便在計劃旁邊放置一系列問題。這是最容易實現的事情,但這讓 Claude 感到困惑,因為我們同時要求制定一個計劃,并提出一系列關于計劃的問題。如果用戶的回答與計劃內容相沖突怎么辦?Claude 需要調用 ExitPlanTool 兩次嗎?我們需要另一種方法。

      (你可以在我們關于提示緩存的文章中閱讀更多關于我們為什么 要創建 ExitPlanTool 的信息)

      嘗試 2:改變輸出格式

      接下來,我們嘗試修改 Claude 的輸出指令,以使用稍微修改的 markdown 格式來提問。例如,我們可以要求它輸出一個帶有括號中替代選項的要點問題列表。然后,我們可以解析該問題并將其格式化為用戶的 UI。

      雖然這是我們能做的最通用的更改,Claude 甚至似乎能夠很好地輸出這個,但這并不能保證。Claude 會附加額外的句子,省略選項,或者完全使用不同的格式。

      嘗試 3:AskUserQuestion 工具


      最后,我們決定創建一個 Claude 可以在任何時候調用的工具,但特別提示在計劃模式期間這樣做。當工具觸發時,我們會顯示一個模態框來顯示問題,并阻止智能體的循環直到用戶回答。

      這個工具允許我們提示 Claude 進行結構化輸出,并幫助我們確保 Claude 給用戶提供多個選項。它還為用戶提供了組合此功能的方法,例如在代理式 SDK 中調用它或在技能中引用它。

      最重要的是,Claude 似乎很喜歡調用這個工具,我們發現它的輸出效果很好。即使是最好的設計工具,如果 Claude 不知道如何調用它,也是行不通的。

      這是 Claude Code 中啟發的最終形式嗎?我們不確定。正如你將在下一個例子中看到的,適用于一個模型的方法可能不適用于另一個模型。

      更新能力:任務和待辦事項


      當我們第一次發布 Claude Code 時,我們意識到模型需要一個待辦事項列表來保持它的正常運行。可以在開始時編寫待辦事項,并在模型工作時進行檢查。為此,我們給了 Claude TodoWrite 工具,它可以編寫或更新待辦事項并將其顯示給用戶。

      但即便如此,我們也經常看到 Claude 忘記了它的職責。為了適應這種情況,我們每 5 個回合就會插入系統提醒,提醒 Claude 它的目標。

      但隨著模型的改進,它們不僅不需要被提醒待辦事項列表,而且還會發現它的局限性。收到待辦事項清單的提醒使 Claude 認為它必須堅持而不是修改它。我們還看到 Opus 4.5 在使用子智能體方面做得更好,但是子智能體如何在共享的待辦事項列表進行協調呢?

      看到這一點,我們用任務工具代替了 TodoWrite(閱讀更多 關于任務的內容)。待辦事項的作用是保持模型的正常運行,而任務的作用更多的是幫助智能體相互溝通。任務可以包括依賴關系,在子智能體之間共享更新,模型可以更改和刪除它們。

      隨著模型功能的增加,你的模型曾經需要的工具現在可能會限制它們。重要的是要不斷地回顧之前關于需要什么工具的假設。這也是為什么堅持支持一小組具有相當相似的功能配置文件的模型是有用的。

      設計一個搜索界面

      對 Claude 來說,一組特別重要的工具是搜索工具,可以用來構建自己的上下文。

      當 Claude Code 首次推出時,我們使用了一個 RAG 向量數據庫來查找 Claude 的上下文。雖然 RAG 功能強大且速度快,但它需要索引和設置,并且在許多不同的環境中可能很脆弱。更重要的是,Claude 被賦予了這個上下文,而不是自己找到上下文。

      但如果 Claude 能在網絡上搜索,為什么不搜索你的代碼庫呢?通過給 Claude 一個 Grep 工具,我們可以讓它自己搜索文件和構建上下文。

      這是我們看到的一個模式,隨著 Claude 變得越來越聰明,如果給它合適的工具,它就會越來越善于構建它的環境。

      當我們引入智能體技能時,我們正式定義了漸進式披露的概念,它允許智能體通過探索逐步發現相關的上下文。

      Claude 可以讀取技能文件,然后這些文件可以引用模型可以遞歸讀取的其他文件。事實上,技能的一個常見用途是為 Claude 添加更多的搜索功能,比如告訴它如何使用 API 或查詢數據庫。

      在一年的時間里,Claude 從不能真正建立自己的上下文,到能夠在幾層文件中進行嵌套搜索,以找到它所需要的確切上下文。

      漸進式披露現在是我們在不添加工具的情況下添加新功能的常用技術。

      漸進式披露:Claude Code 指南智能體

      Claude Code 目前有大約 20 個工具,我們不斷地問自己是否需要所有這些工具。添加新工具的門檻很高,因為這給模型提供了更多的選擇。

      例如,我們注意到 Claude 對如何使用 Claude Code 了解不夠。如果你問它如何添加 MCP 或者斜杠命令的作用,它將無法回答。

      我們本可以將所有這些信息放在系統提示中,但考慮到用戶很少詢問這些信息,這將增加上下文的腐朽并干擾 Claude Code 的主要工作:編寫代碼。

      相反,我們嘗試了一種漸進披露的形式。我們給了 Claude 一個文檔的鏈接,他可以下載這個鏈接來搜索更多的信息。這是有效的,但我們發現 Claude 會把很多結果放到上下文中來找到正確的答案,而你真正需要的只是答案。

      因此,我們構建了 Claude Code 指南子智能體,當你詢問它自己時,Claude 會被提示調用,子智能體有關于如何很好地搜索文檔以及返回什么內容的大量說明。

      雖然這不是完美的,Claude 仍然會感到困惑,當你問它如何設置自己,它是比以前好得多!我們能夠在不添加工具的情況下向 Claude 的動作空間添加東西。

      是藝術,不是科學

      如果你希望有一套關于如何構建工具的嚴格規則,很遺憾,這不是本指南。為模型設計工具既是一門科學,也是一門藝術。這在很大程度上取決于你正在使用的模型,智能體的目標以及它所處的環境。

      經常實驗,閱讀你的成果,嘗試新事物。像一個智能體一樣看待問題。

      https://x.com/trq212/status/2027463795355095314

      會議推薦

      QCon 全球軟件開發大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節跳動、小米、百度等一線科技企業與創新團隊的技術專家,圍繞 AI 工程化、系統架構與研發模式演進展開深入探討。更多詳情可掃碼或聯系票務經理 18514549229 進行咨詢。

      今日薦文


      你也「在看」嗎?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      別高興太早了!三星家電“撤離”中國,這不是好消息!

      別高興太早了!三星家電“撤離”中國,這不是好消息!

      叮當當科技
      2026-05-07 05:44:46
      以軍:巴盧特身亡

      以軍:巴盧特身亡

      第一財經資訊
      2026-05-07 17:37:06
      熱搜!鐘麗緹女兒發浴室自拍照沒打碼,導致同學坐馬桶畫面流出

      熱搜!鐘麗緹女兒發浴室自拍照沒打碼,導致同學坐馬桶畫面流出

      丫頭舫
      2026-05-06 10:12:55
      當伊朗亮出海底光纜底牌時,全世界才發現,中國藏了一手更絕的

      當伊朗亮出海底光纜底牌時,全世界才發現,中國藏了一手更絕的

      聞識
      2026-05-06 21:50:14
      一紙訃告,字字泣血!瀏陽煙花廠爆炸事故中一女子的悼詞,引熱議

      一紙訃告,字字泣血!瀏陽煙花廠爆炸事故中一女子的悼詞,引熱議

      火山詩話
      2026-05-07 12:42:44
      我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

      我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

      千秋文化
      2026-04-20 19:55:30
      泉州市一污水提質增效工程發生坍塌事故,造成1人死亡

      泉州市一污水提質增效工程發生坍塌事故,造成1人死亡

      澎湃新聞
      2026-05-07 20:34:25
      問題果然出現了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

      問題果然出現了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

      混沌錄
      2026-05-06 23:01:06
      五百萬請求背后的三次推倒重來

      五百萬請求背后的三次推倒重來

      爬蟲飼養員
      2026-05-06 22:06:28
      98.6%!挪威基本沒人買油車了!

      98.6%!挪威基本沒人買油車了!

      王煜全
      2026-05-06 15:16:01
      她15歲出道即爆紅,卻因"不雅照"被毀,如今男友是我們熟悉的他

      她15歲出道即爆紅,卻因"不雅照"被毀,如今男友是我們熟悉的他

      興史興談
      2026-05-07 00:58:05
      中國球迷可能看不了今年世界杯?FIFA稱談判還在進行中,天價轉播權引爭議

      中國球迷可能看不了今年世界杯?FIFA稱談判還在進行中,天價轉播權引爭議

      澎湃新聞
      2026-05-07 21:04:26
      這下慘了!50家ST集體跌停,張素芬、外資還集體扎堆6家央國企ST

      這下慘了!50家ST集體跌停,張素芬、外資還集體扎堆6家央國企ST

      長風價值掘金
      2026-05-07 17:57:50
      秦昊真坦誠啊:和伊能靜結婚時,她卡里有6000萬,我就20萬

      秦昊真坦誠啊:和伊能靜結婚時,她卡里有6000萬,我就20萬

      阿廢冷眼觀察所
      2026-05-06 15:16:12
      6月1日起全國醫院統一新規,看病再也不用愁,誰都不能例外

      6月1日起全國醫院統一新規,看病再也不用愁,誰都不能例外

      老特有話說
      2026-05-07 15:20:09
      白衣美女,身材真好

      白衣美女,身材真好

      藍色海洋009
      2026-05-07 20:42:57
      研究表明:性生活次數不達標,不管男女容易早衰且癌癥風險增高!

      研究表明:性生活次數不達標,不管男女容易早衰且癌癥風險增高!

      黯泉
      2026-05-03 20:25:37
      “禍從天降”!深圳一商場天花板掉落,砸到路人!最新回應

      “禍從天降”!深圳一商場天花板掉落,砸到路人!最新回應

      南方都市報
      2026-05-07 22:37:02
      別不信,現在很多公交集團員工連求饒的機會都沒有了

      別不信,現在很多公交集團員工連求饒的機會都沒有了

      音樂時光的娛樂
      2026-05-07 16:01:35
      央視三胎宣傳片惹爭議,脫離現實強行把孕婦塑造成超人式幸福?

      央視三胎宣傳片惹爭議,脫離現實強行把孕婦塑造成超人式幸福?

      今朝牛馬
      2026-05-07 20:36:33
      2026-05-08 00:11:00
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
      1477文章數 149關注度
      往期回顧 全部

      科技要聞

      月之暗面完成20億美元融資,估值突破200億

      頭條要聞

      日媒詢問中國是否希望恢復中日之間人員往來 中方回應

      頭條要聞

      日媒詢問中國是否希望恢復中日之間人員往來 中方回應

      體育要聞

      巴黎再進歐冠決賽,最尷尬的情況還是發生了

      娛樂要聞

      Lisa主持!寧藝卓觀看脫衣秀風波升級

      財經要聞

      人均年薪406萬,這家ST公司驚呆市場!

      汽車要聞

      雷克薩斯全新純電三排SUV 全新TZ全球首發

      態度原創

      本地
      手機
      藝術
      數碼
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      手機要聞

      麒麟9050+雙潛望+超聲波指紋,華為Mate90 Pro Max迎重磅升級!

      藝術要聞

      這位老教授筆下的青年,活力滿滿

      數碼要聞

      5月6月機圈殺瘋了!十幾款新機排隊上場,你的錢包頂得住嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 鱼台县| 超碰狠狠干| 国产AV一区二区精品久久凹凸 | 人妻精品中文久久一区| 福利在线不卡| 手机在线亚洲国产精品| 女性高爱潮视频| 偷国产乱人伦偷精品视频| www内射| 亚洲?成人?综合?另类| 色情午夜 码一区二区网址| 在线天堂最新版资源| 久久久久亚洲AV青青草原| 国产伦一区二区三区精品| 高清亚洲综合色成在线播放放| 国产香蕉一区二区在线网站| 国产性夜夜春夜夜爽免费下载| 欧美人与动欧交视频| 国产18禁美女无遮挡| 国产免费无码一区二区视频| 在线成人国产天堂精品av| 亚洲乱熟女| 久久精品国产久精国产爱| 久久精品aⅴ无码中文字幕| 百合av一区二区三区| 美女视频久久久| 免费人成黄页在线观看美国| 国产熟女一区二区三区五月婷| 亚洲bt欧美bt精品| 国产成人精选视频在线观看不卡| 亚洲国产福利成人一区二区| 国产福利2021最新在线观看| 黑色丝袜无码中中文字幕| 成人精品久久一区二区三区| 色偷偷www8888| 久久久无码精品亚洲日韩按摩| 国产美女一级做a爱视频| 中国精品视频一区二区三区| 国产乱淫视频免费| 国产真实野战在线视频| 免费黄色大全一区二区三区|