<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      踏馬的 Agent

      0
      分享至

      先解釋一下標題。Harness 這個詞最近在 AI 圈很火,本意是馬具,套在馬身上讓它好好干活的那套東西

      Agent with harness,也是很踏馬的


      踏馬的Agent

      這篇文章想聊的事情很簡單。過去三年,AI 圈先后流行了三個帶「Engineering」的詞:Prompt EngineeringContext EngineeringHarness Engineering。每一個新詞出來的時候,上一個詞就顯得不夠用了

      這三次變化背后有一條線,順著捋一遍,會發現一些有意思的東西

      先學說話

      2023 年ChatGPT剛火的時候,大家遇到的第一個問題特別樸素:不會跟 AI 說話

      你隨便問它一個問題,它給你一個回答,質量忽高忽低。后來有人發現,你在提示詞末尾加一句let's think step by step,模型的推理能力就能明顯提升。給幾個示例(few-shot),輸出格式就能穩定下來。再后來有人總結了一整套方法論,按場景分類,每種場景配一套模板

      那個階段的隱含假設很簡單:模型夠聰明,你不會問而已

      在簡單任務上,這個假設完全成立。你問一個問題,模型答一個問題,一輪結束。Prompt 寫得好就好,寫得差就差

      但你讓模型寫一個完整的項目,這套邏輯就開始松了。模型需要知道項目結構、依賴關系、技術棧偏好、現有代碼長什么樣。這些東西塞不進一句提示詞里

      會說話是第一課。但光會說話,確實走不太遠

      然后學選信息

      2025 年 9 月,Anthropic 發了一篇工程博客,標題叫「Effective context engineering for AI agents」。開頭有一句話說得挺直接:構建 AI 應用,越來越不在于找到正確的措辭,越來越在于回答一個更大的問題:什么樣的上下文配置,最可能讓模型產生你想要的行為

      這就是從PromptContext的換擋

      Prompt Engineering 關注的是怎么寫指令。Context Engineering 關注的是怎么管理模型在推理時能看到的全部信息:系統指令、工具定義、外部數據、對話歷史、MCP 接入的各種服務

      模型能力在漲。上下文窗口從 4K 到 128K 再到百萬 token。RAG 來了,工具調用來了,MCP 來了。模型能接收的信息量大了好幾個數量級。相應的,你能塞給它的東西也多了好幾個數量級

      你會說話了,但給多了它消化不動,給少了它缺信息,給錯了更糟糕

      給錯了是最要命的。模型會非常認真地基于錯誤的上下文,產出一個看起來很對、實際上離譜的結果。它不會告訴你「你給我的信息有問題」,它只會老老實實地用錯誤的前提推出一個自洽的結論

      Anthropic 在那篇博客里說,context 是一種有限資源,每一個 token 都有成本。Context Engineering 就是在這個有限窗口里,塞進信號最強的那部分,同時把噪音擋在外面

      這個階段的瓶頸很明確:人不知道該給什么信息


      Anthropic 的 Context Engineering 博客,2025 年 9 月

      再然后,發現人才是問題

      2025 年 11 月,還是 Anthropic,又發了一篇博客,叫「Effective harnesses for long-running agents」。這篇文章記錄了一個有點扎心的發現:即使用他們最好的模型Opus 4.5,配上了上下文管理能力(compaction),讓 Agent 在多個上下文窗口里跑長任務,結果還是會出問題。模型要么試圖一次性做完所有事,要么跑到一半就覺得「差不多了」提前收工

      信息給對了,還是不行

      2026 年 2 月,OpenAI 發了一組博客講Harness Engineering。他們在內部做了個實驗:一個小團隊完全不手寫代碼,靠 Codex Agent 交付了一個大約一百萬行代碼的產品。工程師干的活從寫代碼變成了別的東西

      一開始他們用一個超長的AGENTS.md文件,把所有規則都寫進去告訴 Agent。很快就發現不行。上下文窗口有限,一個大文件把任務本身的空間都擠沒了。當所有規則都「重要」的時候,Agent 對哪條規則都不上心

      文件很快過時,沒人維護,Agent 開始被一堆不再成立的規則誤導

      后來改了。AGENTS.md縮到 100 行,只當一個目錄。架構文檔、設計決策、技術規范,全部拆成獨立文件,Agent 需要什么就加載什么

      但最有意思的變化是思路上的

      OpenAI 給 Agent 的代碼庫設了極其嚴格的分層依賴規則。業務代碼只能單向調用,越界就被系統切斷,合并都合并不進去。Anthropic 在 Harness 里設了三個角色:規劃師拆需求,生成器寫代碼,評估器做驗收。評估器直接打開產品去點擊測試,發現不對直接打回

      這些約束有一個共同的特點:人沒有告訴 Agent 應該怎么做,人只告訴它哪里不能做

      想想看,這個轉變其實挺微妙的。從「你應該這樣寫代碼」到「你隨便寫,但這條線不能碰」。從主動指導變成被動約束。原因說白了就是,人也不知道 Agent 具體每一步應該怎么做,人只知道邊界在哪

      一直都是人的問題

      回頭看這三個階段,會發現一個有點尷尬的規律

      Prompt Engineering 階段,人不會跟模型說話。Context Engineering 階段,人不知道該給模型什么信息。Harness Engineering 階段,人不知道怎么指揮 Agent 做對,只能劃一條線說「這里不許過」

      瓶頸從來都在人身上。只是每個階段的表現形式不一樣

      模型一代比一代強。從 GPT-3.5 到 GPT-5.4,以及各家的最新版本,能力一直在漲。但更強的模型并沒有讓問題消失,反而讓問題換了個樣子出現

      Anthropic 升級模型之后發現,之前為了對抗「上下文焦慮」設計的重置機制可以去掉了,新模型自己能處理。但同時冒出來的新能力又需要一套全新的 Harness 來配合

      模型越強,人需要做的事情反而越多。做的事不一樣了而已

      從寫提示詞,到選信息,到設計約束和環境。人的角色在持續后退,從前線退到中臺,從中臺退到后臺。但人一直都在

      踏馬

      回到開頭的話題。馬具的功能說白了就兩件事:約束和引導。讓馬的力量朝正確的方向走,同時保護馬自己不受傷害

      Agent 跑長任務的時候,你沖它吆喝一嗓子(Prompt),它可能跑了,但方向不一定對。你把草料備好、路況摸清、裝備配齊(Context),它跑得確實好了一些,但跑遠了還是會偏。你給它套上挽具和韁繩(Harness),力量就被物理性地約束在正確的通道里了

      最潮的仔,都是踏馬的

      Minghao 騎馬去酒廠

      有一家公司做了189 年的 Harness,叫愛馬仕。1837 年在巴黎開的馬具工坊。他們家創始人有一條產品哲學:「我們的第一個客戶是馬」。從被約束者的體驗出發來設計約束,這條經驗放到 Agent 身上一個字不用改

      巧的是,最近 AI 圈還真火了一個叫Hermes的 Agent。開源的,跑在你自己的服務器上,slogan 寫的是「an agent that grows with you」

      Agent with harness,也是很踏馬的

      說不準半年之后又會冒出一個新的帶 Engineering 的詞。到時候再來看,是哪種新的馬具

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “只有我和黃仁勛在專機上”

      “只有我和黃仁勛在專機上”

      中國新聞周刊
      2026-05-14 12:27:23
      編外人員“清退”開始,城管協管、輔警、護士教師都在其中

      編外人員“清退”開始,城管協管、輔警、護士教師都在其中

      巢客HOME
      2026-05-14 05:55:06
      會談結束!中美談足135分鐘,中方一錘定音,臺灣問題有了定論

      會談結束!中美談足135分鐘,中方一錘定音,臺灣問題有了定論

      阿物評論哥
      2026-05-14 16:58:40
      國宴上一幕!馬斯克喘著粗氣,面前擺滿空酒杯,網友:喝大了?

      國宴上一幕!馬斯克喘著粗氣,面前擺滿空酒杯,網友:喝大了?

      消失的電波
      2026-05-14 22:21:16
      四川武警營門推哨兵后續:大家都搞錯了罪名,她面臨的不是襲警罪

      四川武警營門推哨兵后續:大家都搞錯了罪名,她面臨的不是襲警罪

      奇思妙想草葉君
      2026-05-13 18:25:17
      13年后雷軍合影馬斯克,全網沸騰

      13年后雷軍合影馬斯克,全網沸騰

      新浪財經
      2026-05-15 00:49:53
      王楚欽風波升級!官媒發文批評,言辭犀利,難怪國家體育總局出手

      王楚欽風波升級!官媒發文批評,言辭犀利,難怪國家體育總局出手

      阿鳧愛吐槽
      2026-05-14 21:26:37
      “那家伙在空軍1號前居然一動不動”!美媒注意到一名中國儀仗兵

      “那家伙在空軍1號前居然一動不動”!美媒注意到一名中國儀仗兵

      阿龍聊軍事
      2026-05-14 11:02:15
      暴雨、強對流天氣預警:今晚到明天,廣東、廣西、福建、貴州、四川等地部分地區有大到暴雨;局地有雷暴大風或冰雹

      暴雨、強對流天氣預警:今晚到明天,廣東、廣西、福建、貴州、四川等地部分地區有大到暴雨;局地有雷暴大風或冰雹

      魯中晨報
      2026-05-14 18:58:03
      性,已成為職場流通的硬資源!

      性,已成為職場流通的硬資源!

      燈錦年
      2026-05-14 00:10:06
      郭有才遇上硬茬!網傳深圳直播間虧損嚴重,直播連10萬人都湊不齊

      郭有才遇上硬茬!網傳深圳直播間虧損嚴重,直播連10萬人都湊不齊

      火山詩話
      2026-05-14 09:39:10
      武功山景區遭“臭屁蟲”圍攻?有游客調侃“張嘴能吃飽”,景區提醒:可自備防蟲藥物

      武功山景區遭“臭屁蟲”圍攻?有游客調侃“張嘴能吃飽”,景區提醒:可自備防蟲藥物

      瀟湘晨報
      2026-05-14 17:33:19
      馬斯克幼子的虎頭包走紅,品牌方:少數民族繡娘手工縫制,優惠后每個338元,正緊急追加生產

      馬斯克幼子的虎頭包走紅,品牌方:少數民族繡娘手工縫制,優惠后每個338元,正緊急追加生產

      揚子晚報
      2026-05-14 22:32:00
      三角連體服引爭議!28歲田徑美女回應:不是穿給你看的 眼光低俗

      三角連體服引爭議!28歲田徑美女回應:不是穿給你看的 眼光低俗

      念洲
      2026-05-14 14:28:32
      一座天壇,橫跨51年:美國總統再次踏上中美交往的歷史現場

      一座天壇,橫跨51年:美國總統再次踏上中美交往的歷史現場

      澎湃新聞
      2026-05-14 13:34:30
      馬斯克國宴現場:直接干飯喝酒,與庫克合照很傲慢,對雷軍太敷衍

      馬斯克國宴現場:直接干飯喝酒,與庫克合照很傲慢,對雷軍太敷衍

      影像溫度
      2026-05-14 22:07:16
      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊:特朗普訪華團隊里有個人非常特殊

      肖磊看世界
      2026-05-14 14:06:24
      晚郵報:阿萊格里與伊布徹底決裂,今夏將告別米蘭

      晚郵報:阿萊格里與伊布徹底決裂,今夏將告別米蘭

      懂球帝
      2026-05-14 19:33:07
      日媒:世乒賽賽制有問題!中國隊排名小組第三 其他隊伍故意輸球

      日媒:世乒賽賽制有問題!中國隊排名小組第三 其他隊伍故意輸球

      念洲
      2026-05-14 20:27:36
      巔峰時期的QQ有多“狂”?2008年,騰訊竟打算用Q幣給員工發工資

      巔峰時期的QQ有多“狂”?2008年,騰訊竟打算用Q幣給員工發工資

      荊楚寰宇文樞
      2026-05-14 23:20:07
      2026-05-15 03:36:49
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      439文章數 53關注度
      往期回顧 全部

      科技要聞

      馬斯克說會談很順利 黃仁勛點贊 庫克比耶

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      頭條要聞

      馬斯克幼子裝扮“火”了 衣服包包都是中國造

      體育要聞

      爭議抽象天王山,和季后賽最穩定中鋒

      娛樂要聞

      何九華官宣當爸!全程不提孩子媽

      財經要聞

      李強會見美國工商界代表

      汽車要聞

      雙零重力座椅/AI智能體/調光天幕 啟境GT7內飾發布

      態度原創

      藝術
      時尚
      家居
      手機
      軍事航空

      藝術要聞

      帕特里克鏡頭下的戴安娜:光影與情感的極致呈現

      白色上衣+彩色下裝:今年夏天最火搭配,時髦又減齡!

      家居要聞

      精神奢享 對話塔尖需求

      手機要聞

      榮耀600系列國行版終來到,跟海外版完全兩個樣!

      軍事要聞

      美以伊戰爭期間以總理密訪阿聯酋

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品无码免费播放| 国产做a爱片久久毛片a片| 国内国产区免费视频| 97色偷偷色噜噜狠狠爱网站97| av狼友| A级毛片无码久久精品免费| 国产青榴视频在线观看| 久久久亚洲欧洲日产无码AV | 蜜臂久久99精品久久久久宅男| 精品精品国产高清A毛片 | 国产美女久久久久| 欧洲AV在线| 亚洲国产精品性色av| 免费精品国偷自产在线在线| 羞羞影院成人午夜爽爽在线| 午夜精品久久久久久毛片| 日韩特黄无码A片免费视频| 亚洲一区二区三区在线网址| 中文字幕亚洲无线码在线一区| 欧美亚洲另类自拍偷在线拍 | 国产馆在线精品极品粉嫩| 熟女在线播放| 人妻成人网| 日本精品视频一区三区| 大香伊蕉在人线国产最新2005| 夫妻自拍偷拍| 色九九视频| 裸体女人亚洲精品一区| 国产明星视频愉拍在线| 大战熟女丰满人妻av| 人妻少妇不满足中文字幕| 亚洲中文波霸中文字幕| 强行糟蹋人妻hd中文| 亚洲精品宾馆在线精品酒店| 午夜福利片| 久久人人爽人人爽av片| 熟女成人国产精品视频| 美女亚洲一区| 人人爽人人爽人人片av东京热| 91在线无码精品秘?入口动作| 99久久免费国产精品四虎|