sharing
Jess Yan 是 Anthropic 的一位 PM。她剛剛做了一個分享,頗為有趣:在 AI 時代當 PM,我的工作反而更像人了
PM 這個崗位,過去大半時間花在協調上:跨部門會議、匯報、工程團隊的工單 backlog,做完決定還得上山下鄉說服人、拉資源。真正的手藝(craft)反而是被擠掉的那一塊。借助 Claude,她現在能把協調那部分壓縮,把時間還給手藝本身
![]()
Cat Wu 在 3 月那篇 PM on the AI exponential 里畫的工作流分工圖
Jess 在 Anthropic 內部負責的產品叫 Claude Managed Agents,說人話就是一套讓開發者方便地把 AI 當員工調用的云服務。你給一個目標,云上就會有一個或一組 AI agent 替你跑活,sandbox、權限、tracing 這些底層活兒都托管,跑完把結果還給你。這套東西 4 月 8 日剛開公開 beta
文檔先死了
在她以往的工作中,API 設計是在 Google Doc 里。一個人寫一份 spec,開評審會,郵件里塞批注,多周以后回頭看,文檔讀著挺漂亮,真的拿去構建一遇到具體問題就崩
Jess 給的方法是不寫 spec 寫原型。她在 Claude Code 里直接拿 pre-production 的 API spec 跑一個 agent,一個下午就能從 hello world 跑到端到端原型。
這個動作讓她在產品發布前就把 API abstraction 和 Claude Console 的 UX 改了幾輪。她說這些改動哪怕做幾周文檔評審都暴露不出來,等發出去再從用戶反饋里撿回來又太晚
她還會跑 raw curl 請求確認 bare-metal 體驗是否舒服。shipping 的檢驗標準換了一種,文檔讀著對只是修辭,能不能跑才算數
Claude 三件套分工
Jess 的穩定工作流分布在三個產品上:
Claude開放式的研究和探索。早期模糊階段、需要持續對話的時候,她在這里
Claude Cowork其他一切知識工作。發郵件、收件箱歸零、代辦清單、做 slides、翻 Slack 歷史、訂商務出行
Claude Code一旦想清楚要解決什么問題,就來這里寫一個定制 agent,底層跑在 Managed Agents 上
![]()
METR 測的「人類等價時長」從 Sonnet 3.5 (new) 的 21 分鐘跳到 Opus 4.6 的 12 小時,16 個月 41x
她對這件事的描述壓成一句話:能拿自己的產品做實驗,這件事抬升了你能想象出來的下個版本的天花板。原來 PM 只能想象自己能想象的,現在 PM 能想象自己能造出來的。這兩件事不一樣
PM 自己開三個 Agent
在工作中,她使用著三個具體 agent:
數據分析 agent(Adoption analytics)
接進內部數據庫,配了理解數據 schema 的 skill,自己跑 query 找異常和模式。帶 memory,跑過的發現會沉淀,下一輪在上一輪的基礎上推進
開發者輿情監控 agent(Developer sentiment monitoring)
帶內置 web search,按一個域名清單掃開發者反饋,歸納共同主題。內容多到一個 agent 處理不過來時,fan-out 到多個 agent 并行,等結果,再綜合
Demo 構建 agent(Demo building)
接進 demo 用的 GitHub 倉庫、品牌素材、活動 deck,把模板轉成針對具體場合的 demo(會議一版、客戶會議一版)
![]()
Claude Managed Agents 架構圖
以及,這三個 agent 都在云上跑。Jess 可以走開做別的事,回來發現已經做完發布了
Managed Agents 是什么
Managed Agents 公開 beta 配齊四個核心能力:
生產級 agentsandbox、鑒權、工具執行替你處理
長會話自主跑幾個小時,掉線也保留進度和輸出
多 agent 協作agent 可以拉起其他 agent 并行(research preview)
可信治理scoped 權限、身份管理、tracing 都是默認配的
Jess 在特別提了一個東西: memory
Memory 4 月 23 日剛開 beta,給 Managed Agents 的 agent 加了跨 session 學習能力。底層是文件系統型 memory,agent 直接用 bash 和 code execution 讀寫,開發者也可以 export 出來獨立管理,所有改動都有 audit log
![]()
Memory 公告里的題圖
調用 Managed Agents 簡單到一句話。Jess 在 Claude Code 里加載 Managed Agents skill,給 agent 一個粗略草圖就開工。開發者也可以直接對最新版 Claude Code 說 start onboarding for managed agents in Claude API,剩下的 onboarding 路徑它自己走
Rakuten 錯誤降 97%
Rakuten 在 Memory 公告里貢獻了三個數字:
first-pass 錯誤 -97% 成本 -27% 延遲 -34%
意思是 agent 學會了避坑,而且坑是在 workspace 邊界里學的,可觀測。Wisedocs 的文檔校驗流水線接 Memory 后整體效率提升 30%。Netflix 用 agent 跨會話保留上下文,包括需要多輪才能挖出來的洞察、人類中途糾正過的修改
客戶案例側已經鋪得很廣。Notion 讓團隊在 workspace 里把活直接分給 Claude,工程師用它寫代碼、知識工作者用它做 slides 和 spreadsheets,幾十個任務并行跑;Vibecode 把 Managed Agents 當默認底座,用戶從一句 prompt 到部署完快了 10 倍以上;Sentry 把它的 debugging agent Seer 接到一個 Claude agent,從 bug 定位直接到一個可 review 的 PR 一氣呵成;Asana、Atlassian、Blockit、General Legal 都是公開列名的客戶
定價是消費量計費,標準 Claude Platform token 單價之外,加 $0.08 / session-hour 的 active runtime
先開一個再說
你一直想要的實驗和工具,現在距離你只有一句 prompt 加幾個 API call
其實,大多數 PM 還在「做 PRD-等排期-等 review」的三段論里。而當 PM 自己能調用 agent 交付任務后,生產節奏也會隨之變化
從此,PM 的評價標準里會多出一項:你的多少工作,是 agent 產出的?
參考材料
→ Product development in the agentic era claude.com/blog/product-development-in-the-agentic-era
→ Claude Managed Agents claude.com/blog/claude-managed-agents
→ Built-in memory for Claude Managed Agents claude.com/blog/claude-managed-agents-memory
→ Product management on the AI exponential claude.com/blog/product-management-on-the-ai-exponential
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.