網易首頁 > 網易號 > 正文申請入駐

奧特曼兩大「死對頭」聯手，但你才是這場 Claude 發布會最大的贏家

2026-05-07 09:41:28　來源: AppSo

廣東舉報

分享至

一覺醒來，Claude 用戶迎來一個好消息，奧特曼迎來一個壞消息。

馬斯克上周與 Anthropic 高管團隊深入交流，逐一考察他們如何確保 Claude 對人類有益。考察結束后，他決定將 SpaceX 旗下 AI 數據中心 Colossus 1 的全部算力，租給這家此前曾被他視為競爭對手的公司。

這項合作在剛剛召開的 Anthropic 開發者大會上正式公布。大會同步發布了智能體平臺、Claude Code 及開發者工具的系列重大更新，構成了 Anthropic 迄今規模最大的一次產品集中發布。

不過，Anthropic 產品負責人 Ami Vora 在大會上明確表態，此次大會不發布新模型，重點是讓現有產品更好地服務開發者，幫助縮小模型能力與實際應用之間的差距。

馬斯克跟 Anthropic 高管聊了聊，轉頭把數據中心租出去了

過去一年，Anthropic 遭遇了遠超預期的需求增長。Claude API 調用量在過去一年增長了近 17 倍，Claude Code 開發者的平均周使用時長已達 20 小時。

算力供給跟不上需求，成為制約開發者體驗的最突出矛盾。為此，Anthropic 宣布與 SpaceX 簽署合作協議，獲得其 Colossus 1 數據中心的全部計算資源使用權。

https://x.ai/news/anthropic-compute-partnership

Colossus 1 位于田納西州孟菲斯，擁有超過 22 萬塊英偉達處理器，涵蓋 H100、H200 及新一代 GB200，是目前全球規模最大的 AI 數據中心之一。

這筆合作對雙方都具有戰略意義。Anthropic 借此緩解算力瓶頸，SpaceX 則借助這一標桿客戶，為即將啟動的 IPO 增添商業說服力。路透社報道還指出，雙方已就探索數吉瓦級在軌空間數據中心建設表達了興趣，這也是 SpaceX 上市募資的核心敘事方向之一。

算力擴張的紅利將直接傳導至開發者。Anthropic 宣布將 Claude Code 的五小時速率限制翻倍，覆蓋 Pro、Max、Team 及按席位計費的企業用戶，并同步大幅提升 Opus 系列模型的 API 調用上限。

Anthropic 聯合創始人 Tom Brown 在 X 上發文透露，Colossus 上的 Claude 推理服務將在未來幾天內開始擴容，并感謝 SpaceX 的合作。他寫道，為了跟上 AI 需求，將需要推動大量實體基礎設施落地，而在快速調動現實世界資源這件事上，無論是在地球上還是地球之外，沒有誰比 SpaceX 更強。

馬斯克隨即在同一帖子下進行了回復，首次公開披露了這筆合作達成的背后經過。他表示，上周他專程花了大量時間與 Anthropic 團隊的多位高管深入交流，重點了解他們如何確保 Claude 對人類有益，最終留下了深刻印象。

他寫道，接觸到的每一個人都高度專業，且非常在意做正確的事，沒有觸發他的「惡意探測器」。他認為，只要 Anthropic 保持批判性的自我審視，Claude 大概率會走向對人類有利的方向。

正是基于這一判斷，馬斯克決定同意將 Colossus 1 租賃給 Anthropic。他同時還表示，SpaceX 的 AI 團隊此時已將模型訓練工作遷移至 Colossus 2，Colossus 1 因此有了向外部客戶開放的條件。

時機恰好，一切正合適。

你去睡覺，Claude 繼續上班

在模型層，Anthropic 研究 PM 負責人 Dianne Na Penn 回顧了過去 12 個月 Anthropic 共發布 8 個前沿模型的節奏，并以最新的 Opus 4.7 為例說明模型進化帶來的實際價值。

編程智能體 Amp 將整個 Smart 模式遷移至 Opus 4.7，并因此簡化了工具鏈架構；Rakuten 在自有基準測試中，使用 Opus 4.7 解決生產工程任務的數量是此前的三倍；In2 則發現 Opus 4.7 能在規劃階段主動識別邏輯錯誤并回溯修正，最終帶來更快更干凈的執行結果。

Dianne Na Penn 同步宣布了 Opus 4.7 上線后第二天推出的 Claude Design，開發者已開始用它與 Claude Code 結合構建生產級視覺界面。

她提出了「任務時域」這一框架，用來衡量模型在持續自主工作中能走多遠。

去年模型能獨立運行數分鐘，如今已支撐數小時任務，而未來的目標是讓智能體始終在線、主動感知、無需提示。她對開發者的建議是：要為下一個版本的 Claude 設計系統，而非僅針對當前版本，因為當一個此前失敗的原型突然開始通過測試時，往往意味著產品機會已經出現。

在平臺層，Claude Managed Agents 迎來三項核心新功能。

多智能體編排(multiagent orchestration)方面，主控智能體可協調多個擁有獨立上下文窗口的子智能體并行執行，最終匯總結果。

現場演示的虛構創業公司 Lumara 搭建了三個子智能體：指揮官負責統籌整體任務進展、探測器負責篩選具備高價值采礦材料的著陸點、導航器負責規劃飛行路徑并確保安全降落，三者并行運作，整體表現優于單一智能體。

Outcomes 功能允許開發者用一個簡單的 Markdown 文件編寫成功標準，系統會據此創建獨立的評分智能體，在每次執行后判斷是否達標，并在允許的最大迭代次數內持續重試。演示中的判定條件涵蓋無人機須軟著陸、落點須為凈空地帶，以及須保留足夠燃料以確保返回地球，三項缺一不可。

Dreaming 功能以研究預覽版形式發布，是本次大會最受關注的發布之一。它允許智能體在會話結束后自動回顧歷史執行記錄，提煉規律，將學習成果寫入記憶存儲，供后續會話直接調用。

演示中，系統首次運行解決了六個模擬落點中的四個，開啟 Dreaming 后，智能體主動梳理了此前所有任務的執行經驗，整理出一份著陸操作規程，涵蓋不同地形和燃料條件下的判斷邏輯與處理策略，后續每次新會話啟動時都會自動讀取這份規程作為參考。第二次運行時六個落點全部解決，而開發者的操作僅是點擊了控制臺中的一個按鈕。

Claude Code 層的更新，幾乎每一項都在回答同一個問題：如何讓開發者從重復性的操作中解放出來。

Routines是本次發布中最具代表性的自動化工具。開發者只需配置一次，選擇 Cron 定時任務、GitHub Webhook 事件或自定義 API 調用作為觸發器，Claude 便會在無人值守的情況下自動發起任務并生成 PR。

后續演示展示了一個真實場景：團隊成員深夜提交 Issue，第二天早上 Routines 已監聽到該事件，自動觸發了一個包含冪等性、多幣種處理和合規審計日志的完整退款功能實現，且 CI 異常被自動診斷修復。Claude Code 開發者 Boris Cherny 將這一轉變總結為：默認動作不再是「我去提示 Claude Code」，而是「我讓 Claude 去提示 Claude Code」。

Auto Mode內置分類器，對每次工具調用自動判斷兩件事：該操作是否具有破壞性，以及是否疑似提示詞注入攻擊。兩項判斷均通過則直接放行，徹底解決長任務中頻繁等待審批的問題。

WorkTrees對 Git 工作樹進行了封裝和簡化。開發者可通過 claude -w 命令啟動獨立工作樹，也可以直接告訴 Claude 去創建，Claude 會自主判斷是否應在隔離環境中實現新特性，并在任務完成后自動清理。演示中，兩個工作樹并行推進了新顏色和圓角滑塊兩個特性，互不干擾。

Auto Memory允許 Claude 跨會話積累項目知識，將構建命令、調試經驗和項目偏好寫入專屬的 memory.md 文件，供后續會話和子智能體讀取，無需開發者每次重復交代背景。

Code Review 采用多階段多智能體審查模式：多個審查智能體分別關注代碼的不同維度，再由驗證智能體篩除誤報，可通過 GitHub App 為所有 PR 自動開啟，也可在 Claude Code 中用 /review 命令手動觸發。Anthropic 內部所有團隊均已啟用這套流程，應用后工程師人均 PR 數量提升了 200%。

桌面客戶端也完成了大規模更新。新版界面提供會話分組、計劃視圖、Diff 視圖和文件視圖，并新增實驗性的「章節標注」功能，允許開發者為長會話中的關鍵節點打標題，生成可跳轉的目錄導航。

無閃爍終端渲染模式通過虛擬化滾動徹底解決了界面抖動問題，內存和 CPU 占用恒定，并支持鼠標點擊交互。Remote Control 功能支持開發者在手機上接管本地會話，啟動子智能體繼續推進任務。

在 GitHub 專場，Copilot 產品總監 Mario Rodriguez 分享了大規模調用場景下的提示詞緩存實踐。GitHub 將緩存命中率目標設定在 94% 至 96% 之間，低于 70% 通常意味著系統存在配置缺陷。

他總結了三條核心經驗：

系統提示詞必須保持靜態，任何動態內容都會導致緩存失效

工具前綴不能動態變更，否則整個對話的緩存將被全部清除

多模型混合調用時必須保證緩存親和性，確保同一用戶的后續請求命中相同緩存

他還特別指出，使用更長的上下文窗口并不必然帶來更高成本，反而因減少壓縮次數而降低了 Token 支出。

Advisor 策略是 GitHub 與 Anthropic 聯合研發的成本優化方案，將執行與決策分離：Haiku 等輕量模型負責執行任務，遇到超出能力范圍的問題時調用 Opus 提供建議。

現場演示顯示，接入 Advisor 的一側在 Haiku 仍在反復嘗試時就已完成任務，整體成本低于單獨使用 Haiku，智能水平接近純 Opus。Eve Legal 使用該策略后，在保持前沿模型質量的同時將推理成本降低了五倍。

GitHub 還內部測試了名為「Robert Duck」的評論智能體，在以下三個節點插入批評性反饋，以更低代價在早期攔截錯誤：

規劃階段結束后，在進入執行前對方案提出質疑

復雜實現完成后，作為正式代碼審查前的預審環節

測試編寫完畢但尚未運行前，提前暴露潛在問題

該功能已在 Copilot CLI 的實驗模式中上線，可隨時手動調用。

大會壓軸的現場編程環節由 Bun 作者 Jared Sumner 與 Claude Code 開發者 Boris Cherny 共同主持。

Jared 展示了 Bun 代碼庫的完整自動化流水線，每當社區提交 Issue，機器人 Robobot 便自動嘗試復現問題并生成附帶測試的 PR，其近三個月的 PR 貢獻量已超過 Jared 本人。

整場演示歷時約 25 分鐘，Robobot 在無人干預的情況下完成了 4 個 PR，每個 PR 均包含測試用例并經過代碼審查機器人的多輪往返評審。

一個人的十億美元公司，今年就會出現

圓桌對話環節由 Ami Vora 主持，Anthropic 創始人 Dario Amodei 與 Anthropic 總裁 Daniela Amodei 雙雙登臺。補充一個熱知識，Dario Amodei 和 Daniela Amodei 是兩兄妹。

從左往右依次為 Ami Vora、Daniela Amodei、Dario Amodei

Daniela 將公司目前的狀態比作一輛軌跡幾乎垂直向上的過山車，她和 Dario 分別坐在車頭和車尾，感受到的沖擊方向不同，但腎上腺素同樣充沛。

Dario 則認為自己十多年前與同事基于 Scaling Law 在圖表上畫下了那些曲線，預測模型能力將隨計算量指數級增長，如今看著一切正按圖索驥地發生，感受就像《星際穿越》里那位了解廣義相對論數學的物理學家，在紙上早已算清，真正親眼目睹時仍然被震撼。

Dario 指出，今年是 Anthropic 首次出現外部增速超過指數曲線的情況。

Anthropic 原本為 10 倍年化增長做了詳盡規劃，但今年第一季度的折算年化增速達到 80 倍，這正是與 SpaceX 簽署算力合作的直接原因。他坦言希望增速能回到「僅僅」 10 倍，因為 80 倍的速度實在難以從容應對，但無論如何，Anthropic 都會盡力將更多算力傳導給開發者。

Daniela 強調，開發者是 Claude 最重要的用戶群體，原因有三：

開發者給出的反饋最真實，是 Anthropic 改進產品的核心信息來源

Anthropic 自身也是以開發者為主體的組織，雙方有天然的共同語言

開發者社區正在用 Claude 構建醫療、法律、金融等垂直領域中最有潛力和挑戰性的產品

她說，Anthropic 從創立第一天起就主要面向開發者和企業構建，這是其在 AI 生態中相對獨特的定位。Dario 也對未來開發者工作方式的演變提出了三個判斷：

從單智能體走向多智能體協作，Claude 開始扮演「團隊管理者」角色，逐步向「數據中心里的國家級天才團隊」演進

生產力提升的邊界從個人延伸到整個組織，如何讓團隊層面的協作效率實現非線性躍升，將是下一階段的核心命題

Amdahl 定律（Amdahl定律指出：對系統進行優化時，整體性能的提升上限受限于被優化部分在總任務中所占的比例，即串行瓶頸決定了并行加速的天花板。）在這里同樣適用，當代碼生成速度提升三到四倍，安全審查、變更驗證等此前不是瓶頸的環節會成為新的制約，必須同步加速

關于模型訓練方向，Dario 指出代碼領域進展最快的原因在于可驗證性，運行單元測試就能給出明確反饋，大大簡化了訓練過程。而當前正在探索的方向，是讓模型在設計質量、安全漏洞識別等更具主觀性的任務上也能獲得類似的可驗證信號，這一能力一旦突破，有望同步提升模型在寫作、科學推理等領域的表現。

Daniela 還談到了 Anthropic 內部的文化價值觀「hold light and shade（兼顧光明和陰影）」，即同時擁抱機遇與風險。她以 Mythos 為例，認為該模型能力足夠強大，但正是因為潛在安全影響尚未完全評估，目前仍未對外公開發布。她說，Anthropic 每一個重大決策的底層邏輯，都是如何在推動技術進步的同時對所有人負責。

最后，圓桌談話在 Dario 的一個預測中落下帷幕。他表示，大約一年前，有人問他首家由單人運營的十億美元公司會在何時出現，他的答案是 2026 年。

目前已出現兩人團隊創辦的十億美元 AI 公司，以及單人運營的億級企業，距年底還有七八個月，他認為這一預測依然會生效。

這個判斷背后的邏輯是，AI 正在將「如何建立一家公司」本身變成一項可以被模型輔助完成的任務，而不僅僅是幫助工程師寫代碼。

伴隨著算力翻倍、速率放開、智能體自主進化，所有這些措施最終指向同一個問題：當 AI 工具足夠強大，我們能做什么？決定差距的又是什么？相信此時此刻，每個開發者，每個普通用戶都應該有自己的答案。

*封面由 AI 生成

我們正在招募伙伴

簡歷投遞郵箱hr@ifanr.com

?? 郵件標題「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.