一覺醒來,Claude 用戶迎來一個好消息,奧特曼迎來一個壞消息。
馬斯克上周與 Anthropic 高管團隊深入交流,逐一考察他們如何確保 Claude 對人類有益。考察結束后,他決定將 SpaceX 旗下 AI 數據中心 Colossus 1 的全部算力,租給這家此前曾被他視為競爭對手的公司。
![]()
這項合作在剛剛召開的 Anthropic 開發者大會上正式公布。大會同步發布了智能體平臺、Claude Code 及開發者工具的系列重大更新,構成了 Anthropic 迄今規模最大的一次產品集中發布。
不過,Anthropic 產品負責人 Ami Vora 在大會上明確表態,此次大會不發布新模型,重點是讓現有產品更好地服務開發者,幫助縮小模型能力與實際應用之間的差距。
![]()
馬斯克跟 Anthropic 高管聊了聊,轉頭把數據中心租出去了
過去一年,Anthropic 遭遇了遠超預期的需求增長。Claude API 調用量在過去一年增長了近 17 倍,Claude Code 開發者的平均周使用時長已達 20 小時。
算力供給跟不上需求,成為制約開發者體驗的最突出矛盾。為此,Anthropic 宣布與 SpaceX 簽署合作協議,獲得其 Colossus 1 數據中心的全部計算資源使用權。
![]()
https://x.ai/news/anthropic-compute-partnership
Colossus 1 位于田納西州孟菲斯,擁有超過 22 萬塊英偉達處理器,涵蓋 H100、H200 及新一代 GB200,是目前全球規模最大的 AI 數據中心之一。
這筆合作對雙方都具有戰略意義。Anthropic 借此緩解算力瓶頸,SpaceX 則借助這一標桿客戶,為即將啟動的 IPO 增添商業說服力。路透社報道還指出,雙方已就探索數吉瓦級在軌空間數據中心建設表達了興趣,這也是 SpaceX 上市募資的核心敘事方向之一。
![]()
算力擴張的紅利將直接傳導至開發者。Anthropic 宣布將 Claude Code 的五小時速率限制翻倍,覆蓋 Pro、Max、Team 及按席位計費的企業用戶,并同步大幅提升 Opus 系列模型的 API 調用上限。
![]()
Anthropic 聯合創始人 Tom Brown 在 X 上發文透露,Colossus 上的 Claude 推理服務將在未來幾天內開始擴容,并感謝 SpaceX 的合作。他寫道,為了跟上 AI 需求,將需要推動大量實體基礎設施落地,而在快速調動現實世界資源這件事上,無論是在地球上還是地球之外,沒有誰比 SpaceX 更強。
馬斯克隨即在同一帖子下進行了回復,首次公開披露了這筆合作達成的背后經過。他表示,上周他專程花了大量時間與 Anthropic 團隊的多位高管深入交流,重點了解他們如何確保 Claude 對人類有益,最終留下了深刻印象。
![]()
他寫道,接觸到的每一個人都高度專業,且非常在意做正確的事,沒有觸發他的「惡意探測器」。他認為,只要 Anthropic 保持批判性的自我審視,Claude 大概率會走向對人類有利的方向。
正是基于這一判斷,馬斯克決定同意將 Colossus 1 租賃給 Anthropic。他同時還表示,SpaceX 的 AI 團隊此時已將模型訓練工作遷移至 Colossus 2,Colossus 1 因此有了向外部客戶開放的條件。
時機恰好,一切正合適。
你去睡覺,Claude 繼續上班
在模型層,Anthropic 研究 PM 負責人 Dianne Na Penn 回顧了過去 12 個月 Anthropic 共發布 8 個前沿模型的節奏,并以最新的 Opus 4.7 為例說明模型進化帶來的實際價值。
編程智能體 Amp 將整個 Smart 模式遷移至 Opus 4.7,并因此簡化了工具鏈架構;Rakuten 在自有基準測試中,使用 Opus 4.7 解決生產工程任務的數量是此前的三倍;In2 則發現 Opus 4.7 能在規劃階段主動識別邏輯錯誤并回溯修正,最終帶來更快更干凈的執行結果。
Dianne Na Penn 同步宣布了 Opus 4.7 上線后第二天推出的 Claude Design,開發者已開始用它與 Claude Code 結合構建生產級視覺界面。
![]()
她提出了「任務時域」這一框架,用來衡量模型在持續自主工作中能走多遠。
去年模型能獨立運行數分鐘,如今已支撐數小時任務,而未來的目標是讓智能體始終在線、主動感知、無需提示。她對開發者的建議是:要為下一個版本的 Claude 設計系統,而非僅針對當前版本,因為當一個此前失敗的原型突然開始通過測試時,往往意味著產品機會已經出現。
在平臺層,Claude Managed Agents 迎來三項核心新功能。
![]()
多智能體編排(multiagent orchestration)方面,主控智能體可協調多個擁有獨立上下文窗口的子智能體并行執行,最終匯總結果。
![]()
現場演示的虛構創業公司 Lumara 搭建了三個子智能體:指揮官負責統籌整體任務進展、探測器負責篩選具備高價值采礦材料的著陸點、導航器負責規劃飛行路徑并確保安全降落,三者并行運作,整體表現優于單一智能體。
![]()
Outcomes 功能允許開發者用一個簡單的 Markdown 文件編寫成功標準,系統會據此創建獨立的評分智能體,在每次執行后判斷是否達標,并在允許的最大迭代次數內持續重試。演示中的判定條件涵蓋無人機須軟著陸、落點須為凈空地帶,以及須保留足夠燃料以確保返回地球,三項缺一不可。
Dreaming 功能以研究預覽版形式發布,是本次大會最受關注的發布之一。它允許智能體在會話結束后自動回顧歷史執行記錄,提煉規律,將學習成果寫入記憶存儲,供后續會話直接調用。
![]()
演示中,系統首次運行解決了六個模擬落點中的四個,開啟 Dreaming 后,智能體主動梳理了此前所有任務的執行經驗,整理出一份著陸操作規程,涵蓋不同地形和燃料條件下的判斷邏輯與處理策略,后續每次新會話啟動時都會自動讀取這份規程作為參考。第二次運行時六個落點全部解決,而開發者的操作僅是點擊了控制臺中的一個按鈕。
![]()
Claude Code 層的更新,幾乎每一項都在回答同一個問題:如何讓開發者從重復性的操作中解放出來。
Routines是本次發布中最具代表性的自動化工具。開發者只需配置一次,選擇 Cron 定時任務、GitHub Webhook 事件或自定義 API 調用作為觸發器,Claude 便會在無人值守的情況下自動發起任務并生成 PR。
后續演示展示了一個真實場景:團隊成員深夜提交 Issue,第二天早上 Routines 已監聽到該事件,自動觸發了一個包含冪等性、多幣種處理和合規審計日志的完整退款功能實現,且 CI 異常被自動診斷修復。Claude Code 開發者 Boris Cherny 將這一轉變總結為:默認動作不再是「我去提示 Claude Code」,而是「我讓 Claude 去提示 Claude Code」。
Auto Mode內置分類器,對每次工具調用自動判斷兩件事:該操作是否具有破壞性,以及是否疑似提示詞注入攻擊。兩項判斷均通過則直接放行,徹底解決長任務中頻繁等待審批的問題。
![]()
WorkTrees對 Git 工作樹進行了封裝和簡化。開發者可通過 claude -w 命令啟動獨立工作樹,也可以直接告訴 Claude 去創建,Claude 會自主判斷是否應在隔離環境中實現新特性,并在任務完成后自動清理。演示中,兩個工作樹并行推進了新顏色和圓角滑塊兩個特性,互不干擾。
![]()
Auto Memory允許 Claude 跨會話積累項目知識,將構建命令、調試經驗和項目偏好寫入專屬的 memory.md 文件,供后續會話和子智能體讀取,無需開發者每次重復交代背景。
![]()
Code Review 采用多階段多智能體審查模式:多個審查智能體分別關注代碼的不同維度,再由驗證智能體篩除誤報,可通過 GitHub App 為所有 PR 自動開啟,也可在 Claude Code 中用 /review 命令手動觸發。Anthropic 內部所有團隊均已啟用這套流程,應用后工程師人均 PR 數量提升了 200%。
桌面客戶端也完成了大規模更新。新版界面提供會話分組、計劃視圖、Diff 視圖和文件視圖,并新增實驗性的「章節標注」功能,允許開發者為長會話中的關鍵節點打標題,生成可跳轉的目錄導航。
無閃爍終端渲染模式通過虛擬化滾動徹底解決了界面抖動問題,內存和 CPU 占用恒定,并支持鼠標點擊交互。Remote Control 功能支持開發者在手機上接管本地會話,啟動子智能體繼續推進任務。
![]()
在 GitHub 專場,Copilot 產品總監 Mario Rodriguez 分享了大規模調用場景下的提示詞緩存實踐。GitHub 將緩存命中率目標設定在 94% 至 96% 之間,低于 70% 通常意味著系統存在配置缺陷。
他總結了三條核心經驗:
系統提示詞必須保持靜態,任何動態內容都會導致緩存失效
工具前綴不能動態變更,否則整個對話的緩存將被全部清除
多模型混合調用時必須保證緩存親和性,確保同一用戶的后續請求命中相同緩存
他還特別指出,使用更長的上下文窗口并不必然帶來更高成本,反而因減少壓縮次數而降低了 Token 支出。
![]()
Advisor 策略是 GitHub 與 Anthropic 聯合研發的成本優化方案,將執行與決策分離:Haiku 等輕量模型負責執行任務,遇到超出能力范圍的問題時調用 Opus 提供建議。
現場演示顯示,接入 Advisor 的一側在 Haiku 仍在反復嘗試時就已完成任務,整體成本低于單獨使用 Haiku,智能水平接近純 Opus。Eve Legal 使用該策略后,在保持前沿模型質量的同時將推理成本降低了五倍。
GitHub 還內部測試了名為「Robert Duck」的評論智能體,在以下三個節點插入批評性反饋,以更低代價在早期攔截錯誤:
![]()
規劃階段結束后,在進入執行前對方案提出質疑
復雜實現完成后,作為正式代碼審查前的預審環節
測試編寫完畢但尚未運行前,提前暴露潛在問題
該功能已在 Copilot CLI 的實驗模式中上線,可隨時手動調用。
大會壓軸的現場編程環節由 Bun 作者 Jared Sumner 與 Claude Code 開發者 Boris Cherny 共同主持。
![]()
Jared 展示了 Bun 代碼庫的完整自動化流水線,每當社區提交 Issue,機器人 Robobot 便自動嘗試復現問題并生成附帶測試的 PR,其近三個月的 PR 貢獻量已超過 Jared 本人。
![]()
整場演示歷時約 25 分鐘,Robobot 在無人干預的情況下完成了 4 個 PR,每個 PR 均包含測試用例并經過代碼審查機器人的多輪往返評審。
一個人的十億美元公司,今年就會出現
圓桌對話環節由 Ami Vora 主持,Anthropic 創始人 Dario Amodei 與 Anthropic 總裁 Daniela Amodei 雙雙登臺。補充一個熱知識,Dario Amodei 和 Daniela Amodei 是兩兄妹。
![]()
從左往右依次為 Ami Vora、Daniela Amodei、Dario Amodei
Daniela 將公司目前的狀態比作一輛軌跡幾乎垂直向上的過山車,她和 Dario 分別坐在車頭和車尾,感受到的沖擊方向不同,但腎上腺素同樣充沛。
Dario 則認為自己十多年前與同事基于 Scaling Law 在圖表上畫下了那些曲線,預測模型能力將隨計算量指數級增長,如今看著一切正按圖索驥地發生,感受就像《星際穿越》里那位了解廣義相對論數學的物理學家,在紙上早已算清,真正親眼目睹時仍然被震撼。
![]()
Dario 指出,今年是 Anthropic 首次出現外部增速超過指數曲線的情況。
Anthropic 原本為 10 倍年化增長做了詳盡規劃,但今年第一季度的折算年化增速達到 80 倍,這正是與 SpaceX 簽署算力合作的直接原因。他坦言希望增速能回到「僅僅」 10 倍,因為 80 倍的速度實在難以從容應對,但無論如何,Anthropic 都會盡力將更多算力傳導給開發者。
![]()
Daniela 強調,開發者是 Claude 最重要的用戶群體,原因有三:
開發者給出的反饋最真實,是 Anthropic 改進產品的核心信息來源
Anthropic 自身也是以開發者為主體的組織,雙方有天然的共同語言
開發者社區正在用 Claude 構建醫療、法律、金融等垂直領域中最有潛力和挑戰性的產品
她說,Anthropic 從創立第一天起就主要面向開發者和企業構建,這是其在 AI 生態中相對獨特的定位。Dario 也對未來開發者工作方式的演變提出了三個判斷:
從單智能體走向多智能體協作,Claude 開始扮演「團隊管理者」角色,逐步向「數據中心里的國家級天才團隊」演進
生產力提升的邊界從個人延伸到整個組織,如何讓團隊層面的協作效率實現非線性躍升,將是下一階段的核心命題
Amdahl 定律(Amdahl定律指出:對系統進行優化時,整體性能的提升上限受限于被優化部分在總任務中所占的比例,即串行瓶頸決定了并行加速的天花板。)在這里同樣適用,當代碼生成速度提升三到四倍,安全審查、變更驗證等此前不是瓶頸的環節會成為新的制約,必須同步加速
關于模型訓練方向,Dario 指出代碼領域進展最快的原因在于可驗證性,運行單元測試就能給出明確反饋,大大簡化了訓練過程。而當前正在探索的方向,是讓模型在設計質量、安全漏洞識別等更具主觀性的任務上也能獲得類似的可驗證信號,這一能力一旦突破,有望同步提升模型在寫作、科學推理等領域的表現。
![]()
Daniela 還談到了 Anthropic 內部的文化價值觀「hold light and shade(兼顧光明和陰影)」,即同時擁抱機遇與風險。她以 Mythos 為例,認為該模型能力足夠強大,但正是因為潛在安全影響尚未完全評估,目前仍未對外公開發布。她說,Anthropic 每一個重大決策的底層邏輯,都是如何在推動技術進步的同時對所有人負責。
最后,圓桌談話在 Dario 的一個預測中落下帷幕。他表示,大約一年前,有人問他首家由單人運營的十億美元公司會在何時出現,他的答案是 2026 年。
目前已出現兩人團隊創辦的十億美元 AI 公司,以及單人運營的億級企業,距年底還有七八個月,他認為這一預測依然會生效。
這個判斷背后的邏輯是,AI 正在將「如何建立一家公司」本身變成一項可以被模型輔助完成的任務,而不僅僅是幫助工程師寫代碼。
伴隨著算力翻倍、速率放開、智能體自主進化,所有這些措施最終指向同一個問題:當 AI 工具足夠強大,我們能做什么?決定差距的又是什么?相信此時此刻,每個開發者,每個普通用戶都應該有自己的答案。
*封面由 AI 生成
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.