機器之心編輯部
自從 xAI 解散、大批創始成員離職之后,大家都在關心一個問題:Grok 是不是要涼了?
事實證明,并沒有。就在昨天,馬斯克對外透露了 Grok 最新模型的進展。據他介紹,參數量達 1.5T 的 Grok 基礎模型 V9-Medium 已經完成訓練,評估結果不錯。
![]()
目前,模型正在進行微調,幾天后將啟動強化學習階段。按照計劃,Grok V9-Medium 預計會在兩到三周內公開發布。
馬斯克表示,這將是一次重大升級。他此前承認,現在承載所有 Grok 生產流量的、參數量僅 0.5T 的 v8-small(外部測試版本 Grok 4.2)在訓練數據的質量、全面性和比例上存在嚴重缺陷。新的 Grok V9-Medium 不僅將參數規模擴大到前代的 3 倍,還針對 Blackwell 架構 GPU 進行了專門優化。在各項能力上,新模型都會有顯著提升,尤其是在處理復雜編程任務方面。
他還表示,現有的 0.5T 模型計劃在本年底前開源,適合開發者本地運行、微調或構建應用。
![]()
值得一提的是,在后續的補充訓練中,團隊加入了大量來自 Cursor 的數據,并且這一數據源還會繼續擴充。
這得益于馬斯克豪擲千金的一場收購。今年 4 月份,SpaceX 官方宣布,已獲得在今年晚些時候以 600 億美元收購 Cursor 的權利。當時,這一舉動還讓外界有點困惑,質疑 Cursor 是否真的值那么多錢。
但是,也有人認為,Cursor 是開發者實際使用的 AI 代碼編輯器,數據包含真實的工作流(寫代碼、調試、迭代、修復 bug 等),是「人類開發者如何思考」的映射,其價值非常獨特。如果 Grok 新模型能夠有效利用這些數據,那么它將更懂真實開發者的工作方式,而非只是 GitHub 上的公開代碼。
![]()
![]()
![]()
除了新模型,馬斯克近期推出的首款編碼智能體 Grok Build 也是備受關注。你可以把它理解成馬斯克版「Claude Code」—— 一個直接跑在你命令行里的 AI 程序員,能讀代碼、做計劃、改文件、跑測試。
![]()
它比較明顯的差異化設計是 Plan Mode(計劃模式)。你描述需求后,它不會直接亂改你的代碼,而是先輸出一份結構化的執行計劃,列明每一步要做什么。你可以審閱、修改甚至重寫整個計劃,批準之后它才開始動手,所有改動以 diff 形式呈現。
![]()
其他關鍵功能還包括:并行子智能體(最多支持 8 個子智能體同時工作)、Arena Mode(讓多個候選方案內部「打擂臺」)、原生支持 MCP 和 ACP、 支持無界面運行等。
目前,Grok Build 在開發者群體中已經收獲了一些好評。
![]()
![]()
在 Grok Build 之前,終端原生編程智能體這個賽道已經有三個主要玩家:Anthropic 的 Claude Code、OpenAI 的 Codex CLI、Google 的 Gemini-powered Antigravity。Grok Build 的加入,把這場競賽從三強變成了四強。
有意思的是,馬斯克此前公開承認過 xAI 在編程能力上落后,所以 Grok Build 的發布更像是一次「補課式入場」—— 功能架構上快速追平對手,再用 Arena Mode 這種差異化機制試圖彎道超車。
不過目前的 Grok Build,底層跑的還是 grok-code-fast-1,具有 256K-token 的上下文窗口,在競爭對手面前顯然不夠看的。對于大型單一代碼庫和長時間運行的 Agent 會話,這樣的上下文長度顯然會成為瓶頸。
Grok V9-Medium 的 1.5T 參數和 Cursor 真實工作流數據的注入,有望讓整個工具擁有更強大的底層模型。
在未來的 Agent 戰局中,馬斯克的團隊能否占據一席之地?我們拭目以待。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.