![]()
新智元報道
![]()
【新智元導讀】AI編程三國殺來了!5月14日,xAI上線了Grok Build,一個跑在終端里、能自己規劃任務和改代碼的編程智能體。馬斯克曾承認xAI在編程上落后,這是它正面追趕Claude Code和OpenAI Codex的第一步。
馬斯克補齊xAI編程短板的兩張牌,已經打出。
5月14日,xAI發布Grok Build早期Beta,官方把它定位為「編程智能體和CLI(命令行工具)」,優先面向SuperGrok Heavy訂閱用戶開放。
到了25日,xAI在官網正式發布Grok Build公告,準入也從SuperGrok Heavy擴大到所有SuperGrok和X Premium Plus用戶。至此,它才從一個高門檻的小范圍Beta,變成更多付費用戶能上手的工具。
![]()
https://x.ai/news/grok-build-cli
馬斯克此前公開承認過,xAI在編程場景上落后。據Bloomberg報道,xAI內部曾有高管要求團隊,把Grok做到能在各類任務上追平Claude。而Grok Build,就是這場追趕賽的第一個產品。
但產品一上線,很快就有用戶提出了一個尖銳的問題:雖然產品界面不錯,可底層模型不夠強:
只要xAI拿出一個真正SOTA(業界最強水平)的模型,Grok Build一夜之間就能和Codex、Claude Code正面競爭。
![]()
馬斯克隨后在X上回了話,亮出了xAI下一代基礎模型:
「我們最近完成的Grok V9 1.5T運行效果非常出色,這還是在尚未加入Cursor數據進行補充訓練之前的結果。」
![]()
他還專門發帖,捋了一遍xAI那套「有點令人困惑」的版本號:內部正在開發的V9,參數1.5T,在數據整理、訓練方法、模型規模等每個方面都顯著優于V8,并針對Blackwell架構進行了優化;而面向公眾的v4.2,基于V8訓練,參數僅0.5T,在訓練數據的質量、全面性和比例上存在重大缺陷。
![]()
從V8到V9,馬斯克用了一個詞來形容:「差距巨大」。
三大維度重建V9
馬斯克口中的「差距巨大」,主要來源于三個維度的重建。
參數規模
首先,是參數規模,從0.5T漲到1.5T,實現了三倍擴張。
參數量擴大,可能提升模型容量、復雜任務建模能力,以及長鏈路工具調用中的穩定性。但上下文窗口、倉庫級理解和長程任務表現,并不由參數量單獨決定。
V9是否能在復雜代碼倉庫、跨文件修改和多步驟智能體任務中明顯提升,仍需等公開版上線后通過實測驗證。
由于Claude、GPT、Gemini 等頭部模型普遍不公開具體參數量,V9的1.5T更適合作為xAI自身代際比較的指標,而不宜直接拿來和Sonnet、Opus或GPT系列做橫向比較。
Hopper不夠用了
xAI把Blackwell頂上去
按馬斯克的說法,公開版v4.2所基于的V8約為0.5T參數,訓練在Hopper芯片上;內部V9則擴大到1.5T參數,并面向Blackwell架構優化。
這意味著,V9的升級不只是模型尺寸變大,也伴隨著底層硬件平臺的代際切換。
相比Hopper,Blackwell面向更大規模模型集群做了進一步設計,包括更高的互聯帶寬、更強的低精度計算能力,以及面向萬億級模型訓練和推理的系統級擴展能力。
需要注意的是,Hopper本身已經支持FP8,Blackwell的新增重點更應放在FP4、第五代NVLink和更大規模集群互聯上。
xAI的算力底牌,是部署在孟菲斯的Colossus超級集群。
馬斯克過去一年多次更新過Colossus的擴張進度。
這次V9被稱為面向Blackwell優化,也意味著xAI正試圖把集群擴張和硬件升級,轉化為下一代基礎模型的訓練與運行能力。
真實的開發者數據
第二個是數據質量。
馬斯克直言不諱:V8的數據質量有缺陷,全面性不夠,比例不對。這意味著V8并非只是「規模小一點的模型」,而是一個數據基礎就沒打好的模型。
而V9補充訓練的核心一步,是引入Cursor數據。
馬斯克在5月15日的帖子里特別提到:V9的訓練剛剛跑完,Cursor數據還沒有加進去,將在補充訓練階段引入。
5月17日他更新了進度:下一步加入Cursor數據做補充訓練,然后是SFT(監督微調)和RL(強化學習),整個流程大約還需要3到4周。
![]()
Cursor數據的價值,在于它是過程數據。GitHub上有海量代碼,但是終態數據。
從空白文件到最終代碼之間發生的數據:開發者補全、回退、糾錯、與智能體互動……這些過程數據才是訓練編程智能體真正稀缺的資源。
在補充訓練中加入Cursor數據之后,V9將是第一個在真實開發者行為上系統性訓練過的Grok。
這次馬斯克點名Cursor,也不是隨意的。xAI與Cursor的關系由來已久:2025 年grok-code-fast-1發布時,Cursor是其限時免費接入的合作平臺之一。
至于V9補充訓練所用的Cursor數據具體來源和授權細節,目前沒有公開信息。
Grok Build到底是什么
功能上,Grok Build是一個跑在終端里的CLI工具,安裝只要一行命令。
![]()
https://x.ai/cli
功能上,這是一個跑在終端里的CLI工具,安裝只要一行命令。
裝好之后,進入項目目錄敲一個grok,它就開始工作。你可以讓它解釋整個代碼倉庫的結構,也可以直接丟給它一個任務,比如「給這個API加上限流」,它會自己定位文件、改代碼、跑測試、再修自己的錯。
它有三種用法。一是TUI(終端圖形交互界面),全屏、可鼠標操作;二是headless(無界面)模式,塞進腳本和自動化流程里;三是通過ACP(智能體客戶端協議)接入其他應用。
真正值得關注的是它的工作方式:先規劃,后執行。
面對復雜任務,Grok Build會先把思路寫成一份計劃,停下來等你確認。你可以逐條批注、整段重寫,甚至讓它帶著問題先反問你一句,再動手。計劃通過后,每一處改動都以清晰的diff(差異對比)呈現,改了什么一目了然。當一個編程智能體直接在真實項目文件里動手,這道審核關卡就不是可有可無。
它還支持子智能體并行,把一個任務拆給多個子智能體分頭處理;支持MCP(模型上下文協議)服務器;有skills(技能)、plugins(插件)和marketplace(應用市場)的擴展體系;斜杠命令里甚至帶著用/imagine生成圖片、用/imagine-video生成視頻。
把這些拼在一起,Grok Build對標的是Claude Code、Codex CLI和Cursor的智能體,而并非傳統聊天機器人。xAI這次拿出的,是一個完整的開發者工作流入口。
底座是grok-build-0.1
V9還沒上線
按xAI官方文檔,驅動Grok Build的是一個專門訓練的模型:grok-build-0.1。
它在5月19日前后進入API早期訪問,官方對它的定位是「為智能體編程訓練的快速編碼模型」。
這是一款專門定位于編程的模型。它支持文本和圖像輸入,原生具備工具調用、結構化輸出和推理能力,上下文窗口256K(約25.6萬token)。它被訓練成能在一個長鏈路里反復循環:讀問題、寫代碼、用終端、查錯、改錯。
grok-build-0.1已單獨上架xAI API,開發者可以把它直接塞進自己的智能體循環或者IDE集成里,并不一定要套Grok Build這個外殼。
它的出現,也意味著xAI編程模型線的一次重整。更早的grok-code-fast-1已在5月中旬退役,xAI官方建議把代碼工作負載遷移到grok-build-0.1,并稱后者在智能體編程和Web開發能力上有顯著提升。
從一個「快而便宜的代碼模型」,到一整套編程智能體產品,xAI走的是從模型API到開發者入口的路。
目前,xAI官方模型頁仍把Grok 4.3列為通用主模型,只在用途表里把「編程」對應到Grok Build 0.1。
![]()
xAI官網API頁面,當前對外主模型仍為Grok 4.3。https://x.ai/api
馬斯克口中的V8、V9,是xAI基礎模型的代際編號,和對外的產品版本號是兩回事:他帖子里把公開模型稱作v4.2,xAI官網則標為Grok 4.3。
grok-build-0.1則是另一條線上面向編程的專用模型,它和V9是不是同一套底座、有沒有用上V9的預訓練成果,xAI都沒有公開說明。
真正的較量在6月
V9訓練跑完,并不等于上線。整套后訓練流程走完,公開版還要再等幾周。
在這幾周里,同行不會閑著。Claude Code保持著極高的迭代密度,最快兩天內完成bug修復并發版;OpenAI的Codex持續小步推進;Cursor作為IDE平臺,也在加深智能體能力、擴展模型選擇、增強平臺粘性。
V9上線之后,還有問題待驗證。參數翻3倍,并不等于能力翻3倍。1.5T能不能在編程基準上拉開和Claude、GPT的差距,要等實戰。
xAI補齊了產品線,V9訓練已跑完、硬件已就位,幾周后就要拿出公開版,接受所有人檢驗。
xAI的兩張牌已經攤開,但牌桌上不止它一家。
Claude Code、Codex、Grok Build即將正面相遇,Cursor也在一旁持續加碼。
誰是王者,要等6月的代碼實戰才能揭曉。
參考資料:
https://x.com/elonmusk/status/2055914584373141906
編輯:元宇 Moses
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.