<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<kbd id="vnk5c"><samp id="vnk5c"><acronym id="vnk5c"></acronym></samp></kbd>

<rt id="vnk5c"></rt>

<nobr id="vnk5c"></nobr>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

馬斯克的Grok 4.3悄悄上線，跑分評測出爐

2026-05-02 17:06:34　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：艾倫

【新智元導讀】Grok 4.3 是 xAI 一次務實升級：更便宜、更快、更像能干活的助手。但它在硬推理、穩定性和可信度上，仍落后 GPT-5.5 與 Claude Opus 4.7。

xAI 發布 Grok 4.3，沒有把聲量拉到最大，馬斯克甚至沒單獨發推，看起來只是個過渡版本。

https://x.com/elonmusk/status/2045590599206875216

它更像一次安靜的產品換擋：把模型放進 API，把價格打下來，把工具能力補上，再告訴開發者可以從舊版 Grok 遷移過來。

沒有 AGI 宏大敘事，也少了馬斯克式的「即將改變一切」。這反而讓 Grok 4.3 看起來更真實。

對普通消費者來說，Grok 4.3 最重要的變化并非某個榜單分數漲了幾分，而是 AI 助手正在變得更便宜、更快，也更像一個能替人完成文件、表格、演示文稿的合格助手。

然而，Grok 4.3 的聰明程度仍然沒追上 GPT-5.5 和 Claude Opus 4.7。

它是一款性價比很強的新模型，也是一款仍有明顯天花板的模型。

消費者真正需要關心的，是它在哪些場景能省錢省時間，在哪些場景會因為判斷不準、想太久或說太多，反而增加成本。

它確實變強了

尤其像一個更會干活的助手

Artificial Analysis 給 Grok 4.3 的 Intelligence Index 打到 53 分，比 Grok 4.20 0309 v2 高 4 分，也超過 Claude Sonnet 4.6 和 Muse Spark。

這個提升不算小，尤其在 xAI 自家模型線里，Grok 4.3 已經是目前最強的一檔。

更值得看的是代理任務表現。

Grok 4.3 在 GDPval-AA 上拿到 1500 Elo，相比 Grok 4.20 0309 v2 的 1179，提升了 321 分。

這個榜單更接近日常「讓 AI 做事」的場景，比如整理資料、執行復雜步驟、處理真實工作流。這對普通用戶有實際意義。

讓 AI 幫忙寫周報、搭表格、做方案、拆會議紀要、生成 PPT，Grok 4.3 的體驗會比前代更完整。

Grok 可以創建演示文稿、文檔和電子表格，可以在一個計算機環境里寫代碼、運行代碼、安裝依賴并產出文件。

對不懂代碼的用戶來說，這意味著很多原本需要在 Excel、PowerPoint、瀏覽器之間來回切換的操作，可能會被壓縮成一句指令。

這也是 AI 消費級產品真正該競爭的地方——用戶更在意它能不能把一個報銷表做完，把一份旅行計劃排清楚，把一封語氣得體的郵件寫好。

Grok 4.3 在這部分的進步，是真進步。

更便宜

是這次最直接的產品賣點

Grok 4.3 的價格很有侵略性。

它的 API 價格為每百萬輸入 Tokens 1.25 美元、每百萬輸出 Tokens 2.50 美元，相比 Grok 4.20 輸入價格低約 40%，輸出價格低約 60%。

Artificial Analysis 測算，運行整套 Intelligence Index 評測成本約為 395 美元，比 Grok 4.20 0309 v2 低約 20%。

這會影響消費者，只是方式沒那么直觀。

大多數普通人不會直接調用 API，但他們會用到基于 API 構建的產品。

AI 寫作工具、客服機器人、語音助理、教育應用、辦公插件，背后都要為模型調用付費。

當底層模型價格下降，應用廠商有空間降低訂閱費，或者在同樣價格下提供更多次數、更長上下文、更復雜任務。

Grok 4.3 還有一個優勢是速度。

Artificial Analysis 的 xAI 模型頁顯示，它是 xAI 當前輸出速度最快的模型之一，約 196 Tokens/s，屬于很快的一檔。

對語音聊天、實時客服、長文生成和批量內容處理來說，等待時間會直接影響體驗。

但速度有一個細節容易被忽略：Grok 4.3 的首 Token 延遲并不低。

它會先「想一會兒」，然后快速輸出。

長答案里，這種速度優勢明顯；短對話里，用戶可能先感受到停頓，再感受到快。

用于客服、語音助手、移動端聊天時，這個差異會被放大。

它更會說人話

這是 Grok 的隱藏優勢

Grok 一直有一個微妙優勢：語氣更像真人。

Hacker News 上有人提到，一些英語非母語用戶認為 Grok 在把握文本語氣、正式程度和微妙人際表達上，比其他模型更自然。

有人拿它和 ChatGPT、Claude 比，認為 Grok 在非正式朋友語氣、同事溝通、語音輸入識別上表現更貼近真實交流。

https://news.ycombinator.com/item?id=47972447

Grok 可能受益于 X 平臺海量口語化表達訓練。

它更容易捕捉社交網絡里的語氣、節奏、松弛感等；它也可能因此繼承社交網絡的噪音、偏見和表達習慣。

對 C 端用戶來說，這種「更自然」的能力會讓 Grok 在寫消息、口語轉寫、語音助手、輕辦公場景里很討喜。

它未必最聰明，但可能更像一個愿意按你的語氣說話的助手。

Yes, BUT...

它比不過 GPT-5.5 和 Claude Opus 4.7

Grok 4.3 最大的問題，是它看起來已經進入第一梯隊邊緣，卻還沒站到最前面。

Grok 4.3 的 Intelligence Index 為 53，GPT-5.5 為 60，Claude Opus 4.7 為 57。

這個差距不只是排行榜上的幾分。

對普通消費者來說，它會體現在復雜推理、代碼調試、長文核查、專業咨詢和多步驟任務的穩定性上。

在 GDPval-AA 上，Grok 4.3 的提升很大，但仍落后 GPT-5.5 xhigh 276 Elo，按標準 Elo 公式，面對 GPT-5.5 的預期勝率約 17%。

它在幻覺控制上也有代價。

Grok 4.3 的 AA-Omniscience Accuracy（準確率）提升 8 分，但 Non-Hallucination Rate（非幻覺率）下降 8 分。

這里的準確率和非幻覺率是不同的，準確率只看你答對了多少，而非幻覺率是看你沒答出來的問題里面，有多少是模型老實承認自己不會的——不會但振振有詞，就是所謂的「幻覺」。

換言之，Grok 4.3 的知識覆蓋率變高了，但也更容易出現幻覺了。

而消費者最怕的情況就是 AI 答得很流暢、很自信、很像那么回事，結果關鍵事實錯了。

人類已經很擅長自信地犯錯，機器不必急著加入這個傳統項目。

這意味著，在醫療、法律、金融、學術和工程等高風險場景里，Grok 4.3 仍需要謹慎使用。

它適合幫用戶起草、整理、生成初稿，適合做低風險的輔助工作；涉及最終判斷，GPT-5.5 和 Claude Opus 4.7 仍更穩。

長上下文和工具能力很好

但消費者買賬的是結果

Grok 4.3 提供 100 萬 Token 上下文窗口，這對長文檔、代碼庫、合同、報告和資料庫很有吸引力。

用戶可以丟進去更多材料，讓模型在更完整的信息環境里工作。

對研究、辦公和創作來說，這是一種實用能力。

它還支持文本和圖像輸入，輸出文本，并圍繞工具調用、網頁搜索、X 搜索、代碼執行、文件搜索、RAG 等能力加強。

xAI 還推出了 Custom Voices、語音代理、TTS 和 STT 等產品，把 Grok 的邊界從文字擴展到語音。

對普通用戶來說，未來的 Grok 可能不只是一個聊天框，而是一個能讀文件、查網頁、寫表格、說話、聽話的多模態助手。

問題在于，功能多不等于體驗好。

消費級 AI 的競爭，最后會回到三個樸素標準：少等、少錯、少折騰。

Grok 4.3 在「少等」和「少花錢」上明顯前進，在「少錯」上還沒給出足夠強的答案。

Grok 4.3 的準確定位：

性價比模型，不是最強模型

Grok 4.3 最適合的定位，是一款高性價比的工作型模型。

它適合高頻內容生成、語氣改寫、長文本初篩、語音產品、客服場景、批量辦公任務、輕量級代理工作流。

它也適合那些對成本敏感、對響應速度敏感、對最強推理沒有執念的產品。

很多消費者并不需要每次都調用最強模型，就像不應該只是為了買菜開超跑，除非另有所圖。

但如果任務要求深度推理、嚴謹事實核查、復雜代碼、數學證明、長期項目記憶和專業判斷，Grok 4.3 還不該成為第一選擇。

GPT-5.5 和 Claude Opus 4.7 仍然更適合承擔這些高價值、高風險任務。

這次 xAI 的策略很清楚：先把模型做得足夠強，再把價格打下來，用速度和工具能力擴大可用場景。

它沒有贏下「最聰明模型」的頭銜，但可能會贏走一部分真實使用量。

因為市場并不總獎勵最強者，也獎勵夠強、夠快、夠便宜的選擇。

Grok 4.3 的意義正在這里。它把 xAI 從一個經常靠馬斯克聲量吸引注意的模型供應商，往更務實的 API 和消費級工具競爭者方向推進了一步。

它看起來很好，確實很好；只是還沒好到能讓 GPT-5.5 和 Claude Opus 4.7 緊張。

消費者可以期待它降價、提速、讓更多 AI 應用變得便宜。

也該記住，在需要真正聰明和可靠的地方，Grok 4.3 仍然只是備選項。

參考資料：

https://artificialanalysis.ai/models/grok-4-3

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

黃仁勛GTC直言：現在是OpenClaw的時代，SaaS都將變AgaaS

機器之心Pro 2026-03-17 17:22:21
9 跟貼 9
馬斯克翻車了！一邊告OpenAI，一邊偷偷蒸餾ChatGPT

36氪 2026-05-02 09:29:07
13 跟貼 13

AI能改10萬行代碼，卻讓你走路去洗車！Karpathy戳破「鋸齒狀智能」

新智元 2026-05-01 17:08:00
1 跟貼 1

電動車好嗎？馬斯克來華訪問備受關注，北京天壇馬哥說觀點

北京妙姐 2026-05-01 06:03:00
0 跟貼 0
GPU神話松動，AI真正的戰場變了

虎嗅APP 2026-05-01 01:19:11
33 跟貼 33

馬斯克拿1萬億工資，為什么大家都覺得超值

雷科技 2025-11-08 14:17:34
6 跟貼 6

馬斯克的GPU也在摸魚？狂囤幾十萬張顯卡，只有11%在干活

新智元 2026-05-02 14:15:57
3 跟貼 3
馬斯克的小目標：星艦10000發/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
10 跟貼 10

騰訊混元CL-bench續作發布，讓大模型讀懂你的日常生活

機器之心Pro 2026-05-01 19:53:00
1 跟貼 1
馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
0 跟貼 0
黃仁勛的“五層蛋糕”：AI的底層戰爭，是能源戰爭（附全文）

鈦媒體APP 2026-03-11 21:03:21
0 跟貼 0
2026，國產AI芯片，跨越天塹：從“推理”走向“訓練”

鈦媒體APP 2026-02-25 12:59:31
0 跟貼 0
這套題，GPT-5.5、Opus 4.7加起來沒考到1分，人類卻拿了滿分100

機器之心Pro 2026-05-03 09:22:46
0 跟貼 0
圖靈獎得主：勸年輕人別學計算機，行業紅利正在消失

DeepTech深科技 2026-05-02 18:30:19
6 跟貼 6
貝佐斯創業，馬斯克嘲笑，兩人的恩怨糾葛20年

量子位 2025-11-22 12:44:22
0 跟貼 0
新一代具身智能仿真框架：高吞吐并行高保真渲染助力規模化訓練

量子位 2026-05-01 14:32:45
1 跟貼 1
硅谷大廠的AI“含金量”開始分級

鈦媒體APP 2026-05-03 10:46:11
0 跟貼 0
剛剛，小扎買了一家機器人公司，要做人形機器人的「安卓平臺」

機器之心Pro 2026-05-03 09:25:01
0 跟貼 0
在四五年內，在太空運行大規模AI將比地面更劃算

每日經濟新聞 2026-01-22 12:48:26
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
以人為本的AI對用戶而言才是最有用的AI

每日經濟新聞 2026-03-14 13:16:04
0 跟貼 0
DeepSeek用V4重畫了坐標系

鈦媒體APP 2026-05-01 09:52:15
10 跟貼 10
吳宜澤關鍵時刻手更硬，17-16淘汰艾倫晉級世錦賽決賽

咪咕體育 2026-05-03 07:27:47
58 跟貼 58
這事兒能喘這么大氣兒啊

肥羅愛追劇 2026-04-30 09:09:11
3 跟貼 3
吳宜澤一開場就火力全開連續硬核進攻，艾倫：他是怎么做到的？

全力說體育 2026-05-01 07:16:58
33 跟貼 33
中國為什么出不了馬斯克？馬斯克回答一針見血，不服不行！

趣料加工廠 2026-04-30 11:28:56
2 跟貼 2
艾倫無視裁判，吳宜澤表情炸裂！2026世錦賽笑料十足瞬間！

來斯文 2026-05-02 08:40:47
1 跟貼 1
魏翔艾倫爆笑小品！都督，浪大，再唱的話就喝飽了

騎著蝸牛追導彈85 2026-04-30 09:40:00
0 跟貼 0
導演不謹慎了啊

小島追劇 2026-05-01 22:35:00
0 跟貼 0
吳宜澤11-11遭艾倫追平，龐衛國點出精準戰術短板

原諒你 2026-05-03 06:53:29
4 跟貼 4
艾倫的失誤到底多逆天？還原錯失絕殺一刻笑翻觀眾吳宜澤暗喜

佳客體育 2026-05-03 07:59:16
9 跟貼 9
單桿142+140！吳宜澤11-11艾倫，中國00后小將火力全開

小葉子侃球FM 2026-05-02 22:38:50
1 跟貼 1
車載語音助手終于能聽懂人話了

薛定諤的BUG 2026-05-01 17:35:35
0 跟貼 0
5月2日世錦賽，名場面誕生：艾倫主動打進罰分黑球，吳宜澤懵了

凱西的生活 2026-05-03 01:32:07
0 跟貼 0
馬斯克4秒掙的錢相當于普通人一年的收入

每日經濟新聞 2026-01-21 00:05:31
1 跟貼 1
兔子提議限制機器人武器化

天天觀影視 2026-05-01 12:19:18
1 跟貼 1
吳宜澤17-16艾倫晉級世錦賽決賽，賽后采訪一番話殺人誅心！

貓熊說體育 2026-05-03 07:55:54
25 跟貼 25
谷歌給老車換大腦：語音助手4月30日上車

硅嶼手記 2026-05-01 04:05:16
0 跟貼 0
美國國防部長已下令從德國撤出5000名駐軍，撤軍工作將在未來6至12個月內完成

魯中晨報 2026-05-02 07:55:05
19462 跟貼 19462
吳宜澤把2個賽點追成1個中國奇跡！央視主播哭了：他眼神里有光

小娛樂悠悠 2026-05-03 10:42:58
0 跟貼 0

中方公布向菲律賓飛機發射信號彈畫面，驅離效果甚微，該上強度了

中方公布向菲律賓飛機發射信號彈畫面，驅離效果甚微，該上強度了

愛吃醋的貓咪

2026-05-01 21:24:37

警惕境外勢力資助青年躺平，多數青年實干反擊！

警惕境外勢力資助青年躺平，多數青年實干反擊！

樂享人生風雨

2026-05-02 00:48:41

潘石屹再次預判我國樓市！不出意外，未來3年，樓市或迎來3大走向

潘石屹再次預判我國樓市！不出意外，未來3年，樓市或迎來3大走向

巢客HOME

2026-05-03 05:05:03

米體：國米買斷阿坎吉后，與他的合同將自動續約到2028年

米體：國米買斷阿坎吉后，與他的合同將自動續約到2028年

懂球帝

2026-05-03 10:16:09

海港輸得太“冤”了！

新浪財經

2026-05-03 10:55:09

美國威脅制裁向伊朗繳通行費的航運企業

美國威脅制裁向伊朗繳通行費的航運企業

新京報

2026-05-03 10:56:21

倫敦世乒賽：大爆冷！張本智和0:3輸球，松島輝空0:3無緣開門紅

倫敦世乒賽：大爆冷！張本智和0:3輸球，松島輝空0:3無緣開門紅

國乒二三事

2026-05-02 22:20:14

十年前，易建聯花1000萬在洛杉磯買下豪宅，如今出售市值多少？

十年前，易建聯花1000萬在洛杉磯買下豪宅，如今出售市值多少？

小蘭聊歷史

2026-04-26 08:44:22

女人偷情在做完運動之后，為何都喜歡讓男人幫她拍照？

女人偷情在做完運動之后，為何都喜歡讓男人幫她拍照？

思絮

2026-05-01 23:16:10

阿爾布賴頓：藍狐奪冠當年，我們由警方護送去瓦爾迪家看比賽

阿爾布賴頓：藍狐奪冠當年，我們由警方護送去瓦爾迪家看比賽

懂球帝

2026-05-03 10:14:03

5000元買電動車，為什么推薦九號、臺鈴，而不選擇雅迪、愛瑪？

5000元買電動車，為什么推薦九號、臺鈴，而不選擇雅迪、愛瑪？

電動車的那些事兒

2026-05-03 07:52:26

戴安斯遲遲不動，特朗普訪華縮至一天，中方五一假期連發阻斷令！

戴安斯遲遲不動，特朗普訪華縮至一天，中方五一假期連發阻斷令！

阿器談史

2026-05-03 09:20:09

中國股市：一份“不能買”的股票名單，獻給兩億股民的最真誠忠告

中國股市：一份“不能買”的股票名單，獻給兩億股民的最真誠忠告

股經縱橫談

2026-05-01 20:40:08

為什么女教師成了單身女的最重災區？網友剖析一針見血，我明白了

為什么女教師成了單身女的最重災區？網友剖析一針見血，我明白了

夜深愛雜談

2026-04-27 22:11:39

每吃一次，大腦萎縮就快一步？醫生：這3物是老年癡呆“催化劑”

每吃一次，大腦萎縮就快一步？醫生：這3物是老年癡呆“催化劑”

今日養生之道

2026-05-03 07:53:40

劉惜君——美腳美甲高跟

白宸侃片

2026-04-27 12:49:34

皮爾斯：世一人約基奇帶隊輸殘陣！換巔峰詹姆斯、怎么說？

皮爾斯：世一人約基奇帶隊輸殘陣！換巔峰詹姆斯、怎么說？

歷史第一人梅西

2026-05-02 12:01:10

越來越多車主直接棄車，不走報廢流程，內行：聰明人都這么選

越來越多車主直接棄車，不走報廢流程，內行：聰明人都這么選

小李子體育

2026-05-02 04:53:06

時長超三小時的6部史詩級電影，全程無尿點，看完直接封神

時長超三小時的6部史詩級電影，全程無尿點，看完直接封神

小微看電影

2026-04-21 14:15:03

曾經紅火一時的貝貝南瓜，為何遇冷不好賣了？4個原因，很現實

曾經紅火一時的貝貝南瓜，為何遇冷不好賣了？4個原因，很現實

超喜歡我

2026-04-30 03:53:07

AI產業主平臺領航智能+時代

15117文章數 66828關注度

往期回顧全部

科技要聞

庫克罕見"拒答"！蘋果正被AI供應鏈卡脖子

頭條要聞

牛彈琴：比網紅還網紅快80歲的特朗普一晚上發8張圖

頭條要聞

牛彈琴：比網紅還網紅快80歲的特朗普一晚上發8張圖

體育要聞

裁判準備下班，結果吳宜澤進了決賽

娛樂要聞

蔡卓妍婚后首現身戴結婚戒指笑容不斷

財經要聞

后巴菲特時代，首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

時尚

本地

健康

公開課

教育要聞

西湖大學太“雙標”！外籍學生學費35萬一年，國內學生僅6千元

春天別總傻傻穿一身黑，看看這些日常穿搭，高級舒適又優雅

本地新聞

用青花瓷的方式，打開西溪濕地

干細胞治燒燙傷面臨這些“瓶頸”

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：久久99精品久久水蜜桃| 蜜臀久久99精品久久久酒店新书| 无码人妻精品一区二区三区不卡 | 亚洲成成品网站| 成人性做爰aaa片免费看| 午夜老湿机| 激情内射亚州一区二区三区爱妻| 亚洲AⅤ永久无码精品毛片| 国产区一区二区现看视频| 男人天堂国产| 亚洲综合精品伊人久久| 成人精品久久一区二区三区| 欧美性xxxxx极品少妇| 亚洲成av人的天堂在线观看| 久青草影院在线观看国产| 3Pav图| 精品国产一卡| 亚洲VR永久无码一区| 欧美裸体xxxx极品| www.伊人五月天| 啦啦啦www在线观看免费视频 | 男人扒开添女人下部免费视频| 无码成人AV在线一区二区| 无码久久精品国产AV影片| 又大又粗又黄的网站不卡无码 | 欧美a视频在线观看| 伊人久久大香线蕉av色婷婷色| 免费无码高H视频在线观看| 在线播放亚洲欧美日韩| 久久精品国产成人午夜福利| 97人妻人人揉人人躁人人| 最新亚洲av日韩av二区| av色在线| 亚洲欧美综合| 日本一区二区三区内射| 亚洲VR永久无码一区| 首页亚洲国产丝袜长腿综合 | 亚洲综合香蕉| 欧洲美熟女乱又伦AV影片| 美女国内精品自产拍在线播放| 亚洲午夜久久久影院伊人|

<u id="f7yu6"></u>

<rt id="f7yu6"><var id="f7yu6"></var></rt>

<pre id="f7yu6"><td id="f7yu6"></td></pre>