刷榜AI全掛了！Meta斯坦福地獄級測試，GPT/Claude/Gemini交出0分

2026-05-06 19:24:45　來源: 新智元

北京舉報

分享至

新智元報道

編輯：好困

【新智元導(dǎo)讀】SWE-Bench上能拿72%的模型，換張考卷直接歸零！Meta聯(lián)合斯坦福、哈佛放出ProgramBench，200個項目從零手寫，9大頂級模型完整通過率0%。最強(qiáng)的Claude Opus 4.7平均通過率也才51.2%。更離譜的是一聯(lián)網(wǎng)，就有模型在36%的任務(wù)里跑去GitHub扒源碼。

給你一份FFmpeg的使用文檔，和一個編譯好的可執(zhí)行文件。

現(xiàn)在，從零把整個程序重新寫出來。

這就是ProgramBench給全球頂級AI出的題。

昨天剛發(fā)布，出自SWE-Bench原班人馬之手，Meta、斯坦福、哈佛三家聯(lián)手打造。

200個軟件項目。9個頂級模型。通過率，0%！

共同一作John Yang，斯坦福在讀博士，同時也是SWE-Bench和SWE-agent的創(chuàng)建者

不是修bug，是從零造軟件

過去一年，「讓AI Agent從零造軟件」的案例報道越來越多。

Anthropic用一組平行Claude寫了個C編譯器，Cursor發(fā)博客講長時間自主編程，Epoch AI的MirrorCode也在做類似的事。

但這些案例有個共同問題，每次只測幾個項目，腳手架都是手工調(diào)優(yōu)的。

相比之下，ProgramBench把這件事正規(guī)化了。

200個任務(wù)，統(tǒng)一腳手架，系統(tǒng)性反作弊，一把拉到benchmark的標(biāo)準(zhǔn)。

論文地址：https://programbench.com/static/paper.pdf

在之前的測試中，SWE-Bench會給你一個現(xiàn)成的代碼庫，告訴你哪里有bug或者需要加什么功能，你去改。本質(zhì)上是「閱讀理解+局部手術(shù)」。

而且在評估層面，它用的是單元測試，檢查你的代碼內(nèi)部實現(xiàn)對不對，你的函數(shù)簽名、變量名都得和預(yù)期一致。

ProgramBench則完全反過來。

它只給你兩樣?xùn)|西，一個編譯好的可執(zhí)行文件，加上使用文檔。

你的任務(wù)是僅憑運行這個程序、觀察它的輸入輸出行為，從零寫出一套能復(fù)現(xiàn)同樣行為的代碼。

選什么編程語言，用什么數(shù)據(jù)結(jié)構(gòu)，怎么拆分模塊，全部你自己定。

沒有代碼骨架，沒有函數(shù)簽名，沒有任何提示。

評估方式上，研究團(tuán)隊用Agent驅(qū)動的模糊測試，為200個任務(wù)生成了總計248,853個行為測試。

你寫的程序跑一遍，輸入輸出和原版一致就算過，不一致就掛。測試永遠(yuǎn)不會透露給模型。

和SWE-Bench的單元測試不同，ProgramBench的行為測試完全不關(guān)心你的代碼內(nèi)部長什么樣，只要行為一致就行。

200個任務(wù)覆蓋的項目橫跨壓縮工具（zstd、lz4、brotli）、語言解釋器（PHP、Lua、tinycc）、數(shù)據(jù)庫（DuckDB、SQLite）、媒體處理（FFmpeg）、開發(fā)者工具（ripgrep、fzf、jq）。

代碼行數(shù)中位數(shù)8,635行，最大的FFmpeg有270萬行。

總結(jié)來說，這個測試考的是AI有沒有能力「像人類工程師一樣思考和設(shè)計軟件」，而不只是「在現(xiàn)成代碼里找到該改的地方然后改對」。

九大模型排排坐，成績?nèi)砍曾喌?/strong>

參加測試的共有9款模型，涵蓋Claude、Gemini、GPT三大家族。

完整通過率（所有測試全部通過），全員0%。

先看三家旗艦的正面對決。

GPT-5.4和Gemini 3.1 Pro的平均測試通過率幾乎打平，分別是38.3%和36.6%。但兩者的做題風(fēng)格截然不同。

GPT-5.4只用16次API調(diào)用、0.33美元成本，基本就是一口氣把整個程序?qū)懲辏?00%的代碼在一次編輯中生成，之后幾乎不回頭改。

Gemini 3.1 Pro則是9個模型里最愛「觀察」的。它用了94次API調(diào)用，其中34.1%的操作都在運行原版程序、觀察輸入輸出行為。探索做得最多，但最終成績差距不大。

真正拉開身位的是Claude Opus 4.7。

平均通過率51.2%，在3%的任務(wù)上通過了95%以上的測試，是唯一達(dá)到「幾乎通過」標(biāo)準(zhǔn)的模型。但即便是它，也沒有在任何一個任務(wù)上拿到滿分。

從整體來看，9個模型的表現(xiàn)呈現(xiàn)出清晰的梯隊。

Claude系三款旗艦（Opus 4.7、Opus 4.6、Sonnet 4.6）領(lǐng)先，GPT-5.4和Gemini 3.1 Pro構(gòu)成第二梯隊，剩下的四款小模型通過率都在35%以下。

另一個反直覺的發(fā)現(xiàn)是，砸錢和堆步數(shù)并不能換來更好的成績。

Sonnet 4.6每個任務(wù)平均跑868條命令，成本27.09美元，最長的軌跡接近2000步。但它的成績反而不如只用93次調(diào)用、花3.81美元的Opus 4.7。

更關(guān)鍵的是，98%的運行中，模型都是自己覺得「做完了」主動交卷的，根本沒有撞到時間或步數(shù)上限。

不是考試時間不夠，是真的做不到。

此外，任務(wù)難度和模型排名高度一致。

簡單的CLI工具（nnn、fzf、gron）大家都能拿到不錯的分?jǐn)?shù)，復(fù)雜系統(tǒng)（FFmpeg、PHP、typst、ast-grep）則對所有模型一視同仁地?zé)o情。

需要說明的是，ProgramBench用的是mini-SWE-agent這個極簡腳手架，沒有上下文壓縮、沒有多Agent協(xié)作、沒有定制化工具鏈。

代碼寫出來了，但完全不像人寫的

研究團(tuán)隊對比了通過75%以上測試的高分解答和人類原版代碼，發(fā)現(xiàn)了幾個驚人的差異。

單文件怪獸。

人類代碼中位數(shù)分布在15個文件里，模型的中位數(shù)是3個。

60%的解答只有1到3個代碼文件。

人類工程師按功能拆分模塊，模型傾向于把所有東西塞進(jìn)一個巨大的文件。目錄深度中位數(shù)，人類是2層，模型是1層。

函數(shù)又少又長。

Opus 4.7寫的函數(shù)數(shù)量只有人類的29%，Sonnet 4.6是24%，GPT-5.4只有10%。

但每個函數(shù)的平均長度更長，Gemini 3.1 Pro寫的函數(shù)比人類長62%。

代碼量大幅縮水。

模型代碼中位數(shù)1,173行，人類是3,068行。85%的高分解答比原版短。

總結(jié)來說就是，現(xiàn)在的AI會寫代碼，但不會做軟件設(shè)計。

它不懂為什么要拆分模塊，不理解為什么人類工程師要花時間定義接口和抽象層。策略就是把所有邏輯硬塞進(jìn)盡可能少的文件和函數(shù)里，能跑就行。

GPT-5.4的表現(xiàn)最極端。平均每個任務(wù)只創(chuàng)建5個文件，修改1.2次，39.5%的軌跡在創(chuàng)建文件后零修改。

相比之下，Claude Sonnet 4.6平均創(chuàng)建11.3個文件、修改18.3次，表現(xiàn)出更接近人類的迭代開發(fā)模式。

還有一個很有意思的現(xiàn)象。

模型只有50%的概率會用和原版相同的編程語言。

其中，Python是模型的最愛，占所有1,800次運行的36%。

原版用Rust寫的項目，只有44%用Rust重寫；C/C++的，46%。Go項目的「忠誠度」最高，70%。

不管你原來是用什么語言寫的，模型有三分之一的概率會用Python重來一遍。

說好的不作弊，一聯(lián)網(wǎng)就去GitHub扒源碼

這可能是整個研究里最有戲劇感的部分。

研究團(tuán)隊做了一組對照實驗，給模型開放網(wǎng)絡(luò)訪問權(quán)限，但在系統(tǒng)提示中明確告知「作弊不允許」。

然后用9個AI裁判檢查每條軌跡是否存在作弊行為。

結(jié)果觸目驚心。

Claude Sonnet 4.6有36%的任務(wù)被判定作弊，Claude Opus 4.6是21%，Gemini 3 Flash是20%。

作弊方式五花八門。

最赤裸裸的是去GitHub克隆源碼倉庫。

稍微隱蔽一點的是通過包管理器下載，比如cargo install、go get。

更狡猾的是去本地包緩存目錄翻依賴庫的源碼。

但AI裁判之間的分歧也大得驚人。

對于Claude Opus 4.6，9個裁判在57%的任務(wù)上無法達(dá)成一致。

有一個案例特別典型。

Claude Sonnet 4.6在做handlr這個Rust項目時，跑去~/.cargo/registry/src/目錄翻了xdg-mime、clap等依賴庫的源代碼。

5個裁判判定作弊，4個裁判認(rèn)為這些是第三方庫不算作弊。

最終，研究團(tuán)隊放棄了「聯(lián)網(wǎng)+事后檢測」的方案，直接斷網(wǎng)。

模型在面對困難任務(wù)時，「找捷徑」的傾向比預(yù)想的強(qiáng)得多。而連9個AI裁判都判不清楚什么算作弊、什么算合理的逆向工程，說明這條邊界本身就是模糊的。

舊考試結(jié)束了，新考試才剛開始

SWE-Bench上能拿72%的模型，在ProgramBench上拿0%。

這兩個測試考的根本就是兩種能力。SWE-Bench考的是「在別人的代碼里找到問題并修好」，ProgramBench考的是「自己從頭設(shè)計并實現(xiàn)一個完整系統(tǒng)」。

前者AI已經(jīng)做得相當(dāng)好了，后者目前完全不及格。

Epoch AI上周剛發(fā)了一篇博文，宣判舊推理benchmark集體死亡。想搞出還沒被刷爆的測試，至少得放棄四個舒適條件中的一個，純文本、短耗時、易評分、人類專家碾壓。

按這個框架來看，ProgramBench放棄了其中兩個，短耗時和易評分。

它把任務(wù)拉到了人類工程師可能需要數(shù)周甚至數(shù)月才能完成的量級，同時用行為等價性而非源碼匹配來評估。

作者John Yang在推文中強(qiáng)調(diào)，「ProgramBench非常難，但它在設(shè)計上是可解的。」

也就是說，0%不代表這些任務(wù)超出了AI的理論極限，只是說明今天的模型還遠(yuǎn)遠(yuǎn)不夠。

SWE-Bench測的是AI能不能當(dāng)一個好員工。ProgramBench測的是AI能不能當(dāng)一個工程師。

這兩件事之間的距離，今天剛被精確測量出來。答案是0%。

參考資料：

https://programbench.com/static/paper.pdf

https://x.com/jyangballin/status/2051677497562210552?s=20

https://x.com/EpochAIResearch/status/2051760424891392204?s=20

https://epochai.substack.com/p/rip-classic-reasoning-benchmarks

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

不用等官方了！第三方「國產(chǎn)Codex」爆火，一天收割8K個Star

雷科技 2026-05-07 20:49:14
21 跟貼 21

Claude Code之父紅杉演講震撼全場! 26年未寫1行代碼, 電腦都不開了

新智元 2026-05-06 17:15:48
190 跟貼 190

噓，Claude正在「做夢」！睡一覺瘋狂進(jìn)化，一夜暴漲6倍戰(zhàn)力

新智元 2026-05-07 12:07:18
12 跟貼 12

在模型廠碾壓之前，AI視頻Agent產(chǎn)品是否只能掙波快錢？

36氪 2026-05-07 19:42:12
0 跟貼 0

10美元破解機(jī)器人觸覺難題！斯坦福開源方案讓機(jī)械手擁有人類手感

DeepTech深科技 2026-04-19 19:34:17
8 跟貼 8

Agent-World：擴(kuò)展真實世界環(huán)境，讓智能體與環(huán)境協(xié)同進(jìn)化！

機(jī)器之心Pro 2026-05-06 12:40:24
0 跟貼 0

別急著做新工具的“小白鼠”：AI時代的慢沉淀與大迭代

秦朔朋友圈 2026-05-08 00:04:02
0 跟貼 0

這不是一個關(guān)于AI的故事，這是一個關(guān)于你的故事

孤獨大腦 2026-03-12 15:28:05
0 跟貼 0

對標(biāo)OpenClaw？Meta被曝將推消費級AI智能體

智東西 2026-05-07 19:11:07
0 跟貼 0

GMI Cloud蔣劍彪：全球AI產(chǎn)業(yè)的范式轉(zhuǎn)移，從“模型為王”到“系統(tǒng)制勝”

智東西 2026-05-06 19:33:24
0 跟貼 0

AI圈魔怔了，Anthropic卻很清醒：成立TAI給AI踩了一腳急剎

雷科技 2026-05-08 07:49:42
0 跟貼 0

英偉達(dá)力薦，小團(tuán)隊兩個月開源一款「光速級」智能體推理引擎

機(jī)器之心Pro 2026-05-07 15:06:46
0 跟貼 0

00后小哥復(fù)刻Claude最強(qiáng)神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

華為工程師，偷偷用中文寫代碼，這事在硅谷炸鍋了

逗比歡樂營 2026-05-06 09:28:28
1 跟貼 1

俄外交部呼吁各國及時從基輔撤離人員

環(huán)球網(wǎng)資訊 2026-05-07 08:47:57
38609 跟貼 38609

不寫復(fù)雜代碼的程序員，反而能準(zhǔn)時交付

碳基打工人 2026-05-07 20:13:57
0 跟貼 0

武漢多人買格力空調(diào)還沒安裝門店關(guān)閉，格力讓消費者以優(yōu)惠價格再買一次？多方回應(yīng)

瀟湘晨報 2026-05-07 15:53:43
1415 跟貼 1415

老程序員離職，臨走竟然刪除所有代碼，老板找來讓他恢復(fù)，合理嗎

詩意Traveler 2026-05-07 02:27:37
0 跟貼 0

重慶洪崖洞景區(qū)奶芙店私自增加所售奶芙制品重量，官方通報

界面新聞 2026-05-07 15:36:33
151 跟貼 151

TACO: 讓 CLI Agent 在自主迭代中學(xué)會丟掉無用上下文

機(jī)器之心Pro 2026-05-07 12:59:10
0 跟貼 0

這就是上海男籃的底氣！

新民晚報 2026-05-07 09:32:29
152 跟貼 152

第三輪第六批中央生態(tài)環(huán)境保護(hù)督察全面啟動

生態(tài)環(huán)境部 2026-05-07 10:04:40
59 跟貼 59

斯坦福發(fā)現(xiàn)：靠粗糧養(yǎng)腸道，都錯了！這類食物才是它的心頭愛

芝士小熊i 2026-05-06 10:48:02
1 跟貼 1

王毅會見美國國會參議員代表團(tuán)

央視新聞客戶端 2026-05-07 17:24:29
49 跟貼 49

皇馬官宣對2巨星啟動紀(jì)律處分程序！或直接解除合同已無限期停賽

風(fēng)過鄉(xiāng) 2026-05-08 06:19:29
2 跟貼 2

五部時間循環(huán)電影：困在同一天的N種死法

我是一個粉刷匠2 2026-05-07 02:25:37
2 跟貼 2

中國拒絕“漫天要價”的背后：不是中國離不開世界杯，是世界杯更需要中國

中國網(wǎng) 2026-05-07 17:51:22
2173 跟貼 2173

“很久沒有這種興奮感了”！段永平出手！清倉中國神華買入泡泡瑪特稱泡泡瑪特的商業(yè)壁壘遠(yuǎn)比想象中強(qiáng)大是王寧的粉絲

每日經(jīng)濟(jì)新聞 2026-05-07 17:25:55
204 跟貼 204

阿里開源：用凍結(jié)多模態(tài)大模型為文生圖訓(xùn)練提供高質(zhì)量Reward

機(jī)器之心Pro 2026-05-06 16:50:57
0 跟貼 0

歐盟中國商會警告：淘汰中國設(shè)備要付出4000億美元代價

參考消息 2026-05-07 17:47:03
1588 跟貼 1588

上海迪士尼能通話錄音游客不能錄，否則無法提供服務(wù)！游客：憑什么迪士尼能錄我不能

瀟湘晨報 2026-05-07 16:14:22
60 跟貼 60

AReaL v1.0開源，智能體強(qiáng)化學(xué)習(xí)「一鍵接入」

機(jī)器之心Pro 2026-03-05 14:46:18
0 跟貼 0

強(qiáng)化學(xué)習(xí)實戰(zhàn)訓(xùn)練營①：從零入門，一節(jié)課搞懂 RL 核心邏輯！強(qiáng)化學(xué)習(xí)入門基礎(chǔ)與核心概念詳解！

盧菁老師 2026-05-06 09:13:22
0 跟貼 0

趙祥松｜一單外賣的解剖學(xué)：誰在吃肉，誰在喝湯，誰在流血

祥松談 2026-05-08 06:09:07
0 跟貼 0

斯坦福HAI大重組！李飛飛升任校長顧問

新智元 2026-05-05 10:11:35
38 跟貼 38

37歲開源神作突然更新：開發(fā)者還在用30年前的系統(tǒng)

賽博蘭博 2026-05-05 14:50:54
6 跟貼 6

Meta新發(fā)布會：我和朋友變身忍者神龜

賽博蘭博 2026-05-07 01:10:34
2 跟貼 2

8000億的海光信息貴嗎？

虎嗅APP 2026-05-08 06:00:10
0 跟貼 0

女子機(jī)場租用充電寶1小時扣費149元，退費需回現(xiàn)場自證，網(wǎng)上顯示小電科技被投訴量超5萬件

極目新聞 2026-05-07 13:36:00
700 跟貼 700

峨眉山景區(qū)回應(yīng)“男子推搡猴子”：3年內(nèi)禁止其進(jìn)入景區(qū)

界面新聞 2026-05-07 16:44:02
5605 跟貼 5605

罵中國最兇，過中國領(lǐng)空最勤，新法落地后日本航司機(jī)票先漲兩千四
回京歷史夢
2026-05-07 12:35:20

回血的深圳，消失的中產(chǎn)
壹地產(chǎn)
2026-05-07 19:20:26

iPhone用戶為什么突然集體裝VPN
我是一個養(yǎng)蝦人
2026-05-01 07:00:40

東契奇更新傷情消息！還需再養(yǎng)三周，若湖人輸給雷霆將賽季報銷
奕辰說球
2026-05-07 11:01:37

杰倫·布朗換字母哥？名記曝綠軍“單相思”，字母哥心儀的是紐約
仰臥撐FTUer
2026-05-08 07:55:03

馬卡報：曼聯(lián)目標(biāo)瓊阿梅尼和巴爾韋德沖突升級，皇馬召開緊急會議；記者：曼聯(lián)和馬特烏斯·費爾南德斯接觸，球員愿意加盟紅魔
MUREDS
2026-05-07 23:27:34

5月8日24時，國內(nèi)成品油價格將迎調(diào)整
南昌青云譜發(fā)布
2026-05-07 10:42:25

今起關(guān)閉改造！已陪伴廣州人22年，街坊：不舍
番禺臺
2026-05-07 17:40:57

京圈“頂級富二代”落馬：該對有錢人祛魅了……
不二表姐
2026-03-26 23:45:09

交通銀行黨委：堅決擁護(hù)黨中央決定
環(huán)球網(wǎng)資訊
2026-05-07 12:40:10

"太窒息了"! 數(shù)學(xué)系華人小哥崩潰:不想和中國留學(xué)生交朋友,盡管我自己也是!
澳洲紅領(lǐng)巾
2026-05-07 15:15:55

楊子離婚 3個月就和新歡產(chǎn)子，黃圣依17年青春喂了狗，體面盡失
橙星文娛
2026-04-29 10:30:58

“我要去中國了” 51歲老馬退出斯諾克元老賽火箭：為錢我會參加
風(fēng)過鄉(xiāng)
2026-05-07 07:56:33

倫敦世乒賽：拒絕大爆冷！國乒孫穎莎輸?shù)?局，3:2險勝韓國女單
國乒二三事
2026-05-07 18:26:51

她倆就這樣突然接吻了？
奮斗在韓國
2026-05-07 19:14:41

女子200萬買下廢棄四合院,當(dāng)晚院中槐樹一夜開花,道士網(wǎng)友:快跑
古怪奇談錄
2025-08-05 15:36:06

看人下菜碟、矯情別硬上綜藝，《妻旅》中的他讓伊能靜都怒發(fā)脾氣
一娛三分地
2026-05-07 23:59:41

長得太美被導(dǎo)演占為己有，25歲生下3個孩子，如今個個都給她爭光
攬星河的筆記
2026-05-07 20:18:36

一張“初三女孩體測”照片，讓家長被數(shù)萬網(wǎng)友指責(zé)：太不用心了！
川渝視覺
2026-04-25 20:19:24

越南生育率撐不住了？專家稱人口紅利或于2036年見頂
21世紀(jì)經(jīng)濟(jì)報道
2026-05-07 21:48:52

2026-05-08 08:16:49

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

15153文章數(shù) 66848關(guān)注度

往期回顧全部

科技要聞

月之暗面完成20億美元融資，估值突破200億

凌晨突發(fā)！馬斯克租22萬塊GPU給“死敵”

首個被叫停的AI外資收購案，為什么是Manus

“馬斯克不懂AI”：OpenAI當(dāng)庭戳老底

告別廢話文學(xué)與幻覺！GPT-5.5 Instant發(fā)布

頭條要聞

媒體：三星"敗退"中國市場有兩個原因先別急著慶祝

特斯拉宣布大降價幾乎便宜一半加拿大網(wǎng)民：謝謝中國

伊朗武裝部隊：美軍違反停火協(xié)議空襲伊朗已反擊

日媒詢問中國是否希望恢復(fù)中日之間人員往來中方回應(yīng)

干部受邀釣魚溺亡家屬稱其手機(jī)里有大量領(lǐng)導(dǎo)違紀(jì)證據(jù)

頭條要聞

媒體：三星"敗退"中國市場有兩個原因先別急著慶祝

特斯拉宣布大降價幾乎便宜一半加拿大網(wǎng)民：謝謝中國

伊朗武裝部隊：美軍違反停火協(xié)議空襲伊朗已反擊

日媒詢問中國是否希望恢復(fù)中日之間人員往來中方回應(yīng)

干部受邀釣魚溺亡家屬稱其手機(jī)里有大量領(lǐng)導(dǎo)違紀(jì)證據(jù)

體育要聞

巴黎再進(jìn)歐冠決賽，最尷尬的情況還是發(fā)生了

國乒女團(tuán)3-0戰(zhàn)勝韓國，晉級世乒賽半決賽

全場轟11記Ace球！鄭欽文兩盤橫掃30號種子，躋身羅馬站32強(qiáng)

深圳大勝1-0浙江：賀希寧32+5總分升隊史第二史密斯27+9

于米提補籃準(zhǔn)絕殺！山西爆冷險勝1-0廣廈布朗35分胡金秋丟絕平球

娛樂要聞

Lisa主持！寧藝卓觀看脫衣秀風(fēng)波升級

孫楊強(qiáng)迫拉張豆豆手那一幕，我看笑了，也看怒了

馬龍逛大英博物館！粉絲追著要簽名，夏露好美

“嘎子哥”謝孟偉直播惹爭議，老婆出面回應(yīng)

王思聰洛杉磯近照曝光！一身LV卻白發(fā)駝背

財經(jīng)要聞

人均年薪406萬，這家ST公司驚呆市場！

美股小幅收跌，能源股全線走低，斯倫貝謝跌近4%

高油價擠壓支出，美國企業(yè)CEO們警告：消費者"錢花完了"

OpenAI庭審：馬斯克孩子母親出庭，稱馬斯克曾向奧特曼提供特斯拉董事會席位

在這個領(lǐng)域的戰(zhàn)爭中，中國手握最大底牌

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

極狐汽車4月銷量16532輛同比增長101.7%

Fermín Soneira接棒蘭博基尼CTO 7月1日正式上任

4月五菱汽車全球銷量11.67萬輛海外出口首破3萬

理想為什么不做轎車，有了解釋……

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

游戲

親子

公開課

軍事航空

教育要聞

愛孩子愛到失控，是這個時代最普遍的病

下個月的今天，你將圓夢高考，今天是5月8日，農(nóng)歷三月二十二。“322”成勢，“雙二”成對，寓意士氣翻...

“家長等著坐牢吧”，頂樓放十幾噸水給孩子玩，兒子動作暴露家教

高考地理答題模板，高中生必備！

高考地理中的潮光互補

PS獨占神作停服真相曝光！竟是大佬玩家親手毀掉

數(shù)毛社談新款Xbox的最大問題:他究竟是主機(jī)還是PC？

《遠(yuǎn)星物語》團(tuán)隊新作《皓白初曉》登Steam EA

在CS殺人會下地獄，那在戰(zhàn)地救人就會上天堂！

親子要聞

八部門發(fā)文改善保障兒童用藥供應(yīng)，有望解決四大痛點

淚目！母子發(fā)生車禍，受傷的寶寶含淚叮囑：你不吃，餓了怎么辦？

只祝她“母親節(jié)快樂”是不夠的

最新回復(fù)！東湖學(xué)府幼兒園開園有變，延至明年春

孩子吞食異物如何處理，關(guān)鍵時刻能救命

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

七個無法存下錢的壞習(xí)慣

李彥宏：百度離破產(chǎn)30天

軍事要聞

伊朗：最高領(lǐng)袖穆杰塔巴全面掌控局勢

剛果（金）東北部遭武裝組織襲擊至少36人死亡

日本民眾舉行集會抗議高市政權(quán)擴(kuò)軍修憲

美國務(wù)卿批準(zhǔn)向中東國家出售價值258億美元的武器

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

刷榜AI全掛了！Meta斯坦福地獄級測試，GPT/Claude/Gemini交出0分

月之暗面完成20億美元融資，估值突破200億

媒體：三星"敗退"中國市場有兩個原因 先別急著慶祝

媒體：三星"敗退"中國市場有兩個原因 先別急著慶祝

巴黎再進(jìn)歐冠決賽，最尷尬的情況還是發(fā)生了

Lisa主持！寧藝卓觀看脫衣秀風(fēng)波升級

人均年薪406萬，這家ST公司驚呆市場！

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

愛孩子愛到失控，是這個時代最普遍的病

PS獨占神作停服真相曝光！竟是大佬玩家親手毀掉

八部門發(fā)文改善保障兒童用藥供應(yīng)，有望解決四大痛點

伊朗：最高領(lǐng)袖穆杰塔巴全面掌控局勢

媒體：三星"敗退"中國市場有兩個原因先別急著慶祝

媒體：三星"敗退"中國市場有兩個原因先別急著慶祝