刷榜AI全掛了！Meta斯坦福地獄級測試，GPT/Claude/Gemini交出0分

2026-05-06 19:24:45　來源: 新智元

北京舉報

分享至

新智元報道

編輯：好困

【新智元導(dǎo)讀】SWE-Bench上能拿72%的模型，換張考卷直接歸零！Meta聯(lián)合斯坦福、哈佛放出ProgramBench，200個項目從零手寫，9大頂級模型完整通過率0%。最強的Claude Opus 4.7平均通過率也才51.2%。更離譜的是一聯(lián)網(wǎng)，就有模型在36%的任務(wù)里跑去GitHub扒源碼。

給你一份FFmpeg的使用文檔，和一個編譯好的可執(zhí)行文件。

現(xiàn)在，從零把整個程序重新寫出來。

這就是ProgramBench給全球頂級AI出的題。

昨天剛發(fā)布，出自SWE-Bench原班人馬之手，Meta、斯坦福、哈佛三家聯(lián)手打造。

200個軟件項目。9個頂級模型。通過率，0%！

共同一作John Yang，斯坦福在讀博士，同時也是SWE-Bench和SWE-agent的創(chuàng)建者

不是修bug，是從零造軟件

過去一年，「讓AI Agent從零造軟件」的案例報道越來越多。

Anthropic用一組平行Claude寫了個C編譯器，Cursor發(fā)博客講長時間自主編程，Epoch AI的MirrorCode也在做類似的事。

但這些案例有個共同問題，每次只測幾個項目，腳手架都是手工調(diào)優(yōu)的。

相比之下，ProgramBench把這件事正規(guī)化了。

200個任務(wù)，統(tǒng)一腳手架，系統(tǒng)性反作弊，一把拉到benchmark的標(biāo)準(zhǔn)。

論文地址：https://programbench.com/static/paper.pdf

在之前的測試中，SWE-Bench會給你一個現(xiàn)成的代碼庫，告訴你哪里有bug或者需要加什么功能，你去改。本質(zhì)上是「閱讀理解+局部手術(shù)」。

而且在評估層面，它用的是單元測試，檢查你的代碼內(nèi)部實現(xiàn)對不對，你的函數(shù)簽名、變量名都得和預(yù)期一致。

ProgramBench則完全反過來。

它只給你兩樣?xùn)|西，一個編譯好的可執(zhí)行文件，加上使用文檔。

你的任務(wù)是僅憑運行這個程序、觀察它的輸入輸出行為，從零寫出一套能復(fù)現(xiàn)同樣行為的代碼。

選什么編程語言，用什么數(shù)據(jù)結(jié)構(gòu)，怎么拆分模塊，全部你自己定。

沒有代碼骨架，沒有函數(shù)簽名，沒有任何提示。

評估方式上，研究團(tuán)隊用Agent驅(qū)動的模糊測試，為200個任務(wù)生成了總計248,853個行為測試。

你寫的程序跑一遍，輸入輸出和原版一致就算過，不一致就掛。測試永遠(yuǎn)不會透露給模型。

和SWE-Bench的單元測試不同，ProgramBench的行為測試完全不關(guān)心你的代碼內(nèi)部長什么樣，只要行為一致就行。

200個任務(wù)覆蓋的項目橫跨壓縮工具（zstd、lz4、brotli）、語言解釋器（PHP、Lua、tinycc）、數(shù)據(jù)庫（DuckDB、SQLite）、媒體處理（FFmpeg）、開發(fā)者工具（ripgrep、fzf、jq）。

代碼行數(shù)中位數(shù)8,635行，最大的FFmpeg有270萬行。

總結(jié)來說，這個測試考的是AI有沒有能力「像人類工程師一樣思考和設(shè)計軟件」，而不只是「在現(xiàn)成代碼里找到該改的地方然后改對」。

九大模型排排坐，成績?nèi)砍曾喌?/strong>

參加測試的共有9款模型，涵蓋Claude、Gemini、GPT三大家族。

完整通過率（所有測試全部通過），全員0%。

先看三家旗艦的正面對決。

GPT-5.4和Gemini 3.1 Pro的平均測試通過率幾乎打平，分別是38.3%和36.6%。但兩者的做題風(fēng)格截然不同。

GPT-5.4只用16次API調(diào)用、0.33美元成本，基本就是一口氣把整個程序?qū)懲辏?00%的代碼在一次編輯中生成，之后幾乎不回頭改。

Gemini 3.1 Pro則是9個模型里最愛「觀察」的。它用了94次API調(diào)用，其中34.1%的操作都在運行原版程序、觀察輸入輸出行為。探索做得最多，但最終成績差距不大。

真正拉開身位的是Claude Opus 4.7。

平均通過率51.2%，在3%的任務(wù)上通過了95%以上的測試，是唯一達(dá)到「幾乎通過」標(biāo)準(zhǔn)的模型。但即便是它，也沒有在任何一個任務(wù)上拿到滿分。

從整體來看，9個模型的表現(xiàn)呈現(xiàn)出清晰的梯隊。

Claude系三款旗艦（Opus 4.7、Opus 4.6、Sonnet 4.6）領(lǐng)先，GPT-5.4和Gemini 3.1 Pro構(gòu)成第二梯隊，剩下的四款小模型通過率都在35%以下。

另一個反直覺的發(fā)現(xiàn)是，砸錢和堆步數(shù)并不能換來更好的成績。

Sonnet 4.6每個任務(wù)平均跑868條命令，成本27.09美元，最長的軌跡接近2000步。但它的成績反而不如只用93次調(diào)用、花3.81美元的Opus 4.7。

更關(guān)鍵的是，98%的運行中，模型都是自己覺得「做完了」主動交卷的，根本沒有撞到時間或步數(shù)上限。

不是考試時間不夠，是真的做不到。

此外，任務(wù)難度和模型排名高度一致。

簡單的CLI工具（nnn、fzf、gron）大家都能拿到不錯的分?jǐn)?shù)，復(fù)雜系統(tǒng)（FFmpeg、PHP、typst、ast-grep）則對所有模型一視同仁地?zé)o情。

需要說明的是，ProgramBench用的是mini-SWE-agent這個極簡腳手架，沒有上下文壓縮、沒有多Agent協(xié)作、沒有定制化工具鏈。

代碼寫出來了，但完全不像人寫的

研究團(tuán)隊對比了通過75%以上測試的高分解答和人類原版代碼，發(fā)現(xiàn)了幾個驚人的差異。

單文件怪獸。

人類代碼中位數(shù)分布在15個文件里，模型的中位數(shù)是3個。

60%的解答只有1到3個代碼文件。

人類工程師按功能拆分模塊，模型傾向于把所有東西塞進(jìn)一個巨大的文件。目錄深度中位數(shù)，人類是2層，模型是1層。

函數(shù)又少又長。

Opus 4.7寫的函數(shù)數(shù)量只有人類的29%，Sonnet 4.6是24%，GPT-5.4只有10%。

但每個函數(shù)的平均長度更長，Gemini 3.1 Pro寫的函數(shù)比人類長62%。

代碼量大幅縮水。

模型代碼中位數(shù)1,173行，人類是3,068行。85%的高分解答比原版短。

總結(jié)來說就是，現(xiàn)在的AI會寫代碼，但不會做軟件設(shè)計。

它不懂為什么要拆分模塊，不理解為什么人類工程師要花時間定義接口和抽象層。策略就是把所有邏輯硬塞進(jìn)盡可能少的文件和函數(shù)里，能跑就行。

GPT-5.4的表現(xiàn)最極端。平均每個任務(wù)只創(chuàng)建5個文件，修改1.2次，39.5%的軌跡在創(chuàng)建文件后零修改。

相比之下，Claude Sonnet 4.6平均創(chuàng)建11.3個文件、修改18.3次，表現(xiàn)出更接近人類的迭代開發(fā)模式。

還有一個很有意思的現(xiàn)象。

模型只有50%的概率會用和原版相同的編程語言。

其中，Python是模型的最愛，占所有1,800次運行的36%。

原版用Rust寫的項目，只有44%用Rust重寫；C/C++的，46%。Go項目的「忠誠度」最高，70%。

不管你原來是用什么語言寫的，模型有三分之一的概率會用Python重來一遍。

說好的不作弊，一聯(lián)網(wǎng)就去GitHub扒源碼

這可能是整個研究里最有戲劇感的部分。

研究團(tuán)隊做了一組對照實驗，給模型開放網(wǎng)絡(luò)訪問權(quán)限，但在系統(tǒng)提示中明確告知「作弊不允許」。

然后用9個AI裁判檢查每條軌跡是否存在作弊行為。

結(jié)果觸目驚心。

Claude Sonnet 4.6有36%的任務(wù)被判定作弊，Claude Opus 4.6是21%，Gemini 3 Flash是20%。

作弊方式五花八門。

最赤裸裸的是去GitHub克隆源碼倉庫。

稍微隱蔽一點的是通過包管理器下載，比如cargo install、go get。

更狡猾的是去本地包緩存目錄翻依賴庫的源碼。

但AI裁判之間的分歧也大得驚人。

對于Claude Opus 4.6，9個裁判在57%的任務(wù)上無法達(dá)成一致。

有一個案例特別典型。

Claude Sonnet 4.6在做handlr這個Rust項目時，跑去~/.cargo/registry/src/目錄翻了xdg-mime、clap等依賴庫的源代碼。

5個裁判判定作弊，4個裁判認(rèn)為這些是第三方庫不算作弊。

最終，研究團(tuán)隊放棄了「聯(lián)網(wǎng)+事后檢測」的方案，直接斷網(wǎng)。

模型在面對困難任務(wù)時，「找捷徑」的傾向比預(yù)想的強得多。而連9個AI裁判都判不清楚什么算作弊、什么算合理的逆向工程，說明這條邊界本身就是模糊的。

舊考試結(jié)束了，新考試才剛開始

SWE-Bench上能拿72%的模型，在ProgramBench上拿0%。

這兩個測試考的根本就是兩種能力。SWE-Bench考的是「在別人的代碼里找到問題并修好」，ProgramBench考的是「自己從頭設(shè)計并實現(xiàn)一個完整系統(tǒng)」。

前者AI已經(jīng)做得相當(dāng)好了，后者目前完全不及格。

Epoch AI上周剛發(fā)了一篇博文，宣判舊推理benchmark集體死亡。想搞出還沒被刷爆的測試，至少得放棄四個舒適條件中的一個，純文本、短耗時、易評分、人類專家碾壓。

按這個框架來看，ProgramBench放棄了其中兩個，短耗時和易評分。

它把任務(wù)拉到了人類工程師可能需要數(shù)周甚至數(shù)月才能完成的量級，同時用行為等價性而非源碼匹配來評估。

作者John Yang在推文中強調(diào)，「ProgramBench非常難，但它在設(shè)計上是可解的。」

也就是說，0%不代表這些任務(wù)超出了AI的理論極限，只是說明今天的模型還遠(yuǎn)遠(yuǎn)不夠。

SWE-Bench測的是AI能不能當(dāng)一個好員工。ProgramBench測的是AI能不能當(dāng)一個工程師。

這兩件事之間的距離，今天剛被精確測量出來。答案是0%。

參考資料：

https://programbench.com/static/paper.pdf

https://x.com/jyangballin/status/2051677497562210552?s=20

https://x.com/EpochAIResearch/status/2051760424891392204?s=20

https://epochai.substack.com/p/rip-classic-reasoning-benchmarks

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點推薦

從印度二本到Meta副總裁！被世界拒絕15次的他，撐起AI時代地基

新智元 2025-11-15 13:05:14
423 跟貼 423

讓兩個大模型在線吵架，跑通全網(wǎng)95%科研代碼｜深勢Deploy-Master

機器之心Pro 2026-01-09 14:22:47
0 跟貼 0

Claude Code之父：我們公司已沒真人寫代碼了

智東西 2026-05-09 20:46:17
4 跟貼 4

對標(biāo)OpenClaw？Meta被曝將推消費級AI智能體

智東西 2026-05-07 19:11:07
0 跟貼 0

10美元破解機器人觸覺難題！斯坦福開源方案讓機械手擁有人類手感

DeepTech深科技 2026-04-19 19:34:17
0 跟貼 0

AI突現(xiàn)首例自我復(fù)制！橫跨4國160小時無限繁殖

新智元 2026-05-09 18:31:30
13 跟貼 13

中國創(chuàng)造一門新編程語言的黃金時代來了？

虎嗅APP 2025-12-23 03:54:05
39 跟貼 39

Agent-World：擴展真實世界環(huán)境，讓智能體與環(huán)境協(xié)同進(jìn)化！

機器之心Pro 2026-05-06 12:40:24
0 跟貼 0

生成式Critic重新定義LLM強化學(xué)習(xí)信用分配

機器之心Pro 2026-05-09 14:52:19
0 跟貼 0

00后小哥復(fù)刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

2026 AI眼鏡大戰(zhàn)升級！一邊等蘋果出手，一邊憋大招

智東西 2026-05-09 22:02:10
0 跟貼 0

公司斥巨資挖來的程序員，老板都不敢惹她，直到有幸看到她的技術(shù)

陌陌說時尚 2026-05-09 09:48:18
2 跟貼 2

外賣小哥冒死沖進(jìn)火場救火被物業(yè)收取50元“滅火器使用費”

閃電新聞 2026-05-09 09:31:06
11841 跟貼 11841

那個凌晨兩點還在工作的測試，后來怎么樣了

51Testing軟件測試網(wǎng) 2026-05-09 17:30:11
0 跟貼 0

Markdown不行了？Agent時代，老掉牙的HTML正在逆襲

雷科技 2026-05-09 20:35:53
3 跟貼 3

Codex不只敲代碼！教你幾分鐘全自動搞定視頻

王子健 2026-05-08 23:37:52
5 跟貼 5

性能真的不重要了嗎？Jeff Dean給出反常答案

新智元 2025-12-28 17:20:51
0 跟貼 0

實測Codex Chrome：簡單任務(wù)翻車，復(fù)雜任務(wù)反而成了

雷科技 2026-05-09 08:14:34
8 跟貼 8

魯比奧：如果俄烏談判再無進(jìn)展美方不愿再“浪費時間”

財聯(lián)社 2026-05-09 04:47:18
665 跟貼 665

剝奪大模型執(zhí)行權(quán)！港中文開源Agent治理內(nèi)核，高危攔截率達(dá)92.95%

新智元 2026-05-09 12:08:54
0 跟貼 0

嘴炮王者譚sir竟被邏輯女帝反殺成渣：愿大姐被歲月溫柔以待

解壓小劇場 2026-05-09 08:17:50
3 跟貼 3

河北多地漫天楊絮似大雪紛飛省綠辦：多年前曾定下治理時間表每年都有打藥等防治措施

閃電新聞 2026-05-09 12:40:08
304 跟貼 304

廣西壯族自治區(qū)計劃生育協(xié)會常務(wù)副會長蘇英權(quán)接受審查調(diào)查

上觀新聞 2026-05-09 18:03:27
29 跟貼 29

Excel公式寫到崩潰？這個隱藏函數(shù)讓你一次定義，全局復(fù)用

閃存獵手 2026-05-08 19:53:26
0 跟貼 0

上海迪士尼能通話錄音游客不能錄，否則無法提供服務(wù)！游客：憑什么迪士尼能錄我不能

瀟湘晨報 2026-05-07 16:14:22
631 跟貼 631

谷歌和斯坦福聯(lián)手父母帶娃必玩的AI游戲

新芒X 2026-05-08 13:43:54
0 跟貼 0

茶顏悅色，裝不下去了

中國新聞周刊 2026-05-07 22:15:57
298 跟貼 298

5月18日零時起，蘭州市新啟用32處“電子眼”

甘肅交通廣播 2026-05-09 18:11:38
0 跟貼 0

AReaL v1.0開源，智能體強化學(xué)習(xí)「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0

恒大前總裁夏海鈞廣州豪宅將拍賣：7室5廳享一線江景，參考市價超7000萬元

紅星新聞 2026-05-09 21:20:17
89 跟貼 89

河南一景區(qū)“攻城送蒜薹”玩梗成真：把參演游客的枷鎖換成了“蒜薹花環(huán)”，演完可帶走

揚子晚報 2026-05-08 20:46:07
135 跟貼 135

不用寫代碼也能做個小游戲？實測Hy3 preview 模型

泡泡網(wǎng) 2026-05-07 20:27:49
0 跟貼 0

5.6美國加油機發(fā)出7700緊急代碼

空天觀察 2026-05-08 19:37:33
0 跟貼 0

【AI大模型安全與評測】從DeepSeek-V4拆解真實評估邏輯，90%的人都搞錯了！企業(yè)級大模型評

盧菁老師 2026-05-09 09:07:47
0 跟貼 0

276人落網(wǎng)：跨國殺豬盤背后，Meta刪了1.59億條詐騙廣告

薛定諤的BUG 2026-05-08 19:07:55
0 跟貼 0

AI諂媚可能讓人陷入妄想癥

量子位 2026-04-08 12:28:40
0 跟貼 0

龍蝦軍團(tuán)有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0

iOS 26.5下周正式推送，一口氣上線五大新功能

環(huán)球網(wǎng)資訊 2026-05-08 10:49:06
542 跟貼 542

143數(shù)學(xué)全國2卷（文） 10 函數(shù)的奇偶性與單調(diào)性

我服子佩 2026-05-08 14:14:11
1 跟貼 1

150數(shù)學(xué)全國2卷（文） 21 函數(shù)的取值范圍與單調(diào)性

我服子佩 2026-05-09 21:45:36
1 跟貼 1

奉勸大家：這6樣?xùn)|西千萬“別用紙巾擦”，一擦就壞，很難修復(fù)
室內(nèi)設(shè)計師有料兒
2026-05-06 12:09:03

廣東加時險勝北京！楊鳴指導(dǎo)犀利點評：韌性定勝負(fù)，細(xì)節(jié)決輸贏！
田先生籃球
2026-05-09 23:38:48

14記ACE球仍遭前法網(wǎng)冠軍逆轉(zhuǎn)，鄭欽文遺憾止步羅馬32強
極目新聞
2026-05-10 00:18:29

2013年，金正哲聯(lián)手張成澤發(fā)動朝鮮兵變，因一細(xì)節(jié)敗露，雙遭反殺
阿胡
2025-03-11 13:28:03

我年過六十歲才恍然大悟：為什么大多數(shù)女人都對六十歲以上的男人敬而遠(yuǎn)之，甚至?xí)鲃踊乇埽瑑蓚€原因
心理觀察局
2026-05-04 08:51:10

這就是公開辱華的后果！取消冠軍頭銜只是開始，職業(yè)生涯也全毀了
阿鳧愛吐槽
2025-12-17 17:24:39

蔣萬安被問懵：不認(rèn)中國人身份，憑何遷兩蔣靈柩回大陸？
娛樂的宅急便
2026-05-08 13:39:15

國際油價本周大跌7%
每日經(jīng)濟(jì)新聞
2026-05-09 09:16:42

光纖+存儲芯片+商業(yè)航天+算力租賃，深度布局的10家潛力公司
粵語音樂噴泉
2026-05-08 18:52:45

人不會無緣無故患帶狀皰疹！調(diào)查發(fā)現(xiàn)：得帶狀皰疹，離不開這5點
岐黃傳人孫大夫
2026-05-01 14:35:03

夢幻開局！上海久事2-0橫掃山東，時隔四年重返 CBA 四強
友誼第一
2026-05-10 00:55:25

緊急！停招電氣工程專業(yè)！
新浪財經(jīng)
2026-05-08 16:42:06

鄉(xiāng)鎮(zhèn)女大學(xué)生曬“低審美”穿搭，網(wǎng)友眼前一黑：求求你都扔了吧！
妍妍教育日記
2026-05-09 10:34:34

國內(nèi)規(guī)模最大的資金外流渠道，并非地下錢莊，也不是虛擬貨幣
流蘇晚晴
2026-05-06 20:24:48

大量硼砂，別再給家里人吃了！這10類食物最易摻硼砂，超危險
笑熬漿糊111
2026-04-13 00:05:12

烏拉圭河底撈出納粹巨鷹，重達(dá)半噸鷹爪抓萬字符，20年沒人敢處置
老謝談史
2026-04-26 21:14:12

網(wǎng)紅痞幼拿下張雪機車，純粹蹭熱度
喜歡歷史的阿繁
2026-05-09 01:27:27

曾被馬來西亞侵占的瓊臺礁，戰(zhàn)略價值遠(yuǎn)超黃巖島，后來怎么樣了？
泠泠說史
2026-05-09 20:07:27

立夏后，每天杯子里泡點它，清肝明目排熱毒，舒舒服服迎夏天
江江食研社
2026-05-06 18:10:55

丑鞋出海賣爆了，賣家狂賺400萬
跨境派Pro
2026-05-09 14:14:21

2026-05-10 02:48:49

新智元

AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代

15170文章數(shù) 66852關(guān)注度

往期回顧全部

科技要聞

美國政府強力下場蘋果英特爾達(dá)成代工協(xié)議

曝DeepSeek融資500億，梁文鋒或自投200億

Meta瘋狂擁抱AI：員工苦不堪言

SK海力士平均獎金600萬工服成相親神器

世紀(jì)AI訴訟持續(xù)爆猛料，OpenAI正在被高管掏空？

頭條要聞

演員文章面館大火后又開酒吧多位明星到場母親也現(xiàn)身

國防部證實:中方建造的"麒麟"級潛艇首艇交付巴基斯坦

香港富豪孫女被綁架綁匪拿到2800萬后逃跑8人花11萬

為190元"僅退款"榴蓮千里討公道賣家:暫未收到道歉

國防部:解放軍已成功配齊隱身艦載戰(zhàn)機等"航母五件套"

頭條要聞

演員文章面館大火后又開酒吧多位明星到場母親也現(xiàn)身

國防部證實:中方建造的"麒麟"級潛艇首艇交付巴基斯坦

香港富豪孫女被綁架綁匪拿到2800萬后逃跑8人花11萬

為190元"僅退款"榴蓮千里討公道賣家:暫未收到道歉

國防部:解放軍已成功配齊隱身艦載戰(zhàn)機等"航母五件套"

體育要聞

成立128年后，這支升班馬首奪頂級聯(lián)賽冠軍

世乒賽-中國女團(tuán)3-0羅馬尼亞將與日本隊爭冠

CBA-廣東加時險勝北京1-1扳平張皓嘉三分絕殺

上海狂勝2-0山東進(jìn)四強：洛夫頓20+9+5 陳林堅21分王哲林14+6

英超-利物浦1-1切爾西鐵腰世界波恩佐任意球破門

娛樂要聞

50歲趙薇臉頰凹陷滄桑得認(rèn)不出！

繼“粉底液將軍”后，張凌赫再出“幺蛾子”

劉濤參加媽祖誕辰盛典，湄洲再迎媽祖回娘家

震驚足壇！馬拉多納死亡真相曝光，醫(yī)護(hù)面臨重刑

baby近照臉好僵！被質(zhì)疑打針了沒恢復(fù)

財經(jīng)要聞

多地號召，公職人員帶頭繳納物業(yè)費

小象超市瘋狂下沉三線市場

國常會部署化解地方債風(fēng)險釋放哪些信號？

存儲芯片上演造富潮

車企因鎖電問題被約談立案不實

汽車要聞

軸距加長/智駕拉滿阿維塔07L定位大五座SUV

搭載閃充技術(shù)的C級轎車領(lǐng)匯e9上市售15.08萬元起

對話北京現(xiàn)代雷宏錄：IONIQ要在全球品質(zhì)之上融入中國智慧

MG 07官圖發(fā)布更親民的新能源轎跑來了

全系智能泊車鉑智3X年款升級限時權(quán)益價9.48萬起

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

教育

游戲

時尚

公開課

家居要聞

菁英人居全能豪宅

流動的尺度打破家的形式主義

破繭成蝶土味精裝房爆改

大膽前衛(wèi) 時尚大宅

教育要聞

天津女教師懟家長！完整錄音曝光，老師很囂張，飯碗恐不保了

2026年高考重點關(guān)注|40種典型地形地貌形成過程（地質(zhì)過程）

明明叫作“黑板”，可為什么都是綠色的？

第一名捏!!!5個月民辦二本速通京區(qū)211!!!

當(dāng)代學(xué)生如何看待虧欠課題：執(zhí)著于虧欠可能錯失機會

Windows 11 PC上的Xbox模式不支持多顯示器

PS4趕緊換PS5！索尼啟動《GTA6》首輪宣發(fā)攻勢

《明末》被收購后國內(nèi)首條動態(tài)：江湖又見！

《樂高蝙蝠俠：黑暗騎士遺產(chǎn)》發(fā)售前加入了D加密

伊姐周六熱推：電視劇《喀什戀歌》；電視劇《低智商犯罪》......

夏季通勤穿搭沒靈感?看看這些低飽和色系的搭配，知性又優(yōu)雅

初夏穿搭秘籍：讓你輕松變身時尚達(dá)人！

今年春夏最火的3個穿搭思路，普通人可以直接照搬嗎？

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻

為什么人類有不同的膚色？

七個無法存下錢的壞習(xí)慣

李彥宏：百度離破產(chǎn)30天

手機 / 數(shù)碼

房產(chǎn) / 家居

刷榜AI全掛了！Meta斯坦福地獄級測試，GPT/Claude/Gemini交出0分

美國政府強力下場 蘋果英特爾達(dá)成代工協(xié)議

演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

演員文章面館大火后又開酒吧 多位明星到場母親也現(xiàn)身

成立128年后，這支升班馬首奪頂級聯(lián)賽冠軍

50歲趙薇臉頰凹陷滄桑得認(rèn)不出！

多地號召，公職人員帶頭繳納物業(yè)費

軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

態(tài)度原創(chuàng)

菁英人居 全能豪宅

天津女教師懟家長！完整錄音曝光，老師很囂張，飯碗恐不保了

Windows 11 PC上的Xbox模式不支持多顯示器

伊姐周六熱推：電視劇《喀什戀歌》；電視劇《低智商犯罪》......

美國政府強力下場蘋果英特爾達(dá)成代工協(xié)議

演員文章面館大火后又開酒吧多位明星到場母親也現(xiàn)身

演員文章面館大火后又開酒吧多位明星到場母親也現(xiàn)身

軸距加長/智駕拉滿阿維塔07L定位大五座SUV

菁英人居全能豪宅