<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<big id="ko4ha"><i id="ko4ha"><video id="ko4ha"></video></i></big>

^{<blockquote id="ko4ha"></blockquote>}

<sup id="ko4ha"></sup>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

頂級AI撞上低級烏龍：連寫幾十頁推導，結果發現題干錯了？

2026-05-04 12:08:00　來源: 新智元

北京舉報

0

分享至

新智元報道

編輯：傾傾

【新智元導讀】Google DeepMind再次血洗數學圈！700個地獄級難題被丟進Gemini的熔爐，結果讓數學家集體破防：這哪是證明，這分明是「邏輯拆遷」。DeepMind這一波不僅貼臉爆殺了OpenAI，還砸爛了人類所有的優越感。

幾百美金的懸賞，跨越半個世紀的死局。

20世紀最偉大的「題目魔術師」保羅·埃爾德什（PaulErd?s）生前留下了幾百個懸賞令，金額從50刀漲到5000刀。

50年里，無數數學天才熬禿了頭，也沒能拿走一分錢。

結果，Google DeepMind帶著名為Aletheia（真理女神）的怪獸進場了。

上線僅7天，13道難題應聲而碎。

論文鏈接：https://arxiv.org/abs/2601.22401

但最扎心的真相是：AI并不是比你更聰明，它只是比你更懂「洗稿」。

13/700的真相：AI真的在加速科學嗎？

「AI攻克百年數學難題」看起來很像爽文標題，聽聽就行，別被帶了節奏。

數學這行只看硬指標。DeepMind這次祭出的Aletheia，底色根本不是什么「天才數學家」，而是一個冷酷的「頂級邏輯洗煤廠」

這套邏輯極其殘酷，帶著一股子硅谷大廠KPI導向的血腥味：

初始的流量層里，裝著700個埃爾德什猜想。

隨后，Gemini開啟Deep Think模式，像不要錢一樣大規模灌入算力，得出200個候選方案。

然后，這200個候選人經過自然語言驗證器，剔除邏輯不通的部分，最后只剩下63個。

最后，經過專家級別的數學推演，得到13個真正具有數學原創意義的答案。

成功證明問題：Erd?s problem#1051

700個問題里只解答出13個，轉化率還不到2%。

其中，最具代表性的是對「Erd?s-1051」猜想中關于無理數分布的證明。

聽著很牛X，但DeepMind自己也承認，剩下的68.5%都是學術垃圾。

有些AI給出的證明過程長達幾百頁，讀起來像是東拼西湊的論文。

在整個過程中，Aletheia像一個「自動審稿員」。Gemini負責狂暴輸出，而驗證器負責冷酷拒絕。

Gemini DeepThink處理數學猜想具體過程：https://www.youtube.com/watch?v=Nmv4YxpbhU8

更諷刺的是，人類數學家復核后發現，這13個所謂的「突破」，很大一部分屬于數學界的「低垂果實」——太繁瑣所以沒人想做。

一位參與評審的組合數學專家曾私下感嘆：

AI目前的強項不是創造，而是清掃。

只要算力管夠，這種靠暴力邏輯搜集、整理、強行出結果的路徑，AI基本無敵。

潛意識剽竊：AI數學家的「洗稿」藝術

在這次DeepMind的成果展示中，出現了一個讓學術界集體炸鍋的新名詞：潛意識剽竊。

簡單說，就是AI利用自己幾乎無限的硬盤，從某個犄角旮旯翻出一篇冷門論文，然后用現代的邏輯語言把它重新包裝了一遍。

最典型的翻車現場是關于Erd?s-1089猜想的證明。

當時Aletheia給出了一個極其精妙的推導，精妙到連幾個頂尖數學家都差點想給它頒獎。

但隨后，有人在數據庫的深層挖掘中發現，這個所謂的「原創靈感」，與1981年一篇東歐冷門數學期刊上的論文高度重合。

這就是AI作為一個「黑盒」最讓人絕望的本能。

對AI來說，它并沒有原創和抄襲的概念。它只是在概率的指引下，把權重最高的Token組合在一起。

AI記住了所有你忘了的東西。當它從千億級參數中提取出那個冷門關聯時，它自己都不知道是在致敬還是在白嫖。

GoogleDeepMind-Aletheia項目詳情，在此頁面可以找到更多具體輸出案例：https://github.com/google-deepmind/superhuman

只要喂的數據夠多，AI就能通過變換符號系統、調整推導步長，把一篇舊論文洗得像剛出爐的SCI。

菲爾茲獎得主陶哲軒一語道破：

AI并不是在做數學，它是在對人類過往的智慧進行大規模的歸納整合。

細思極恐。如果連數學這種硬核真理領域，AI都能靠「洗稿」蒙混過關，那我們寫的行業報告、架構方案、市場分析，在它眼里算什么？

大師也翻車：被詛咒的Erd?s-75號

接下來這個「Erd?s-75號靈異事件」，暴露出AI的智商硬傷。

這道題在數學圈臭名昭著，因為它被「詛咒」了。

1995年，埃爾德什在寫下這個猜想時，犯了一個低級邏輯錯誤，這道題題干就是錯的，是個偽命題。

魔幻的一幕發生了：Aletheia接手后，不僅沒發現題目有問題，反而憑借其狂暴的算力和自我博弈機制，硬生生地輸出了一份長達幾十頁、邏輯閉環的「完美證明」。

這種「邏輯狂奔」暴露了當前AI的致命缺陷：

首先，AI缺乏審美與常識。它只會在符號框架內找最優解，卻根本分不清這個框架本身是不是一張廢紙。

其次，獎勵函數具有盲目性。AI的目標是讓驗證器閉嘴。只要推導過程符合規則，結論哪怕再荒謬，它也敢一路狂飆到底。

最后發現Bug的，還得是那幫數學家。他們翻出1995年的手稿，一行行對完后得出結論：「這題出錯了，AI證的是個寂寞。」

而這一點，恰恰是我們和AI競爭時的最后防線。AI能在幾毫秒內跑完幾千公里的邏輯馬拉松，但它不知道終點線是不是畫在懸崖外面。

DeepMind貼臉開大：OpenAI的「數學公關戰」破產題

前陣子，OpenAI靠著o1在數學AIME考試里刷屏，宣稱AI已經有了類似人類的「慢思考」能力。

但在DeepMind看來，那頂多算是一場極其成功的文獻開盒。

為了打臉OpenAI，Google專門在Aletheia的輸出分類里設立了一個很損的標簽：「已知文獻關聯」。

它明擺著在諷刺OpenAI：你以為你解決了問題，其實你只是從訓練集里翻出了標準答案。

而DeepMind表示，我不僅能證出來，我還能告訴你哪些是人類證過的、哪些是我洗稿洗出來的、哪些才是真正的原創。

這場「數學公關戰」撕開了大廠競爭的遮羞布。

OpenAI的數學能力很大程度上依賴于「題海戰術」，一旦遇到訓練集之外的真命題就容易抓瞎。

而DeepMind走的是「AlphaGo路線」——自我博弈+形式化驗證（Lean），寧可轉化率只有2%，也要確保這13個成果是硬通貨。

DeepMind官方技術文檔：Aletheia用于數學的自我對弈與形式化證明

數學界的「掃地僧」陶哲軒一直關注著這場博弈。

他在自己的他在博客里含蓄地表示：相比于追求「看起來正確」的概率模型，他更看好那種能生成「可由計算機驗證證明」的系統。

這等于是給DeepMind站了臺。

瓶頸位移：從「解題機器」到「審美法官」

折騰了半天，這場13/700的戰役到底告訴了我們什么？

是——數學發現的瓶頸，正在從「解題能力」位移到「價值判定」。

這種范式轉移，預示了未來所有硬核從業者的兩種求生路徑：

一種是從「操作員」變成「審美法官」。

既然AI能以極低成本生成海量邏輯證明，人類的價值就不再是去復核每一個符號，而是運用直覺和審美，去判斷哪個方向才有真正的科學突破。

另一種形態是邏輯審計員。

面對潛意識剽竊和大師Bug，人類需要利用對歷史的精通，去甄別AI到底是真天才，還是個洗稿高手。

AI能在幾毫秒內重走完人類幾千年的邏輯之路，但它依然讀不懂人類在深夜推演失敗時，那份撕掉草稿紙的無奈。

邏輯可以代工，但靈魂和審美，AI暫時還沒學會怎么洗。

參考資料：

https://x.com/quocleix/status/2018402933193539735?s=20

https://arxiv.org/abs/2601.22401

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

媒體：霍爾木茲海峽一聲驚雷炸響戰爭的引信已經點燃

國是直通車 2026-05-04 21:08:48
25356 跟貼 25356
吳宜澤回應斯諾克世錦賽奪冠創歷史：父母是真正冠軍

環球網 2026-05-05 07:45:17
5488 跟貼 5488

中山大學通報“附屬醫院康某某相關學術論文圖片及數據存疑”：已正式啟動調查程序

環球網資訊 2026-05-05 14:54:11
690 跟貼 690

莫氏雞煲上線湯料包5分鐘售罄4000多份，累計賣出4萬多份，總銷售額破160萬元，記者實測：1分鐘搶到兩包

極目新聞 2026-05-04 09:46:46
8620 跟貼 8620
景區裝電梯無痛爬山被質疑過度開發

極目新聞 2026-05-02 17:18:12
4157 跟貼 4157

32℃！雷雨、7級大風！江蘇最新天氣預測

江南晚報 2026-05-06 02:58:45
3 跟貼 3

車主稱60萬買林肯飛行家前機蓋頻繁異常開啟 4S店回應

紅星新聞 2026-05-05 08:34:16
1498 跟貼 1498
俄羅斯宣布與烏克蘭實施勝利日停火

財聯社 2026-05-05 09:57:03
4896 跟貼 4896

文班：我消耗了太多體力做了一些對球隊并沒有太大幫助的事情

北青網-北京青年報 2026-05-05 19:44:31
65 跟貼 65
接好運！上海女子200元買刮刮樂，30元面值的喜相逢刮中100萬元！

觀威海 2026-05-05 10:42:12
175 跟貼 175
實探鄭州中牟蒜地：免費抽蒜薹持續近一個月，有人從海南專程來，農戶提供午餐

環球網資訊 2026-05-05 09:36:24
612 跟貼 612
深圳樓市，咨詢量爆了

南方都市報 2026-05-05 11:04:16
3177 跟貼 3177
張雪父子，共同亮相賽場

魯中晨報 2026-05-05 16:58:04
36 跟貼 36
廣東一景區巖石被染成五彩色，景區回應：是環保涂料

上觀新聞 2026-05-05 13:44:14
93 跟貼 93
大熊貓食用的竹子發霉出現斑點？動物園工作人員回應

極目新聞 2026-05-05 12:06:54
93 跟貼 93
五一假期全國鐵路累計發送旅客超1億人次

界面新聞 2026-05-05 12:11:03
48 跟貼 48
新華視點｜五一文旅消費觀察：文旅融合升溫消費提質升級

新華社 2026-05-05 15:37:21
84 跟貼 84

一群專業演員愣演不過一個說相聲的《低智商犯罪》爛不是沒理由的

一群專業演員愣演不過一個說相聲的《低智商犯罪》爛不是沒理由的

金風說

2026-05-05 17:40:33

技術越牛，死得越快？一個蘇州新材料老板的深夜困惑

技術越牛，死得越快？一個蘇州新材料老板的深夜困惑

胡華成

2026-04-05 18:18:14

大快人心！白洋淀五一徹底涼涼，靠宰客斂財的景區終于迎來了報應

大快人心！白洋淀五一徹底涼涼，靠宰客斂財的景區終于迎來了報應

社會日日鮮

2026-05-05 20:11:56

2026倫敦世乒賽奪冠熱門出爐！法國隊概率居首國乒沖12連冠遇勁敵

2026倫敦世乒賽奪冠熱門出爐！法國隊概率居首國乒沖12連冠遇勁敵

kio魚

2026-05-06 06:00:33

西安65歲以上老人可輕松辦理優待證，全市36個便捷服務點提供免費乘車！

西安65歲以上老人可輕松辦理優待證，全市36個便捷服務點提供免費乘車！

好笑娛樂君每一天

2026-05-06 02:03:22

男子和妻子的弟媳纏綿，怕妻子聽到聲音，2017年弟媳竟被他捂死了

男子和妻子的弟媳纏綿，怕妻子聽到聲音，2017年弟媳竟被他捂死了

漢史趣聞

2026-05-05 11:36:31

奧布拉克：我們本該做得更好，現在必須抬起頭去想下一次機會

奧布拉克：我們本該做得更好，現在必須抬起頭去想下一次機會

懂球帝

2026-05-06 05:55:07

警告三次不如動真格一次！中國下達逐客令，巴拿馬反應出乎意料

警告三次不如動真格一次！中國下達逐客令，巴拿馬反應出乎意料

黑哥講現代史

2026-05-04 23:15:22

高市在澳洲雙膝跪地，在亞洲只遞刀子：這一跪，把日本老底跪穿了

高市在澳洲雙膝跪地，在亞洲只遞刀子：這一跪，把日本老底跪穿了

騷年先鋒

2026-05-06 05:22:03

特斯拉 Model Y 將大改款？網傳有 5 項升級，每個都是車主想要的！

特斯拉 Model Y 將大改款？網傳有 5 項升級，每個都是車主想要的！

新浪財經

2026-05-04 22:51:52

游客在三門峽一動物園找到“兩塊錢的快樂”？園方回應：門票2元屬實，20多年未漲價，基本無其他收費項目

游客在三門峽一動物園找到“兩塊錢的快樂”？園方回應：門票2元屬實，20多年未漲價，基本無其他收費項目

極目新聞

2026-05-03 14:52:34

吳宜澤18-17絕殺墨菲！首奪世錦賽冠軍獎金462萬排名升世界第4

吳宜澤18-17絕殺墨菲！首奪世錦賽冠軍獎金462萬排名升世界第4

侃球熊弟

2026-05-05 05:36:18

晚年毛主席向唐聞生秘密托付：我死后聽周總理的！讓基辛格驚嘆能當總統的她到底憑啥？

晚年毛主席向唐聞生秘密托付：我死后聽周總理的！讓基辛格驚嘆能當總統的她到底憑啥？

歷史回憶室

2026-05-05 18:11:08

詹姆斯加盟湖人隊8年后，恐怕做夢也想不到自己會取得如此成就

詹姆斯加盟湖人隊8年后，恐怕做夢也想不到自己會取得如此成就

好火子

2026-05-05 22:57:56

阿森納悅神忘形力克馬競，全隊誓言三場英超拼下冠軍！精神致勝！

阿森納悅神忘形力克馬競，全隊誓言三場英超拼下冠軍！精神致勝！

英超德甲才瘋狂

2026-05-06 06:04:06

美國媒體民調顯示：除雷霆所在州，全美都希望詹姆斯帶湖人晉級！

美國媒體民調顯示：除雷霆所在州，全美都希望詹姆斯帶湖人晉級！

歷史第一人梅西

2026-05-05 17:09:52

中國選手吳宜澤奪冠，破紀錄獲693萬豪華獎金

中國選手吳宜澤奪冠，破紀錄獲693萬豪華獎金

余憁搞笑段子

2026-05-05 10:37:20

俄想截胡？烏總理急訪華游說：圖們江教訓慘痛，中國不能輕易點頭

俄想截胡？烏總理急訪華游說：圖們江教訓慘痛，中國不能輕易點頭

娛樂小可愛蛙

2026-05-05 21:19:02

隨著山東泰山4-1大勝上海申花，縱觀全場，談以下五點個人感受！

隨著山東泰山4-1大勝上海申花，縱觀全場，談以下五點個人感受！

田先生籃球

2026-05-05 22:42:56

后悔莫及，兩三百元維修費，換兩條人命！遼寧北鎮悲劇本可避免

后悔莫及，兩三百元維修費，換兩條人命！遼寧北鎮悲劇本可避免

一口娛樂

2026-05-04 12:30:11

AI產業主平臺領航智能+時代

15136文章數 66837關注度

往期回顧全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

媒體：中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

頭條要聞

媒體：中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

體育要聞

全世界都等著看他笑話，他帶國米拿下冠軍

娛樂要聞

內娛真情誼！楊紫為謝娜演唱會送花籃

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

教育

游戲

數碼

公開課

本地新聞

用青花瓷的方式，打開西溪濕地

教育要聞

親子陪跑是給孩子最好的人生馬拉松

全新類魂3A美女角色盔甲太性感！外媒銳評像劣質手游

數碼要聞

微星“MAG 276QRDY54”27英寸顯示器發售，6299元

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：日本免费一区二区三区激情视频| 99九九99九九视频精品| 一区二区三区精品| 五月丁香六月综合激情在线观看| 老肥熟女老女人野外免费区| 亚洲最大av无码网站| 久久人人做人人妻人人玩精| 久久人人爽爽人人爽人人片av| 亚洲天堂色图| 丰满老熟好大bbb| 欧美成人a在线网站| 祁阳县| 午夜精品福利影院| 国产色悠悠视频在线观看| 亚洲天堂中文| 人人操碰| 欧美日产国产精品日产| 精品国产免费一区二区三区| 久久99精品久久久久久噜噜| 丁香五月综合| 337p粉嫩大胆色噜噜噜| 中出极品日本女| 色婷婷天天综合在线| 激情综合五月| 老头把我添高潮了a片| jizz日本人妻| 亚洲s色大片在线观看 | 国产婷婷在线精品综合| 91免费国产在线观看尤物| 色欲综合一区二区三区| 久久精品一区| 久久综合精品国产一区二区三区无 | 国产极品精品自在线不卡| 免费在线观看尤物视频| 99久久ER热在这里只有精品99| 国产女人在线视频| 亚洲国产亚洲国产路线久久| 2025国产福利网站| 少妇做爰免费视频了| 国产麻花豆剧传媒精品mv在线| 综合偷自拍亚洲乱中文字幕|

<sub id="vd3dc"></sub>

<thead id="vd3dc"><i id="vd3dc"><noscript id="vd3dc"></noscript></i></thead><cite id="vd3dc"></cite>

<cite id="vd3dc"><rp id="vd3dc"><pre id="vd3dc"></pre></rp></cite>

<style id="vd3dc"></style>