<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      頂級AI撞上低級烏龍:連寫幾十頁推導,結果發現題干錯了?

      0
      分享至


      新智元報道

      編輯:傾傾

      【新智元導讀】Google DeepMind再次血洗數學圈!700個地獄級難題被丟進Gemini的熔爐,結果讓數學家集體破防:這哪是證明,這分明是「邏輯拆遷」。DeepMind這一波不僅貼臉爆殺了OpenAI,還砸爛了人類所有的優越感。

      幾百美金的懸賞,跨越半個世紀的死局。

      20世紀最偉大的「題目魔術師」保羅·埃爾德什(PaulErd?s)生前留下了幾百個懸賞令,金額從50刀漲到5000刀。

      50年里,無數數學天才熬禿了頭,也沒能拿走一分錢。

      結果,Google DeepMind帶著名為Aletheia(真理女神)的怪獸進場了。

      上線僅7天,13道難題應聲而碎。


      論文鏈接:https://arxiv.org/abs/2601.22401

      但最扎心的真相是:AI并不是比你更聰明,它只是比你更懂「洗稿」。

      13/700的真相:AI真的在加速科學嗎?

      「AI攻克百年數學難題」看起來很像爽文標題,聽聽就行,別被帶了節奏。

      數學這行只看硬指標。DeepMind這次祭出的Aletheia,底色根本不是什么「天才數學家」,而是一個冷酷的「頂級邏輯洗煤廠」

      這套邏輯極其殘酷,帶著一股子硅谷大廠KPI導向的血腥味:


      初始的流量層里,裝著700個埃爾德什猜想。

      隨后,Gemini開啟Deep Think模式,像不要錢一樣大規模灌入算力,得出200個候選方案。

      然后,這200個候選人經過自然語言驗證器,剔除邏輯不通的部分,最后只剩下63個。

      最后,經過專家級別的數學推演,得到13個真正具有數學原創意義的答案。


      成功證明問題:Erd?s problem#1051

      700個問題里只解答出13個,轉化率還不到2%。

      其中,最具代表性的是對「Erd?s-1051」猜想中關于無理數分布的證明。

      聽著很牛X,但DeepMind自己也承認,剩下的68.5%都是學術垃圾。


      有些AI給出的證明過程長達幾百頁,讀起來像是東拼西湊的論文。

      在整個過程中,Aletheia像一個「自動審稿員」。Gemini負責狂暴輸出,而驗證器負責冷酷拒絕。


      Gemini DeepThink處理數學猜想具體過程:https://www.youtube.com/watch?v=Nmv4YxpbhU8

      更諷刺的是,人類數學家復核后發現,這13個所謂的「突破」,很大一部分屬于數學界的「低垂果實」——太繁瑣所以沒人想做。

      一位參與評審的組合數學專家曾私下感嘆:

      AI目前的強項不是創造,而是清掃。

      只要算力管夠,這種靠暴力邏輯搜集、整理、強行出結果的路徑,AI基本無敵。

      潛意識剽竊:AI數學家的「洗稿」藝術

      在這次DeepMind的成果展示中,出現了一個讓學術界集體炸鍋的新名詞:潛意識剽竊。

      簡單說,就是AI利用自己幾乎無限的硬盤,從某個犄角旮旯翻出一篇冷門論文,然后用現代的邏輯語言把它重新包裝了一遍。

      最典型的翻車現場是關于Erd?s-1089猜想的證明。


      當時Aletheia給出了一個極其精妙的推導,精妙到連幾個頂尖數學家都差點想給它頒獎。

      但隨后,有人在數據庫的深層挖掘中發現,這個所謂的「原創靈感」,與1981年一篇東歐冷門數學期刊上的論文高度重合。

      這就是AI作為一個「黑盒」最讓人絕望的本能。

      對AI來說,它并沒有原創和抄襲的概念。它只是在概率的指引下,把權重最高的Token組合在一起。

      AI記住了所有你忘了的東西。當它從千億級參數中提取出那個冷門關聯時,它自己都不知道是在致敬還是在白嫖。


      GoogleDeepMind-Aletheia項目詳情,在此頁面可以找到更多具體輸出案例:https://github.com/google-deepmind/superhuman

      只要喂的數據夠多,AI就能通過變換符號系統、調整推導步長,把一篇舊論文洗得像剛出爐的SCI。

      菲爾茲獎得主陶哲軒一語道破:

      AI并不是在做數學,它是在對人類過往的智慧進行大規模的歸納整合。

      細思極恐。如果連數學這種硬核真理領域,AI都能靠「洗稿」蒙混過關,那我們寫的行業報告、架構方案、市場分析,在它眼里算什么?

      大師也翻車:被詛咒的Erd?s-75號

      接下來這個「Erd?s-75號靈異事件」,暴露出AI的智商硬傷。


      這道題在數學圈臭名昭著,因為它被「詛咒」了。

      1995年,埃爾德什在寫下這個猜想時,犯了一個低級邏輯錯誤,這道題題干就是錯的,是個偽命題。

      魔幻的一幕發生了:Aletheia接手后,不僅沒發現題目有問題,反而憑借其狂暴的算力和自我博弈機制,硬生生地輸出了一份長達幾十頁、邏輯閉環的「完美證明」。

      這種「邏輯狂奔」暴露了當前AI的致命缺陷:

      首先,AI缺乏審美與常識。它只會在符號框架內找最優解,卻根本分不清這個框架本身是不是一張廢紙。


      其次,獎勵函數具有盲目性。AI的目標是讓驗證器閉嘴。只要推導過程符合規則,結論哪怕再荒謬,它也敢一路狂飆到底。

      最后發現Bug的,還得是那幫數學家。他們翻出1995年的手稿,一行行對完后得出結論:「這題出錯了,AI證的是個寂寞。」

      而這一點,恰恰是我們和AI競爭時的最后防線。AI能在幾毫秒內跑完幾千公里的邏輯馬拉松,但它不知道終點線是不是畫在懸崖外面。

      DeepMind貼臉開大:OpenAI的「數學公關戰」破產題

      前陣子,OpenAI靠著o1在數學AIME考試里刷屏,宣稱AI已經有了類似人類的「慢思考」能力。

      但在DeepMind看來,那頂多算是一場極其成功的文獻開盒。

      為了打臉OpenAI,Google專門在Aletheia的輸出分類里設立了一個很損的標簽:「已知文獻關聯」。

      它明擺著在諷刺OpenAI:你以為你解決了問題,其實你只是從訓練集里翻出了標準答案。

      而DeepMind表示,我不僅能證出來,我還能告訴你哪些是人類證過的、哪些是我洗稿洗出來的、哪些才是真正的原創。

      這場「數學公關戰」撕開了大廠競爭的遮羞布。

      OpenAI的數學能力很大程度上依賴于「題海戰術」,一旦遇到訓練集之外的真命題就容易抓瞎。

      而DeepMind走的是「AlphaGo路線」——自我博弈+形式化驗證(Lean),寧可轉化率只有2%,也要確保這13個成果是硬通貨。


      DeepMind官方技術文檔:Aletheia用于數學的自我對弈與形式化證明

      數學界的「掃地僧」陶哲軒一直關注著這場博弈。

      他在自己的他在博客里含蓄地表示:相比于追求「看起來正確」的概率模型,他更看好那種能生成「可由計算機驗證證明」的系統。

      這等于是給DeepMind站了臺。

      瓶頸位移:從「解題機器」到「審美法官」

      折騰了半天,這場13/700的戰役到底告訴了我們什么?

      是——數學發現的瓶頸,正在從「解題能力」位移到「價值判定」。

      這種范式轉移,預示了未來所有硬核從業者的兩種求生路徑:

      一種是從「操作員」變成「審美法官」。

      既然AI能以極低成本生成海量邏輯證明,人類的價值就不再是去復核每一個符號,而是運用直覺和審美,去判斷哪個方向才有真正的科學突破。

      另一種形態是邏輯審計員。

      面對潛意識剽竊和大師Bug,人類需要利用對歷史的精通,去甄別AI到底是真天才,還是個洗稿高手。

      AI能在幾毫秒內重走完人類幾千年的邏輯之路,但它依然讀不懂人類在深夜推演失敗時,那份撕掉草稿紙的無奈。

      邏輯可以代工,但靈魂和審美,AI暫時還沒學會怎么洗。

      參考資料:

      https://x.com/quocleix/status/2018402933193539735?s=20

      https://arxiv.org/abs/2601.22401


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一群專業演員愣演不過一個說相聲的《低智商犯罪》爛不是沒理由的

      一群專業演員愣演不過一個說相聲的《低智商犯罪》爛不是沒理由的

      金風說
      2026-05-05 17:40:33
      技術越牛,死得越快?一個蘇州新材料老板的深夜困惑

      技術越牛,死得越快?一個蘇州新材料老板的深夜困惑

      胡華成
      2026-04-05 18:18:14
      大快人心!白洋淀五一徹底涼涼,靠宰客斂財的景區終于迎來了報應

      大快人心!白洋淀五一徹底涼涼,靠宰客斂財的景區終于迎來了報應

      社會日日鮮
      2026-05-05 20:11:56
      2026倫敦世乒賽奪冠熱門出爐!法國隊概率居首 國乒沖12連冠遇勁敵

      2026倫敦世乒賽奪冠熱門出爐!法國隊概率居首 國乒沖12連冠遇勁敵

      kio魚
      2026-05-06 06:00:33
      西安65歲以上老人可輕松辦理優待證,全市36個便捷服務點提供免費乘車!

      西安65歲以上老人可輕松辦理優待證,全市36個便捷服務點提供免費乘車!

      好笑娛樂君每一天
      2026-05-06 02:03:22
      男子和妻子的弟媳纏綿,怕妻子聽到聲音,2017年弟媳竟被他捂死了

      男子和妻子的弟媳纏綿,怕妻子聽到聲音,2017年弟媳竟被他捂死了

      漢史趣聞
      2026-05-05 11:36:31
      奧布拉克:我們本該做得更好,現在必須抬起頭去想下一次機會

      奧布拉克:我們本該做得更好,現在必須抬起頭去想下一次機會

      懂球帝
      2026-05-06 05:55:07
      警告三次不如動真格一次!中國下達逐客令,巴拿馬反應出乎意料

      警告三次不如動真格一次!中國下達逐客令,巴拿馬反應出乎意料

      黑哥講現代史
      2026-05-04 23:15:22
      高市在澳洲雙膝跪地,在亞洲只遞刀子:這一跪,把日本老底跪穿了

      高市在澳洲雙膝跪地,在亞洲只遞刀子:這一跪,把日本老底跪穿了

      騷年先鋒
      2026-05-06 05:22:03
      特斯拉 Model Y 將大改款?網傳有 5 項升級,每個都是車主想要的!

      特斯拉 Model Y 將大改款?網傳有 5 項升級,每個都是車主想要的!

      新浪財經
      2026-05-04 22:51:52
      游客在三門峽一動物園找到“兩塊錢的快樂”?園方回應:門票2元屬實,20多年未漲價,基本無其他收費項目

      游客在三門峽一動物園找到“兩塊錢的快樂”?園方回應:門票2元屬實,20多年未漲價,基本無其他收費項目

      極目新聞
      2026-05-03 14:52:34
      吳宜澤18-17絕殺墨菲!首奪世錦賽冠軍 獎金462萬 排名升世界第4

      吳宜澤18-17絕殺墨菲!首奪世錦賽冠軍 獎金462萬 排名升世界第4

      侃球熊弟
      2026-05-05 05:36:18
      晚年毛主席向唐聞生秘密托付:我死后聽周總理的!讓基辛格驚嘆能當總統的她到底憑啥?

      晚年毛主席向唐聞生秘密托付:我死后聽周總理的!讓基辛格驚嘆能當總統的她到底憑啥?

      歷史回憶室
      2026-05-05 18:11:08
      詹姆斯加盟湖人隊8年后,恐怕做夢也想不到自己會取得如此成就

      詹姆斯加盟湖人隊8年后,恐怕做夢也想不到自己會取得如此成就

      好火子
      2026-05-05 22:57:56
      阿森納悅神忘形力克馬競,全隊誓言三場英超拼下冠軍!精神致勝!

      阿森納悅神忘形力克馬競,全隊誓言三場英超拼下冠軍!精神致勝!

      英超德甲才瘋狂
      2026-05-06 06:04:06
      美國媒體民調顯示:除雷霆所在州,全美都希望詹姆斯帶湖人晉級!

      美國媒體民調顯示:除雷霆所在州,全美都希望詹姆斯帶湖人晉級!

      歷史第一人梅西
      2026-05-05 17:09:52
      中國選手吳宜澤奪冠,破紀錄獲693萬豪華獎金

      中國選手吳宜澤奪冠,破紀錄獲693萬豪華獎金

      余憁搞笑段子
      2026-05-05 10:37:20
      俄想截胡?烏總理急訪華游說:圖們江教訓慘痛,中國不能輕易點頭

      俄想截胡?烏總理急訪華游說:圖們江教訓慘痛,中國不能輕易點頭

      娛樂小可愛蛙
      2026-05-05 21:19:02
      隨著山東泰山4-1大勝上海申花,縱觀全場,談以下五點個人感受!

      隨著山東泰山4-1大勝上海申花,縱觀全場,談以下五點個人感受!

      田先生籃球
      2026-05-05 22:42:56
      后悔莫及,兩三百元維修費,換兩條人命!遼寧北鎮悲劇本可避免

      后悔莫及,兩三百元維修費,換兩條人命!遼寧北鎮悲劇本可避免

      一口娛樂
      2026-05-04 12:30:11
      2026-05-06 06:35:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15136文章數 66837關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      本地
      教育
      游戲
      數碼
      公開課

      本地新聞

      用青花瓷的方式,打開西溪濕地

      教育要聞

      親子陪跑是給孩子最好的人生馬拉松

      全新類魂3A美女角色盔甲太性感!外媒銳評像劣質手游

      數碼要聞

      微星“MAG 276QRDY54”27英寸顯示器發售,6299元

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本免费一区二区三区激情视频| 99九九99九九视频精品| 一区二区三区精品| 五月丁香六月综合激情在线观看| 老肥熟女老女人野外免费区| 亚洲最大av无码网站| 久久人人做人人妻人人玩精| 久久人人爽爽人人爽人人片av| 亚洲天堂色图| 丰满老熟好大bbb| 欧美成人a在线网站| 祁阳县| 午夜精品福利影院| 国产色悠悠视频在线观看| 亚洲天堂中文| 人人操碰| 欧美日产国产精品日产| 精品国产免费一区二区三区| 久久99精品久久久久久噜噜| 丁香五月综合| 337p粉嫩大胆色噜噜噜| 中出极品日本女| 色婷婷天天综合在线| 激情综合五月| 老头把我添高潮了a片| jizz日本人妻| 亚洲s色大片在线观看 | 国产婷婷在线精品综合| 91免费国产在线观看尤物| 色欲综合一区二区三区| 久久精品一区| 久久综合精品国产一区二区三区无 | 国产极品精品自在线不卡| 免费在线观看尤物视频| 99久久ER热在这里只有精品99| 国产女人在线视频| 亚洲国产亚洲国产路线久久| 2025国产福利网站| 少妇做爰免费视频了| 国产麻花豆剧传媒精品mv在线| 综合偷自拍亚洲乱中文字幕|