<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      斷網解題,Claude Mythos推翻Erd?s 80年猜想!比OpenAI更短更漂亮

      0
      分享至


      新智元報道


      【新智元導讀】OpenAI用125頁思維鏈踹開Erd?s 80年猜想的門,Mythos如今找到了一條更短更優雅的路。最離譜的是,它拿到第一個可行解就停手了——面對名滿天下的開放問題,AI也會緊張。

      AI做數學這件事,速度已經徹底「失控」了!

      OpenAI前腳剛推翻了一個懸了80年的數學猜想,Anthropic后腳就亮出證明。同一周,DeepMind還一口氣啃下了9道同類難題。

      就在剛剛,Anthropic研究員Levent Alpoge在上甩出十條推文:

      OpenAI花了125頁才解開,他周末拿Mythos隨手一試。

      不僅分分鐘搞定,而且路徑還更短更簡潔!


      斷網隔離,Mythos開測

      這位Levent Alpoge來頭可不小。

      1992年出生,哈佛本科4.0滿分、劍橋Part III、普林斯頓博士(導師是菲爾茲獎得主Manjul Bhargava),2015年拿了Morgan Prize(美國本科生數學研究最高獎),哈佛Junior Fellow,并且解決了希爾伯特第十問題在所有數域上的推廣。

      2023年GPT-4發布,他立刻被擊中了。

      對我來說,它瞬間成了人類有史以來創造的最有趣的東西。回到CS!

      緊接著,他便加入了Anthropic。


      這周OpenAI破解Erd?s難題之后,Levent做了一件「顯而易見的事」——讓Mythos也試試。

      為了確保公平,測試條件很嚴格。

      多個Claude Code實例各自獨立工作,全程斷網,杜絕從OpenAI公開解法里「抄作業」的可能。


      結果,模型不止一次找到了和OpenAI類似的解法,但它更偏愛另一條完全不同但更加簡潔的路。

      更有意思的是,模型明明已經找到了一個能推翻猜想的方案,卻在第一個可行答案上就停了下來。

      明明往前再走一步,就能拿到更強的結果。但Mythos太緊張了!

      面對這道名滿天下的開放問題,它不敢相信自己的結論,保守地停在了第一個可行方案上。

      看到這,Levent直接樂了:「這種感覺,所有數學家都懂!」


      目前,Opus 4.7已完成了證明全文的整理排版:


      https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

      80年沒人贏過的賭注

      時間撥回1946年。

      匈牙利數學家Paul Erd?s提了一個聽起來極簡單的問題,在平面上撒n個點,最多能有多少對點之間的距離恰好是1?

      舉個例子,你在桌上擺100枚硬幣,每兩枚硬幣圓心之間如果剛好隔一個硬幣直徑,就算一對「單位距離」。100枚硬幣最多能湊出多少對?

      Erd?s自己給了一個答案:把點排成方格網格,經過適當縮放后,單位距離對的數量大約是n^(1+c/log log n)。

      也就是,100枚硬幣大概能湊出100多一丟丟對。

      然后他下了賭注,這就是極限了,沒人能做得更好。


      之所以這么自信,因為這里有個關鍵瓶頸——高斯整數Z[i]。

      Erd?s的方格網格依賴這個數系,而一個固定范數在Z[i]里能分解出多少種方式,取決于除數函數,上限大約是 exp(O(log n / log log n))。

      這就是那個「多出一丁點」的天花板。

      80年來,所有人都在這個框架里打轉。


      數論重武器,降維打擊幾何學

      對于人類數學家來說,代代相傳的直覺是「答案要在高斯整數Z[i]里找」。

      Mythos沒讀過這個傳統,一上來就把Z[i]換成了次數遠比2大的數域K的整數環O_K。

      聽起來像「用大炮打蚊子」,但就是這種跨學科的暴力,撬開了80年的僵局。


      方法是,先利用Golod-Shafarevich判則,在一個二次域上面搭一座無限高的「數域塔」K? ? K? ? K? ?……

      然后對每一層K_n取一個四次根擴張F_n = K_n(D^{1/4}),次數為d_n。

      這座塔之所以管用,靠的是一個關鍵性質:

      不管塔造多高,數域的「復雜度密度」始終有界,結構始終可控。一旦參數夠大,幾何計數就能啟動。


      接下來是整個證明的核心。

      在Erd?s的Z[i]里,單位群只有{±1, ±i}四個元素。能往外伸的「單位距離方向」就這么幾個,直接被除數函數死死卡住。

      但在高維數域里,單位群的秩隨維度增長,van der Corput定理直接把秩轉化成方向數。

      如此一來,4個方向就變成隨維度爆炸式增長。


      這段看不懂沒關系,記住一件事就行——

      Erd?s被困在一個只有4個出口的房間里,Mythos把墻拆了。


      接下來是具體的構造。

      首先,選一個實嵌入把這些數投射到平面上,就得到了點集P。

      然后,取一個單位向量平移這些點,新舊兩點之間的距離恰好是1。

      因為方向數增長極快,滿足條件的點對數量遠超Erd?s的上限。

      兩者相乘,就得到了多項式增益。


      更直覺地說:

      單位距離方向數增長為exp(Ω(d log log d)),而所有其他損耗全是exp(O(d))量級。d log log d碾壓d。

      Erd?s的猜想,就這樣被推翻了。

      整個論證沒有任何解析上的復雜性。和OpenAI那條125頁路徑相比,簡潔得多。


      用Levent自己的話說:

      高層來看,這本質上還是Erd?s原始構造加上一座類域塔。

      只不過這里做的是字面意義上最蠢的事——把大小不超過半徑一半的點加到大小不超過半徑一半的單位上。

      而它之所以管用,是因為類域塔的幾何計數增長實在太快了。


      一周三連,各自破城

      過去這一周的時間線,信息密度高到離譜。

      5月20日OpenAI官宣,一個未公開名稱的通用推理模型,自主反駁了Erd?s單位距離猜想。

      同一天,普林斯頓教授Will Sawin在arXiv貼出手工改進版,把指數從6×10?3?干到了0.014。103?倍的差距。

      Georgia Tech數學家Tom Trotter,Erd?s本人的合作者感慨道:「如果Erd?s還活著,他一定會激動到發瘋。」

      5月21日DeepMind上場,AlphaProof Nexus一口氣啃下9道Erd?s題,每道推理成本最多只需幾百美元。

      5月26日,Anthropic也宣布實現獨立證明,路徑比OpenAI的125頁短得多。

      三家路線完全不同,但結果都收斂到了同一個點。


      從笑話到《數學年刊》

      要知道,在七個月前AI做數學還是個笑話。

      2025年10月,OpenAI時任VP Kevin Weil在上宣稱GPT-5解決了10個Erd?s問題。

      看到推文后,負責維護erdosproblems.com的數學家Thomas Bloom當場回懟「嚴重歪曲事實」,模型只是檢索到了已知解法。Yann LeCun和Demis Hassabis都跟著嘲諷了一波。

      很快,Weil就刪了帖,并在四個月后離開了OpenAI。


      當時所有人的判斷都一樣:模型會做題,但不會做研究。

      轉眼到了今天。

      Bloom簽了驗證報告。Gowers寫下了「提交到《數學年刊》我會毫不猶豫推薦接受」的盛贊。Litt說這是「AI自主產出的第一個讓我覺得本身就有意思的結果」。

      甚至,Litt還在Nature的采訪中表示:「沒有人類能像LLM那樣吸收全部數學文獻。AI正在打破學科之間的壁壘。」


      三年前GPT-4還做不了本科數學題。

      如今,讓最偉大的數學家都感到絕望的Erd?s問題,卻正在變成AI的入學考試!

      打破80年僵局的,是一個不知道「這題應該怎么想」的模型。

      沒有包袱,反而能從代數數論里借來重武器去打一道幾何題。

      Erd?s留下了超過1000道未解題。這周又解了1道。

      參考資料:

      https://x.com/__alpoge__/status/2059298565093196012?s=20

      https://x.com/_sholtodouglas/status/2059303540150137244?s=20

      https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

      編輯:摩西

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      第二個惡魔醫生被抓,鄭大一附院王福建為94名患者植入不需要器械

      第二個惡魔醫生被抓,鄭大一附院王福建為94名患者植入不需要器械

      大魚簡科
      2026-02-18 22:03:00
      花生再次被關注!調查發現:糖尿病常吃花生不過半年或有4好處

      花生再次被關注!調查發現:糖尿病常吃花生不過半年或有4好處

      芹姐說生活
      2026-05-15 23:37:01
      備戰亞洲杯!邵佳一圈定國足名單,國安3將入選,海港申花成贏家

      備戰亞洲杯!邵佳一圈定國足名單,國安3將入選,海港申花成贏家

      體壇鑒春秋
      2026-05-27 17:43:52
      伊朗“最大內鬼”,原來是他?

      伊朗“最大內鬼”,原來是他?

      中國新聞周刊
      2026-05-22 21:03:52
      為了“掏空”老百姓的錢袋子,編造出來的四個謊言,誰信誰倒霉!

      為了“掏空”老百姓的錢袋子,編造出來的四個謊言,誰信誰倒霉!

      風信子的花
      2026-05-26 19:06:10
      航天員黎家盈年收入多少?回來后享受什么待遇?

      航天員黎家盈年收入多少?回來后享受什么待遇?

      混沌錄
      2026-05-26 22:05:52
      “男性相親避雷表”橫空出世!網友:百發百中,基本沒有猜錯的

      “男性相親避雷表”橫空出世!網友:百發百中,基本沒有猜錯的

      火山詩話
      2026-05-25 06:33:21
      湖南省省長毛偉明,暗訪煤礦和非煤礦山

      湖南省省長毛偉明,暗訪煤礦和非煤礦山

      新京報政事兒
      2026-05-27 21:40:02
      三個兒子賴在家啃老22年,夫婦一氣之下離家,12年后返鄉兩人傻住了

      三個兒子賴在家啃老22年,夫婦一氣之下離家,12年后返鄉兩人傻住了

      嘮叨情感屋
      2025-05-15 22:05:26
      教師行業倒查進入最嚴期,重點查處4類問題!

      教師行業倒查進入最嚴期,重點查處4類問題!

      細說職場
      2026-05-27 18:29:33
      B 費狂喜!曼聯砸 4300 萬鎖定卡里克首簽!甩烏加特十條街!

      B 費狂喜!曼聯砸 4300 萬鎖定卡里克首簽!甩烏加特十條街!

      瀾歸序
      2026-05-27 06:21:11
      蘋果官網宣布:5月28日,舊 iPhone 又調價了!

      蘋果官網宣布:5月28日,舊 iPhone 又調價了!

      搞機小帝
      2026-05-28 00:06:19
      沒想到,卷入草臺風波的張雪,因臺灣館長一句話賺足海峽兩岸口碑

      沒想到,卷入草臺風波的張雪,因臺灣館長一句話賺足海峽兩岸口碑

      阿傖說事
      2026-05-27 19:52:02
      鬧大了!杭州“白嫖女”被全網追殺,但說實話:她照樣嫁得出去

      鬧大了!杭州“白嫖女”被全網追殺,但說實話:她照樣嫁得出去

      李昕言溫度空間
      2026-05-27 22:03:19
      母親葬禮婆家全員缺席,丈夫掛我99通電話,我下令開除他家所有人

      母親葬禮婆家全員缺席,丈夫掛我99通電話,我下令開除他家所有人

      千秋文化
      2026-05-13 19:39:45
      炸學校殺學生,這條紅線烏克蘭踩得有多蠢?

      炸學校殺學生,這條紅線烏克蘭踩得有多蠢?

      漢唐光輝
      2026-05-28 00:08:49
      英超賽季場均上座榜:曼聯居首,西漢姆聯第二

      英超賽季場均上座榜:曼聯居首,西漢姆聯第二

      樂道足球C
      2026-05-27 16:33:57
      “晾了三天,終于臭了”!最近不少人連夜搶購,已賣爆

      “晾了三天,終于臭了”!最近不少人連夜搶購,已賣爆

      環球網資訊
      2026-05-27 09:33:10
      中方發布對菲66號公告,馬科斯明白中國動真格

      中方發布對菲66號公告,馬科斯明白中國動真格

      讓你大開眼界
      2026-05-26 21:13:14
      女子多次告知自己花生嚴重過敏 餐廳仍在菜中加入花生油 致女子出現嚴重過敏反應進搶救室 女子要求賠償1000元被質疑“敲詐勒索”

      女子多次告知自己花生嚴重過敏 餐廳仍在菜中加入花生油 致女子出現嚴重過敏反應進搶救室 女子要求賠償1000元被質疑“敲詐勒索”

      閃電新聞
      2026-05-26 18:43:15
      2026-05-28 02:55:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15321文章數 66892關注度
      往期回顧 全部

      科技要聞

      韜定律:全球在卷納米數 華為換了一把尺子

      頭條要聞

      特朗普:伊朗即使放棄高濃縮鈾也無法獲得解除制裁

      頭條要聞

      特朗普:伊朗即使放棄高濃縮鈾也無法獲得解除制裁

      體育要聞

      這群老阿姨,是最硬核的馬刺球迷

      娛樂要聞

      王鶴棣風波連累父親炸串店遭差評?

      財經要聞

      中國半導體的陽謀

      汽車要聞

      限時補貼價9.28-10.98萬 MG 4X正式上市

      態度原創

      健康
      本地
      游戲
      親子
      軍事航空

      打外泌體會比干細胞更安全嗎

      本地新聞

      用剪紙的方式,打開江蘇揚州

      IGN年度第三款滿分神作!豐富度不輸老頭環、塞爾達

      親子要聞

      韓國孩子4歲就要考英語幼兒園是家長停不下來的教育焦慮

      軍事要聞

      以軍稱已打死哈馬斯新任軍事領導人

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲日韩精品欧美一区二区| 无码人妻一区二区三区免费N鬼沢| www.欧美乱伦.con| 97人妻天天爽夜夜爽二区| 少妇又紧又色又爽又刺激视频| 国产欧美在线一区二区三区| 人妻少妇精品视频专区| 涩涩AV| 风间由美性色一区二区三区| 国产精品乱码一区二区三区| 久久综合色一综合色88欧美| 精品无码AV无码免费专区| 亚洲日韩中文字幕天堂不卡| 日韩精品久久无码中文字幕| 成人一区二区三区视频在线观看| 国产精品任我爽爆在线播放6080 | 五月婷婷俺也去开心| 欧美肥老太交视频免费| a色毛片免费视频| 日本三级网| 亚洲va久久久噜噜噜久久男同| 亚洲成av人片在www鸭子| 尤物一区| 精品熟人妻一区二区三区四区不卡| 国产永久免费高清在线观看视频| 2020国产精品香蕉在线观看| 免费的国产成人av网站装睡的| 欧美人做人爱a全程免费| 亚洲午夜福利| 国产资源在线视频| 精品99在线黑丝袜| 免费久久99精品国产自在现| 国产欧美日韩精品丝袜高跟鞋| 亚洲日韩av无码不卡一区二区三区| 亚洲欧美激情在线一区| 岛国av在线免费播放| 免费看片A级毛片免费看| 5060国产午夜无码专区| 99久久亚洲综合精品成人网| 欧美成 人版在线观看| 黑人玩弄人妻中文在线|