<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      留給人類數(shù)學(xué)家的懸賞不多了!谷歌DeepMind解決9道埃爾德什問題

      0
      分享至

      聞樂 發(fā)自 凹非寺
      量子位 | 公眾號 QbitAI

      AI進軍數(shù)學(xué)界的速度太快了。

      OpenAI前腳剛用內(nèi)部模型突破埃爾德什的80年單位距離問題,谷歌DeepMind后腳就解決一個同樣卡了人類56年的埃爾德什數(shù)學(xué)難題——

      最新發(fā)布AlphaProof Nexus,一套由Gemini驅(qū)動的智能體框架,一出手就是9個埃爾德什開放問題



      除了這9道,它還順手證明了OEIS整數(shù)序列百科里的44個猜想、搞定了一道擱置15年的代數(shù)幾何難題、還改進了凸優(yōu)化領(lǐng)域里一個沿用已久的理論邊界。

      推理成本呢?每道題幾百美元,整套證明代碼也全都開源放在了GitHub上。



      這篇論文共有20位作者,其中的Aja Huang,也是2016年AlphaGo的核心研究員。

      56年沒人做出來的題,AI 給了什么答案

      AlphaProof Nexus解決的這幾道題,咱挑三道最有意思的說說。

      Erd?s#12,1970年提出,懸置56年

      這道題問的是:你能不能找出一個無限大的整數(shù)集合,滿足兩個聽起來很別扭的條件:

      第一,任意從中挑三個不同的數(shù)字a、b、c,a永遠不能整除b加c的和。

      第二,這組數(shù)不能太零散,在自然數(shù)里要保持一定的密度。

      簡單理解就是,這群數(shù)字之間,既不能一個數(shù)整除另一個數(shù),也不能一個數(shù)整除另外兩個數(shù)的和,同時數(shù)字還要分布得相對密集,不能只挑寥寥幾個數(shù)投機取巧。

      從1970年開始,就沒人能給出這個集合的完整構(gòu)造,各種局部進展有,但始終拼不成一個整體解。



      AI的解法是用中國剩余定理把大問題拆成許多個獨立的區(qū)塊,每個區(qū)塊內(nèi)部用三項等差數(shù)列的回避集來滿足約束,然后把所有區(qū)塊拼回一個完整的無限集。



      Erd?s#125,1996年提出,30年沒有定論

      這道題聽著就更奇怪了。

      想象兩個數(shù)字集合:第一個集合里全是“在三進制下只由數(shù)字0和1組成的整數(shù)”,第二個集合里全是“在四進制下只由數(shù)字0和1組成的整數(shù)”。把這兩個集合里所有數(shù)字兩兩相加,得到一個新集合。

      問:這個新集合里的數(shù)字在自然數(shù)中出現(xiàn)的頻率(數(shù)學(xué)上叫下密度)是不是正的?

      直覺上你可能會覺得,兩種集合包含的數(shù)字本來就不算很多,加起來應(yīng)該也挺稀疏的。

      但稀疏到什么程度?是徹底稀到密度歸零,還是多少保持一點正密度?

      這中間的差別非常微妙,1996年提出后一直沒定論。

      AI的答案是:密度為零。



      證明思路是log?除以log?是無理數(shù)。這意味著3的冪次和4的冪次可以以任意精度彼此逼近。

      利用這一點,AI構(gòu)造了一個歸納性稀疏化論證:不斷找到兩個幾乎對齊的尺度,讓密度以0.99的比率一步步衰減,直到徹底歸零。

      一個純數(shù)論的性質(zhì),解決了一個組合幾何的問題。

      Erd?s#846,1992年提出,卡了人類34年。

      這是個平面幾何題,AI證明了存在這樣一個無限擴展的平面點集:

      你從中任意挑出有限個點,總能發(fā)現(xiàn)其中大部分點是不共線的——

      隨便截一段,看起來都挺正常,但當(dāng)你試圖把這個無限集合拆分成有限個“絕對沒有任何三點共線”的子集時,辦不到。

      一個集合的每個有限局部都正常,但整體頑固得不可拆分。這種全局與局部的張力,是組合幾何里最難的那一類問題。

      AI把完全圖的每條邊映射到平面上一個點,用二次多項式編碼坐標(biāo),再拉上無窮Ramsey定理完成證明,把一個幾何問題翻譯成了圖論和邏輯的語言。

      除了這三道,還有六道分別在整除集構(gòu)造、范德瓦爾登數(shù)間隙、西頓集孤立點、集合拆分密度等領(lǐng)域。



      同時,AlphaProof Nexus還在OEIS整數(shù)序列百科里證明了44個開放猜想,在代數(shù)幾何那邊解決了一道希爾伯特函數(shù)對數(shù)凹性的15年懸案,凸優(yōu)化那邊改進了一個錨定梯度下降法的理論邊界。



      菲爾茲獎得主陶哲軒曾經(jīng)提醒過,AI目前解決埃爾德什問題的實際成功率大約在1-2%,這次谷歌的系統(tǒng)挑戰(zhàn)了353道題,解開9道,比例剛好對上了。

      用幾百美元算力換一道56年難題

      AlphaProof Nexus的架構(gòu)核心用一句話就能說清楚,Gemini 3.1 Pro生成Lean語言證明步驟→Lean編譯器逐行檢查→報錯直接反饋給模型→模型根據(jù)報錯修改→再檢查→循環(huán)到全部通過。



      好家伙,這有點像平時寫代碼,只不過現(xiàn)在Debug的是數(shù)學(xué)定理……



      在這套框架里,DeepMind設(shè)計了四個Agent

      最簡單的Agent A是同時啟動多個獨立子Agent,先靠Gemini 3.1 Pro梳理解題思路,動手編寫證明代碼。

      寫完立刻交給編譯器核驗,一旦報錯,錯誤信息就會傳回模型,讓它不斷修改、重試,直到通關(guān)。

      全程沒有額外輔助工具,純靠寫代碼+查錯循環(huán)。



      Agent B多了一樣?xùn)|西,AlphaProof。

      AlphaProof是DeepMind之前專門為奧數(shù)級別題目訓(xùn)練過的強化學(xué)習(xí)證明工具。

      當(dāng)Agent A模式在某個小步驟上反復(fù)卡住、編譯器反復(fù)報錯也修不過來時,Agent B可以調(diào)用AlphaProof做一次強化學(xué)習(xí)驅(qū)動的樹搜索,專門攻擊這個局部難點。

      Agent C引入了進化算法的思路。

      前面兩種Agent的子Agent都是各自獨立工作的,互不交流。

      Agent C是所有子Agent共享一個證明草圖種群,每一個子模塊都會產(chǎn)出不同的證明草稿。

      然后由另一個模型從合理性、清晰度、新穎性三個維度給每一份草稿打分,用Elo評分系統(tǒng)排名。

      高分草稿會相互組合,衍生出新解法,低分草稿直接淘汰,整個種群在證明空間里做進化搜索。

      Agent D是全功能完全體,進化篩選思路+專項工具攻克難點+大模型邏輯推理,三股力量在一個框架里協(xié)同,也是這次批量破解難題的主力。



      這么看下來,我以為最強的Agent D應(yīng)該會碾壓一切,Agent A只當(dāng)個對照組。

      結(jié)果沒想到論文里表明最簡單的Agent A,同樣能解出全部9道題

      沒有進化算法,沒有AlphaProof,就一個LLM循環(huán)加編譯器反饋的Agent A,只是在難題上更費錢一點。



      研究團隊把原因歸為兩個:

      • 一是Gemini 3.1 Pro本身的能力已經(jīng)足夠強了;
      • 二是Lean編譯器的那層實打?qū)嵉募m錯反饋,對AI的引導(dǎo)作用,遠比人們預(yù)想的更大。

      這個結(jié)果或許也在預(yù)示著,未來隨著大模型能力持續(xù)升級,復(fù)雜的多工具組合系統(tǒng),可能不再是剛需,只用大模型+專業(yè)校驗工具這套簡單循環(huán),就能搞定大多數(shù)數(shù)學(xué)難題。

      而且這套方案的優(yōu)勢也體現(xiàn)在成本上,單題僅需幾百美元。

      埃爾德什生前為這些難題設(shè)置了懸賞,只是他不會想到——

      解開這些謎題的可能不是人類智慧,而是算力。

      論文地址:https://arxiv.org/abs/2605.22763v1
      Github地址:https://github.com/google-deepmind/alphaproof-nexus-results


      [1]https://x.com/pushmeet/status/2058936037754224998
      [2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

      — 完 —

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      為隊友發(fā)聲!米切爾:很多人都是唯冠軍論,卻忽略了哈登的偉大

      為隊友發(fā)聲!米切爾:很多人都是唯冠軍論,卻忽略了哈登的偉大

      懂球帝
      2026-05-26 15:01:09
      騰訊「企鵝島」已入駐1.4萬人,員工可享2000元檔公寓租金

      騰訊「企鵝島」已入駐1.4萬人,員工可享2000元檔公寓租金

      鞭牛士
      2026-05-26 10:45:22
      一人毀掉整部劇?央視劇《主角》唯一敗筆,觀眾:看他演戲真別扭

      一人毀掉整部劇?央視劇《主角》唯一敗筆,觀眾:看他演戲真別扭

      老黯談娛
      2026-05-26 12:47:27
      黃仁勛夜市搶食!湊過去問美女烤玉米好不好吃:沒曾想上口就咬

      黃仁勛夜市搶食!湊過去問美女烤玉米好不好吃:沒曾想上口就咬

      快科技
      2026-05-25 19:05:22
      "韜定律"能替代摩爾定律嗎?華為給出了自己的答案

      "韜定律"能替代摩爾定律嗎?華為給出了自己的答案

      別打我我投降
      2026-05-25 16:16:21
      家住深圳65樓,已經(jīng)崩潰了,日子沒法過了!

      家住深圳65樓,已經(jīng)崩潰了,日子沒法過了!

      科學(xué)發(fā)掘
      2026-05-26 12:24:47
      為什么老顧客突然就不來了?網(wǎng)友:消費299元,不肯送我一個餅

      為什么老顧客突然就不來了?網(wǎng)友:消費299元,不肯送我一個餅

      據(jù)說說娛樂
      2026-05-26 10:46:59
      比雷霆還慘!一年選中2個分區(qū)決賽MVP,結(jié)果都送人了,史上最坑GM

      比雷霆還慘!一年選中2個分區(qū)決賽MVP,結(jié)果都送人了,史上最坑GM

      你的籃球頻道
      2026-05-26 13:33:25
      彼得雷烏斯戳破真相:烏克蘭早已打醒世界,美國卻還在裝睡

      彼得雷烏斯戳破真相:烏克蘭早已打醒世界,美國卻還在裝睡

      老馬拉車莫少裝
      2026-05-24 22:40:10
      一枚紐扣,挖出潛伏在總參大院十年的國民黨王牌特工

      一枚紐扣,挖出潛伏在總參大院十年的國民黨王牌特工

      老范談史
      2026-05-08 02:36:29
      中國“撿錢”時代或?qū)砼R:如果手中只有10萬,試試死啃這兩條線

      中國“撿錢”時代或?qū)砼R:如果手中只有10萬,試試死啃這兩條線

      美食格物
      2026-05-13 14:03:12
      俄烏最新:烏克蘭今年反攻收復(fù)近600平方公里失地!

      俄烏最新:烏克蘭今年反攻收復(fù)近600平方公里失地!

      項鵬飛
      2026-05-23 21:34:03
      開始離譜了!燕郊板塊房價從4萬變6千,業(yè)主集體斷供

      開始離譜了!燕郊板塊房價從4萬變6千,業(yè)主集體斷供

      專業(yè)聊房君
      2026-05-25 07:28:59
      哇塞!八塊腹肌的楊瀚森!

      哇塞!八塊腹肌的楊瀚森!

      柚子說球
      2026-05-25 23:00:33
      伊朗宣布:擊落

      伊朗宣布:擊落

      環(huán)球時報國際
      2026-05-25 23:33:26
      俄方突然下令:猛攻基輔在即,全體撤離!烏克蘭外長怒斥“訛詐”

      俄方突然下令:猛攻基輔在即,全體撤離!烏克蘭外長怒斥“訛詐”

      菁菁子衿
      2026-05-26 13:19:24
      在外打工半年,回家掀開老婆衣服,看清她肚子后我砸了杯子

      在外打工半年,回家掀開老婆衣服,看清她肚子后我砸了杯子

      木子言故事
      2026-05-21 11:31:57
      廣州下場收二手房:環(huán)城高速內(nèi),300萬以下,不限樓齡!

      廣州下場收二手房:環(huán)城高速內(nèi),300萬以下,不限樓齡!

      廣州PLUS
      2026-05-26 11:20:40
      看了耿同學(xué)的打假 我去查了自然期刊的撤稿數(shù) 各國對比

      看了耿同學(xué)的打假 我去查了自然期刊的撤稿數(shù) 各國對比

      慕容律師
      2026-05-25 11:56:06
      “新型啃老”已來臨,985畢業(yè)生家里蹲,家長:不工作也不結(jié)婚

      “新型啃老”已來臨,985畢業(yè)生家里蹲,家長:不工作也不結(jié)婚

      戶外阿毽
      2026-05-25 15:03:21
      2026-05-26 17:48:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      12689文章數(shù) 176470關(guān)注度
      往期回顧 全部

      科技要聞

      中國AI要向外卷,而不只是做第二個OpenAI

      頭條要聞

      25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

      頭條要聞

      25歲海歸男戀上32歲離異女 因88.8萬彩禮鬧掰追討12萬

      體育要聞

      上賽季差點降入英甲,下賽季要踢英超了

      娛樂要聞

      臺媒貼臉!S媽被問大S嗑藥當(dāng)場沉默

      財經(jīng)要聞

      中國鋁行業(yè)爆單 下一個“煤炭”大周期?

      汽車要聞

      涉水加強 福特烈馬亞馬遜限量版上市 售價39.98萬

      態(tài)度原創(chuàng)

      時尚
      教育
      旅游
      房產(chǎn)
      軍事航空

      全網(wǎng)刷屏,華語樂壇“嫡長女”終于來了!

      教育要聞

      新高考專業(yè)學(xué)校到底哪個更重要

      旅游要聞

      質(zhì)感心旅行 | SLH持續(xù)拓展全球酒店網(wǎng)絡(luò),深化中國市場本土化布局

      房產(chǎn)要聞

      招商地產(chǎn)接盤碧桂園!海口這個爛尾豪宅,要徹底改命?

      軍事要聞

      美伊在阿巴斯港附近短暫交火 交戰(zhàn)過程披露

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产成人精品日本亚洲直接| 国产精品福利自产拍在线观看| 在线中文字幕国产精品| 国内视频自拍| 亚洲啊啊啊一区二区三区| 午夜国产一区二区三区精品不卡| 亚洲国产中文字幕在线视频综合| 日韩一区二区在线观看的| 亚洲综合av一区二区| 国产精品久久久久久久9999| 亚洲熟女av一区激情| 97人人做人人爽香蕉精品| 青青草国产精品日韩欧美| 日本一区二区三区免费播放视频站| 亚洲一区自拍| 精品自拍视频| 爆乳熟妇一区二区三区| 亚洲AV日韩AV永久无码下载| 中字幕视频在线永久在线观看免费 | 亚洲综合在线另类色区奇米| 亚洲国产美女精品久久久| 国产成人久久av免费高潮| 精品人妻少妇嫩草AV无码专区| 国产精品欧美亚洲韩国日本久久| 久久久精品人妻一区二区三区日本| 精品亚洲一区二区视频| 国产在线高清一级毛片| 亚洲日本精品国产第一区| 亚洲免费v片| 玩弄少妇人妻中文字幕| 日本熟妇浓毛| 日韩成人综合| 少妇AV| 国产真实乱人视频| 日韩精品成人区中文字幕| 亚洲精品97久久中文| 本免费Av无码专区一区| 日本道专区无码中文字幕| 无码A级| 湾仔区| 精品人妻一区二区三区蜜桃AⅤ|