<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      多位數學家談AI在數學領域的影響:數學的AI拐點已出現

      0
      分享至


      來源:ScienceAl

      編輯coisini

      數學是一門推理嚴謹、邏輯縝密的學科,這與人工智能(AI)的「黑箱」特性看似背道而馳。然而,這一印象在 2025 年被徹底顛覆。

      近日,發表于《Quanta Magazine》的一篇報道,歸納總結了多位數學家對 AI 在數學領域影響的觀察與思考。ScienceAI 對《Quanta Magazine》報道核心內容進行了不改變原意的編譯、整理,內容如下。

      2025 年 7 月,多個人工智能模型在國際數學奧林匹克競賽中解決了六道題中的五道。數學家們感到震驚 —— 難以預料到 AI 程序能這么快變得如此強大,但這些結果并不一定意味著 AI 將在數學研究領域取得重大突破。畢竟,奧賽題目只是已知答案的難題,而非未解之謎。

      但轉折點已經出現。

      那些曾認為 AI 模型錯誤百出、難堪大用的數學家們開始嘗試將其納入研究工具。他們驚訝地發現 AI 不僅擅長解謎題,還能幫助開辟真正的新領域。很快,數學家們開始利用 AI 發現并證明新的結果,一天之內就能完成過去需要數周甚至數月的工作。

      「2025 年是 AI 真正開始在許多不同任務上發揮作用的一年」,著名數學家陶哲軒表示。

      雖然沒有任何單一成果能稱霸世界,但其中一些已經達到專業數學期刊發表成果的水平。在某些情況下,算法能在極少人工干預下提出猜想、證明它并驗證證明過程。此外,與 ChatGPT、Claude 或 Gemini 等大型語言模型的廣泛對話催生了全新的證明策略。

      「這個人有鏟子,那個人有鎬頭。我們一起就能挖通隧道,很多嘗試就像『往墻上扔東西,看哪個能粘住』」,陶哲軒這樣比喻。

      多倫多大學數學教授 Daniel Litt 表示,即使是解決簡單問題,AI「也在改變數學的研究方式」。

      陶哲軒認為:數學的研究方式很快就會發生巨大變化。過去數學家一次研究一個問題,「有了這些工具,你可以一次解決成千上萬的問題,并開始進行統計研究,我們將不得不進行許多范式上的變革、文化上的變革」,陶哲軒說道。

      這些變革必然會面臨爭議,數學界與其他正在努力應對 AI 影響的學科一樣。普林斯頓高等研究院教授、菲爾茲獎得主 Akshay Venkatesh 表示,隨著 AI 模型成為強大的新工具,它們可能會導致數學家失去對數學理解的直接體驗。與陶哲軒一樣,Venkatesh 也認為 AI 的影響將是巨大的,但他更為謹慎:「我們(數學)文化中有一些寶貴的東西應該努力保留。」

      一些數學家現在正離開學術界,前往 OpenAI、谷歌等大型科技公司工作,或加入專注于數學的 AI 初創公司,如 Harmonic、Logical Intelligence、Axiom Math 和 Math Inc。

      「企業界對 AI 在數學領域如此感興趣的一個原因是,人們認識到通用智能的關鍵在于結合從機器學習中獲得的洞察與從數學中獲得的精確性」,卡內基梅隆大學數學輔助推理研究所所長 Jeremy Avigad 說。

      到 2026 年年初,對 AI 能力的震驚已轉變為某種近乎驚嘆的情緒。2 月份一項名為「First Proof」的挑戰賽讓參賽者在一周內用他們的 AI 模型解決數學各領域的 10 個研究級問題。數學家們特意選擇了那些不太可能出現在算法訓練數據中的問題。在不同程度的自主性下,這些模型成功解決了超過一半的問題。如果說奧賽結果代表了 AI 進入雄心勃勃的大學數學項目的時刻,那么 First Proof 的結果可以說標志著它們完成了研究生學業。在一篇分析 First Proof 挑戰賽結果的文章中,Litt 寫道:「這項技術很可能比計算機本身更重大。」

      創造性進化

      2025 年夏天是 AI 能力的一個拐點,而這并非憑空而來。谷歌 DeepMind 科學副總裁 Pushmeet Kohli 表示,DeepMind 自 2018 年以來一直在嘗試用 AI 解決數學問題。現任職于 Axiom 的 Fran?ois Charton 早在 2019 年就開始嘗試利用機器學習解決數學問題。

      但在最初幾年,這只是一個冷門領域。起初,Charton 和其他少數人使用 AI 解決已知答案的問題,只是為了看看新技術能否奏效。到 2024 年,他們開始取得進展。他們尋找有豐富數據可供分析的問題,然后用 AI 構建具有可量化屬性的數學對象 —— 例如在網格上放置點以避免形成等腰三角形的最佳排列方式。



      2025 年 1 月,陶哲軒和布朗大學的 Javier Gómez-Serrano 開始與 DeepMind 的兩位數學家 Adam Wagner 和 Bogdan Georgiev 合作開發一個名為 AlphaEvolve 的 AI 系統。AlphaEvolve 的工作原理是使用 Gemini 編寫可能長達數百行的 Python 代碼程序,然后利用所謂遺傳算法「進化」這些程序,以尋找數學問題的最優解。四位數學家每隔一兩天就用 AlphaEvolve 研究一個新問題,持續了幾個月。

      在這個過程中,他們也學會了如何改進給 AlphaEvolve 的提示。一個關鍵發現:模型似乎能從鼓勵中受益 —— 比如「你能做到」。

      到 5 月底,該團隊已在數學多個領域的 67 個不同問題上測試了 AlphaEvolve。在其中 23 個問題上,AlphaEvolve 對已知最優解做出了小幅改進。在 67 個問題中的 36 個上,它的表現與已有成果相當;而在其余少數問題上,它未能匹配已知最優結果。

      數學家們在 2025 年 11 月的一篇論文《大規模數學探索與發現》中分享了他們的發現。Gómez-Serrano 指出,他們的任何一個成果,如果由某個領域的專家投入數月時間,或許也能獲得。但他們并非領域專家,卻能在短短一兩天內得到相當的結果。

      正如陶哲軒所說,當前的 AI 模型「非常擅長在大規模問題列表中尋找『容易摘取的成果』」。這些工作繁瑣、吃力不討好,人類研究者并不愿意做。他還提醒說,模型們正在「大量未報告的失敗之海中取得零散的成功」,而這些成功值得關注。

      Gómez-Serrano 估計,他現在大約三分之二的時間都在使用 AI。他說:「(AI)正變得有用且可用。這是我們未來進行數學研究的新方式的開始。」

      錯漏百出

      前幾年,AI 的額外能力似乎源于它能夠重新挖掘埋藏在晦澀參考文獻中、早已被遺忘的證明。加州大學洛杉磯分校的 Igor Pak 曾指出,ChatGPT 目前「在查找參考文獻、學術相關性等方面表現出色」。

      然后,在 2025 年,蘇黎世聯邦理工學院的 Johannes Schmitt 表示,情況發生了變化,他說:「與 LLM 對話開始變得有用,不是因為它們會給你完整的答案,而是因為它們成了很好的對話伙伴。」

      Schmitt 指出,AI 模型的有趣之處在于:一個受過任何數學訓練的人,幾乎不可能在犯下如此多基本錯誤的同時,還能提出精妙、原創且正確的想法。

      加州大學洛杉磯分校的 Ernest Ryu 主要研究應用數學的一個分支 —— 優化理論。他在奧賽結果之后也更加關注 LLM,并開始用它們幫助準備講義。他說:「有時 AI 模型會發現我推理中的一個錯誤,可能是重大的,可能是微小的。有時它甚至會找到一個比我講義中更簡單的證明。」

      他有一種感覺,AI 模型正在「展現出生命的跡象」。他記得自己當時既懷疑又樂觀。為了親自判斷 LLM 能做什么、不能做什么,他決定做一個實驗。

      他開始著手解決優化理論中一個未解決的問題,這個問題他過去曾嘗試過幾次。這一次,他使用了 ChatGPT。

      Ryu 研究的問題最早于 1983 年由一位名叫 Yurii Nesterov 的俄羅斯數學家提出。Nesterov 試圖尋找那些以多變量為輸入、輸出單個數值且以特定數學方式表現「良好」的函數的最小值。如果把輸出想象成一幅高程地圖,你要證明最終會收斂到最低點。

      這類問題在應用數學中相當常見,尤其是在機器學習中,它是訓練神經網絡的核心。一種廣泛使用的技術叫做梯度下降法,假設你從地圖上的某一點開始,它使用微積分的基本工具來判斷哪個方向是下坡,以及你所站位置的山坡有多陡。每次都沿著最陡的方向向下走一步,你最終會到達最低點。

      盡管梯度下降法能讓你得到正確答案,但有時它到達答案的速度非常慢。因此,數學家們長期以來一直在尋找能更快收斂到正確答案的變體。Nesterov 開發了一種技術,其中每一步下坡的大小不僅取決于函數在給定點的陡峭程度,還取決于你到達該點所經過的路徑。如果你過去邁的步子更大,你就會繼續保持大步幅。

      直觀上看,這種方法似乎能讓你更快到達山底。但如果速度太快沖過頭了呢?你可能會面臨在真正最小值附近無限振蕩、永遠無法達到的風險。Nesterov 無法證明他的算法最終會收斂到最優值。42 年來,也沒有其他人能做到。

      Ryu 說當他詢問 ChatGPT 時,它一直給出錯誤的證明,但過程中有一些有趣的步驟、一些正確且似乎可能有用的部分結果。隨著模型逐步推進,Ryu 開始檢查它的答案,保留正確的部分,并通過新的提示將其反饋給模型。

      Ryu 說:「我不得不扮演驗證者的角色,使用 ChatGPT 時,我感覺自己覆蓋了非常多的內容,速度比我獨自完成要快得多。這就是讓我堅持下去的原因。」

      在大約 12 個小時的工作之后,他得出了該問題一個簡化版本的證明。又過了幾天,他終于證明了 Nesterov 的方法是收斂的。Ryu 說:「這是一個可以在頂級優化期刊上發表的成果(不考慮 AI 輔助成分)。」

      幾個月后,Ryu 從加州大學洛杉磯分校請假,前往 OpenAI 工作。他認為我們終將得到真正令人印象深刻、由 AI 輔助的重大發現。

      應用案例

      2025 年 9 月,來自世界各地的 100 多名數學家聚集在布朗大學,參加一個關于代數組合學的特別項目。

      出于不同的原因,他們都有興趣計算一個叫做 d-invariant 的量,這個量出現在數學的許多領域。要理解 d-invariant 是什么,首先需要了解其中一個領域中一個被深入研究的對象 —— 置換群。這個對象描述了一組物品(如一副撲克牌中的牌)可以洗出的不同排列方式。

      如果你只有一張牌,你無法洗牌。所以置換群 S?只有一個元素。S?有兩個元素:如果你有兩張牌,它們可以有兩種排列順序。S?變得稍微復雜一些:三張牌有六種不同的排列方式。


      這些不同的排列方式可以排列成一個由頂點和邊組成的網絡,稱為圖。起始排列 123 放在底部。圖的每條邊(畫成箭頭)代表兩張牌的交換:


      隨著牌數 n 的增加,S?增長得非常快 —— 使得 S?之后的群幾乎不可能畫出此圖。S??的元素數量大約相當于可觀測宇宙中的原子數量。

      數學家們嘗試研究置換群中排列之間的 Bruhat 序及區間。由于大置換群的情況極為復雜,他們借助 AI 系統 AlphaEvolve 分析了數十個置換群。AI 生成了約 50 行 Python 代碼,并意外發現當排列數為 2 的冪時,代碼可簡化為 5 行,且對應的 Bruhat 區間形成了超立方體(hypercube)結構。


      這一結構此前 50 年未被注意。AI 并非按指令尋找超立方體,而是自主揭示了這一隱藏模式。這意味著,借助大語言模型,數學家能快速實驗,發現意想不到的豐富結構。

      類似地,AI 模型在代數幾何中也扮演著重要角色。斯坦福大學數學家、美國數學會現任主席 Ravi Vakil 就專攻這個領域。

      Ravi Vakil 等數學家著手研究球面嵌入旗簇的方式,每種嵌入對應一個多項式方程。隨著多項式次數增加,相關空間應趨近于連續嵌入空間。他們驚訝地發現這種趨近發生得很快,并與 DeepMind 合作,利用 Google Gemini 上的兩個專用模塊(DeepThink 和 FullProof)進行驗證。

      這也許是當前 AI 如何發揮作用的一個典型例子。一群數學專家,在一家大型科技公司的幫助下,以比原本更快的速度弄清楚了某件事。

      當然,在探討 AI 對數學研究的影響時,我們不應只關注成功案例。Litt 提醒說:「AI 生成的胡言亂語對公共空間造成了大量污染。」

      數學家們寄希望于形式化證明 —— 將證明轉換成計算機能理解的語言,然后使用計算機程序來驗證證明中的所有邏輯是否成立。

      許多數學家還認為,AI 數學能力不斷增強帶來的另一個主要挑戰是,它將如何影響學生的學習方式。有數學家稱:「存在一個嚴重的風險:在加速數學研究進步的同時,AI 可能會阻礙我們培養出更多的數學研究者。」

      人們對 AI 最大的期望是,它將幫助數學家發現并證明數學謎題。但眼下這場 AI 變革,或許還有很多可能性。

      原文鏈接:https://www.quantamagazine.org/the-ai-revolution-in-math-has-arrived-20260413/

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      數學差的孩子,大腦里到底卡在哪一步

      數學差的孩子,大腦里到底卡在哪一步

      地球觀察日記
      2026-05-14 10:00:59
      5月18日,國乒新消息:向鵬深夜的發文 把國乒“后臺”全炸出來了

      5月18日,國乒新消息:向鵬深夜的發文 把國乒“后臺”全炸出來了

      浪子阿邴聊體育
      2026-05-19 01:40:24
      人老了,只剩一個人的時候,千萬要記住:1、不要再找老伴兒…

      人老了,只剩一個人的時候,千萬要記住:1、不要再找老伴兒…

      富書
      2026-04-30 23:20:06
      爭議?切爾西7500萬神鋒無緣世界杯!本賽季造26球卻被內馬爾擠掉

      爭議?切爾西7500萬神鋒無緣世界杯!本賽季造26球卻被內馬爾擠掉

      我愛英超
      2026-05-19 06:43:35
      雷霆主帥:我們過去防文班比今晚做得更好,G2進攻需要改進

      雷霆主帥:我們過去防文班比今晚做得更好,G2進攻需要改進

      懂球帝
      2026-05-19 14:48:23
      又一個宗馥莉?頂級豪門被爆家族丑聞,這人倫關系太炸裂了啊……

      又一個宗馥莉?頂級豪門被爆家族丑聞,這人倫關系太炸裂了啊……

      桌子的生活觀
      2026-05-18 12:22:57
      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      深度報
      2026-02-11 23:35:03
      北京vs上海G3上演“天王山之戰”,趙睿周琦能否率隊捍衛主場?

      北京vs上海G3上演“天王山之戰”,趙睿周琦能否率隊捍衛主場?

      狼叔評論
      2026-05-19 16:54:57
      邱澤許瑋甯公園遛娃,身上綁著腰凳將兒子舉高高,一家三口超幸福

      邱澤許瑋甯公園遛娃,身上綁著腰凳將兒子舉高高,一家三口超幸福

      黔鄉小姊妹
      2026-05-18 08:18:28
      樊振東歐冠輸球僅1天,日媒、德媒接連發文銳評,看法竟如出一轍

      樊振東歐冠輸球僅1天,日媒、德媒接連發文銳評,看法竟如出一轍

      阿纂看事
      2026-05-19 10:54:02
      奇葩!俄稱輸給烏不丟人,大家一家人,烏克蘭又一款大殺器亮相

      奇葩!俄稱輸給烏不丟人,大家一家人,烏克蘭又一款大殺器亮相

      史政先鋒
      2026-05-19 17:03:28
      《哭聲》導演新作戛納炸場:140分鐘外星怪物屠村,全程無尿點

      《哭聲》導演新作戛納炸場:140分鐘外星怪物屠村,全程無尿點

      影視情報室
      2026-05-19 01:52:38
      5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

      5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

      阿龍美食記
      2026-05-16 16:38:28
      就因一個概念,上市20天暴漲18倍,市盈率27420,今被停牌核

      就因一個概念,上市20天暴漲18倍,市盈率27420,今被停牌核

      丁丁鯉史紀
      2026-05-19 10:40:42
      武漢“癌癥村”老板親口承認:有人檢查前打電話,讓我堵排污口

      武漢“癌癥村”老板親口承認:有人檢查前打電話,讓我堵排污口

      聽心堂
      2026-05-19 09:08:32
      淺析:蘇-57雙座戰斗機曝光 滿足“忠誠僚機”剛需 爭取海外用戶

      淺析:蘇-57雙座戰斗機曝光 滿足“忠誠僚機”剛需 爭取海外用戶

      hawk26講武堂
      2026-05-19 12:49:16
      大雨、暴雨、雷雨今夜抵達浙江,最新降雨時段公布→

      大雨、暴雨、雷雨今夜抵達浙江,最新降雨時段公布→

      魯中晨報
      2026-05-19 16:42:04
      75歲大爺與保姆生下兒子,做親子鑒定后,大爺卻被子女們氣得心梗

      75歲大爺與保姆生下兒子,做親子鑒定后,大爺卻被子女們氣得心梗

      黃家湖的憂傷
      2025-03-06 09:30:21
      澳大利亞U17主帥:中國隊經歷多場硬仗,競技狀態已調至最佳

      澳大利亞U17主帥:中國隊經歷多場硬仗,競技狀態已調至最佳

      懂球帝
      2026-05-19 12:11:03
      突發!武漢一知名樓盤鄭重聲明

      突發!武漢一知名樓盤鄭重聲明

      越喬
      2026-05-19 14:55:36
      2026-05-19 17:52:49
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4745文章數 37464關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      武大全面開放校園后一棵梧桐樹被刻字 校方回應

      頭條要聞

      武大全面開放校園后一棵梧桐樹被刻字 校方回應

      體育要聞

      文班亞馬1比0雷霆:凌駕MVP的史詩價值

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經要聞

      從賣流量到賣Token,運營商算力生意破局

      汽車要聞

      配置全家桶 全新海獅05這次升級全在點上

      態度原創

      健康
      房產
      藝術
      本地
      軍事航空

      專家揭秘干細胞回輸的安全風險

      房產要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現了!

      藝術要聞

      三影堂攝影藝術中心舉辦藝術家孫瑞祥個展

      本地新聞

      別搜晉江小說了,去看真的晉江

      軍事要聞

      特朗普暫緩打擊伊朗 稱系應中東三國請求

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 婷婷丁香五月激情综合在线| 无码少妇一区二区| 国产亚洲欧美日韩亚洲中文色| 久久99国产精品一区二区 | 一区二区三区四区五区| 亚洲精品国产情侣av在线| 囯产精品一品二区三区| 亚洲成人人妻| 国产品精品久久久久中文| 久久午夜无码鲁丝片直播午夜精品| 丁香五月欧美| 国产三级精品三级在线专区1 | 91国在线啪精品一区| 久久久噜噜噜久久中文字幕色伊伊| 日韩av爽爽爽久久久久久| 国内精品久久久久影院中文字幕| 99国产精品永久免费视频| 亚洲国产一区二区视频| 国产美女在线观看| 国产在线精品区| 亚洲?日韩?中文字幕?色综合 | 99色色网| 国产亚av手机在线观看| 一本色道av久久精品+| 少妇又爽又刺激视频| jizz日本69| 久久久国产精品黄毛片| 国模大尺度啪啪| 国产亚洲精品AA片在线爽| 夜夜干影院| 一区二区在线视频| 久久精品这里只有精99品| 香蕉在线精品一区二区| 五月色色网| 国产成人自拍视频综合| 一级毛片在线播放免费| 亚洲激情综合| 无码天堂va亚洲va在线va| 五月天丁香社区| 人妻无码中文专区久久av| 精品一区二区三区免费视频|