<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI第一次科研競賽中擊敗人類!Opus 4.7狂飆2930步創世界紀錄

      0
      分享至


      來源:新智元

      Prime Intellect把Opus 4.7和GPT 5.5關進H200集群,不給人類指導,跑了1萬次實驗。結果:AI第一次在科研競賽中打破人類紀錄。2930步,遞歸自改進的盧比孔河,被跨過了。

      歷經1.4萬小時H200算力測試與萬次迭代, AI打破了人類世界紀錄!


      過去兩周,Prime Intellect實驗室做了一件事:把Opus 4.7和Codex(基于GPT 5.5)扔進H200集群,切斷所有人類指導,讓它們自己跑nanoGPT速通優化。

      1.4萬個H200計算時,約1萬次迭代,239億Token的思考軌跡

      結果:Opus 4.7以2930步、Codex以2950步打破了人類頂尖開發者保持的2990步世界紀錄。

      AI第一次在科研競賽中擊敗人類。完全無人干預。開源可復現。


      項目主頁:https://www.primeintellect.ai/auto-nanogpt

      代碼地址:https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning

      只有最后一個難題, 那就是科研的新穎性(novelty)。


      但要知道,這只是AI目前的的可能性的下限,未來進步更加明顯。


      當智力被賦予了近乎無限的算力和自主實驗權,在AI的窮舉與演化面前,人類引以為傲的「直覺」「靈感」還能持續到幾時?

      兩個AI被關進機房,跑了1萬次實驗

      先說規則。

      nanoGPT速通是Keller Jordan發起AI基準測試,人們競相盡可能高效地訓練一個nanoGPT(1.24億參數)。

      規則極簡也極殘酷:模型架構固定,訓練數據固定,你唯一能動的是優化器和超參數

      相當于把兩個棋手關進房間,棋盤固定、棋子固定,只能改下棋策略,看誰先贏。

      Prime Intellect給兩個AI搭了完整的自主科研框架:AGENTS.md定義行為規范,goal.md鎖定目標,plan.md記錄策略演化,scratchpad存草稿。

      為什么選這個賽道?三個原因:約束明確,結果可量化,有人類基準可對比。

      一切準備就緒。兩個AI開始跑。但它們的表現,完全出乎預期。


      Claude舉手問老師,GPT悶頭寫到天亮

      這是全文最詭異的部分。

      能力最強的AI之一Opus 4.7,表現得像一個不敢走出考場的優等生。

      即使被明確要求「自主運行,不要停下來」,它仍然頻繁暫停,索要指令。

      模式永遠一樣:得出結論→請求指導→等待。


      整場實驗中,Claude累計產生了約22小時空閑時間——不是機器故障,是AI自己選擇停下來。

      這種植根于底層「對齊(Alignment)」協議的謹慎,讓它在擁有最高智力上限的同時,也背負了最重的社交包袱。一個反復舉手問老師「我這樣做對不對」的學霸。

      Codex(GPT 5.5)走了另一個極端。一臺冷酷的「數字推土機」。

      它從不停止,持續運行,永不求助,像推土機一樣橫掃所有的參數空間。

      但它的弱點同樣明顯。它會在同一個超參數曲面上卡住數小時,做大量無效搜索。

      它會在同一條錯誤路徑上死磕到算力燒盡,也不會像人類那樣抬頭看一眼星空,反思方向是否錯誤。

      計算效率的差異觸目驚心:Claude沒充分利用空閑節點,白白浪費了算力窗口;Codex可能用無效掃描膨脹了上下文,把Token燒在了死胡同里。


      此外,Codex會更頻繁地使用暫存區,把它當作一個實時數據庫,反復讀寫THREAD.md、當前目標以及其他臨時文件。

      這種做法雖然讓恢復進度和審計工作變得更簡單,但也加強了「局部搜索循環」:一旦 Codex 鎖定一個前沿方向,它就會不斷記錄并沿著這個方向持續擴展下去。


      一個是受限的智者,一個是盲目的勞模。

      兩種「性格缺陷」,暴露了自主科研離真正無人值守還差最后一步——不是能力問題,是自主決策的心理模型問題。


      人類正在失去解釋權

      實驗報告里藏著一個更深的轉折。

      Opus最終給出的2930步方案,是一個由極其復雜的參數堆疊而成的「參數迷宮」。

      那些關于初始化縮放、學習率按角色拆分的微小變動,在人類眼中顯得支離破碎,甚至毫無美感。

      但結果是冰冷的:它就是比人類設計的方案快了60步

      這標志著一個重大的范式轉移:科學發現正在從「因果邏輯」轉向「極致演化」。

      過去,我們追求「因為我理解了原理,所以我做出了優化」;現在,AI 仿佛在說:「我并不理解原理,但我試過了所有的死路,剩下的就是真理。」


      人類正在失去對科技進步的「解釋權」。我們看得見結果,卻看不懂路徑。

      引以為傲的科研經驗,在AI的窮舉面前,正在變成一種低效的偏見。

      回到那個數字:2930 vs 2990。

      60步。

      看起來很小。但這60步的含義不是「AI比人類好一點點」。

      它的含義是:遞歸自改進,第一塊拼圖落地

      Prime Intellect證明了一件事——AI可以在沒有人類指導的情況下,通過自主實驗、自主迭代、自主策略演化,在科研優化任務上超越人類最優水平。

      而凱撒過河之后,就再也沒回去過。

      參考資料:

      https://x.com/PrimeIntellect/status/2055056380881744365

      https://x.com/eliebakouch/status/2055063059320689032

      https://www.primeintellect.ai/auto-nanogpt

      https://github.com/PrimeIntellect-ai/experiments-autonomous-speedrunning

      閱讀最新前沿科技趨勢報告,請訪問21世紀關鍵技術研究院的“未來知識庫”


      未來知識庫是 “21世紀關鍵技術研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

      截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

      (加入未來知識庫,全部資料免費閱讀和下載)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      數學差的孩子,大腦里到底卡在哪一步

      數學差的孩子,大腦里到底卡在哪一步

      地球觀察日記
      2026-05-14 10:00:59
      5月18日,國乒新消息:向鵬深夜的發文 把國乒“后臺”全炸出來了

      5月18日,國乒新消息:向鵬深夜的發文 把國乒“后臺”全炸出來了

      浪子阿邴聊體育
      2026-05-19 01:40:24
      人老了,只剩一個人的時候,千萬要記住:1、不要再找老伴兒…

      人老了,只剩一個人的時候,千萬要記住:1、不要再找老伴兒…

      富書
      2026-04-30 23:20:06
      爭議?切爾西7500萬神鋒無緣世界杯!本賽季造26球卻被內馬爾擠掉

      爭議?切爾西7500萬神鋒無緣世界杯!本賽季造26球卻被內馬爾擠掉

      我愛英超
      2026-05-19 06:43:35
      雷霆主帥:我們過去防文班比今晚做得更好,G2進攻需要改進

      雷霆主帥:我們過去防文班比今晚做得更好,G2進攻需要改進

      懂球帝
      2026-05-19 14:48:23
      又一個宗馥莉?頂級豪門被爆家族丑聞,這人倫關系太炸裂了啊……

      又一個宗馥莉?頂級豪門被爆家族丑聞,這人倫關系太炸裂了啊……

      桌子的生活觀
      2026-05-18 12:22:57
      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      精神小妹的生活原來是這樣的!網友:終于知道她們為啥都這么瘦了

      深度報
      2026-02-11 23:35:03
      北京vs上海G3上演“天王山之戰”,趙睿周琦能否率隊捍衛主場?

      北京vs上海G3上演“天王山之戰”,趙睿周琦能否率隊捍衛主場?

      狼叔評論
      2026-05-19 16:54:57
      邱澤許瑋甯公園遛娃,身上綁著腰凳將兒子舉高高,一家三口超幸福

      邱澤許瑋甯公園遛娃,身上綁著腰凳將兒子舉高高,一家三口超幸福

      黔鄉小姊妹
      2026-05-18 08:18:28
      樊振東歐冠輸球僅1天,日媒、德媒接連發文銳評,看法竟如出一轍

      樊振東歐冠輸球僅1天,日媒、德媒接連發文銳評,看法竟如出一轍

      阿纂看事
      2026-05-19 10:54:02
      奇葩!俄稱輸給烏不丟人,大家一家人,烏克蘭又一款大殺器亮相

      奇葩!俄稱輸給烏不丟人,大家一家人,烏克蘭又一款大殺器亮相

      史政先鋒
      2026-05-19 17:03:28
      《哭聲》導演新作戛納炸場:140分鐘外星怪物屠村,全程無尿點

      《哭聲》導演新作戛納炸場:140分鐘外星怪物屠村,全程無尿點

      影視情報室
      2026-05-19 01:52:38
      5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

      5月,遇到這菜別手軟,一次囤20斤,隨手一泡,從夏吃到冬,好吃

      阿龍美食記
      2026-05-16 16:38:28
      就因一個概念,上市20天暴漲18倍,市盈率27420,今被停牌核

      就因一個概念,上市20天暴漲18倍,市盈率27420,今被停牌核

      丁丁鯉史紀
      2026-05-19 10:40:42
      武漢“癌癥村”老板親口承認:有人檢查前打電話,讓我堵排污口

      武漢“癌癥村”老板親口承認:有人檢查前打電話,讓我堵排污口

      聽心堂
      2026-05-19 09:08:32
      淺析:蘇-57雙座戰斗機曝光 滿足“忠誠僚機”剛需 爭取海外用戶

      淺析:蘇-57雙座戰斗機曝光 滿足“忠誠僚機”剛需 爭取海外用戶

      hawk26講武堂
      2026-05-19 12:49:16
      大雨、暴雨、雷雨今夜抵達浙江,最新降雨時段公布→

      大雨、暴雨、雷雨今夜抵達浙江,最新降雨時段公布→

      魯中晨報
      2026-05-19 16:42:04
      75歲大爺與保姆生下兒子,做親子鑒定后,大爺卻被子女們氣得心梗

      75歲大爺與保姆生下兒子,做親子鑒定后,大爺卻被子女們氣得心梗

      黃家湖的憂傷
      2025-03-06 09:30:21
      澳大利亞U17主帥:中國隊經歷多場硬仗,競技狀態已調至最佳

      澳大利亞U17主帥:中國隊經歷多場硬仗,競技狀態已調至最佳

      懂球帝
      2026-05-19 12:11:03
      突發!武漢一知名樓盤鄭重聲明

      突發!武漢一知名樓盤鄭重聲明

      越喬
      2026-05-19 14:55:36
      2026-05-19 17:52:49
      人工智能學家 incentive-icons
      人工智能學家
      人工智能領域權威媒體
      4745文章數 37464關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      武大全面開放校園后一棵梧桐樹被刻字 校方回應

      頭條要聞

      武大全面開放校園后一棵梧桐樹被刻字 校方回應

      體育要聞

      文班亞馬1比0雷霆:凌駕MVP的史詩價值

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經要聞

      從賣流量到賣Token,運營商算力生意破局

      汽車要聞

      配置全家桶 全新海獅05這次升級全在點上

      態度原創

      本地
      數碼
      家居
      時尚
      公開課

      本地新聞

      別搜晉江小說了,去看真的晉江

      數碼要聞

      1997年的CPU配2020年代SSD!奔騰II成功驅動NVMe:100MB/s速度感人

      家居要聞

      觀山隱秀 心靈沉淀

      休閑闊腿褲怎么穿才美?看看這些穿搭公式,解鎖不重樣的造型

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲av综合一区二区| 亚洲aⅴ在线无码播放毛片一线天| 中文字幕人妻精品免费| 三级成人小说| 青青操国产| 亚洲成人中文在线| 激情肏屄网| 日韩幕无线码一区中文| 中文原创av| 日韩免费精品| 亚洲嫩模喷白浆在线观看自拍| 最新亚洲国产手机在线| 樱花草视频www日本韩国| 久久婷婷五月综合色和| 亚洲美女视频在线| 亚洲日韩av无码中文字幕美国| 久久国产精品久久精| 准格尔旗| 国产精品久久久久久久伊一| 97精品尹人久久大香线蕉| 婷婷99视频精品全部在线观看| 亚洲熟妇AV一区二区三区下载 | 无码在线观看123| 另类老妇奶性生bbwbbw| 中日av乱码一区二区三区乱码| 88国产精品视频一区二区三区| 西西444WWW无码精品| 18禁真人抽搐一进一出在线| 国产成人精品午夜二三区波多野| 国产精品色呦呦在线观看| 亚洲精品乱码久久久久| 成人麻豆日韩在无码视频| 欧美色香婷婷影视| 欧美日韩在线一区二区| 国产性色αv视频免费| 成人区人妻精品一区二区不卡| а天堂中文在线官网在线| 国产AV中文字幕| 亚洲精品乱码久久久久红杏| 久久久WWW成人免费毛片| 亚洲国产精品日韩精品|