<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      AI自己造AI,概率60%,2028年底前!Anthropic聯創坐不住了

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】Anthropic聯合創始人Jack Clark讀完數百份公開數據,得出一個讓他自己也坐不住的結論:2028年底前,AI自己造AI的概率是60%。支撐他這一判斷的,是編程、科研復現、模型訓練優化等多條能力曲線:每一條都在向右上方飛,沒有減速跡象。

      AI系統,可能很快就能自行構建自身了!

      說這句話的人,是Anthropic聯合創始人Jack Clark。

      5月4日,他在X上發帖:「我認為,遞歸自我改進(RSI)有60%的概率在2028年底之前發生。」


      除了Anthropic聯合創始人身份之外,Clark還是《Import AI》的創辦者兼主筆,長期跟蹤AI能力進展。

      這次發帖,他在《Import AI》上同時發布了一篇完整的分析文章。


      https://importai.substack.com/p/import-ai-455-automating-ai-research

      這是一件大事。我不知道該如何理解它。這是一個我不情愿接受的看法:其影響太過巨大,讓我感到自身渺小,而且我不確定,社會是否已準備好迎接自動化AI研發所帶來的變革。

      Clark在文章里寫:如果這一天到來,人類將跨過一道「盧比孔河」,進入一個幾乎無法預測的未來

      他不認為這會發生在2026年,但他預判一兩年內可能在非前沿模型上,出現這樣的概念驗證:一個模型,端到端訓練出自己的繼任者。

      支撐Clark結論的,主要來自公開信息:arXiv、bioRxiv、NBER上的論文,加上他對各大前沿實驗室產品的持續觀察,Clark以此拼湊出一幅關于AI進展的全景圖。

      在他看來,AI工程化生產的所有組件,今天已經基本齊了。剩下的問題是:模型什么時候能積累足夠的創造力,開始像人類研究員一樣推動前沿演進。

      四年

      從30秒到12小時

      Clark的核心論據,是一批能力進展曲線。

      先看METR的時間軸圖。


      https://metr.org/time-horizons/

      METR是一個專注AI能力評估的機構,他們追蹤的是:AI系統能獨立完成一項任務,在50%成功率水平線上,這項任務如果讓一個熟練的人來做大概需要多少時間。

      • 2022年,GPT-3.5的數字是:30秒;

      • 2023年,GPT-4把這個數字推到了4分鐘;

      • 2024年,o1推到了40分鐘;

      • 2025年,GPT-5.2(高配版)跨到了6小時;

      • 2026年,Claude Opus 4.6已經到了12小時。

      四年,從30秒到12小時,翻了1440倍!

      AI能力研究員Ajeya Cotra認為,2026年底之前,這個數字有望突破100小時。

      如果達到100小時時間跨度,它將能覆蓋許多多日級軟件/研究輔助任務。

      編程能力同樣也在起飛。

      SWE-Bench衡量的是AI解決真實GitHub工程問題的能力。2023年底,Claude 2的得分是2%。到今年,Claude Mythos Preview達到93.9%,這個基準基本被打穿了。

      CORE-Bench測的是另一件事:給AI一篇論文和對應的代碼庫,讓它獨立復現實驗結果,這是AI研究員最基本的日常工作之一。

      2024年9月該測試推出時,最好成績是21.5%。2025年12月,Opus 4.5在Claude Code scaffold下verified accuracy 為77.78%,經人工校驗后為95.5%,項目方稱CORE-Bench已被解決。


      https://hal.cs.princeton.edu/corebench_hard

      15個月,從21.5%到95.5%。

      MLE-Bench測的是AI獨立參加Kaggle競賽的能力,覆蓋75個真實比賽項目。

      2024年10月發布時最高分16.9%,到2026年2月,Gemini 3加搜索工具的組合已經達到64.4%。


      https://github.com/openai/mle-bench

      Anthropic內部還有一個測試:讓模型優化一個僅使用CPU的小型語言模型訓練代碼,越快越好,以未優化版本的速度為基準。

      • 2025年5月,Claude Opus 4:2.9倍;

      • 2025年11月,Opus 4.5:16.5倍;

      • 2026年2月,Opus 4.6:30倍;

      • 2026年4月,Claude Mythos Preview:52倍。

      不到一年,從2.9倍漲到52倍。

      這是AI在優化AI訓練代碼這件事情上的進展速度。

      99%的工程活

      AI快接完了

      這里有一個關鍵問題:AI研究這件事,到底有多少是純工程,多少是真正的創意?

      Clark給出了一個框架,引用了愛迪生那句話:天才是1%的靈感和99%的汗水。

      他認為,AI研究也是如此。

      一個典型的AI研究循環是這樣的:拿一個現有系統,在某個維度上擴大規模,觀察什么地方開始出問題,修掉工程問題,再擴大一輪。

      這個過程里,大部分工作是數據清洗、跑實驗、調參數、讀論文、復現結果,這些都是「汗水」,不是「靈感」。

      偶爾會出現真正改變范式的發明,比如Transformer架構,比如混合專家模型(MoE)。但那是1%,而且這1%越來越不是瓶頸,因為那99%的工程工作正在被AI快速接管。

      Clark列了幾個信號:

      AI已經能管理其他AI。Claude Code、OpenCode這類工具里,單個AI可以扮演「項目經理」,把任務分發給多個子AI并行處理,之后匯總結果。

      這和一個人類研究團隊的組織方式沒有本質區別。

      PostTrainBench測試了一件事:AI能不能自己微調開源小模型,提升它在某個任務上的表現?

      這個工作通常是前沿實驗室里有經驗的研究員在做。

      截至2026年3月,AI系統在這個任務上能做到人類研究員效果的一半左右,大約是25%到28%的提升幅度,而人類基線是51%。


      https://posttrainbench.com/

      Anthropic內部還有一個「自動化對齊研究」的概念驗證:讓一組AI agent,在AI安全研究問題上自主攻關。

      結果是,AI給出的方案超過了Anthropic人類研究員的基線。


      https://www.anthropic.com/research/automated-alignment-researchers

      Clark把這些證據串在一起的判斷是:AI今天已經能自動化AI工程的絕大部分,AI研究里有多少能自動化,還不完全清楚,但跡象已經很明顯。

      質疑聲也來了

      Clark的帖子發出后,行業里也出現了一些質疑。

      華盛頓大學機器學習教授,《終極算法》作者Pedro Domingos回復到:「從LISP在50年代發明以來,AI就能構建自己了。問題在于,這個過程究竟能帶來遞增回報還是遞減回報——而目前沒有任何證據支持前者。」


      遞歸自我改進聽起來很科幻,但能循環不等于循環有收益。如果每一代AI優化自己的效率只有邊際改善,而不是指數級放大,那這件事的影響范圍會非常有限。

      還有人質疑概念邊界。「RSI到底有沒有一個權威定義?」一位名叫Dan Brickley的研究員問道。


      另一個更尖銳的觀察來自賬號@crepesupreme:

      2027年30%,2028年60%。一年內概率跳升30個百分點,意味著2027到2028年之間存在某個不連續的能力事件。那個具體事件是什么?

      Clark在通訊文章里回應了這個隱含問題:他認為AI研究仍需要某種創意突破才能真正進入「自我研發」循環:AI目前在這一塊還沒有變革性的表現。這正是他給2027年只打30%的原因;而如果這個缺口在2028年底前被填上,概率就升到60%。

      但他同時也承認,自己預判的是概率,而不是確切的時間點。

      還有人問他:「你在Anthropic工作,你為什么要去翻公開數據?直接走下樓去問研究員不就行了?」

      Clark的答案是:用公開數據,是因為公開數據才有可信度。他要的不是內部判斷,是一個任何人都能獨立核驗的結論。

      窗口還開著

      但在縮窄

      Clark在通訊文章里寫:他為什么不給2027年更高的概率?

      因為他認為AI研究還包含一些對創意直覺的要求,而AI目前在這一塊只有「誘人的早期信號」,還沒有系統性突破。

      他列了兩個信號:一個是Gemini模型參與攻克Erd?s數學問題,在700個問題里解出了1個被數學家認為有一定原創性的解。

      另一個是斯坦福、UBC等機構與Google DeepMind合作,AI在發現新數學證明中起到了「非常實質性的作用」。

      這些結果在AI能力演化的時間軸上,可能是某種早期信號。

      Clark的估計是:如果2028年底沒有出現他描述的情況,那說明當前技術路徑存在某個根本性的能力天花板,需要人類的創意才能突破。

      更關鍵的是「如果出現了」之后的問題。

      Anthropic在2026年3月宣布成立The Anthropic Institute時,官方聲明里寫了這樣一句話:

      如果AI系統的遞歸自我改進確實開始發生,那么世界上誰應該被告知,以及這些系統應該如何治理?


      https://www.anthropic.com/news/the-anthropic-institute

      連Anthropic自己,都還沒有這個問題的完整答案。

      Clark在通訊文章里給出了一個更技術性的擔憂:今天的對齊技術,如果有99.9%的準確率,在遞歸迭代50代之后,準確率會跌到95.1%;迭代500代之后,跌到60.5%。

      除非你的對齊方案在理論上能保證在更智能的系統上同樣有效,否則問題會很快出現。

      也許,Clark想要說的是:治理窗口是有限的,而且它正在縮窄。他希望通過文章發出一個提醒:這件事留給討論、研究和治理設計的時間,比大多數人想象的短。

      據奧特曼直播及媒體報道,OpenAI的目標是讓AI在2026年9月前達到「AI 研究實習生」水平,2028年達到更完整的自動化研究員;Anthropic自己也在發表自動化對齊研究的概念驗證;一家叫Recursive Superintelligence的新公司剛剛完成5億美元融資,其目標之一就是自動化AI研究。

      整個行業已經在朝這個方向加速了。

      Clark說,無論從哪個維度看,數據都指向同一個方向,而每一條曲線,都在向右上方飛,時間越長,能力越強,而且沒有任何一條顯示出減速的跡象。

      參考資料:

      https://x.com/chatgpt21/status/2051314386317295758

      https://importai.substack.com/p/import-ai-455-automating-ai-research

      https://www.anthropic.com/research/automated-alignment-researchers

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      他是上海著名演員,比陸毅帥,比劉愷威演技好,出道30年始終不火

      他是上海著名演員,比陸毅帥,比劉愷威演技好,出道30年始終不火

      寒士之言本尊
      2026-05-04 23:59:05
      中國一旦發生戰爭,要記得第一時間要帶好這5樣東西,才能保命

      中國一旦發生戰爭,要記得第一時間要帶好這5樣東西,才能保命

      軒逸阿II
      2026-05-05 16:34:53
      消失9年后復出,《藍色生死戀》最美蘿莉近照嚇壞網友:原來這些年她過得這么慘……

      消失9年后復出,《藍色生死戀》最美蘿莉近照嚇壞網友:原來這些年她過得這么慘……

      英國那些事兒
      2026-05-05 23:35:10
      豆包突然要收費,其實是給所有普通人提了個醒!

      豆包突然要收費,其實是給所有普通人提了個醒!

      秋葉PPT
      2026-05-05 08:22:06
      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

      新歐洲
      2026-04-21 19:37:05
      新加坡航空公司航班高度驟降致1死百傷,3名傷者起訴索賠

      新加坡航空公司航班高度驟降致1死百傷,3名傷者起訴索賠

      現代快報
      2026-05-05 17:32:07
      2026年退休人員的苦日子,可能真的要來了!這4大征兆已經凸顯

      2026年退休人員的苦日子,可能真的要來了!這4大征兆已經凸顯

      貓叔東山再起
      2026-05-05 11:30:09
      最便宜的豐田小車來了!配1.0L發動機油耗2.8L,不足4萬太香了

      最便宜的豐田小車來了!配1.0L發動機油耗2.8L,不足4萬太香了

      娛樂圈的筆娛君
      2026-05-05 21:17:39
      倫敦世乒賽5月5日晚戰報:新增8隊晉級!16強已出12,中日韓贏球

      倫敦世乒賽5月5日晚戰報:新增8隊晉級!16強已出12,中日韓贏球

      全言作品
      2026-05-05 22:36:39
      別再被抗戰劇騙了!一名日軍攝影師,拍下真正的“鬼子進村”照片

      別再被抗戰劇騙了!一名日軍攝影師,拍下真正的“鬼子進村”照片

      歷史甄有趣
      2026-05-04 08:10:22
      特朗普:已賺回出兵成本的37倍!美國已經賣了1億桶委內瑞拉石油,未來一個月還有1億桶,他此前呼吁中國購買委石油,中方:其他國家無權指手畫腳

      特朗普:已賺回出兵成本的37倍!美國已經賣了1億桶委內瑞拉石油,未來一個月還有1億桶,他此前呼吁中國購買委石油,中方:其他國家無權指手畫腳

      每日經濟新聞
      2026-05-03 09:07:16
      徐正源大幅度降薪來遼寧鐵人執教!未來將帶隊進入正軌,值得期待

      徐正源大幅度降薪來遼寧鐵人執教!未來將帶隊進入正軌,值得期待

      懂個球
      2026-05-05 23:13:59
      炎亞綸凌晨發長文清算16年恩怨:決裂汪東城、官宣結婚告別飛輪海

      炎亞綸凌晨發長文清算16年恩怨:決裂汪東城、官宣結婚告別飛輪海

      可樂談情感
      2026-05-05 14:12:48
      鐘誠下課:執教吉林兩季29勝59負 男籃助教李昂接任成新帥

      鐘誠下課:執教吉林兩季29勝59負 男籃助教李昂接任成新帥

      醉臥浮生
      2026-05-05 22:06:59
      十二年青春喂了空!CoCo終于坦白,揭露謝賢最真實的一面

      十二年青春喂了空!CoCo終于坦白,揭露謝賢最真實的一面

      一盅情懷
      2026-05-04 16:37:51
      77歲王薇薇殺瘋MetGala!黑布裙加銀發炸場,全網:這狀態我服了

      77歲王薇薇殺瘋MetGala!黑布裙加銀發炸場,全網:這狀態我服了

      觀魚聽雨
      2026-05-05 23:33:15
      拼爹還是拼自己?父親是前外交部長,他哈佛畢業卻擠公交搬啤酒箱

      拼爹還是拼自己?父親是前外交部長,他哈佛畢業卻擠公交搬啤酒箱

      南宗歷史
      2026-05-05 17:00:11
      摸景甜胸側,抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

      摸景甜胸側,抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

      草莓解說體育
      2026-04-15 04:23:51
      賠錢賺吆喝!網傳某車企11款車型月銷不足3.3萬、單款月均3000輛

      賠錢賺吆喝!網傳某車企11款車型月銷不足3.3萬、單款月均3000輛

      火山詩話
      2026-05-05 09:07:51
      需交一半稅 曝吳宜澤奪冠獎金到手剩245萬 商業價值或飆升至1.7億

      需交一半稅 曝吳宜澤奪冠獎金到手剩245萬 商業價值或飆升至1.7億

      我愛英超
      2026-05-05 19:07:01
      2026-05-06 02:12:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      15136文章數 66837關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      頭條要聞

      媒體:中國史無前例下"阻斷禁令" 美媒迅速捕捉到信號

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      內娛真情誼!楊紫為謝娜演唱會送花籃

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      藝術
      教育
      旅游
      本地
      公開課

      藝術要聞

      AI應用“豆包”要收費,第一批“韭菜”是誰?

      教育要聞

      告別焦慮!南師附中官方:11位特長生上岸者首度分享:試題難在哪?如何準備?

      旅游要聞

      女子體驗瀑布秋千受傷后送醫途中離世 官方通報

      本地新聞

      用青花瓷的方式,打開西溪濕地

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品亚洲综合久久小说| 欧美日韩精品| 久久天天躁狠狠躁夜夜婷| 亚洲综合在线一区二区三区| 久久综合九色综合欧洲98| 伊人久久2008| 在线播放国产精品亚洲| 亚洲中文字幕在线第二页| 40岁大乳的熟妇在线观看| 三级特黄60分钟在线播放| 夜夜夜夜撸| 亚洲一本网| 三上悠亚精品专区久久| 精品无码人妻av受辱日韩| 四库影院永久国产精品地址| 国产高清在线男人的天堂| 三级特黄60分钟在线播放| 中国老熟妇| 国产精品无码a∨麻豆| 伊人久久无码中文字幕| 波多野结衣无码视频在线观看| 国产精品毛片一区二区| 国精品无码一区二区三区在线蜜臀 | jizz18女人高潮| 欧洲码亚洲码的区别入口| 成在线人免费视频播放| 天堂av在线播放免费| 亚欧洲乱码视频一二三区| 国产精品无码av一区二区三区| 天堂AV免费| 免费观看羞羞视频网站| 一本大道AV人久久综合| 欧美人与禽交zozo| 国产欧美亚洲日韩图片| 精品久久久久久无码专区不卡 | 亚洲综合国产伊人五月婷| 欧洲美熟女乱av亚洲一区| 万山特区| 91亚瑟视频| 91密桃精品国产91久久| 亚洲日韩精品秘?在线观看|