<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      不好!1930年的AI都來搶程序員飯碗了

      1930年的AI都來搶程序員飯碗了

      0
      分享至

      Jay 發自 凹非寺
      量子位 | 公眾號 QbitAI

      勞動節,馬上100歲的vintage大模型也得勞動。

      是的,有人給只有1930年知識的大模型,微調成軟件工程師了……

      過程比想象中輕松,僅用250個訓練樣本,強悍的老頭便解決了自己人生中的第一個編程問題——

      給xarray庫打了個補丁。



      一個連電視機都沒見過的AI,現在也開始跟Claude們「學壞」,要跟程序員搶飯碗了。(bushi)

      中古硅基軟件工程師

      先補充下背景,1930是誰?

      這是最近爆火的「老頭AI」,全名叫talkie-1930-13b

      操盤手是AI研究員Nick Levine、多倫多大學副教授David Duvenaud,以及大家熟悉的那位——真·GPT系列之父Alec Radford



      而他們對老頭最有趣的設計,就是其訓練數據有條鐵律:1931年1月1日之后的任何一個字,全部不準進!

      是的,它不知道電視機,不知道互聯網,更不知道二戰怎么收場……

      老頭的世界,永遠停在了1930年12月31日的午夜。

      但讓全網「癱軟」的點在于,就這么個老古董,當扔給它一道Python編程題時,這個跨越近百年的「過去之靈」,竟然寫出了人生第一行Python代碼。

      離離原上譜。



      如今,老頭再次發力。

      有人對Alec Radford的這個1930 vintage LLM做了微調,讓它去解SWE-bench上的真實軟件工程問題。

      誰曾想,真讓老頭干成了。

      250個訓練樣本之后,它落地了第一個fix——一個針對xarray庫的小補丁。

      百歲老人,硬核上崗。

      對了,團隊放出了老頭在落地這個xarray庫補丁的全過程。

      說實話,如果以看前沿LLM的標準,這個demo看著真有點惱火。

      一個簡單的問題,老頭足足花了49輪才搞定,又長又慢。

      其中有些輪次實在看不下去了,真的太笨了,著急死了,但你又不好意思對老頭發脾氣。

      但,這在某些時刻,反而讓人更興奮。跟看爽文一樣。

      我舉個最「直接、不繞彎」的例子。(bushi)

      老頭一開始其實搞砸了。

      第12輪對話的時候,它嘗試apply patch失敗了。



      代碼可以報錯,但,老兵不死。

      老頭沒有放棄,它仍在繼續嘗試,直到終于意識到自己錯在哪……

      然后,在第44輪,它給修好了!!



      我知道,fix本身很簡單,別說AI SOTA了,代碼水平跟小白比估計都夠嗆。

      但真正重要的,是老頭在整個解題過程中的思考

      這個過程展示出的那種推理能力,跟我們在現代模型上看到的如出一轍。

      一個1930年的模型,也會試錯,會反思,會自我修正

      demo之外,benchmark的表現同樣亮眼。

      當微調時的訓練數據規模擴展到大約75K條trajectory,也就是10億token的時候,模型在SWE-bench-Verified上達到了4.5%的pass@1。

      要知道,它原來在HumanEval上才4%的pass@100。這進步幅度相當可觀。

      雖然絕對值還很低,但對一個1930年知識模型來說,已經很離譜了。



      更有意思的是另一個對照實驗。

      事實上,團隊還同時給老頭訓練了一個兄弟模型,叫talkie-web,這個模型是在互聯網數據上預訓練的。

      同樣的微調配方,talkie-web在SWE-bench-Verified上的成績是5.5%的。

      沒錯,即便團隊偏心,給孿生兄弟加上互聯網數據,也就比老頭高了1個百分點



      以上結果,歡迎復現。

      這不是什么穿越爽文,團隊已經在GitHub上開源了項目,鏈接放在文章結尾,感興趣的朋友可以去跑跑看。

      團隊自己也很興奮,在README里喊話:

      如果你手頭有更多算力,我們很想看到1930模型和互聯網模型在后訓練持續擴展時的完整scaling曲線對比。

      想看想看,這可比單純秀肌肉的benchmark有意思多了。

      什么是智能?

      團隊并沒有剖析背后的原因,但我看了不少網友在帖子下面的評論,覺得這是一個值得討論的話題。

      我們一直以為,AI需要吃掉整個互聯網才能變聰明。

      但如果一個只讀過1930年以前書的模型,經過一點點后訓練就能寫代碼修bug……

      那我們對「什么是智能」的理解,是不是也得重新想想?

      4.5%的pass@1,放在今天的SOTA面前當然不夠看。但它證明的那件事,比任何benchmark分數都重要。

      一個1930年代的人,如果擁有幾乎相同的教育體系,完全可以理解現代軟件工程。

      一百年前的數據量,加上正確的后訓練方法,就足以產生現代意義上的推理。

      智能的瓶頸,或許從來不在于預訓練數據的多少。

      你不需要一個訓練過所有知識的模型,它只需要具備基本的語言理解能力,這就夠了。

      或許,當我們在Scaling路上一路狂奔的間隙,也可以稍微停一停,抬起頭來跟身邊人侃侃大山、扯扯淡——

      誒,你說……
      智能的本質,到底是什么?

      GitHub:
      https://github.com/RicardoDominguez/talkie-coder

      參考鏈接:
      [1]
      https://x.com/rdolmedo_/status/2050665193374732430?s=20
      [2]
      https://github.com/RicardoDominguez/talkie-coder

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      活塞vs騎士次輪前瞻:年輕人欲沖破重圍 老兵們要證明自己

      活塞vs騎士次輪前瞻:年輕人欲沖破重圍 老兵們要證明自己

      北青網-北京青年報
      2026-05-05 19:44:02
      大哥催我去銀行簽字,我不解:簽什么?侄子含糊說道

      大哥催我去銀行簽字,我不解:簽什么?侄子含糊說道

      小秋情感說
      2026-05-05 15:53:40
      浙江麗水一吊車吊鋼管時,管子突然從高空散落砸中多車,街道辦:未有人員傷亡,系吊裝時未將鋼管捆牢,受損車輛后續將由公安部門協調處理

      浙江麗水一吊車吊鋼管時,管子突然從高空散落砸中多車,街道辦:未有人員傷亡,系吊裝時未將鋼管捆牢,受損車輛后續將由公安部門協調處理

      瀟湘晨報
      2026-05-05 17:09:08
      【人物】“00后”冠軍吳宜澤:一個中國斯諾克家庭為他押上了一切

      【人物】“00后”冠軍吳宜澤:一個中國斯諾克家庭為他押上了一切

      界面新聞
      2026-05-05 11:06:08
      老祖宗120字千古奇文《道》:道盡天地人性、權謀財富。建議收藏

      老祖宗120字千古奇文《道》:道盡天地人性、權謀財富。建議收藏

      瓜哥的動物日記
      2026-05-05 02:09:17
      世錦賽落幕!誕生4個贏家+3個輸家,吳宜澤、趙心童、墨菲全在列

      世錦賽落幕!誕生4個贏家+3個輸家,吳宜澤、趙心童、墨菲全在列

      侃球熊弟
      2026-05-05 05:52:45
      退休7年,回工作三十多年的老單位辦事3次,才懂得什么叫人走茶涼

      退休7年,回工作三十多年的老單位辦事3次,才懂得什么叫人走茶涼

      小馬達情感故事
      2026-05-04 18:25:06
      轉行采購商?前NBA球員班巴現身廣交會,曬出參展證件

      轉行采購商?前NBA球員班巴現身廣交會,曬出參展證件

      懂球帝
      2026-05-05 14:34:12
      今年五一,樓市扯下了最后遮羞布

      今年五一,樓市扯下了最后遮羞布

      房產老司機
      2026-05-05 11:35:27
      “誰會穿40碼的鞋啊?”女子正常咨詢鞋碼卻被男主播嘲諷,商家致歉:永久除名涉事男主播,在當場直播的消費者憑截圖全額原路退款

      “誰會穿40碼的鞋啊?”女子正常咨詢鞋碼卻被男主播嘲諷,商家致歉:永久除名涉事男主播,在當場直播的消費者憑截圖全額原路退款

      都市快報橙柿互動
      2026-05-05 12:31:38
      五一假期廣州山姆搶榴蓮!現場堪比“水果界神仙打架”

      五一假期廣州山姆搶榴蓮!現場堪比“水果界神仙打架”

      樓主說樓市
      2026-05-04 22:15:28
      和原生父母斷交,瓦爾迪:不想再被充滿欺騙和隱瞞的親情困擾

      和原生父母斷交,瓦爾迪:不想再被充滿欺騙和隱瞞的親情困擾

      懂球帝
      2026-05-05 12:26:13
      黃仁勛點名Anthropic達里奧,別一當CEO,就開「上帝視角」

      黃仁勛點名Anthropic達里奧,別一當CEO,就開「上帝視角」

      機器之心Pro
      2026-05-05 11:11:08
      “中年返貧三件套”,正在吞掉一代人的存款

      “中年返貧三件套”,正在吞掉一代人的存款

      十點讀書
      2026-04-18 18:36:15
      鄭麗文徹底撕破臉,扯下藍營最后一塊遮羞布!

      鄭麗文徹底撕破臉,扯下藍營最后一塊遮羞布!

      達文西看世界
      2026-05-05 10:58:59
      四年暴跌120億,微信是怎么“殺死”口香糖行業的?

      四年暴跌120億,微信是怎么“殺死”口香糖行業的?

      流蘇晚晴
      2026-04-19 20:34:47
      航拍湖南瀏陽煙花廠爆炸事故現場:專業人員進入核心區域救援

      航拍湖南瀏陽煙花廠爆炸事故現場:專業人員進入核心區域救援

      新京報
      2026-05-05 09:46:42
      南海突發!菲攔截我國4艘科考船,司令態度囂張,美暗撐菲方挑釁

      南海突發!菲攔截我國4艘科考船,司令態度囂張,美暗撐菲方挑釁

      鐵錘簡科
      2026-05-05 16:06:27
      紐約時報|沒有“基本盤”的代價:斯塔默給美國民主黨敲響的警鐘

      紐約時報|沒有“基本盤”的代價:斯塔默給美國民主黨敲響的警鐘

      時尚的弄潮
      2026-05-05 17:47:32
      季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

      季后賽場均14+6!博伊爾斯這個新秀值得期待!而他的女友同樣搶鏡!

      籃球大圖
      2026-05-05 11:26:52
      2026-05-05 20:31:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12573文章數 176461關注度
      往期回顧 全部

      科技要聞

      傳蘋果考慮讓英特爾、三星代工設備處理器

      頭條要聞

      煙花廠爆炸致26死61傷 湖南省委書記:令人非常痛心

      頭條要聞

      煙花廠爆炸致26死61傷 湖南省委書記:令人非常痛心

      體育要聞

      全世界都等著看他笑話,他帶國米拿下冠軍

      娛樂要聞

      英皇演唱會風波不斷!張敬軒成棄將

      財經要聞

      瀏陽煙花往事

      汽車要聞

      同比大漲190% 方程豹4月銷量29138臺

      態度原創

      房產
      時尚
      教育
      本地
      家居

      房產要聞

      五一樓市徹底明牌!塔尖人群都在重倉凱旋新世界

      夏天最經典的銀色,貴氣十足!

      教育要聞

      情緒是心靈的呼吸,孩子發脾氣怨恨父母,是一件好事!

      本地新聞

      用青花瓷的方式,打開西溪濕地

      家居要聞

      靈動實用 生活藝術場

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻大战黑人白浆狂泄| 久久精品99国产国产精| 国产7色在线 | 国产| 天天日天天骚| 亚洲乱亚洲乱妇24p| 思思久久96热在精品国产| 亚洲精品mv免费网站| 国产精品综合久久久久久久免费| 亚洲国产成人精品激情资源9| 色婷婷亚洲综合五月| 日本一区中文字幕| 丁香六月婷婷久久综合| 高清大学生毛片一级| 天天狠天天添日日拍| 亚洲国产精品久久艾草| 人人妻人人做人人爽| 涩欲国产一区二区三区四区| 精品国产乱码久久久久久口爆 | 色偷偷男人的天堂亚洲av| 天天狠天天添日日拍| 情侣作爱视频网站| 中文字幕免费视频| 免费无码专区毛片高潮喷水| 久久99国产一区二区三区| 免费看无码网站成人A片| 国产日韩高清av在线观看| 乱人伦中文字幕在线| 亚洲成人av在线系列| 黑人成人网| 伊人综合成人| 久久狠狠色噜噜狠狠狠狠97视色| 韩日美无码精品无码| 欧美性性性性xxxxoooo| 国产欧美另类精品久久久 | 三级网站| 亚洲一区二区三区色视频| 熟女Www亚洲国产W| AV激情亚洲男人的天堂| 俄罗斯小屁孩cao大人免费 | 人妻熟人中文字幕一区二区 | 国产精品xxx大片免费观看|