<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>

<p id="tp1vn"></p>

<sub id="tp1vn"><p id="tp1vn"></p></sub>

<u id="tp1vn"><rp id="tp1vn"></rp></u>

<meter id="tp1vn"></meter>

<wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>

日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao

<s id="zmkh4"><li id="zmkh4"></li></s>

<sub id="zmkh4"></sub>

<sub id="zmkh4"></sub>

<legend id="zmkh4"><track id="zmkh4"><menuitem id="zmkh4"></menuitem></track></legend>

<sub id="zmkh4"></sub>

<thead id="zmkh4"></thead>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

不好！1930年的AI都來搶程序員飯碗了

1930年的AI都來搶程序員飯碗了

2026-05-03 17:40:17　來源: 量子位

北京舉報

0

分享至

Jay 發自凹非寺
量子位 | 公眾號 QbitAI

勞動節，馬上100歲的vintage大模型也得勞動。

是的，有人給只有1930年知識的大模型，微調成軟件工程師了……

過程比想象中輕松，僅用250個訓練樣本，強悍的老頭便解決了自己人生中的第一個編程問題——

給xarray庫打了個補丁。

一個連電視機都沒見過的AI，現在也開始跟Claude們「學壞」，要跟程序員搶飯碗了。（bushi）

中古硅基軟件工程師

先補充下背景，1930是誰？

這是最近爆火的「老頭AI」，全名叫talkie-1930-13b。

操盤手是AI研究員Nick Levine、多倫多大學副教授David Duvenaud，以及大家熟悉的那位——真·GPT系列之父Alec Radford。

而他們對老頭最有趣的設計，就是其訓練數據有條鐵律：1931年1月1日之后的任何一個字，全部不準進！

是的，它不知道電視機，不知道互聯網，更不知道二戰怎么收場……

老頭的世界，永遠停在了1930年12月31日的午夜。

但讓全網「癱軟」的點在于，就這么個老古董，當扔給它一道Python編程題時，這個跨越近百年的「過去之靈」，竟然寫出了人生第一行Python代碼。

離離原上譜。

如今，老頭再次發力。

有人對Alec Radford的這個1930 vintage LLM做了微調，讓它去解SWE-bench上的真實軟件工程問題。

誰曾想，真讓老頭干成了。

250個訓練樣本之后，它落地了第一個fix——一個針對xarray庫的小補丁。

百歲老人，硬核上崗。

對了，團隊放出了老頭在落地這個xarray庫補丁的全過程。

說實話，如果以看前沿LLM的標準，這個demo看著真有點惱火。

一個簡單的問題，老頭足足花了49輪才搞定，又長又慢。

其中有些輪次實在看不下去了，真的太笨了，著急死了，但你又不好意思對老頭發脾氣。

但，這在某些時刻，反而讓人更興奮。跟看爽文一樣。

我舉個最「直接、不繞彎」的例子。（bushi）

老頭一開始其實搞砸了。

在第12輪對話的時候，它嘗試apply patch失敗了。

代碼可以報錯，但，老兵不死。

老頭沒有放棄，它仍在繼續嘗試，直到終于意識到自己錯在哪……

然后，在第44輪，它給修好了！！

我知道，fix本身很簡單，別說AI SOTA了，代碼水平跟小白比估計都夠嗆。

但真正重要的，是老頭在整個解題過程中的思考。

這個過程展示出的那種推理能力，跟我們在現代模型上看到的如出一轍。

一個1930年的模型，也會試錯，會反思，會自我修正。

demo之外，benchmark的表現同樣亮眼。

當微調時的訓練數據規模擴展到大約75K條trajectory，也就是10億token的時候，模型在SWE-bench-Verified上達到了4.5%的pass@1。

要知道，它原來在HumanEval上才4%的pass@100。這進步幅度相當可觀。

雖然絕對值還很低，但對一個1930年知識模型來說，已經很離譜了。

更有意思的是另一個對照實驗。

事實上，團隊還同時給老頭訓練了一個兄弟模型，叫talkie-web，這個模型是在互聯網數據上預訓練的。

同樣的微調配方，talkie-web在SWE-bench-Verified上的成績是5.5%的。

沒錯，即便團隊偏心，給孿生兄弟加上互聯網數據，也就比老頭高了1個百分點。

以上結果，歡迎復現。

這不是什么穿越爽文，團隊已經在GitHub上開源了項目，鏈接放在文章結尾，感興趣的朋友可以去跑跑看。

團隊自己也很興奮，在README里喊話：

如果你手頭有更多算力，我們很想看到1930模型和互聯網模型在后訓練持續擴展時的完整scaling曲線對比。

想看想看，這可比單純秀肌肉的benchmark有意思多了。

什么是智能？

團隊并沒有剖析背后的原因，但我看了不少網友在帖子下面的評論，覺得這是一個值得討論的話題。

我們一直以為，AI需要吃掉整個互聯網才能變聰明。

但如果一個只讀過1930年以前書的模型，經過一點點后訓練就能寫代碼修bug……

那我們對「什么是智能」的理解，是不是也得重新想想？

4.5%的pass@1，放在今天的SOTA面前當然不夠看。但它證明的那件事，比任何benchmark分數都重要。

一個1930年代的人，如果擁有幾乎相同的教育體系，完全可以理解現代軟件工程。

一百年前的數據量，加上正確的后訓練方法，就足以產生現代意義上的推理。

智能的瓶頸，或許從來不在于預訓練數據的多少。

你不需要一個訓練過所有知識的模型，它只需要具備基本的語言理解能力，這就夠了。

或許，當我們在Scaling路上一路狂奔的間隙，也可以稍微停一停，抬起頭來跟身邊人侃侃大山、扯扯淡——

誒，你說……
智能的本質，到底是什么？

GitHub：
https://github.com/RicardoDominguez/talkie-coder

參考鏈接：
[1]
https://x.com/rdolmedo_/status/2050665193374732430?s=20
[2]
https://github.com/RicardoDominguez/talkie-coder

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

中國創造一門新編程語言的黃金時代來了？

虎嗅APP 2025-12-23 03:54:05
0 跟貼 0
AI自主開發團隊崛起，一個月搞定傳統團隊數月工作量

DeepTech深科技 2026-04-01 21:07:59
0 跟貼 0

AI自己造AI，概率60%，2028年底前！Anthropic聯創坐不住了

新智元 2026-05-05 20:07:09
0 跟貼 0

Anthropic聯創定下deadline：2028年AI實現自我進化，沒有人類了

機器之心Pro 2026-05-05 15:18:37
3 跟貼 3
這套題，GPT-5.5、Opus 4.7加起來沒考到1分，人類卻拿了滿分100

機器之心Pro 2026-05-03 09:22:46
2 跟貼 2

AP2O-Coder 讓大模型擁有「錯題本」，像人類一樣按題型高效刷題

機器之心Pro 2026-01-14 15:07:07
0 跟貼 0

由豆包付費想到，AI到底會長成一門什么生意

鈦媒體APP 2026-05-05 17:33:14
0 跟貼 0
OpenAI“復活”了QQ寵物，網友直接玩瘋

愛范兒 2026-05-03 16:25:25
11 跟貼 11

支持遠程操控和通用GUI操作3

機器之心Pro 2026-03-02 13:36:13
0 跟貼 0
大型掛機現場：馬斯克的55萬英偉達GPU，利用率才11%

機器之心Pro 2026-05-05 20:02:20
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
75 跟貼 75
Claude Code 源碼泄露了，有人用Python復刻了一個極簡版

機器之心Pro 2026-04-02 11:30:10
4 跟貼 4
“DeepSeek版Claude Code”，Github 2.3k星

量子位 2026-05-04 14:03:17
15 跟貼 15
男子撿到別人手機，發現失主不停打軟件電話，自己真是有心無力！

家有臭寶 2026-05-02 17:35:16
850 跟貼 850
1美元買10顆星？頂會曝出GitHub假星灰產，熱門倉庫或藏木馬

新智元 2026-05-05 13:15:38
0 跟貼 0
程序員求職困局：代碼寫得好為何拿不到offer

心事寄山海 2026-05-05 00:08:08
0 跟貼 0
莫氏雞煲上線湯料包5分鐘售罄4000多份，累計賣出4萬多份，總銷售額破160萬元，記者實測：1分鐘搶到兩包

極目新聞 2026-05-04 09:46:46
8519 跟貼 8519
我扒了50個被獵頭發掘的程序員檔案，發現"少寫"反而更值錢

賽博蘭博 2026-05-01 06:15:27
0 跟貼 0
VinciCoder：多模態統一代碼生成框架和視覺反饋強化學習

機器之心Pro 2025-11-17 14:12:38
0 跟貼 0
步槍：“上次壓我飯碗派出所沒有立案，這次必須嚴懲兇手！”

易欣看大世界 2026-05-03 02:45:12
4 跟貼 4
吳宜澤斯諾克世錦賽奪冠成首位00后斯諾克世錦賽冠軍

央視新聞客戶端 2026-05-05 05:39:09
1081 跟貼 1081
全國人民感謝上海，樓市數據真相

王波說房 2026-05-01 16:33:41
13 跟貼 13
當年百廢待興之時就缺程序員

喜蕃影視 2026-05-04 10:25:22
1 跟貼 1
5月5日5點55分，GPT-5.5自己選客人開派對！Codex反超Claude Code

新智元 2026-05-05 17:07:29
0 跟貼 0
景區裝電梯無痛爬山被質疑過度開發

極目新聞 2026-05-02 17:18:12
4162 跟貼 4162
不要急著解決問題

劉潤 2026-05-05 11:21:58
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
用AI復刻童年游戲，零成本找回老玩家快樂

爬蟲飼養員 2026-05-05 10:29:32
0 跟貼 0
萌娃和母親聊天，下秒動作老要震驚住，保命飯碗可不能丟

青夢水生 2026-05-04 19:32:00
1 跟貼 1
“我在大廠的1480天：焦慮如何證明自己有價值”

觀察者網 2026-05-03 14:21:06
3 跟貼 3
世界模型讓智能體預知未來？這篇新范式研究給了一個反直覺的答案

機器之心Pro 2026-05-05 15:17:00
0 跟貼 0
程序員買下3套江景房就出國，一走就是20年，回來一看全沒了

溫情故事匣 2026-05-05 14:43:42
0 跟貼 0
37歲開源神作突然更新：開發者還在用30年前的系統

賽博蘭博 2026-05-05 14:50:54
1 跟貼 1
不要拿愛好挑戰別人的飯碗，就這技術，去奧運會妥妥的拿金牌！

蒼狗愛搞笑 2026-05-04 16:06:37
1 跟貼 1
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
美空軍加油機飛越波斯灣時發出緊急代碼7700，請求立即降落

上觀新聞 2026-05-05 16:24:05
0 跟貼 0
媒體：霍爾木茲海峽一聲驚雷炸響戰爭的引信已經點燃

國是直通車 2026-05-04 21:08:48
21 跟貼 21
俄羅斯宣布與烏克蘭實施勝利日停火

財聯社 2026-05-05 09:57:03
2670 跟貼 2670

活塞vs騎士次輪前瞻：年輕人欲沖破重圍老兵們要證明自己

活塞vs騎士次輪前瞻：年輕人欲沖破重圍老兵們要證明自己

北青網-北京青年報

2026-05-05 19:44:02

大哥催我去銀行簽字，我不解：簽什么？侄子含糊說道

大哥催我去銀行簽字，我不解：簽什么？侄子含糊說道

小秋情感說

2026-05-05 15:53:40

浙江麗水一吊車吊鋼管時，管子突然從高空散落砸中多車，街道辦：未有人員傷亡，系吊裝時未將鋼管捆牢，受損車輛后續將由公安部門協調處理

浙江麗水一吊車吊鋼管時，管子突然從高空散落砸中多車，街道辦：未有人員傷亡，系吊裝時未將鋼管捆牢，受損車輛后續將由公安部門協調處理

瀟湘晨報

2026-05-05 17:09:08

【人物】“00后”冠軍吳宜澤：一個中國斯諾克家庭為他押上了一切

【人物】“00后”冠軍吳宜澤：一個中國斯諾克家庭為他押上了一切

界面新聞

2026-05-05 11:06:08

老祖宗120字千古奇文《道》：道盡天地人性、權謀財富。建議收藏

老祖宗120字千古奇文《道》：道盡天地人性、權謀財富。建議收藏

瓜哥的動物日記

2026-05-05 02:09:17

世錦賽落幕！誕生4個贏家+3個輸家，吳宜澤、趙心童、墨菲全在列

世錦賽落幕！誕生4個贏家+3個輸家，吳宜澤、趙心童、墨菲全在列

侃球熊弟

2026-05-05 05:52:45

退休7年，回工作三十多年的老單位辦事3次，才懂得什么叫人走茶涼

退休7年，回工作三十多年的老單位辦事3次，才懂得什么叫人走茶涼

小馬達情感故事

2026-05-04 18:25:06

轉行采購商？前NBA球員班巴現身廣交會，曬出參展證件

轉行采購商？前NBA球員班巴現身廣交會，曬出參展證件

懂球帝

2026-05-05 14:34:12

今年五一，樓市扯下了最后遮羞布

今年五一，樓市扯下了最后遮羞布

房產老司機

2026-05-05 11:35:27

“誰會穿40碼的鞋啊？”女子正常咨詢鞋碼卻被男主播嘲諷，商家致歉：永久除名涉事男主播，在當場直播的消費者憑截圖全額原路退款

“誰會穿40碼的鞋啊？”女子正常咨詢鞋碼卻被男主播嘲諷，商家致歉：永久除名涉事男主播，在當場直播的消費者憑截圖全額原路退款

都市快報橙柿互動

2026-05-05 12:31:38

五一假期廣州山姆搶榴蓮！現場堪比“水果界神仙打架”

五一假期廣州山姆搶榴蓮！現場堪比“水果界神仙打架”

樓主說樓市

2026-05-04 22:15:28

和原生父母斷交，瓦爾迪：不想再被充滿欺騙和隱瞞的親情困擾

和原生父母斷交，瓦爾迪：不想再被充滿欺騙和隱瞞的親情困擾

懂球帝

2026-05-05 12:26:13

黃仁勛點名Anthropic達里奧，別一當CEO，就開「上帝視角」

黃仁勛點名Anthropic達里奧，別一當CEO，就開「上帝視角」

機器之心Pro

2026-05-05 11:11:08

“中年返貧三件套”，正在吞掉一代人的存款

“中年返貧三件套”，正在吞掉一代人的存款

十點讀書

2026-04-18 18:36:15

鄭麗文徹底撕破臉，扯下藍營最后一塊遮羞布！

鄭麗文徹底撕破臉，扯下藍營最后一塊遮羞布！

達文西看世界

2026-05-05 10:58:59

四年暴跌120億，微信是怎么“殺死”口香糖行業的？

四年暴跌120億，微信是怎么“殺死”口香糖行業的？

流蘇晚晴

2026-04-19 20:34:47

航拍湖南瀏陽煙花廠爆炸事故現場：專業人員進入核心區域救援

航拍湖南瀏陽煙花廠爆炸事故現場：專業人員進入核心區域救援

新京報

2026-05-05 09:46:42

南海突發！菲攔截我國4艘科考船，司令態度囂張，美暗撐菲方挑釁

南海突發！菲攔截我國4艘科考船，司令態度囂張，美暗撐菲方挑釁

鐵錘簡科

2026-05-05 16:06:27

紐約時報｜沒有“基本盤”的代價：斯塔默給美國民主黨敲響的警鐘

紐約時報｜沒有“基本盤”的代價：斯塔默給美國民主黨敲響的警鐘

時尚的弄潮

2026-05-05 17:47:32

季后賽場均14+6！博伊爾斯這個新秀值得期待！而他的女友同樣搶鏡！

季后賽場均14+6！博伊爾斯這個新秀值得期待！而他的女友同樣搶鏡！

籃球大圖

2026-05-05 11:26:52

追蹤人工智能動態

12573文章數 176461關注度

往期回顧全部

科技要聞

傳蘋果考慮讓英特爾、三星代工設備處理器

頭條要聞

煙花廠爆炸致26死61傷湖南省委書記：令人非常痛心

頭條要聞

煙花廠爆炸致26死61傷湖南省委書記：令人非常痛心

體育要聞

全世界都等著看他笑話，他帶國米拿下冠軍

娛樂要聞

英皇演唱會風波不斷！張敬軒成棄將

財經要聞

瀏陽煙花往事

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

時尚

教育

本地

家居

房產要聞

五一樓市徹底明牌！塔尖人群都在重倉凱旋新世界

夏天最經典的銀色，貴氣十足！

教育要聞

情緒是心靈的呼吸，孩子發脾氣怨恨父母，是一件好事！

本地新聞

用青花瓷的方式，打開西溪濕地

家居要聞

靈動實用生活藝術場

寂然無界簡潔風格
江景風格流動的秩序
自然肌理溫潤美學

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：人妻大战黑人白浆狂泄| 久久精品99国产国产精| 国产7色在线 | 国产| 天天日天天骚| 亚洲乱亚洲乱妇24p| 思思久久96热在精品国产| 亚洲精品mv免费网站| 国产精品综合久久久久久久免费| 亚洲国产成人精品激情资源9| 色婷婷亚洲综合五月| 日本一区中文字幕| 丁香六月婷婷久久综合| 高清大学生毛片一级| 天天狠天天添日日拍| 亚洲国产精品久久艾草| 人人妻人人做人人爽| 涩欲国产一区二区三区四区| 精品国产乱码久久久久久口爆 | 色偷偷男人的天堂亚洲av| 天天狠天天添日日拍| 情侣作爱视频网站| 中文字幕免费视频| 免费无码专区毛片高潮喷水| 久久99国产一区二区三区| 免费看无码网站成人A片| 国产日韩高清av在线观看| 乱人伦中文字幕在线| 亚洲成人av在线系列| 黑人成人网| 伊人综合成人| 久久狠狠色噜噜狠狠狠狠97视色| 韩日美无码精品无码| 欧美性性性性xxxxoooo| 国产欧美另类精品久久久 | 三级网站| 亚洲一区二区三区色视频| 熟女Www亚洲国产W| AV激情亚洲男人的天堂| 俄罗斯小屁孩cao大人免费 | 人妻熟人中文字幕一区二区 | 国产精品xxx大片免费观看|