<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      GPT之父把AI扔回1930年:沒(méi)見(jiàn)過(guò)一行代碼,卻「發(fā)明」了Python!

      0
      分享至


      新智元報(bào)道

      編輯:桃子

      【新智元導(dǎo)讀】你敢信?一個(gè)活在95年前的AI,竟寫(xiě)出了Python代碼。GPT之父下場(chǎng),用2600億Token煉出了一個(gè)「老古董」AI。

      一個(gè)從未見(jiàn)過(guò)電腦的AI,竟寫(xiě)出了現(xiàn)代編程語(yǔ)言!

      這可不是什么科幻的設(shè)定。

      就在今天,GPT之父Alec Radford帶隊(duì)發(fā)布了震撼全網(wǎng)的「talkie」——

      總參數(shù)130億,一個(gè)只讀過(guò)1931年之前舊文獻(xiàn)的大模型。


      talkie的「世界觀」(全部訓(xùn)練數(shù)據(jù)),被凍結(jié)在了1930年12月31日。

      那個(gè)時(shí)代,沒(méi)有互聯(lián)網(wǎng),沒(méi)有維基百科,更沒(méi)有任何現(xiàn)代代碼。

      它讀過(guò)的最「新」的東西,是近百年前的專(zhuān)利書(shū)、科學(xué)期刊、禮儀手冊(cè)和私人書(shū)信。


      但就是這樣一個(gè)「活在95年前」的AI,居然能寫(xiě)出Python代碼。




      沒(méi)學(xué)過(guò)編程,

      卻寫(xiě)出了Python,理解了「逆函數(shù)」

      talkie最炸裂的發(fā)現(xiàn),藏在一組編程測(cè)試?yán)铩?/p>

      Alec Radford團(tuán)隊(duì)突發(fā)奇想,用HumanEval去測(cè)試talkie的編程能力——

      給它幾個(gè)Python函數(shù)作為上下文示例,然后讓它解決新的編程問(wèn)題。

      要知道,talkie的訓(xùn)練數(shù)據(jù)中,沒(méi)有任何一行現(xiàn)代代碼。連數(shù)字計(jì)算機(jī)的概念,都不存在于它的「知識(shí)體系」中。


      但結(jié)果令人震驚,通過(guò)少樣本學(xué)習(xí),它竟然能寫(xiě)出正確的Python程序。

      雖然目前只能完成簡(jiǎn)單的單行程序,比如兩個(gè)數(shù)相加,或者對(duì)上下文示例做微小修改。


      Alec Radford:GPT、CLIP、Whisper背后核心大佬

      但其中一個(gè)案例讓人印象深刻:給定一個(gè)旋轉(zhuǎn)密碼的編碼函數(shù)encode_shift,它的邏輯是把每個(gè)字母在字母表中向后移動(dòng)5位。

      talkie自己寫(xiě)出了對(duì)應(yīng)的解碼函數(shù),整個(gè)修改只有一個(gè)字符:把+5改成了-5,加號(hào)換成了減號(hào)。

      它真正理解了「逆函數(shù)」:加密是加,解密就是減」這個(gè)逆運(yùn)算的概念。


      傳送門(mén):https://talkie-lm.com/chat

      2600億Token,專(zhuān)喂百年前的紙

      Alec Radford團(tuán)隊(duì)為什么要費(fèi)這么大勁,手動(dòng)OCR近百年前的物理文獻(xiàn),來(lái)訓(xùn)練一個(gè)「老古董」?

      因?yàn)樗麄円卮餉I領(lǐng)域最核心的一個(gè)問(wèn)題:LLM的能力,到底是推理,還是背誦?

      talkie可以寫(xiě)出Python,證明了——

      LLM可以用19世紀(jì)的知識(shí)做推理,并非只是檢索。不得不說(shuō),這才是真正意義上的「泛化」!


      再來(lái)看talkie的訓(xùn)練語(yǔ)料庫(kù),可以稱(chēng)得上是一個(gè)龐大的「考古工程」。

      它的訓(xùn)練語(yǔ)料達(dá)到了2600億token,全部來(lái)自1931年之前的英語(yǔ)文本,包括書(shū)籍、報(bào)紙、期刊、科學(xué)論文、美國(guó)專(zhuān)利、判例法。

      要知道,這么多文本皆需要從實(shí)體文檔掃描并OCR轉(zhuǎn)錄。


      而選擇1930年作為截止日期,原因很實(shí)際:這是美國(guó)公共版權(quán)法(public domain)的分界線。

      不過(guò),這帶來(lái)了一個(gè)意想不到的瓶頸:數(shù)據(jù)質(zhì)量。

      團(tuán)隊(duì)做了一組對(duì)照實(shí)驗(yàn):用傳統(tǒng)OCR系統(tǒng)轉(zhuǎn)錄的舊文本訓(xùn)練模型,和用人工轉(zhuǎn)錄的同一批文本訓(xùn)練模型相比,前者的學(xué)習(xí)效率只有后者的30%。

      簡(jiǎn)單的正則清洗能把這個(gè)數(shù)字提升到70%,但仍然有巨大的差距。


      在評(píng)估talkie性能實(shí)驗(yàn)中,團(tuán)隊(duì)又打造了一個(gè)「現(xiàn)代孿生體」(talkie-web-13b-base)。

      后者用FineWeb的現(xiàn)代網(wǎng)絡(luò)數(shù)據(jù)訓(xùn)練,兩款模型用了「相同的算力」。

      顯而易見(jiàn),在核心語(yǔ)言理解、數(shù)學(xué)推理任務(wù)上,talkie的表現(xiàn)與現(xiàn)代孿生體相當(dāng)。

      但在通用知識(shí)評(píng)測(cè)上,即使剔除了對(duì)1930年視角來(lái)說(shuō)「穿越」的題目,talkie仍然落后。


      團(tuán)隊(duì)?wèi)岩桑@跟數(shù)據(jù)質(zhì)量有很大關(guān)系。

      為此,Radford團(tuán)隊(duì)計(jì)劃從零開(kāi)始訓(xùn)練「復(fù)古OCR系統(tǒng)」,專(zhuān)門(mén)用于重新轉(zhuǎn)錄1931年前的文本。

      用最現(xiàn)代的Claude 4.6

      訓(xùn)練最古老的AI

      talkie的「后訓(xùn)練」方案也很有意思。

      要把一個(gè)只讀過(guò)舊書(shū)的「基礎(chǔ)模型」變成能對(duì)話的聊天機(jī)器人,根本沒(méi)有現(xiàn)成的指令微調(diào)的數(shù)據(jù)可用。


      團(tuán)隊(duì)的做法是,從1930年之前的結(jié)構(gòu)化參考書(shū)中提取指令-回答對(duì):禮儀手冊(cè)、書(shū)信寫(xiě)作指南、菜譜、百科全書(shū)、詩(shī)歌集。

      然后,再用這些「復(fù)古教材」做第一輪SFT。

      在接下來(lái)的RLAIF階段,團(tuán)隊(duì)用在線DPO來(lái)提升talkie的指令遵循能力,Claude Sonnet 4.6作為裁判。

      一個(gè)2026年最先進(jìn)的AI,給一個(gè)「活在」1930年的AI打分。

      最終的精調(diào)階段,團(tuán)隊(duì)甚至用Claude Opus 4.6生成多輪對(duì)話數(shù)據(jù),來(lái)打磨talkie的對(duì)話能力。

      訓(xùn)練過(guò)程中,Claude對(duì)talkie指令遵循能力的評(píng)分從2.0提升到了3.4(滿分5分)。

      最后一步,用Claude Opus 4.6與talkie進(jìn)行多輪合成對(duì)話,再做一輪拒絕采樣+SFT,打磨對(duì)話能力。

      團(tuán)隊(duì)也坦承了一個(gè)諷刺之處:用現(xiàn)代大模型訓(xùn)練一個(gè)本該凍結(jié)在1930年的模型,本身就是一種「時(shí)間污染」。

      他們的長(zhǎng)期目標(biāo)是用復(fù)古基座模型自身作為裁判,實(shí)現(xiàn)完全「自舉式」的后訓(xùn)練流水線。

      值得一提的是,talkie的7B版本在RL訓(xùn)練后出現(xiàn)了一個(gè)搞笑的副作用——

      它開(kāi)始用列表體說(shuō)話,純屬是被現(xiàn)代AI的「壞習(xí)慣」傳染了。

      AI界最干凈的一次「開(kāi)卷考試」

      研究團(tuán)隊(duì)還做了另一個(gè)有趣的實(shí)驗(yàn)。

      他們從《紐約時(shí)報(bào)》的「歷史上的今天」欄目中提取了近5000條歷史事件描述,計(jì)算talkie對(duì)每條事件的「驚訝度」。


      結(jié)果非常清晰,1930年之前的事件,talkie不太驚訝。1930年之后的事件,驚訝度開(kāi)始攀升。

      到了1950年代和1960年代達(dá)到峰值,然后趨于平穩(wěn)。

      這條曲線本身就是一個(gè)關(guān)于預(yù)測(cè)能力的實(shí)驗(yàn)。隨著模型規(guī)模增大,這條曲線會(huì)怎么變化?

      谷歌DeepMind CEO Demis Hassabis曾提出一個(gè)思想實(shí)驗(yàn)——

      一個(gè)只訓(xùn)練到1911年的模型,能不能像愛(ài)因斯坦在1915年那樣獨(dú)立發(fā)現(xiàn)廣義相對(duì)論?

      talkie目前當(dāng)然做不到。但它提供了一條路徑,往上Scale就行了。

      今夏擴(kuò)展到GPT-3級(jí)別

      talkie目前是130億參數(shù),團(tuán)隊(duì)的路線圖相當(dāng)激進(jìn)——

      今年夏天,發(fā)布GPT-3級(jí)別的復(fù)古模型。


      更遠(yuǎn)期的目標(biāo):將語(yǔ)料擴(kuò)展到超過(guò)一萬(wàn)億token,理論上足夠訓(xùn)練一個(gè)GPT-3.5級(jí)別的模型,能力接近初代ChatGPT。

      一個(gè)凍結(jié)在1930年的ChatGPT。

      參考資料:

      https://x.com/status_effects/status/2048878495539843211?s=20

      https://talkie-lm.com/introducing-talkie

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      地位不穩(wěn)了,掘金約基奇季后賽數(shù)據(jù)或?qū)⒂绊懫錃v史最佳球員的討論

      地位不穩(wěn)了,掘金約基奇季后賽數(shù)據(jù)或?qū)⒂绊懫錃v史最佳球員的討論

      好火子
      2026-05-02 00:57:59
      蘭州一餐館懸掛錢(qián)學(xué)森和袁隆平照片,顧客直呼“這才是真正的明星”,老板回應(yīng):因?yàn)橛兴麄兾覀儾庞酗埑?>
    </a>
        <h3>
      <a href=極目新聞
      2026-05-01 20:08:28
      “骨盆前傾成這樣,還不去醫(yī)院?”家長(zhǎng)曬一年級(jí)女兒體態(tài),被群嘲

      “骨盆前傾成這樣,還不去醫(yī)院?”家長(zhǎng)曬一年級(jí)女兒體態(tài),被群嘲

      妍妍教育日記
      2026-04-24 11:15:25
      洛陽(yáng)白馬寺發(fā)布鄭重聲明:不少游客因通過(guò)非官方第三方渠道購(gòu)買(mǎi)非法倒賣(mài)的預(yù)約門(mén)票,導(dǎo)致無(wú)法正常入寺,切勿輕信

      洛陽(yáng)白馬寺發(fā)布鄭重聲明:不少游客因通過(guò)非官方第三方渠道購(gòu)買(mǎi)非法倒賣(mài)的預(yù)約門(mén)票,導(dǎo)致無(wú)法正常入寺,切勿輕信

      極目新聞
      2026-04-29 18:10:47
      女大學(xué)生泰國(guó)旅游被轉(zhuǎn)賣(mài)緬甸園區(qū),照片流出長(zhǎng)這么好看被折磨太慘

      女大學(xué)生泰國(guó)旅游被轉(zhuǎn)賣(mài)緬甸園區(qū),照片流出長(zhǎng)這么好看被折磨太慘

      老貓觀點(diǎn)
      2026-04-27 07:20:19
      湖人又瘋了!?要先續(xù)約他!在詹姆斯之前!

      湖人又瘋了!?要先續(xù)約他!在詹姆斯之前!

      柚子說(shuō)球
      2026-05-01 22:47:38
      不是克洛普,也不是穆帥!曝皇馬新帥頭號(hào)目標(biāo):鎖定世界冠軍主帥

      不是克洛普,也不是穆帥!曝皇馬新帥頭號(hào)目標(biāo):鎖定世界冠軍主帥

      瀾歸序
      2026-05-02 03:11:02
      11年不敗神話延續(xù)!利雅得勝利2-0完勝吉達(dá)國(guó)民,刷多項(xiàng)隊(duì)史紀(jì)錄

      11年不敗神話延續(xù)!利雅得勝利2-0完勝吉達(dá)國(guó)民,刷多項(xiàng)隊(duì)史紀(jì)錄

      星耀國(guó)際足壇
      2026-05-01 12:01:39
      中美高層通話重磅表態(tài)!要求美國(guó)作出抉擇,不得阻撓中國(guó)統(tǒng)一

      中美高層通話重磅表態(tài)!要求美國(guó)作出抉擇,不得阻撓中國(guó)統(tǒng)一

      起喜電影
      2026-05-01 20:37:32
      4499元!蘋(píng)果正式官宣:5月1日,兩款新機(jī)長(zhǎng)期斷貨!

      4499元!蘋(píng)果正式官宣:5月1日,兩款新機(jī)長(zhǎng)期斷貨!

      搞機(jī)小帝
      2026-05-02 00:04:03
      注意!中老年男性有性生活和沒(méi)性生活,差別居然這么大?

      注意!中老年男性有性生活和沒(méi)性生活,差別居然這么大?

      皓皓情感說(shuō)
      2026-04-22 08:20:32
      滾回你自己的破國(guó)家!南非爆發(fā)大規(guī)模排外浪潮,暴力驅(qū)逐非法移民

      滾回你自己的破國(guó)家!南非爆發(fā)大規(guī)模排外浪潮,暴力驅(qū)逐非法移民

      十夏九漓
      2026-05-01 19:35:35
      無(wú)敵存在!成都蓉城一騎絕塵:中超敢在申花主場(chǎng)讓2追3,還有誰(shuí)?

      無(wú)敵存在!成都蓉城一騎絕塵:中超敢在申花主場(chǎng)讓2追3,還有誰(shuí)?

      足球大腕
      2026-05-01 22:44:51
      心碎!西湖首窩鴛鴦寶寶12只變0只,才6天就團(tuán)滅?真相讓人沉默

      心碎!西湖首窩鴛鴦寶寶12只變0只,才6天就團(tuán)滅?真相讓人沉默

      超人強(qiáng)動(dòng)物俱樂(lè)部
      2026-05-01 19:55:04
      中超金哨又惹爭(zhēng)議!讀秒漏判絕殺點(diǎn)球 津門(mén)虎官方質(zhì)疑 于根偉炮轟

      中超金哨又惹爭(zhēng)議!讀秒漏判絕殺點(diǎn)球 津門(mén)虎官方質(zhì)疑 于根偉炮轟

      我愛(ài)英超
      2026-05-01 22:47:48
      這下麻煩大了!不到24小時(shí),白冰再迎3大噩耗,個(gè)個(gè)戳他心窩

      這下麻煩大了!不到24小時(shí),白冰再迎3大噩耗,個(gè)個(gè)戳他心窩

      八斗小先生
      2026-04-29 16:16:19
      報(bào)道稱(chēng)自二戰(zhàn)結(jié)束以來(lái) 美國(guó)債首次超過(guò)經(jīng)濟(jì)總量

      報(bào)道稱(chēng)自二戰(zhàn)結(jié)束以來(lái) 美國(guó)債首次超過(guò)經(jīng)濟(jì)總量

      財(cái)聯(lián)社
      2026-05-01 22:12:15
      方媛帶3個(gè)孩子海邊度假,母女同框似姐妹,郭富城忙工作缺席

      方媛帶3個(gè)孩子海邊度假,母女同框似姐妹,郭富城忙工作缺席

      娛樂(lè)皮皮醬
      2026-05-01 11:09:32
      金靖近照大變樣!暴瘦脫相撞臉女星,網(wǎng)友:沒(méi)以前有靈氣了

      金靖近照大變樣!暴瘦脫相撞臉女星,網(wǎng)友:沒(méi)以前有靈氣了

      草莓解說(shuō)體育
      2026-05-01 14:41:01
      62339人,大連英博主場(chǎng)上座人數(shù)再創(chuàng)新高,位列中超歷史第3

      62339人,大連英博主場(chǎng)上座人數(shù)再創(chuàng)新高,位列中超歷史第3

      懂球帝
      2026-05-01 20:49:19
      2026-05-02 06:31:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      15111文章數(shù) 66826關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek發(fā)布多模態(tài)論文又連夜刪除

      頭條要聞

      美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買(mǎi)中國(guó)車(chē)"教程瘋傳

      頭條要聞

      美國(guó)也搞起"人肉代購(gòu)" "去墨西哥買(mǎi)中國(guó)車(chē)"教程瘋傳

      體育要聞

      無(wú)奈!約基奇:這要在塞爾維亞 全隊(duì)早被炒了

      娛樂(lè)要聞

      馬筱梅產(chǎn)后身材恢復(fù)超好 現(xiàn)身戶外直播

      財(cái)經(jīng)要聞

      GPU神話松動(dòng),AI真正的戰(zhàn)場(chǎng)變了

      汽車(chē)要聞

      限時(shí)9.67萬(wàn)起 吉利星越L/星瑞i-HEV智擎混動(dòng)上市

      態(tài)度原創(chuàng)

      房產(chǎn)
      家居
      數(shù)碼
      時(shí)尚
      公開(kāi)課

      房產(chǎn)要聞

      所有戶型全賣(mài)爆!海口TOP級(jí)豪宅,景觀樣板間五一全線開(kāi)放!

      家居要聞

      靈動(dòng)實(shí)用 生活藝術(shù)場(chǎng)

      數(shù)碼要聞

      索尼推出HT-A7100回音壁:搭60智能穹頂聲場(chǎng)2.0技術(shù),5282元

      這個(gè)夏天,彩色褲子又火了!

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 国产精品久久久久9999| ,国产乱人伦无码视频| 国产精品18久久久久久VR| 一区二区在线观看成人午夜| 中文字幕在线观看亚洲| 蓝莓5秒跳转隐藏通道2025| 欧美性大战xxxxx久久久| 18禁裸乳无遮挡啪啪无码免费| 2020国产精品精品国产| 亚洲精品午夜aaa级久久久久| 另类 专区 欧美 制服| 国产熟女第三页| 香蕉久久av一区二区三区| 人妻人人添人妻人人爱| 久久精品国产亚洲AV麻豆长发| 亚洲天堂中文字幕| 粗长巨龙挤进新婚少妇未删版| 国产呦精品一区二区三区网站| 免费av网站| 久久精品超碰av无码| 人妻少妇乱子伦精品无码专区毛片| 日韩免费无砖专区2020狼| 3P视频在线| 国产成人无码a区在线观看视频app| 日韩少妇激情一区二区| 欧美国产精品不卡在线观看| 嫩草研究院久久久精品| 日韩精品成人一区二区三区| 久久久精品免费视频| 亚洲综合第一区| 国产精品国产免费无码专区不卡| 国产jjizz女人多水喷水| 毛片av中文字幕一区二区| 无码三级中文字幕在线观看 | 亚洲中文字幕A| 中文有码人妻字幕在线| 精品伊人久久久大香线蕉天堂| 国产乱来乱子视频| 痉挛高潮喷水av无码免费| 成年大片免费视频播放手机不卡| 狠狠色综合网久久久久久|