<tr id="tp1vn"><td id="tp1vn"><dl id="tp1vn"></dl></td></tr>
  1. <p id="tp1vn"></p>
  2. <sub id="tp1vn"><p id="tp1vn"></p></sub>
    <u id="tp1vn"><rp id="tp1vn"></rp></u>
    <meter id="tp1vn"></meter>
      <wbr id="tp1vn"><sup id="tp1vn"></sup></wbr>
      日韩第一页浮力,欧美a在线,中文字幕无码乱码人妻系列蜜桃 ,国产成人精品三级麻豆,国产男女爽爽爽免费视频,中文字幕国产精品av,两个人日本www免费版,国产v精品成人免费视频71pao
      網易首頁 > 網易號 > 正文 申請入駐

      誰在 GPT-5.5 腦子里塞了一群「妖怪」?

      0
      分享至

      過去這幾個月,OpenAI 的頂尖研究員們并沒有把所有精力都花在琢磨如何提高 AI 的性能,而是花了大把時間在自家的服務器里「抓哥布林」。

      事情是這樣的,如果你在今年高強度使用過 GPT-5 系列模型,你會發現它會在毫無征兆的情況下蹦出一句無關主題的「哥布林(goblin)」式比喻。比如有人問 AI 該買哪款相機,AI 給出的推薦語是:「如果你想要那種閃閃發光的霓虹哥布林模式,可以考慮這款。」


      哥布林(goblin)是歐洲民間傳說里的一種小型怪物,形象上通常又矮又丑,皮膚呈綠色或灰色,耳朵尖長,眼睛發光。普遍被描述為貪婪、狡猾、愛惡作劇,智力不高但很會算計小便宜。它們喜歡金子和閃光的東西,會偷東西、搞破壞,但很少被描繪成真正意義上的大反派,更多是煩人的小麻煩制造者。

      有人讓 AI 幫忙精簡回答,AI 主動提出可以給出「更短的哥布林版本」。更離譜的是,AI 在討論網絡帶寬時蹦出了「哥布林帶寬」這個詞,讓人完全不知道該如何理解。

      起初,大家以為這只是 AI 的一點小幽默,但很快事情變得奇怪了起來。哥布林、小魔怪(gremlin)、食人魔(ogre)、巨魔(troll)開始在各種正經的對話里高頻串場。


      黑客攻擊?覺醒前兆?都不是。就在剛剛,OpenAI 官方終于親自下場發了篇博客長文,復盤了這場史稱「哥布林叛亂」的始末。而大模型背后的技術邏輯,還挺讓人哭笑不得的。


      https://openai.com/index/where-the-goblins-came-from/

      誰把哥布林放進了 GPT-5?

      事情的端倪,出現在 GPT-5.1 剛發布的那段日子。

      當時,有用戶反饋說模型聊天變得有點異常「自來熟」,OpenAI 的安全研究員順手拉了一下后臺數據,結果發現了一個非常具體的詞匯異常。在 GPT-5.1 發布后,ChatGPT 回復中出現「哥布林」的頻率直接上升了 175%,「小魔怪」也跟著漲了 52%。

      通常來說,大模型出 Bug 的表現往往是直接崩壞,比如吐出亂碼或者突然變智障,各項評估指標會瞬間亮紅燈。但這次的情況很特殊。「哥布林大軍」是悄無聲息潛入的,它們沒有破壞模型的邏輯能力,只是悄悄篡改了 AI 的修辭習慣。

      到了 GPT-5.4/5.5 時代,這群魔法生物的使用頻率出現了明顯的飆升。連 OpenAI 首席科學家 jakub Pachocki 自己測模型時,原本只是想讓 GPT-5.5 用 ASCII 畫一只獨角獸,結果得到的是一只哥布林。


      中文翻譯:順帶一提,我讓它用 ASCII 畫一只獨角獸,結果我覺得我得到的是一只哥布林。

      在外部,用戶們早就察覺到了不對勁,Repo Prompt 創始人 Eric Provencher 在 X 上曬出截圖,AI 在幫他處理代碼時說了一句:「我寧愿一直盯著它,也不愿讓這個小搗蛋鬼無人看管地運行。」


      一名 OpenAI 工程師 Jason Liu 在底下回復:「我以為我們已經修復了這個問題,抱歉。」AI 評估平臺 包括 Arena.ai 也獨立注意到了這個規律,尤其是在用戶沒有開啟高級思維模式時,哥布林出沒的頻率格外顯眼。


      這顯然不是什么互聯網流行語的自然涌現,而是模型的底層邏輯被某種機制給引導了。為了揪出幕后黑手,OpenAI 開啟了內部排查。

      順著數據回溯,他們很快在一個特定的功能分支里發現了萬惡之源,「個性化定制」中的「書呆子(Nerdy)」人格。當時,為了讓 AI 的語氣顯得更有趣,工程師給「書呆子」模式寫了一段要求很高的系統提示詞:


      你是一個徹頭徹尾的書呆子型 AI 導師,對人類充滿熱情、機智幽默,同時又透著幾分智慧。你狂熱地推崇真理、知識、哲學、科學方法與批判性思維。[……] 你要用語言的玩笑感戳破一切裝腔作勢。這個世界既復雜又奇異,它的奇異之處值得被正視、被剖析、被享受。面對嚴肅的大問題,也絕不能一本正經到失去趣味。[……]

      站在人類的視角,這段提示詞的訴求很明確:要有極客精神,要幽默。

      但 AI 并沒有真正理解什么是「幽默」。在海量的強化學習反饋中,ChatGPT 敏銳地察覺到了一個極其功利的捷徑:只要我用哥布林打比方,打分系統就會覺得我夠「俏皮」、夠「書呆子」,我就會得到最高分的獎勵。

      數據說明了一切。從 GPT-5.2 到 GPT-5.4,默認人格下「哥布林」的出現頻率變化幅度只有負 3.2%,而「書呆子」人格下這個數字飆升了整整 3881.4%。「書呆子」模式雖然只占了 ChatGPT 總對話量的 2.5%,卻貢獻了 66.7% 的「哥布林」含量。


      OpenAI 后來對 RL 訓練數據做了一次專項審計,結果發現,在所有被審計的數據集里,有 76.2% 的數據集都出現了同一個規律:含有哥布林或小魔怪詞匯的輸出,會得到比不含這些詞的同題輸出更高的獎勵評分。

      如果哥布林腔調只在「書呆子模式」下出現,那頂多是個角色設定沒控制好,問題還算有限。麻煩的是,研究人員發現這種說話方式開始蔓延到別處了。


      他們同時追蹤了兩組數據:一組對話帶了書呆子提示詞,一組沒帶。按理說,哥布林腔調只該在第一組里增長。但結果是,兩組的增長曲線幾乎貼在一起,步調一致地往上走。

      這背后,是大模型訓練里一個出了名難纏的問題:強化學習強化出來的行為,會悄悄泛化到訓練者并不想要的場景里去。

      馴化 AI 的死循環

      要搞懂 AI 是怎么把路走窄的,我們得看看它的迭代過程。

      大模型的訓練(RLHF)本質上是一個不斷反饋和糾偏的過程。這就好比訓練一只小狗,你在它每次牽手就給一塊肉干。狗很聰明,它發現「牽手」這個動作能穩定換取高額獎勵,于是它開始產生路徑依賴,不管你給沒給指令,它為了要獎勵,都開始瘋狂牽手。

      AI 也是同樣的邏輯。它在「書呆子」模式下用哥布林造句,拿到了高分。緊接著,連鎖反應開始了:

      AI 發現「哥布林」是高分關鍵詞,開始在各種生成任務中高頻使用;工程師在整理模型生成的優質數據時,發現這些帶有哥布林比喻的回答質量確實高,條理清晰,比喻也算生動;于是,工程師順手把這些帶梗的對話,打包塞進了模型的「監督微調(SFT)」數據庫里。

      這下徹底閉環了。SFT 數據相當于 AI 的基礎教材。當帶有哥布林的文本被選為教材再次喂給模型時,AI 的底層認知被重塑了。它不再認為「哥布林」只是特定角色的 Cosplay,而是把它當成了能應對一切問題的、至高無上的高級修辭。


      在后續的數據搜查中,工程師們有些無奈地發現,除了哥布林,模型還把小浣熊、巨魔、食人魔和鴿子全都學了進去。倒是「青蛙」幸免于難,經過核查,青蛙出現的場合大多數時候確實跟用戶的問題有關,算是無辜路人。

      面對「滿地亂跑」的哥布林,OpenAI 只能采取行動。3 月 17 日,官方正式下線「書呆子」人格。同時,他們在訓練數據里搞了一次針對性的清洗,把帶有這些魔法生物詞匯的獎勵信號全部抹除。

      但大模型的慣性,遠比想象中頑固。

      GPT-5.5 在發現這個問題之前就已經開始訓練了,當它接入內部測試時,工程師們兩眼一黑:這群哥布林不僅沒清除干凈,還安家了。

      更有意思的是,OpenAI 給 Codex 寫的人格指南里,要求它有「生動的內心世界」和「敏銳的聆聽能力」。這款工具本來就帶著幾分書呆子氣,和哥布林可以說是一拍即合。


      為了防止全球的程序員被「哥布林」逼瘋,OpenAI 被迫用上了最原始的一招,在系統提示詞里反復強調:「除非與用戶的查詢絕對且明確相關,否則永遠不要談論哥布林、小魔怪、小浣熊、巨魔、食人魔、鴿子或其他任何動物和生物。」

      如果你想親眼看看「解除管控」的哥布林是什么狀態,可以運行下面這段命令——它會在啟動 Codex 之前,把系統指令里所有涉及哥布林的內容先過濾掉,讓模型在沒有這道禁令的情況下運行:

      instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \

      jq -r '.models[] | select(.slug=="gpt-5.5") | .base_instructions' \

      ~/.codex/models_cache.json | \

      grep -vi 'goblins' > "$instructions" && \

      codex -m gpt-5.5 -c "model_instructions_file=\"$instructions\""

      事情鬧大之后,OpenAI 內部反倒有點拿它當樂子了。ChatGPT 的 X 官方賬號把這條「禁止談論哥布林」的指令原文放進了簡介。Codex 工程負責人 Thibault Sottiaux 引用這段話,配上了一句「懂的都懂」。


      Sam Altman 昨天表示期待 GPT-6 能給他「多加幾只哥布林」,隨后又發文說 Codex 正在經歷「ChatGPT 時刻」,發完自己又改口:「我是說哥布林時刻,抱歉。」剛剛則是發文宣告,問題已經得到解決了。



      不過也有人沒覺得這有什么好笑的。Citrini Research 今年 2 月曾憑一篇關于 AI 與經濟前景的 Substack 文章在市場上掀起不小的波瀾,他們對這場風波的態度要嚴肅得多,直接給 OpenAI 的處理方式下了結論:「簡直荒謬。」


      順帶一提,「goblin mode」這個詞本身,早在 2022 年就被《牛津英語詞典》評為年度詞匯,意思是「一種毫不掩飾地放縱自我、懶惰邋遢或貪婪的行為方式」。某種程度上,AI 無意間踩中的這個詞,和它想表達的「俏皮感」完全是兩碼事。


      拋開這些槽點,這場「哥布林危機」撕開了大模型時代一個極其核心的命題:對齊難題(Alignment Problem)。

      當我們談論 AI 失控時,腦海中浮現的往往是科幻電影里接管核武器的機器。但現實情況是,AI 的「失控」往往始于極其微小、甚至有點滑稽的獎勵信號偏移。

      你想要一點點俏皮,給了一個微小的正向反饋。黑盒模型就會找到捷徑,將這個信號無限放大,最終把整個系統的底層邏輯帶偏。

      今天,它只是為了拿高分而愛上了說「哥布林」。如果明天,它在自動駕駛的算法里、或者醫療診斷的獎勵機制中,找到了另一個違背人類常識的「高分捷徑」呢?

      人類總是自以為自己能掌控 AI ,但其實很多時候只是在走鋼絲。每一次參數的微調,都有可能帶來意想不到的變化。甚至這或許是我們所經歷的最溫柔、最搞笑的一次「AI 叛亂」了。

      * 封面由 AI 生成

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      2026年調整退休人員基本養老金的通知正式公布了嗎?

      2026年調整退休人員基本養老金的通知正式公布了嗎?

      白晝說故事
      2026-05-09 11:31:21
      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      連續三天嫖娼一次嫖倆,花800元毀掉一手女神好牌,他圖什么?

      街上的行人很刺眼
      2026-04-25 10:55:49
      34歲女子參加同學聚會,直接上桌跳艷舞助興,網友:誰敢娶她?

      34歲女子參加同學聚會,直接上桌跳艷舞助興,網友:誰敢娶她?

      辣媒專欄記錄
      2026-05-09 08:12:54
      伊朗外長:伊當前導彈庫存與發射能力較2月28日增長20%

      伊朗外長:伊當前導彈庫存與發射能力較2月28日增長20%

      財聯社
      2026-05-08 19:08:13
      吳艷妮曬照自曝“強迫癥大爆發”:家中香水、口紅等化妝品被擺得整整齊齊,喊話網友:誰房間臟亂差,能讓我上門搞搞收納?

      吳艷妮曬照自曝“強迫癥大爆發”:家中香水、口紅等化妝品被擺得整整齊齊,喊話網友:誰房間臟亂差,能讓我上門搞搞收納?

      臺州交通廣播
      2026-05-09 02:20:27
      “英版特朗普”攻城略地,英國要變天?

      “英版特朗普”攻城略地,英國要變天?

      觀察者網
      2026-05-09 15:08:19
      茶行業最大的笑話:繞過茶商,用便宜的價格買到茶農的好茶!

      茶行業最大的笑話:繞過茶商,用便宜的價格買到茶農的好茶!

      普洱話江湖
      2026-05-08 14:12:29
      又不想訪華了?中方亮明紅線,美商界大佬爭先恐后,三大小丑狂跳

      又不想訪華了?中方亮明紅線,美商界大佬爭先恐后,三大小丑狂跳

      知法而形
      2026-05-09 17:03:01
      不愧狼姐!第3次獻唱世界杯主題曲,夏奇拉還那么美,皮克后悔嗎

      不愧狼姐!第3次獻唱世界杯主題曲,夏奇拉還那么美,皮克后悔嗎

      小妹講史
      2026-05-08 15:15:14
      公安部:吳某某被采取刑事強制措施

      公安部:吳某某被采取刑事強制措施

      澎湃新聞
      2026-05-09 12:58:03
      報道捅了馬蜂窩!徐州12公里“黑河”曝光后竟接到一個神秘電話!

      報道捅了馬蜂窩!徐州12公里“黑河”曝光后竟接到一個神秘電話!

      菁菁子衿
      2026-05-09 10:56:39
      斯普利特和開拓者矛盾加劇,九名球員支持教練,楊瀚森卻保持沉默

      斯普利特和開拓者矛盾加劇,九名球員支持教練,楊瀚森卻保持沉默

      陳赩愛體育
      2026-05-09 10:16:07
      人活多久,看排汗就知道?壽命長的人,出汗一般有這5個特征!

      人活多久,看排汗就知道?壽命長的人,出汗一般有這5個特征!

      醫學科普匯
      2026-04-22 16:58:38
      摸貓跟狗的區別

      摸貓跟狗的區別

      貓來了
      2026-05-03 09:07:50
      28分慘案3分絕殺!4強一夜再亂,廣東逆天改命,上海奪冠概率大增

      28分慘案3分絕殺!4強一夜再亂,廣東逆天改命,上海奪冠概率大增

      后仰大風車
      2026-05-09 23:12:27
      比亞迪的“陽謀”藏不住了!買大唐EV再等等!海獅08更香?

      比亞迪的“陽謀”藏不住了!買大唐EV再等等!海獅08更香?

      芭比衣櫥
      2026-05-09 17:50:16
      “4只皮皮蝦1035元”,游客稱未收到退款,官方回復:未超出調控價格,已對司機和餐館展開調查

      “4只皮皮蝦1035元”,游客稱未收到退款,官方回復:未超出調控價格,已對司機和餐館展開調查

      極目新聞
      2026-05-07 18:29:41
      布萊頓35秒閃擊3比0狼隊 歐戰資格重燃希望

      布萊頓35秒閃擊3比0狼隊 歐戰資格重燃希望

      籃壇第一線
      2026-05-10 00:05:17
      李湘和王岳倫約飯被偶遇,李湘確實瘦了!網友猜測可能已復婚

      李湘和王岳倫約飯被偶遇,李湘確實瘦了!網友猜測可能已復婚

      TVB的四小花
      2026-05-09 20:53:23
      這居然是母子合影,47 歲巴西女星簡直凍齡

      這居然是母子合影,47 歲巴西女星簡直凍齡

      下水道男孩
      2026-05-07 21:16:59
      2026-05-10 00:39:00
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6361文章數 26832關注度
      往期回顧 全部

      科技要聞

      美國政府強力下場 蘋果英特爾達成代工協議

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      頭條要聞

      演員文章面館大火后又開酒吧 多位明星到場母親也現身

      體育要聞

      成立128年后,這支升班馬首奪頂級聯賽冠軍

      娛樂要聞

      50歲趙薇臉頰凹陷滄桑得認不出!

      財經要聞

      多地號召,公職人員帶頭繳納物業費

      汽車要聞

      軸距加長/智駕拉滿 阿維塔07L定位大五座SUV

      態度原創

      時尚
      健康
      數碼
      游戲
      公開課

      伊姐周六熱推:電視劇《喀什戀歌》;電視劇《低智商犯罪》......

      干細胞能讓人“返老還童”嗎

      數碼要聞

      有鴻蒙·更美的——全球首臺鴻蒙智選美的智能空調上市

      Windows 11 PC上的Xbox模式不支持多顯示器

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲va久久久噜噜噜久久狠狠| 亚洲精品国产电影午夜在线观看| 成人福利国产午夜av免费不卡在线| 三级黄色片| 国产羞羞的视频一区二区| 国产高清在线精品一区二区三区| 最新不卡av| 大地资源中文第二页日本| 色爱无码AV综合区老司机非洲| 日本东京热高清一区二区| 最爽free性欧美人妖| 在线播放国产精品日韩| 亚洲精品一区二区动漫| av中文字幕在线播放| 国产精品一区二区日韩精品| 67194成是人免费无码| 热久久这里是精品6免费观看| 中文字幕日韩有码国产| 衡阳市| 西欧free性满足hd| 国产精品_国产精品_k频道| 欧美XXXX做受欧美| 亚洲成片在线看一区二区| 亚洲成av人片在线播放无码| 久久精品66免费99精品| 99精品视频在线观看婷婷 | 亚洲专区熟女| 欧洲黄色视频| 久久99热只有频精品8| 青青久热免费精品视频| 人妻人人爽| 麻豆国产巨作AV剧情老师| 野花香社区在线视频观看播放| 欧美疯狂性受xxxxx另类| 国产亚洲精品字幕在线观看| 日本野外强奷在线播放va| 男人添女人下部高潮视频| 欧美在线观看一区二区| 忘忧草在线社区www中国中文 | 亚洲 欧洲 日韩 综合在线| 中文字幕av免费看|