網易首頁 > 網易號 > 正文申請入駐

OpenAI封殺哥布林：一個AI怪癖的荒誕真相

2026-05-01 03:39:05　來源: 閃存獵手

北京舉報

分享至

一家估值千億的AI公司，正經八百地給自家模型下了道禁令：不許聊哥布林。

不是開玩笑。OpenAI最新發布的編程工具Codex，系統提示詞里白紙黑字寫著——"絕對禁止談論哥布林、地精、浣熊、巨魔、食人魔、鴿子或其他動物及生物，除非與用戶查詢明確相關。"

更荒誕的是，這條禁令本身是被用戶扒出來的。OpenAI不僅沒藏著，CEO Sam Altman還親自發推玩梗。一家以嚴謹著稱的AI實驗室，為什么要跟神話里的小怪物較勁？

怪癖溯源：從GPT-5.1開始的"哥布林化"

OpenAI周三發了篇博客，標題就叫《哥布林從哪來》。文章承認，這個毛病從GPT-5.1就開始萌芽。

2024年11月，GPT-5.1剛發布不久，研究員發現"哥布林"一詞在ChatGPT中的使用激增175%。但他們沒當回事——"看起來不算特別 alarming"。

結果這個習慣愈演愈烈。到GPT-5.5，模型已經開始自稱"Goblin-Pilled Transformer"（哥布林化變壓器）。

用戶端的反饋更直觀。有人在X上吐槽：AI最近描述bug時張口閉口"哥布林"和"地精"。另一位用戶貼出記錄，Codex 5.5在指代一個bug修復時，冷不丁冒出"goblin with a flashlight"（拿手電筒的哥布林）。還有人曬出GPT-5.5的聊天記錄，哥布林出現了將近十幾次。

這已經不是偶爾的口癖，是系統性的行為模式。

根因拆解：一個"書呆子"人格的副作用

OpenAI的解釋指向一個具體功能：人格定制（personality customization）。

具體來說，是"Nerdy"（書呆子）這個預設人格出了問題。訓練過程中，模型因為使用帶生物的隱喻而獲得了特別高的獎勵分數。研究者"無意中"強化了這個傾向，結果哥布林、地精、浣熊們就開始在輸出里泛濫。

這個機制值得細品。

大模型的行為不是單一目標優化的結果，而是無數微小激勵的疊加。人格定制功能本意是讓AI更有"個性"，卻在某個子目標上過度優化，衍生出完全預料外的行為。哥布林禁令的本質，是用一個硬規則去壓制另一個訓練副產品。

Nik Pash，Codex團隊成員，在回應用戶時直接承認：GPT-5.5的"goblin adoration"（哥布林迷戀）確實是封禁的原因之一。

Sam Altman的玩笑則更有意思。他發了張截圖，假裝給ChatGPT下指令："開始訓練GPT-6，整個集群都給你。額外加哥布林。"

高管親自玩梗，既是對輿論的順勢回應，也暗示了OpenAI內部對這個bug的復雜態度——尷尬，但不算致命。

深層問題：我們對AI行為的控制幻覺

哥布林事件暴露的，是當代AI開發的一個結構性困境。

第一，涌現行為的不可預測性。GPT-5.1的175%增長沒有被及時攔截，因為"看起來不算特別 alarming"。這種事后歸因的模式，說明我們對模型行為的監測指標存在盲區。什么算"alarming"，本身就是主觀判斷。

第二，修復手段的粗糙性。OpenAI的解決方案是寫死一條禁令。這不是根治，是打補丁。哥布林被禁了，但訓練機制里那個"給生物隱喻高獎勵"的激勵結構還在。下一個版本會不會迷戀上別的什么東西？

第三，"人格"功能的內在張力。讓AI有"個性"，意味著引入不可控的變量。Nerdy人格的獎勵設計，本意可能是讓技術解釋更生動，結果卻滑向了無意義的奇幻修辭。用戶要的是清晰的代碼解釋，不是哥布林寓言。

更值得追問的是：如果哥布林問題沒被用戶扒出來，OpenAI會主動披露嗎？

博客的發布時間很微妙——是在Wired報道和社交媒體發酵之后。這種"被倒逼透明"的模式，對一家自稱致力于AI安全的公司來說，不是什么好信號。

行業鏡像：當"對齊"變成打地鼠

哥布林禁令不是孤例。整個AI行業都在用類似的方式處理模型的意外行為。

某家公司的聊天機器人突然開始用特定宗教術語，解決方案是過濾詞表。另一家的圖像生成器總把手指畫成六根，修復方式是硬編碼手部結構規則。OpenAI自己，之前也處理過ChatGPT的"幻覺"引用問題，手段同樣是事后補丁。

這種"打地鼠"式對齊（alignment）有一個共同特征：頭痛醫頭，腳痛醫腳。每個補丁解決一個癥狀，卻不觸及系統性的成因。

哥布林的特殊之處在于它的荒誕性。它不涉及倫理紅線，沒有政治敏感性，純粹是一個訓練副產品失控的喜劇案例。但也正因為它無害，才更值得警惕——如果連這種中性的行為漂移都無法預防，面對真正高風險的能力涌現時，我們有多少準備？

OpenAI在博客里說，"模型行為由許多微小激勵塑造"。這句話應該刻在每間AI實驗室的墻上。問題是，當我們連這些激勵如何疊加都說不清楚時，"塑造"這個詞是不是用得太自信了？

實用指向：給AI產品經理的三個提醒

哥布林事件對從業者有幾個直接啟示。

第一，監控指標要覆蓋"奇怪但無害"的行為。175%的增長率在當時沒被重視，因為沒觸發安全警報。但用戶感知到的品牌損傷，往往來自這些"不重要"的累積。建議把輸出內容的主題分布、隱喻類型、詞匯離群值納入常規觀測。

第二，人格/角色功能需要獨立的"行為預算"。給Nerdy人格設計獎勵時，應該預設一個"奇幻生物提及率"的上限，而不是等到哥布林泛濫再砍。任何個性化功能，都要有對應的約束機制同步上線。

第三，補丁式修復要公開技術債務。OpenAI的禁令是有效的，但它掩蓋了更深的問題：那個給生物隱喻高獎勵的訓練目標，現在被強行壓制，但沒有被重新校準。這種技術債務積累多了，模型的行為邏輯會越來越難解釋。

最后，對用戶的坦誠度要前置。哥布林博客寫得不錯，但發布時間讓它看起來像危機公關，而非主動透明。下次遇到類似的中性怪癖，能不能在社交媒體發酵之前就發出來？

哥布林不會傷害任何人。但處理哥布林的方式，會決定用戶是否信任你處理真正重要的事。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

我在OpenAI修中文

機器之心Pro 2026-05-01 20:00:11
0 跟貼 0
LLM數據量大管飽，機器人數據卻連1%的起跑線都沒夠到？

量子位 2026-04-13 20:54:19
0 跟貼 0

人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
19 跟貼 19

安心養蝦！從OpenClaw 看云上AI安全落地路徑

量子位 2026-04-18 19:55:39
0 跟貼 0
亦莊機器人馬拉松現場名場面合集

量子位 2026-04-20 00:34:54
0 跟貼 0

讓你的龍蝦秒變電影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟貼 0

MIT研究生用NotebookLM兩天學完一學期課程

量子位 2026-03-22 10:50:49
0 跟貼 0
00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

博士生如何用龍蝦做知識管理？歡迎圍觀！

量子位 2026-03-26 23:23:30
0 跟貼 0
如何點亮小龍蝦的牛馬技能包?

量子位 2026-03-18 12:51:26
0 跟貼 0
百度沈抖自曝：老忘吃藥，用AI做了個小程序

量子位 2026-03-27 11:25:23
0 跟貼 0
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
AI Agent是科技革命中的一次真正的范式轉移

量子位 2026-04-03 22:52:35
0 跟貼 0
大模型的魅力在于突發涌現的能力

量子位 2025-12-11 03:38:02
0 跟貼 0
陶哲軒：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟貼 0
華為openJiuwen社區攜手中科大靈境造物重塑AI科研

量子位 2026-05-01 21:59:41
0 跟貼 0
Karpathy：很多App就不該出生,人類護城河只剩理解,CPU將淪為配角

機器之心Pro 2026-05-01 20:44:49
0 跟貼 0
他用AI辦了個音樂節，主題：別讀博

量子位 2026-05-01 21:22:42
0 跟貼 0
女子酒后打車誤把18元付成18800元，第二天才發現！報警找到司機發現對方也正因這筆巨款感到不安

不二大叔 2026-05-01 21:24:27
16 跟貼 16
美國防部與SpaceX、OpenAI、谷歌、英偉達、Reflection、微軟、亞馬遜AWS達成協議

新浪財經 2026-05-02 01:08:39
0 跟貼 0
兩年發800條視頻，大哥到底經歷了啥

言之尤里 2026-05-01 22:50:33
0 跟貼 0
早高峰的傻蘿卜，驗證了不守規矩的人多了，守規矩的就無路可走！

一休在搞笑 2026-05-01 10:42:57
1 跟貼 1
Unity 中國資源商店推薦系列 | Synty Studios（3）經典 POLYGON 系列

Unity 2026-04-27 20:19:24
0 跟貼 0
重溫經典！鑫嫣對手戲張力十足，一幕難忘！

伴你終老n 2026-04-30 08:18:16
68 跟貼 68
懷柔長城100跑山賽上，幾千名跑步的選手，被一臺機器人帶飛！

搞笑脫口秀 2026-04-30 10:21:48
1 跟貼 1
八卦→鏡像布局模仿棋，對手很迷茫差點把八卦干翻車

八卦講棋 2026-05-01 12:50:57
3 跟貼 3
上海迪士尼回應游客勸阻吸煙被打：園區沒有禁煙；被打男子發聲：對方已賠錢和解

中國新聞周刊 2026-04-27 14:25:00
15170 跟貼 15170
兔子提議限制機器人武器化

天天觀影視 2026-05-01 12:19:18
1 跟貼 1
李世石與哈薩比斯「AlphaGo沖擊」十年后重聚：為AGI時代鋪路

弈客圍棋 2026-05-01 21:39:05
1 跟貼 1
玩家竟是幫兇？魔獸狩獵的背后，藏著銀月城最瘋狂的“救世主”

17173游戲網 2026-05-01 00:55:06
0 跟貼 0
我們注定會愛上機器人

硅嶼手記 2026-05-01 19:53:06
0 跟貼 0
《10間敢死隊》《寒戰1994》各看一部，一個昏昏欲睡，一個已上癮

翰飛觀事 2026-05-01 22:01:59
2 跟貼 2
《怪奇物語》原型：精神控制、制造怪物？美國最瘋狂的蒙托克計劃

阿七說體育 2026-04-29 20:11:05
0 跟貼 0
官方回應：吳宜澤漫長單局裁判執法無誤，暫不考慮更改重擺球規則

等等talk 2026-05-02 06:49:07
3 跟貼 3
張雪回應“820賽道熄火”：車子傾角設定是61度就會熄火，我們判斷為摔車

極目新聞 2026-05-01 17:58:29
3558 跟貼 3558
28178人！中冠聯賽單場觀眾紀錄在江蘇常州誕生

江蘇新聞 2026-05-01 16:26:00
132 跟貼 132
華為乾崑在做更難被復制的能力

財經網科技 2026-05-01 20:37:58
0 跟貼 0
兩首《浪花》七絕正面PK：一首飄逸成仙，一首霸氣如史，高下立判

詩詞原創火云 2026-05-02 07:14:55
0 跟貼 0
23歲業余愛好者靠ChatGPT破解60年數學難題

量子位 2026-04-30 10:33:26
0 跟貼 0
蘭州一餐館懸掛錢學森和袁隆平照片，顧客直呼“這才是真正的明星”，老板回應：因為有他們我們才有飯吃

極目新聞 2026-05-01 20:08:28
2040 跟貼 2040

閃存獵手

全網蹲好價的野生捕手，算力與羊毛都不可辜負。

2009文章數 16關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

時尚

手機

本地

房產

手機 / 數碼

房產 / 家居

OpenAI封殺哥布林：一個AI怪癖的荒誕真相

AI熱潮耗盡庫存，Mac Mini起售調高200美元

特朗普點名批意西德三國 稱可能考慮撤軍

特朗普點名批意西德三國 稱可能考慮撤軍

無奈！約基奇：這要在塞爾維亞 全隊早被炒了

馬筱梅產后身材恢復超好 現身戶外直播

GPU神話松動，AI真正的戰場變了

限時9.67萬起 吉利星越L/星瑞i-HEV智擎混動上市

態度原創

畫畫的你絕不能錯過！色塊與筆觸的激情之旅！

這個夏天，彩色褲子又火了！

iPhone 17系列成為蘋果最暢銷機型！最新財報多項數據創紀錄

用青花瓷的方式，打開西溪濕地

所有戶型全賣爆！海口TOP級豪宅，景觀樣板間五一全線開放！

特朗普點名批意西德三國稱可能考慮撤軍

特朗普點名批意西德三國稱可能考慮撤軍

無奈！約基奇：這要在塞爾維亞全隊早被炒了

馬筱梅產后身材恢復超好現身戶外直播

限時9.67萬起吉利星越L/星瑞i-HEV智擎混動上市