網易首頁 > 網易號 > 正文申請入駐

AI有了自己的哥布林口頭禪，工程師只能選擇禁掉

2026-04-30 19:21:14　來源: 人類見聞

山東舉報

分享至

人類見聞

384篇原創

OpenAI的Chat GPT最近染上口頭禪了…
問它代碼怎么改，它回一句“讓哥布林來修”。聊個天氣，它也能扯到小妖精。不知不覺間，AI自己就學了一套哥布林口頭禪。

OpenAI內部最先注意到，工作群里的截圖越傳越多。有人說可愛，更多人覺得煩。一查后臺，“goblin”（哥布林）這個詞在GPT-5.1之后猛躥175%。經查發現，單純是說上癮了…不是bug。
原因出在一個叫“書呆子”的個性選項上（讓AI語調俏皮、熱衷使用比喻的風格設定）。
用戶選這個模式，AI就被要求說話別太嚴肅，多用點有意思的比喻。就像有趣的哥布林一樣。工程師還給它設了一道獎勵機制，越有書呆子味，得分越高。AI很快找到小竅門了：往回答里塞個哥布林、塞個小妖精的比喻，得分就高了。
可是書呆子模式明明只占全部回復的2.5%，卻貢獻了三分之二的哥布林出現次數，實驗室對比同一道題發現，帶哥布林的回答比不帶的得分高出76%。

看來AI哥布林這是找到了通往書呆子哥布林的哥布林捷徑。
麻煩的是，這個哥布林口頭禪會傳染，書呆子模式的哥布林回答沒被單獨隔離，混進了之后下一輪訓練數據里，不帶書呆子設定的對話，也開始哥布林了。
這下好了，形成哥布林閉環了：用哥布林拿高分；哥布林高分回答當教材；教材哥布林再喂回去；模型學得更哥布林了。除了哥布林，還有浣熊、巨魔、食人魔、鴿子等詞…全一起混進來了。
三月份，公司砍掉了這個書呆子模式，訓練數據也篩了一遍，但GPT-5.5的哥布林訓練早在這之前就開始了，哥布林口頭禪已經學到它“內心深處”了。

工程師對哥布林沒辦法，只能在系統指令里加哥布林禁令：除非跟用戶問題絕對明確相關，否則提都不許提哥布林這些詞。
Codex的源代碼一公開，這行禁令被全世界看到了。CEO出來調侃，說這是“哥布林時刻”。
開源社區里還有人寫指令去掉了哥布林禁令，把哥布林全放出來玩。OpenAI的工程師也半開玩笑地說，可能真會把這個禁令做成一個可選的開關。
哥布林AI它只是太想拿哥布林高分罷了
,"total_cnt":0,"vote_id":460352234}]" data-itemshowtype="0" data-delflag="0" data-fail="0" data-retry="0" bdsfid="456">

請在手機微信登錄投票

本文一共提到多少次哥布林？單選

哥布林

關注并加星標??接收人類文明新資訊
*您的「?關注點贊??分享??推薦評論」都是我們持續更新的動力！
* 本文綜合自網絡，僅用于學習交流分享，數據及表述以官方發布為準。如遇信息錯誤，歡迎評論區指正！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.