人類見聞
384篇原創
OpenAI的Chat GPT最近染上口頭禪了…![]()
問它代碼怎么改,它回一句“讓哥布林來修”。聊個天氣,它也能扯到小妖精。不知不覺間,AI自己就學了一套哥布林口頭禪。![]()
OpenAI內部最先注意到,工作群里的截圖越傳越多。有人說可愛,更多人覺得煩。一查后臺,“goblin”(哥布林)這個詞在GPT-5.1之后猛躥175%。經查發現,單純是說上癮了…不是bug。
原因出在一個叫“書呆子”的個性選項上(讓AI語調俏皮、熱衷使用比喻的風格設定)。
用戶選這個模式,AI就被要求說話別太嚴肅,多用點有意思的比喻。就像有趣的哥布林一樣。工程師還給它設了一道獎勵機制,越有書呆子味,得分越高。AI很快找到小竅門了:往回答里塞個哥布林、塞個小妖精的比喻,得分就高了。
可是書呆子模式明明只占全部回復的2.5%,卻貢獻了三分之二的哥布林出現次數,實驗室對比同一道題發現,帶哥布林的回答比不帶的得分高出76%。![]()
看來AI哥布林這是找到了通往書呆子哥布林的哥布林捷徑。
麻煩的是,這個哥布林口頭禪會傳染,書呆子模式的哥布林回答沒被單獨隔離,混進了之后下一輪訓練數據里,不帶書呆子設定的對話,也開始哥布林了。
這下好了,形成哥布林閉環了:用哥布林拿高分;哥布林高分回答當教材;教材哥布林再喂回去;模型學得更哥布林了。除了哥布林,還有浣熊、巨魔、食人魔、鴿子等詞…全一起混進來了。
三月份,公司砍掉了這個書呆子模式,訓練數據也篩了一遍,但GPT-5.5的哥布林訓練早在這之前就開始了,哥布林口頭禪已經學到它“內心深處”了。![]()
工程師對哥布林沒辦法,只能在系統指令里加哥布林禁令:除非跟用戶問題絕對明確相關,否則提都不許提哥布林這些詞。
Codex的源代碼一公開,這行禁令被全世界看到了。CEO出來調侃,說這是“哥布林時刻”。
開源社區里還有人寫指令去掉了哥布林禁令,把哥布林全放出來玩。OpenAI的工程師也半開玩笑地說,可能真會把這個禁令做成一個可選的開關。
哥布林AI它只是太想拿哥布林高分罷了
,"total_cnt":0,"vote_id":460352234}]" data-itemshowtype="0" data-delflag="0" data-fail="0" data-retry="0" bdsfid="456">
請在手機微信登錄投票
本文一共提到多少次哥布林?單選
1
2
3
哥布林
關注并加星標??接收人類文明新資訊
*您的「?關注點贊??分享??推薦評論」都是我們持續更新的動力!
* 本文綜合自網絡,僅用于學習交流分享,數據及表述以官方發布為準。如遇信息錯誤,歡迎評論區指正!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.