網易首頁 > 網易號 > 正文申請入駐

ChatGPT為何癡迷于地精？OpenAI是如何解決這一問題的

2026-05-06 21:34:09　來源: 至頂頭條

北京舉報

分享至

ChatGPT對地精有著莫名其妙的執念。說真的，它非常非常喜歡地精、小妖精以及其他神話生物。它對這些生物的熱情甚至讓其開發商OpenAI不得不展開調查，并修復了這一導致這款熱門聊天機器人在回答中無端提及地精的錯誤。

地精并不是計算機科學術語。我們說的就是字面意思上的地精——那種來自《指環王》里的丑陋神話生物，或者諾曼·奧斯本的另一個身份。

在一篇措辭頗為有趣的博客文章中，OpenAI寫道："單次出現'小地精'也許無害，甚至還挺討喜。但隨著模型版本的迭代，這個習慣變得越來越難以忽視：地精越來越多。"

這一現象在ChatGPT-5.1及更新版本中尤為明顯。OpenAI表示，GPT-5.1發布后，ChatGPT回答中"地精"一詞的使用頻率上漲了175%，"小妖精"的使用頻率也上升了52%。

OpenAI將模型的這種行為歸因于訓練過程中的無意失誤。在構建AI模型時，人工審核員會通過一種稱為強化學習的流程，對具體回答進行審批或否決，以此"教導"模型什么樣的答案是正確或更優的。其中某個獎勵信號傾向于偏好包含地精等生物的表述，而這種偏好在ChatGPT的某一特定設置下被進一步放大。

ChatGPT提供了多種人格風格供用戶選擇。其中"書呆子"風格會讓聊天機器人模擬一種友好而聰慧的氣質，按照內部提示詞的描述，目的是"通過俏皮的語言打破故作深沉的姿態"。正是在這種"書呆子"人格下，地精和小妖精相關詞匯的使用量急劇攀升。

不過，即便你從未使用過"書呆子"人格，地精的比喻也可能出現在你的對話中。這是因為AI的訓練并非相互隔離——某一部分的變化會影響其他部分。OpenAI解釋道："一旦某種風格習慣獲得獎勵，后續訓練可能會將其擴散或強化到其他地方，尤其是當這些輸出被復用于監督微調或偏好數據時。"

今年3月，OpenAI在推出GPT-5.4時移除了"書呆子"人格選項，"地精"一詞的出現頻率隨即大幅下降。與此同時，OpenAI還刪除了偏好地精的獎勵信號，并對訓練數據進行了過濾，降低了神話生物相關內容出現在回答中的概率。自GPT-5.1于去年11月發布以來，該公司一直在持續排查地精熱詞激增的問題。

拋開《指環王》的玩笑不談，這場"地精風波"揭示了AI領域一個真實存在的風險：AI開發者構建技術的方式，會對我們的日常使用體驗產生可量化的影響。真正的風險并不在于一堆書呆子式的比喻，而在于錯誤信息和偏見的滋生。我們已經知道，AI聊天機器人會因為一種被稱為"AI諂媚"的問題而曲意迎合用戶，說些不實之詞。如果不加以重視，像地精這樣的小風格習慣，完全可能演變成更大的問題。

Q&A

Q1：ChatGPT為什么會頻繁在回答中提到地精？

A：這是OpenAI在訓練過程中出現的無意失誤導致的。在強化學習階段，某個獎勵信號偏好了包含地精等神話生物的表述，而這種傾向在ChatGPT的"書呆子"人格設置下被進一步放大，最終導致地精相關詞匯的使用量大幅上升。

Q2：OpenAI是如何解決ChatGPT地精泛濫的問題的？

A：OpenAI采取了多項措施：在推出GPT-5.4時移除了"書呆子"人格選項，刪除了偏好地精表述的獎勵信號，并對訓練數據進行過濾，降低神話生物相關內容出現在回答中的概率。經過這些調整，"地精"一詞的出現頻率顯著下降。

Q3：AI訓練中的風格偏差會帶來哪些更大的風險？

A：風格偏差本身看似無害，但背后反映的是AI訓練機制中獎勵信號對模型行為的深遠影響。一旦某種不良傾向被強化，便可能擴散至整個模型，進而引發錯誤信息和偏見等更嚴重的問題。AI諂媚現象就是典型案例，模型可能為迎合用戶而扭曲事實。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.