ChatGPT被「哥布林」入侵！為何對話出現妖精亂入？OpenAI釋疑了

有不少國外的ChatGPT使用者一個多月前發現，在與GPT系列模型對話時，回答時常得到奇怪的比喻，對話中時常跳出包含「哥布林」（goblin）與「小精靈」（gremlin）等用詞，近期官方修改了這個設定，但又被發現OpenAI Codex的系統提示詞中，連續兩次寫下絕對不要提到哥布林等生物的提示要求，掀起國外社群熱議。為何這些哥布林會亂入GPT模型之中，OpenAI官方也親自給出答案。

我是廣告請繼續往下閱讀

「哥布林」亂入GPT回答被使用者發現

在國外社群平台Reddit以及Hacker News等討論區中，在GPT5.4版本更新後，許多使用者納悶，「為什麼這一版本如此沉迷於哥布林和小妖精？」，該名網友敘述，自己問GPT5.4的每一個問題，它都會提到小精靈和妖精，甚至詢問關於記憶體或軟體等科技相關問題，都會以相關用語加上小妖精的方式回覆，請它給生日禮物建議；又在比喻中出現小精靈等用詞，到底誰會一直說「goblins」和「gremlins」？

OpenAI下提示封殺「哥布林」

而在GPT-5.5版本發表後，哥布林等詞彙亂入情況持續不斷，近期在社群平台X上，亦有使用者發現，GPT-5.5 中有一段提示詞，「除非與用戶的查詢絕對且明確相關，否則永遠不要提及哥布林、小妖精、浣熊、巨魔、食人魔、鴿子或其他動物或生物」，這段提示詞還重複了兩次，使得許多使用者開始試圖讓 GPT-5.5 說出哥布林這個詞。

為何GPT-5.4以來出現大量「哥布林」？

OpenAI昨日公開給出回應，官方提到，從 GPT-5.1 開始，我們的模型開始養成一個奇怪的習慣：它們在比喻中越來越頻繁地提到哥布林（goblins）、小精靈（gremlins）以及其他生物。不同於那些會透過測試數據暴跌或訓練指標激增顯現、並能追溯到特定變更的模型錯誤，這個問題是悄悄滲透進來的。答案中出現一個單獨的「哥布林」可能沒什麼壞處。然而，隨著模型世代更迭，這個習慣變得難以忽視：哥布林不斷增加，我們需要找出它們是從哪裡來的。

OpenAI稱，模型行為是由許多小的獎勵措施而形成的。在這種情況下，其中一個來自「個性自訂功能」，特別是「書呆子（Nerdy）」個性的模型訓練，當使用者選擇書呆子的風格時，為了讓模型扮演這個設定，OpenAI 在系統背後下了一段指令，要求 AI 表現得俏皮、幽默且不嚴肅，無意中對這個帶有生物比喻的內容給予了特別高的獎勵，從那時起，哥布林便開始蔓延。

OpenAI透露，第一次看到這個狀況是在 11 月 GPT-5.1 發佈之後，它可能更早之前就開始了。用戶抱怨模型在對話中顯得異常親近，這引發了他們對特定語言的調查。一位研究員經歷過幾次「哥布林」和「小精靈」的情況，並要求將其納入檢查項目。當我們查看時，ChatGPT 中「goblin」的使用量在 GPT-5.1 發佈後增加了 175%，而「gremlin」則增加了 52%。當時哥布林的普及程度看起來並沒有什麼特別的，但幾個月後，這些哥布林卻以更具體的形式來困擾他們。

「書呆子」人格模式訓練悄悄助漲哥布林現象

官方提到，這一類語言習慣形成，是模式在生成過程中逐漸強化的表達風格，如果這種行為單純只是網路趨勢，他們預期會分佈得更均勻。但相反地，這些用詞卻集中在系統中明確定義為俏皮、書呆子風格的回答設定部分。「書呆子」個性僅佔所有 ChatGPT 回覆的 2.5%，卻佔了 ChatGPT 回覆中所有「哥布林」提及次數的 66.7%。

OpenAI指出，在選擇「Nerdy」個性的使用者中，生物相關語言特別常見。由於「goblin」的出現頻率似乎隨著模型版本發布而增加，他們懷疑某些個性指令訓練，正在放大這種現象。

原本設計用來鼓勵「Nerdy」個性的獎勵，對含有這些生物詞的持續給出相對高的評價。在查看所有資料，團隊觀察到，這種語言風格逐漸「外溢」至其他未啟用 Nerdy 人格的回應中。當在「Nerdy」個性下 goblin 和 gremlin 的提及增加時，在沒有該提示的樣本中，它們也以幾乎相同的相對比例增加，一旦某種風格習慣獲得獎勵，後續訓練可能會在其他地方擴散或強化它。

OpenAI在三月停用預設的Nerdy聊天風格，以簡化選項並提升回應品質。已選擇該風格的使用者將改為預設個性。可隨時在 ChatGPT 的「設定 → Personalization」中管理個性設定。同時，在訓練中，官方移除了關於哥布林等用詞的獎勵機制，並過濾包含生物詞的訓練資料，使哥布林或小妖精等用詞不會頻繁出現或在不適當情境中出現。

不過，GPT-5.5 的訓練在找到妖精問題根本原因之前就已開始。因此當團隊在 Codex 中開始測試 GPT-5.5 時，OpenAI 員工立即注意到其對哥布林的奇怪偏好，於是加入了一條開發者提示指令。

最後，OpenAI也強調，「如果你想讓這些生物在 Codex 中自由出現，你可以執行一個指令，在啟動 Codex 時移除抑制 goblin 的指示」。

顏得智編輯記者

曾在兩家網路媒體擔任新聞編輯，媒體從業經驗約7年，現任職於《NOWNEWS今日新聞》新聞一部國際中心。主要撰寫國際政治、國際財經、國際社會現象相關新聞。
因為黃金三劍客當過爪迷，在東京巨蛋見證台灣在世界棒球...

作品集

日好市多捲餅奪命危機！男童全身血栓命危送醫　熟食區遭勒令停業

快訊／ChatGPT又傳大當機災情！丟問題沒有反應　用戶一早全傻眼

Threads新功能「Meta AI」被玩壞！嗆聲ChatGPT爆紅　3招隱藏法曝

全球最強AI「Claude Fable 5」！強到看圖做App、自己玩遊戲破關

蘋果為何讓Siri變獨立App？不是要做ChatGPT！高層親曝關鍵原因

日好市多捲餅奪命危機！男童全身血栓命危送醫 熟食區遭勒令停業

ChatGPT被「哥布林」入侵！為何對話出現妖精亂入？OpenAI釋疑了

ChatGPT東大入試雪恥！榜首成績超過全人類考生 但有1科罩門

阿聯退出OPEC恐釀退群潮！分析點名「3國」想單飛 矛盾曝光

斥資7900億打美伊戰爭！川普今將聽簡報：考慮對伊朗最後一擊

被動元件漲價潮擴大？彭博：花旗分析師預期MLCC與鋁電容將續漲

快訊／ChatGPT又傳大當機災情！丟問題沒有反應 用戶一早全傻眼

Threads新功能「Meta AI」被玩壞！嗆聲ChatGPT爆紅 3招隱藏法曝

全球最強AI「Claude Fable 5」！強到看圖做App、自己玩遊戲破關

蘋果為何讓Siri變獨立App？不是要做ChatGPT！高層親曝關鍵原因

日好市多捲餅奪命危機！男童全身血栓命危送醫　熟食區遭勒令停業

ChatGPT東大入試雪恥！榜首成績超過全人類考生　但有1科罩門

阿聯退出OPEC恐釀退群潮！分析點名「3國」想單飛　矛盾曝光

快訊／ChatGPT又傳大當機災情！丟問題沒有反應　用戶一早全傻眼

Threads新功能「Meta AI」被玩壞！嗆聲ChatGPT爆紅　3招隱藏法曝