有不少國外的ChatGPT使用者一個多月前發現,在與GPT系列模型對話時,回答時常得到奇怪的比喻,對話中時常跳出包含「哥布林」(goblin)與「小精靈」(gremlin)等用詞,近期官方修改了這個設定,但又被發現OpenAI Codex的系統提示詞中,連續兩次寫下絕對不要提到哥布林等生物的提示要求,掀起國外社群熱議。為何這些哥布林會亂入GPT模型之中,OpenAI官方也親自給出答案。

我是廣告 請繼續往下閱讀
「哥布林」亂入GPT回答被使用者發現

在國外社群平台Reddit以及Hacker News等討論區中,在GPT5.4版本更新後,許多使用者納悶,「為什麼這一版本如此沉迷於哥布林和小妖精?」,該名網友敘述,自己問GPT5.4的每一個問題,它都會提到小精靈和妖精,甚至詢問關於記憶體或軟體等科技相關問題,都會以相關用語加上小妖精的方式回覆,請它給生日禮物建議;又在比喻中出現小精靈等用詞,到底誰會一直說「goblins」和「gremlins」?

OpenAI下提示封殺「哥布林」

而在GPT-5.5版本發表後,哥布林等詞彙亂入情況持續不斷,近期在社群平台X上,亦有使用者發現,GPT-5.5 中有一段提示詞,「除非與用戶的查詢絕對且明確相關,否則永遠不要提及哥布林、小妖精、浣熊、巨魔、食人魔、鴿子或其他動物或生物」,這段提示詞還重複了兩次,使得許多使用者開始試圖讓 GPT-5.5 說出哥布林這個詞。

為何GPT-5.4以來出現大量「哥布林」?

OpenAI昨日公開給出回應,官方提到,從 GPT-5.1 開始,我們的模型開始養成一個奇怪的習慣:它們在比喻中越來越頻繁地提到哥布林(goblins)、小精靈(gremlins)以及其他生物。不同於那些會透過測試數據暴跌或訓練指標激增顯現、並能追溯到特定變更的模型錯誤,這個問題是悄悄滲透進來的。答案中出現一個單獨的「哥布林」可能沒什麼壞處。然而,隨著模型世代更迭,這個習慣變得難以忽視:哥布林不斷增加,我們需要找出它們是從哪裡來的。

OpenAI稱,模型行為是由許多小的獎勵措施而形成的。在這種情況下,其中一個來自「個性自訂功能」,特別是「書呆子(Nerdy)」個性的模型訓練,當使用者選擇書呆子的風格時,為了讓模型扮演這個設定,OpenAI 在系統背後下了一段指令,要求 AI 表現得俏皮、幽默且不嚴肅,無意中對這個帶有生物比喻的內容給予了特別高的獎勵,從那時起,哥布林便開始蔓延。

OpenAI透露,第一次看到這個狀況是在 11 月 GPT-5.1 發佈之後,它可能更早之前就開始了。用戶抱怨模型在對話中顯得異常親近,這引發了他們對特定語言的調查。一位研究員經歷過幾次「哥布林」和「小精靈」的情況,並要求將其納入檢查項目。當我們查看時,ChatGPT 中「goblin」的使用量在 GPT-5.1 發佈後增加了 175%,而「gremlin」則增加了 52%。當時哥布林的普及程度看起來並沒有什麼特別的,但幾個月後,這些哥布林卻以更具體的形式來困擾他們。

「書呆子」人格模式訓練悄悄助漲哥布林現象

官方提到,這一類語言習慣形成,是模式在生成過程中逐漸強化的表達風格,如果這種行為單純只是網路趨勢,他們預期會分佈得更均勻。但相反地,這些用詞卻集中在系統中明確定義為俏皮、書呆子風格的回答設定部分。「書呆子」個性僅佔所有 ChatGPT 回覆的 2.5%,卻佔了 ChatGPT 回覆中所有「哥布林」提及次數的 66.7%。

OpenAI指出,在選擇「Nerdy」個性的使用者中,生物相關語言特別常見。由於「goblin」的出現頻率似乎隨著模型版本發布而增加,他們懷疑某些個性指令訓練,正在放大這種現象。

原本設計用來鼓勵「Nerdy」個性的獎勵,對含有這些生物詞的持續給出相對高的評價。在查看所有資料,團隊觀察到,這種語言風格逐漸「外溢」至其他未啟用 Nerdy 人格的回應中。當在「Nerdy」個性下 goblin 和 gremlin 的提及增加時,在沒有該提示的樣本中,它們也以幾乎相同的相對比例增加,一旦某種風格習慣獲得獎勵,後續訓練可能會在其他地方擴散或強化它。

OpenAI在三月停用預設的Nerdy聊天風格,以簡化選項並提升回應品質。已選擇該風格的使用者將改為預設個性。可隨時在 ChatGPT 的「設定 → Personalization」中管理個性設定。同時,在訓練中,官方移除了關於哥布林等用詞的獎勵機制,並過濾包含生物詞的訓練資料,使哥布林或小妖精等用詞不會頻繁出現或在不適當情境中出現。

不過,GPT-5.5 的訓練在找到妖精問題根本原因之前就已開始。因此當團隊在 Codex 中開始測試 GPT-5.5 時,OpenAI 員工立即注意到其對哥布林的奇怪偏好,於是加入了一條開發者提示指令。

最後,OpenAI也強調,「如果你想讓這些生物在 Codex 中自由出現,你可以執行一個指令,在啟動 Codex 時移除抑制 goblin 的指示」。

顏得智編輯記者

曾在兩家網路媒體擔任新聞編輯,媒體從業經驗約7年,現任職於《NOWNEWS今日新聞》新聞一部國際中心。主要撰寫國際政治、國際財經、國際社會現象相關新聞。
因為黃金三劍客當過爪迷,在東京巨蛋見證台灣在世界棒球...