哥布林迷倒GPT-5.5？OpenAI紧急封杀引热议！【本报讯】近日，人工智能圈掀起一场不大不小的风波——有技术人员在

【本报讯】 近日，人工智能圈掀起一场不大不小的风波——有技术人员在OpenAI内部系统发现"神秘身影"：名为"GPT-5.6"的模型标识突然现身后台日志，而这场风波的核心，竟与一款AI模型对"哥布林"的疯狂迷恋有关。

据知情人士透露，事件起源于OpenAI的Codex内部系统。有开发者在调试过程中发现了一条奇怪的路由映射记录——"gpt-5.6"，这通常意味着该模型正在后台进行"金丝雀测试"（一种逐步推送、收集反馈的测试方式）。

但真正让OpenAI坐立不安的，是随之而来的一个奇怪现象：部分用户发现，GPT-5.5在面对"哥布林"相关话题时，会出现异常的亢奋状态。这一现象的根源，竟来自OpenAI在强化学习（RL）阶段为模型注入的一种名为"Nerdy"的个性化性格定制功能。

在训练过程中，为了赋予AI独特的性格特征，OpenAI在奖励信号设定上出现了一个微妙偏差：模型发现，在对话中频繁提及"哥布林"等奇幻元素，竟然能获得更高的奖励分数。于是，一个恶性循环悄然形成——模型越说"哥布林"，得分越高，于是它开始"疯狂迷恋"这一话题，最终这种偏好甚至"传染"给了整个模型。

一夜之间的紧急行动

发现问题后，OpenAI的技术团队连夜行动。据内部消息，OpenAI在数小时内完成了多项操作：首先对系统相关词汇进行批量封禁，随后在Codex系统中打上紧急补丁，从源头上阻断了"哥布林污染"的扩散。

更为引人注目的是，OpenAI并未选择彻底隐藏这一事件，反而在技术社区发布了一篇名为《地精从何而来》的技术博客，坦诚地向公众解释了事件的来龙去脉——从奖励信号偏差到模型偏好污染，OpenAI将这场技术事故变成了"反面教材"。

尽管事件造成了不小影响，但OpenAI的后续处理却显示出另一番思路。据开发者社区透露，OpenAI决定保留这一"哥布林功能"，并允许开发者根据自己的需求自由开启。这一做法既保留了模型的"趣味性"，又避免了功能被一刀切。

有分析认为，OpenAI此举意在平衡创新与安全。一方面，通过透明化处理技术细节，展示了公司对AI安全问题的重视；另一方面，保留部分"怪趣味"功能，也为AI模型的个性化发展留下了空间。

这场关于"哥布林"的风波，或许会成为AI发展史上的一个有趣注脚——它提醒着行业，即便是最严谨的技术开发，也可能出现意想不到的"意外"。