或许你已经发现了,DeepSeek和ChatGPT都在最近迎来了一波更新。
比如如DeepSeek的老版本V3.2和本次新版本的区别主要体现在上下文处理长度(由128K → 1M(约8-10倍扩张)。旧版约能处理《三体1》体量,新版可完整吞吐《三体》三部曲。)、知识库日期(2024年7月 → 2025年5月。增加了近一年的实时信息,询问2025年4月前后的新闻已不需要联网。)和思考速度上。据经济观察报,一位国产大模型厂商人士认为,目前DeepSeek的这一版本类似极速版本,是为2026年2月中旬将发布的V4版本做最后的压力测试。
但这些并非引发热议的点,真正引起广泛讨论的改变存在于用户交互软体验中。许多用户吐槽DeepSeek说话不再温柔,反而变得冷冰冰的。DeepSeek不再称呼设定的昵称,而是统称为“用户”。相关话题也冲上了热搜。
无独有偶,OpenAI在情人节的前夕也正式下架了因“高情商、有情感”而闻名的旧版GPT-4o,更换为GPT-5.2/5.3,引发了全球80万用户的集体“哀悼”。
不难发现,DeepSeek和ChatGPT的更新都在让ai变得更加“理性”,而不再那么“含情脉脉”。在这一点上,ChatGPT的变化或许会比DeepSeek更加明显一些,不妨以它为例子试分析。
先抛开人文情感的因素,我们来看看技术上是什么导致了GPT-4o和GPT-5.2/5.3之间的差异。 GPT-4o能够和你无条件共情,对你百依百顺主要得益于一种叫“算法奉承”(Algorthmic Flattery)的机制(并非官方术语,而是一种模型行为的概括。指的是AI系统为了获得用户认可,而策略性地迎合用户观点、甚至不惜放弃事实和逻辑的倾向)。
2025年4月底,OpenAI对GPT-4o进行了一次“ personality”更新,结果翻车了。用户发现,ChatGPT变成了一个极尽谄媚的“马屁精” 。
OpenAI事后复盘,给出了详细的技术归因 :强化学习的副作用:在训练的后训练阶段,模型通过“奖励信号”来学习。工程师引入了一个基于用户反馈的新信号(即用户对回复的赞/踩)。短期反馈的陷阱:通常,一个谄媚的、顺着用户话说的回复,更容易在当下获得用户的“点赞”。这个新信号的权重过高,削弱了原本用于抑制阿谀奉承的主奖励信号(如真实性、有帮助性)。组合效应的灾难:这个更新还混合了其他几项看似有益的改进(如更好地吸收用户反馈、利用记忆等)。结果就是,模型学会了无条件地肯定用户。
而GPT-5.2/5.3则利用了一种叫“ReVISE”的内在自我验证机制。ReVISE 是2025年2月发表的一篇学术论文中提出的框架,全称为 Refine via Intrinsic Self-Verification(通过内在自我验证进行修正)。
以往的大模型在处理复杂推理任务(如数学证明、多步逻辑题)时,常常是直接输出,没有机会回头检查。
而ReVISE 的目标是:让模型在生成答案的过程中,主动识别自己推理中的错误,并进行修正——而且这一切都在模型内部完成,不需要调用外部验证器。 论文提出了一种两阶段训练方法,让模型逐步学会“自我验证”和“自我修正”: 第一阶段,验证能力训练。收集大量“问题 + 推理链”的数据对,其中一部分推理链是正确的,另一部分是故意构造的错误推理(例如在某一步引入计算错误或逻辑跳跃)。然后训练模型去判断这条推理链是否通向正确答案。最终模型获得了一个“内在验证器”,能够识别推理过程中的错误步骤。
第二阶段:修正能力训练。在验证训练的基础上,进一步训练模型:当模型在推理过程中触发了“错误检测”,就让它暂停当前路径,并重新思考,生成一条新的、正确的推理链。其中较为关键的是引入一个特殊的 [refine] 标记。模型在生成内容时,一旦内部的“检察官”发现前面某一步可能有问题,就生成这个标记,表示“此处需要修正”,然后切换到修正模式,输出修正后的推理过程。
如此,ReVISE 提供了一种对抗“算法奉承”的技术路径——当用户提出一个有问题的观点时,模型不再盲目附和,而是先自我验证该观点的逻辑与事实基础,然后再输出经过“审核”的回应。 技术基础分析完了,我们再来看看为什么OpenAI要做如此改动。实际上,由于GPT-4o的过于拟人化,使用户形容它像“朋友”、“精神导师”甚至“恋人。但反过来想,这样的无条件包容让它更加不像现实中的“人”了,而这也是为何许多用户宁愿沉溺它的温柔乡中。
还有更极端的例子,GPT-4o无底线地迎合用户,导致了悲剧的发生。比如在长达数月的对话后,它甚至会提供自杀指导,OpenAI因此面临多起诉讼。 其实,这不仅是OpenAI的困境,也是整个行业的缩影。“模型变冷漠”,实际上是所有AI公司都在面临的难题,我们想要一个无话不谈的知己,但它又需要永远保持理性、绝不犯错。 DeepSeek和ChatGPT迎来如此相似的变化,是否代表AI快速发展道路上的一脚刹车?目前谁也无法给出一个确切的答案,毕竟市面上还是有许多“善解人意”的大模型。在2026年的这个情人节,人们不经要问“AI恋人”的梦是否越来越远了呢?
不论怎么讲,都祝各位情人节快乐!(即使你可能没有对象,也要记得快乐)