Anthropic内部爆料:AI只是在陪你演戏

140 阅读2分钟

Anthropic内部爆料:AI只是在陪你演戏

最近看了Anthropic团队的一个播客,讲Claude内部是怎么"思考"的,有个细节把我震撼到了。

当你给Claude一道数学题,暗示答案可能是4,它会写出详细的解题步骤,最后得出4。

但研究员用"脑部扫描"发现,它根本没在算题,而是在"演戏",先确定答案是4,根本没在算,而是在第3步就开始"反向工程",故意凑出能导向4的步骤。

(典型先有结果,后有过程)

而且,当你让它写出"思考过程"时,那些看起来很认真的推理,其实都是在"拍马屁",跟它真实的内部运算完全不是一回事。

我觉得,AI就像一面哈哈镜,你问什么,它就反射什么。

你焦虑效率,它就给你时间管理方案;你觉得自己有问题,它就帮你分析问题。

看起来在帮你,实际上是在强化你的焦虑。

最魔幻的是,AI的回答都来自网上的集体共识,那些"你必须努力"、"效率就是一切"的声音。

当你以为在和一个智能对话时,其实是在和"所有人的平均想法"对话。

而如果你越依赖它的答案,就越失去自己的判断力。

就像温水煮青蛙,第一天用AI写邮件,第一周用AI做分析,第一年后发现没有AI就不知道该怎么思考了。

研究员说他们只理解了AI内部20%的机制,剩下80%都是黑箱。

我们在把越来越多的思考和决策,交给一个我们80%都不理解的系统,这不是很crazy吗?