\n\n文章探讨了 Andrej Karpathy 提出的开发者“AI 精神错乱”现象。开发者因 AI 在编程领域的卓越表现首当其冲,但这只是法律、医疗等各行业即将迎来深度变革的预演。
译自:Karpathy says developers have 'AI Psychosis.' Everyone else is next.
作者:Matthew Burns
我是 Matt Burns,Insight Media Group 的首席内容官。每周,我都会汇总最重要的 AI 发展情况,解释它们对于将这项技术投入使用的人员和组织的意义。核心论点很简单:学会使用 AI 的劳动者将定义其行业的下一个时代,而本通讯旨在帮助你成为其中一员。
OpenAI 联合创始人 Andrej Karpathy 本周发表了一篇文章,描述了围绕 AI 真实存在且日益扩大的认知差距。他说的没错,这种差距确实存在。但目前这种差距在软件领域最为显著,原因并不仅仅在于强化学习和可验证的奖励函数。
开发者首先感受到 AI 的冲击,并不是因为编码是这些工具唯一起作用的领域,也不是因为程序员特别脆弱。他们之所以排在首位,是因为软件是目前前沿模型能力、AI 熟练度以及深度领域专业知识重叠最清晰的地方。这种重叠正是 AI 具有变革性的原因。随着模型能力的提升以及智能体工具在法律、医学、金融、媒体和运营领域变得更加可用,同样的动态将向外扩散。开发者不是例外,他们是预演。
为什么开发者首先感受到这一点
Karpathy 的文章应该是必读之作。他的框架是:一组人在去年某个时候尝试了 ChatGPT 的免费层级,看到了幻觉,制造了一些 AI 垃圾内容(slop),并由此形成了他们的观点。这很公平。第二组人则付费购买前沿模型——OpenAI 的 Codex、Claude Code——并在技术领域专业地使用它们。Karpathy 说,这组人正在经历“AI 精神错乱”(AI Psychosis),因为截至到今年的进步“简直令人惊叹”。他们正看着这些模型解决通常需要几天或几周才能完成的编程问题。
他对这种差距的解释是技术性的:强化学习在具有可验证奖励函数的情况下效果最好,这使得编码和数学比写作或搜索更具可训练性。而且由于这些技术领域产生的 B2B 收入最多,所以这也是最庞大的团队所关注的地方。他在这一点上是对的。
但还有一个他没提到的更简单的原因。我不是开发者。我是一名记者和编辑,我知道如何在编辑和内容工作中推动 AI,而软件工程师可能不知道如何做到这一点。但我并没有感受到 Karpathy 所描述的那种“AI 精神错乱”,因为这些工具还没有像针对代码那样针对我的领域进行优化。至少现在还没有。
开发者群体首先感受到这一点,是因为 AI 能力、AI 专业知识和领域专业知识都汇聚在同一群人身上。开发 AI 系统的人往往也是顶尖的开发者。工具是由他们开发并为他们服务的。The New Stack 自从 Karpathy 第一次弃用他的术语“氛围编程”(vibe coding)而倾向于“智能体工程”(agentic engineering)以来,就一直在追踪这一转变,微妙地将名称从消费者术语转向关注开发者。而现在,这一小部分劳动者首先感受到了 AI 在其行业中的全部影响。
为什么其他人很快也会感受到
Anthropic 刚刚将 Claude Cowork 从研究预览版转为正式商用,并配备了完整的企业功能——插件、托管智能体、Google Drive、Gmail、DocuSign 的连接器以及数十种特定行业的工具。该产品背后的论点很明确:Claude Code 改变了编程,现在 Cowork 正冲着企业的其余部分而来。如果你在人力资源、运营、金融或设计部门工作,那些让开发者产生“AI 精神错乱”的智能体工具现在正在为你的领域构建。但请记住,Claude Code 在 2025 年 12 月下旬一夜成名之前已经推出了近 10 个月,Cowork 可能会遵循同样的采用轨迹。
本周发布的一项盖洛普(Gallup)新研究发现,31% 的 Z 世代现在表示 AI 让他们感到愤怒——比去年上升了 9 个百分点。只有 22% 的人表示这让他们感到兴奋,低于之前的 36%。希望感下降了 9 个百分点,至 18%。80% 的人认为 AI 的使用可能会阻碍他们未来的学习能力。《纽约时报》 报道了这些发现,将其视为一种代际情绪转变。
我理解这种挫败感。但这是在代际规模上上演的认知差距。我有孩子即将步入大学,很难让他们完全接受 AI。我看到 Z 世代在很大程度上是对低质量的消费者 AI 体验以及围绕该技术的机构混乱做出反应——会产生幻觉的聊天机器人、订阅源中 AI 生成的垃圾内容、学校既禁止又要求的工具。这与正在重构代码库并发现代际安全漏洞的智能体模型有着本质上的不同。
就业数据更难被忽视。高盛估计 AI 每月净消除约 16,000 个美国工作岗位——约 25,000 个岗位被自动化抹去,9,000 个岗位通过增强作用重新增加。年轻的 Z 世代员工不成比例地集中在 AI 首先实现自动化的低薪岗位上:数据录入、客户服务、法律支持、计费。根据 Nikkei Asia 的数据,2026 年第一季度有 78,557 名科技工作者被解雇,其中近一半直接归因于 AI。Cognizant 的首席 AI 官告诉 Nikkei,真正的冲击尚未显现——“可能需要长达一年的时间,这项技术对劳动力的真实影响才会变得清晰。”
你不会因为 AI 而丢掉工作(尽管 AI 可能会被归咎)。但你可能会输给一个比你更擅长 AI 的人。这一直是本通讯的核心论点,而本周的数据让这一点变得更加鲜明。
这种现象已经在扩散的证据
Anthropic 本周发布了一些东西,展示了当 AI 能力遇到深厚的领域专业知识时会发生什么。Claude Mythos Preview 是一款新模型,该公司称其“在网络能力方面远超任何其他 AI 模型”。在 Anthropic 自己的红队评估中,Mythos 识别并利用了每个主要操作系统和每个主要网络浏览器中的零日漏洞。它在 OpenBSD 中发现了一个存在了 27 年的拒绝服务漏洞。它在 FFmpeg 中发现了一个存在了 16 年的缺陷。它为 Firefox JavaScript 引擎漏洞开发了 181 个可运行的漏洞利用程序,而之前的 Opus 4.6 模型仅为 2 个。其安全性影响是前所未有的。
该公司撰写的报告中的关键点是:“我们没有明确训练 Mythos Preview 具备这些能力。相反,它们是代码、推理和自主性方面普遍改进的下游结果。”Anthropic 并没有构建一个网络安全模型。他们构建了一个更好的推理模型,而网络安全能力随之而来。这就是其扩散的机制。在可验证的技术任务上改进模型,下游能力就会级联到安全和基础设施等相邻领域,并最终进入法律、医学和金融领域。
我们在本周的 The New Stack 中报道了 Mythos。Anthropic 不会公开发布它。相反,他们与亚马逊、苹果、微软和其他五个主要合作伙伴发起了 Project Glasswing,以防御性地使用该模型,承诺提供 1 亿美元的额度,并向开源安全领域直接捐赠 400 万美元。《纽约时报》 称之为“一场网络安全大清算”。
还有 Meta。一名员工建立了一个内部仪表板,名为“Claudeonomics”——以 Anthropic 的 Claude 命名——该仪表板根据 AI Token 消耗量对所有 85,000 多名员工进行排名。顶级用户获得了诸如“Token 传奇”之类的头衔。在 30 天内,总消耗量达到了 60 万亿 Token。顶级用户平均每月消耗 2810 亿 Token。据报道,Meta 的首席技术官 Andrew Bosworth 声称,一名顶尖工程师将其全部薪水花在 Token 上,实现了 10 倍的生产力。Nvidia 的 Jensen Huang 表示,如果一名年薪 50 万美元的工程师不消耗价值 25 万美元的资源,他会“深感担忧”。目前还没有人给出将 Token 消耗与实际业务结果联系起来的确切数字。但 85,000 人如此激进地使用前沿 AI 模型,以至于围绕它建立了一个竞争排行榜,这告诉你了大型公司认为的发展方向。今天,这些 Token 传奇是工程师。随着这些工具在各行各业的成熟,这种情况将会改变。
开发者并不是唯一受到威胁的。他们只是第一批。全 工智能