最魔幻的皇帝新衣:用AI的人慢了19%,但他们以为自己快了20%,怎么解?

0 阅读11分钟

去年7月,一个研究悄悄发了出来。
当时没几个人注意到。

直到上周Cursor爆出年入20亿美元、AI编程市场十倍增长的消息,老金我才把这两件事放在一起看。

一看不得了。

一个叫METR(Model Evaluation & Threat Research)的研究机构,做了一个AI工具领域迄今为止 最严格的随机对照试验,论文2025年7月发在arXiv上。

为什么说最严格?
因为之前所有说"AI让效率提升XX%"的数据,全是问卷和自我报告。

这次不一样。
随机分组,不告诉参与者研究目的,用客观数据记录完成时间。

16名资深开发者,246个真实任务,跟踪四个月。
跟药物临床试验一个级别的方法论。

结果出来所有人都不说话了。

用AI辅助工作的人,实际完成任务的速度 慢了19%。 但问他们自己感觉如何? 他们觉得自己 快了20%。

一个正负差了将近40个百分点的认知偏差。 这不叫效率提升,这叫 生产力幻觉。

Cursor的疯狂增长

先说另一面。

据Bloomberg 3月2日报道,AI编程工具Cursor的年化收入刚刚达到20亿美元。
三个月前还是10亿。
三个月翻一倍。

公司估值293亿美元。

整个AI编程市场更夸张。
从一年前的5亿美元,暴涨到现在超过50亿美元。
十倍增长,一年完成。

Dario Amodei(Anthropic的CEO,就是做Claude的那家公司)预测:6个月内,90%的代码将由AI编写。

Pragmatic Engineer的开发者调查也验证了这个趋势。
95%的开发者每周都在用AI写代码。
75%用AI完成一半以上的工作。
55%已经在常用AI Agent(能自己干活的AI助手)。

Image

看到这些数据,你会觉得AI编程是这个时代最确定的风口。
资本在疯狂涌入,开发者在疯狂使用。

但问题来了。

那个让整个行业尴尬的研究

回到开头那个随机对照试验。

这个研究为什么重要? 因为之前所有说AI编程提效的数据,都有一个致命问题。

自我报告偏差。

你问一个程序员"用了AI之后效率有没有提高"。
他花了200美元买了Cursor订阅。
他花了两周学怎么写提示词。
他在团队里跟同事安利了无数次。

你觉得他会说"没提高"吗?

这跟你买了一双3000块的跑鞋,别人问你跑得快不快是一个道理。
你当然说快了。

但这次不一样。

这次是随机分组。
一组用AI,一组不用。
不告诉他们研究目的。
用客观数据衡量完成时间。

结果就是那个让人难堪的数字:慢了19%。

老金我看到这个研究的时候第一反应是不信。
但仔细想了想,其实说得通。

用AI写代码的流程是这样的。
你要先跟AI描述需求。
AI生成一堆代码。
你要review这些代码。
发现问题,再跟AI说哪里不对。
AI改了,你再review。
反复几轮下来,时间就这么花掉了。

你以为省了写代码的时间,但多出了沟通和审查的时间。

而且还有一个更隐蔽的问题。
AI生成的代码你不一定完全理解。
出了bug你debug的时间反而更长。

这就是为什么客观数据说慢了19%,但主观感觉快了20%。
因为你确实少打了很多字。
打字少了,感觉就快了。
但打字从来不是编程的瓶颈。

思考才是。

Image

这不只是程序员的问题

老金我说到这你可能觉得,这是程序员的事,跟我有什么关系。

关系大了。

你用AI写文案,是不是也觉得效率提升了?
但你有没有算过,你花在"改AI写的废话"上的时间,比自己从头写还多?

你用AI做PPT,是不是觉得太方便了?
但你有没有发现,AI生成的PPT你自己都讲不明白,因为逻辑不是你的?

你用AI搜资料、做总结、写邮件。
每一个场景都是同一个套路:操作少了,感觉快了,但产出质量没人验证。

这个随机对照试验虽然测的是程序员。
但它揭示的是一个人性层面的bug。
当工具替你完成了动作,你的大脑会自动把"省力"等同于"高效"。

这就是为什么健身房里用器械辅助的人觉得自己练得很猛,但肌肉增长反而不如用自由重量的。

省力≠有效,在任何领域都成立。

Image

旧金山工程师的真实感受

SF Standard在2月份做了一组旧金山工程师的匿名采访。

有一位工程师的话让老金我印象很深。
"我基本上就是Claude Code的代理人。"

他的意思是,他的日常工作已经变成了给AI下指令、审查AI的输出、修AI的bug。
不是他在写代码,是AI在写。
他只是个中间人。

另一位工程师说得更直白。
"你花几年练的技能,现在被商品化了。"

记者问他们最大的感受是什么。
一个词:grief。
翻译过来就是悲伤,那种失去重要东西的悲伤。

这不是矫情。

部分资深开发者发现了一个更可怕的现象。 他们在不用AI工具的时候。 之前自然而然就能做的事情。

技能开始退化了。

就像你天天用导航开车。
突然有一天没有导航。
你发现自己连回家的路都要想一想。

如果对你有帮助,记得关注一波~

初级程序员的至暗时刻

如果说资深开发者感受到的是悲伤。
那初级程序员面对的就是恐惧。

斯坦福的研究数据很冷酷。
22到25岁程序员的就业率,从2022年到2025年下降了20%。

500名科技公司高管的调查结果更冷酷。
72%计划减少初级开发者的招聘。
64%会把省下来的钱投入AI工具。

翻译一下就是:以前招5个初级程序员干的活,现在2个高级程序员加AI就够了。

MIT Technology Review去年底的报道说,AI编程工具已经无处不在。
言下之意是,你不用AI的竞争对手在用。
你的老板会觉得你效率低。
你不得不用。

但你用了之后,你的技能在退化。
而公司觉得初级岗位不需要那么多人了。

这是一个死循环。

反面观点也得说

老金我写文章有个原则。
只讲一面之词是耍流氓。

所以反面观点也得摆出来。

第一,那个随机对照试验有局限性。
样本量不算大。
测试的任务类型有限。
真实工作场景比实验复杂得多。
AI工具在更新迭代,半年前的结论不一定适用现在。

第二,市场需求可能在增长。
软件在吃掉一切。
AI降低了编程门槛,可能创造出更多需求。
之前不可能做的项目,现在因为AI变得可行了。
需求增长的速度可能快于自动化替代的速度。

第三,开源社区的反弹值得关注。
Gentoo Linux和NetBSD已经禁止AI生成的代码提交。
理由是代码质量和知识产权问题。
这说明AI代码并不是万能的,某些场景下人写的代码仍然不可替代。

这些反面观点都有道理。
但它们不改变一个基本事实。

老金观点

老金我先说一句可能得罪人的话。

慢了19%,不是AI的问题,是这群人不会用。

老金我一直在讲一个概念叫 元能力。
就是那些决定你能不能用好任何工具的底层能力。

比如:
你能不能把一个模糊需求拆成清晰的步骤?
你能不能判断AI给你的结果是对是错?
你知不知道什么时候该用AI、什么时候不该用?

Image

这些能力跟具体工具无关。
Cursor也好,ChatGPT也好,通义千问也好,换什么工具都一样。

那些慢了19%的人,老金我猜他们的使用方式大概是这样的:
打开AI,丢一句"帮我写个XX",然后盯着AI生成一坨东西,看不懂,改几轮,越改越乱。

他们把AI当成了一个能自动出活的黑盒。

但AI从来不是黑盒,它是放大器。
你的思路清晰,它帮你加速。
你的思路混乱,它帮你加速混乱。

所以真相不是"AI让你更快"或"AI让你更慢"。
真相是:它让你变得更贵,或者更便宜。

这话不只对程序员说,对所有用AI的人都一样。

取决于你用AI做什么。

如果你用AI替代思考。
让它帮你写代码、写文案、做方案,你负责复制粘贴。
那你就是在把自己变成一个人肉代理。
可替代性极高,价值在降低。

如果你用AI替代打字。
你自己想清楚架构、逻辑、边界条件。
然后让AI帮你把想法变成成品。
你负责审查和调整。
那你的价值在提升。

区别在于:你是在指挥AI,还是在被AI指挥。

Cursor年入20亿美元是真的。
AI让程序员慢了19%也是真的。
这两件事同时为真,不矛盾。

因为工具的价值和使用者的元能力是两回事。
锤子卖得好,不代表每个买锤子的人都知道该往哪敲。

老金我的建议很简单。

别停止思考。

AI能帮你写代码,但不能帮你理解问题。
AI能帮你生成文案,但不能帮你判断哪句话能打动人。
AI能帮你提高产出,但前提是你知道该产出什么。

老金我的具体建议:
不管你是写代码还是写文案,每周至少花1小时,关掉AI自己干。
保持核心技能,别让大脑彻底外包。

那些正在退化的技能。
不是因为AI太强了。
是因为你把大脑外包了。

最后一个问题

Cursor的CEO说他们的目标是让每个人都能编程。
但老金我想问的是另一个问题。

当每个人都能编程的时候,编程还值钱吗?
当每个人都能用AI的时候,你的不可替代性在哪?

想清楚这个问题再决定。
你是要做AI的指挥官。
还是AI的代理人。


往期推荐:

AI编程教程列表
提示词工工程(Prompt Engineering)
LLMOPS(大语言模运维平台)
AI绘画教程列表
WX机器人教程列表

开源知识库地址(实时更新交流群):
https://tffyvtlai4.feishu.cn/wiki/OhQ8wqntFihcI1kWVDlcNdpznFf

Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源

我的小破站(含我开源的项目):https://www.aiking.dev/


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。
我不会代码,我英语也不好,但是我做出来了很多东西,在文末的开源知识库可见。
我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。
如果觉得不错,随手点个赞、在看、转发三连吧🙂
如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。