AI 智能体正在放大低质量代码:为什么大组织会先被反噬?

1 阅读6分钟

AI 提速了原型,却没有解决收尾、验证和维护,大组织往往会先被低质量代码反噬。 原文链接AI 小老六

如果一个团队的提交量在三个月里翻了一倍,PR 描述写得更像样了,样例项目也铺得更快,这到底说明了什么?很多人会本能地把它理解成效率革命已经落地。我没这么乐观。

现在最常见的错觉,是把 前半程顺滑 当成 ​整件事都变简单了​。模型在起手阶段确实很猛。找资料、搭脚手架、写一个能跑的原型、把想法摁进一个可见的界面,这些事它做得又快又便宜。问题出在后面。真正贵的部分,从来不是把第一版凑出来,而是把边界补齐、把异常路径走通、把接口收紧、把别人的旧代码接上,再让半年后的自己还能看懂。

article-01.png

图:模型能显著压缩起手时间,却无法替团队免掉后段收尾成本

原型阶段很爽,收尾阶段最贵

很多人第一次用智能体写代码都会有同一种兴奋感:它几分钟就能铺开一大坨东西,像是把原本几小时的活一下子掰平了。可 软件工程的成本结构 不是平均分布的。真正吃时间的是最后那一截,也是最需要判断力的那一截。

最糟的是,模型生成的代码常常不是明显错误,而是 ​**“差一点” 的答案**​。测试也许能过,命名也许没问题,分层甚至看起来挺讲究,可一旦你开始继续迭代,前面的松散假设、偷懒的抽象和没有讲透的边界就会一起反噬。你会发现自己不是少干了活,而是把工作换成了另一种更烦的活:

  • 审代码
  • 猜意图
  • 补约束
  • 收残局

真正昂贵的,不是把第一版写出来,而是把它变成一个能长期维护的系统。

高手能纠错,组织未必能

个人开发者和大组织使用这类工具,结果很可能完全不同。高手通常有很强的 ​自校验能力​,知道哪些地方可以借力,哪些地方必须亲手收。模型给他的价值更像 ​增压器​,而不是方向盘。

大组织则容易把这件事做反。链路长、责任散、评审时间被压缩、交付节奏又快,最容易出现的不是“没人会用”,而是“会一点的人大量在用”。结果就是 低质量内容 以极高速度流入主干,局部看都像在进展,整体看却在透支未来的维护成本。

article-02.png

图:同样的 AI 工具,在高手手里像增压器,在大组织里却可能变成放大器

场景智能体带来的短期收益真实风险
搜索资料、搭 demo很高风险可控,返工成本低
写生产代码的第一版中等如果没人严审,技术债会被提前埋进去
复杂重构、跨模块改动表面很高误改、误解上下文、破坏隐含约束最严重
长期维护的业务系统不稳定产能上去了,平均质量未必守得住

语法正确,不再等于工程正确

过去大家会凭一些外观线索判断东西靠不靠谱。代码格式整齐、命名规整、文档像模像样,至少说明作者花过心思。现在这些线索正在失效。模型特别擅长把东西写得 ​像那么回事​,而人又天然容易被这种表面完成度麻痹。

这不是说生成结果一无是处,而是说旧的 质量代理指标 正在失灵。今天最需要重新训练的能力,不是“怎么把提示词写得更花”,而是“怎么更早识别那些结构上不对、但局部句子全都没毛病的产物”。这件事很难,也很花精力。

先决定哪些工作可以放心外包

更务实的办法,是先划清边界,而不是笼统问“模型能不能写代码”。这个问题太大,也太容易把讨论带偏。真正有用的是把任务拆开看:

  1. 哪些工作出错成本低。
  2. 哪些工作一旦出错会把团队拖进泥里。

适合放手给模型的,通常是 ​信息检索、样板搭建、一次性脚本、局部试验​。不能轻易放手的,是 ​定义边界条件、修改核心约束、清理历史包袱、做长期维护的架构决策​。后一类工作真正值钱的地方,不在于写出第一版代码,而在于知道什么绝对不能碰坏。

产能崇拜,是这轮工具热最危险的副作用

真正让我警惕的,不是某个模型今天又多会写几门语言,而是很多团队已经开始把 输出变多 当成唯一捷报。代码量、PR 数、原型数量,这些指标天然好看,也天然容易诱导管理层做错决策。

article-03.png

图:当团队只奖励输出变多时,真正被累积起来的往往是维护负担

软件工程从来不是桶越多越好。桶多了,垃圾也会更多。真正稀缺的东西一直没变:

  • 能辨认什么是好设计
  • 能在局部诱惑面前守住整体约束
  • 能把一套系统几年之后还维持在可控状态

智能体没有把这部分稀缺性抹平,它只是把 低质量产出的放大器 做得更便宜了。

所以问题不该是 “AI 会不会取代工程师”,而该是 “团队有没有能力抵挡一大堆看起来像成果的半成品”。

如果这个问题答不上来,最先被放大的不会是生产力,而是组织里本来就存在的低质量部分。

推荐阅读

Claude Code 如何压缩上下文:Microcompact、Prompt Cache 与 cache_edits 工程拆解

前端别再乱接管浏览器了! 自定义滚动、密码框、日期控件,这些为什么总把体验做坏?

平台智能化到了分水岭:为什么配置代码化才是 AI Coding 的下一代接口

技术沟通为什么总在返工?你写的是文档,产品听到的却不是同一种语言

为什么 AI Coding 难进生产环境?深入了解 Everything-Claude-Code!