“AI无处不在”路线图:不为人知的工程成本

35 阅读8分钟

AI的盲目普及带来隐性工程成本,导致系统膨胀、决策僵化、运维重负、基础设施成本高企,并需长期维护。

译自:The Hidden Engineering Cost of 'AI Everywhere' Product Roadmaps

作者:Alexander T. Williams

AI 已悄然从差异化优势转变为默认期望。现在,产品路线图上几乎每个功能都标有“AI 驱动”,无论这是否合理。团队很少问 AI 是否是正确的工具;他们问的是能多快添加 AI。这种心态表面上看起来很有战略性,但它带来了一种随着时间推移而累积的隐性工程成本。

可悲的是,开发团队首先承担了这一成本。基础设施不断扩展,复杂性成倍增加,可靠性期望急剧上升。路线图上看似的创新,幕后往往转化为运营阻力。AI 越是普及,它所产生的无形工作就越多。真正的风险不在于构建 AI 功能,而在于假装这些功能是免费的。

AI 功能在创造价值之前就使系统膨胀

每个 AI 功能都始于承诺,终于系统。即使是最小的“智能”增强功能也会引入新的依赖关系、新的数据流和新的故障模式。模型需要训练数据、推理管道、回退逻辑和监控。这些都不可能独立存在,而且它们都不像传统的应用程序代码那样运行。

工程团队很快发现 AI 系统难以简化。

工程团队很快发现 AI 系统难以简化。延迟变得更重要,可观测性变得更困难,可复现性变得脆弱。在测试中表现良好的模型,在生产中可能会因为输入变化而悄然退化。这种漂移迫使团队在用户注意到有意义的改进之前很久就构建额外的保障措施。

当 AI 跨多个产品领域分层时,成本变得更加显著。共享服务变成了瓶颈,而孤立的实现则重复了工作。最初的增量创新很快演变为架构蔓延。工程师花费更多时间保持系统一致,而不是推进功能。

最终,价值落后于付出。组织庆祝 AI 的采用,而工程团队则与一个需要持续关注的不断扩大的表面积作斗争。这种不平衡很少出现在季度规划中,但它主导了日常的工程现实。

路线图中的 AI 承诺将团队锁定在脆弱的决策中

一旦 AI 出现在路线图上,灵活性就会消失。各种时间表迫使工程团队尽早选择模型、供应商和架构,通常在需求稳定之前。这些早期决策很快固化,因为后期替换它们既昂贵又在政治上困难重重。

这种僵化与 AI 系统的实际演进方式相冲突。模型改进,API 变化,价格波动。当最初合理的选择在几个月后变成负担时,工程团队就会感受到这种摩擦。平台重构很少被优先考虑,因为它无法带来可见的产品胜利。

结果是隐性的技术债务。权宜之计堆积如山,以弥补早期决策的局限性。工程师构建抽象层以保护产品免受不稳定性的影响,增加了未来团队必须理解和维护的层次。即使功能范围保持不变,复杂性也会增加。

随着时间的推移,路线图开始反映过去 AI 选择的限制,而非用户需求。工程团队不再问应该构建什么,而是开始问什么仍然可能。这种转变在领导层注意到交付速度放缓之前很久就侵蚀了速度。

AI 可靠性期望重塑工程工作负载

传统软件以可预测的方式失败,而AI 系统则不然。用户期望 AI 驱动的功能感觉神奇,但工程师知道它们是概率性的、有噪声的,并且对上下文敏感。满足这些期望需要一种防御性工程水平,而大多数路线图从未承认过这一点。

团队必须针对不确定性进行设计。置信度阈值、人工回退和可解释性工具成为强制性要求。监控超越了正常运行时间,扩展到输出质量、偏差检测和行为异常。这些问题需要持续调整,而非偶尔修复。

随着 AI 跨产品传播,可靠性需求呈非线性增长。

轮班制度也随之改变。工程师不仅要响应中断,还要响应引发客户投诉的细微退化。调试变得更具调查性,而非确定性。即使事件频率没有增加,精神负担也会增加。

随着 AI 跨产品传播,这些可靠性需求呈非线性增长。每个新功能都增加了一个可能以意想不到的方式失败的新表面,这就是营销人员正在寻找 Taboola 替代方案以及销售部门本月正在试用其第 5 个聊天机器人的原因,导致了全组织的混乱。可悲的是,工程团队承担着这种风险的负担,通常没有额外的时间或人力来应对它。

“AI 无处不在”将基础设施变成了一个成本中心

如果你现在还没注意到,AI 密集型产品正在重塑基础设施经济学。推理工作负载不可预测地激增,存储迅速增长,数据管道需要持续的吞吐量。成本随着使用模式的波动而变化,而这些模式比传统的流量增长更难预测。

工程团队变成了不情愿的财务管理者。他们优化提示词、缓存响应并限制功能,不是为了优雅,而是为了生存。每个架构决策都伴随着成本模型,而成本模型会随着供应商调整定价或使用层级而变化。

这种压力改变了系统的构建方式。工程师用简单性换取效率,引入批处理、异步处理和分层质量模式。这些优化控制了预算,但增加了任何接触该系统的人的认知负担。

具有讽刺意味的是,AI 的采用通常被框定为增长杠杆,但它同样容易限制实验。团队不愿发布可能增加使用量和成本的改进。基础设施不再赋能创新,而是开始对其进行监管,悄然从底层重塑产品策略。

工程团队支付长期维护税

AI 功能不像传统功能那样稳定。模型需要重新训练,数据集需要刷新,评估标准不断演变。维护变得持续而非阶段性,使工程资源捉襟见肘。

知识集中成为一种风险。一小群工程师通常了解整个 AI 堆栈,从数据摄取到模型行为。当这些人离开或转换角色时,机构记忆就会蒸发。新员工面临陡峭的学习曲线,仅仅是为了保持系统运行。

随着时间的推移,AI 系统将减少技术债务,但它们也会产生新的问题。

文档难以跟上步伐。行为源于数据和模型,而不仅仅是代码,这使得意图更难捕捉。工程师依赖于部落知识和仪表板,而不是清晰的规范。

随着时间的推移,AI 系统将减少技术债务,但它们也会产生新的问题。曾经感觉前沿的东西变得脆弱和不透明。工程精力从构建转向“看护”。这种转变很少与职业激励或团队士气相符,但它定义了 AI 密集型路线图的长期成本。

结语

AI 不是问题。将其视为一个复选框才是。可持续的路线图承认 AI 功能重塑了工程工作的每个层面,从架构到值班文化。这种现实必须从一开始就考虑在内。

尽早让工程部门参与进来的产品领导者能做出更好的权衡。他们会问 AI 在何处真正增加了杠杆作用,又在何处增加了阻力。他们允许团队说不、延迟或简化——而不是将其框定为抵制创新。

成功的组织也投资于平台思维。共享工具、明确的所有权和审慎的约束减少了重复工作和倦怠。工程精力从“救火”转向“管理”,这正是 AI 系统蓬勃发展的地方。

“AI 无处不在”的隐性成本不仅仅体现在计算或人力上。它体现在注意力、韧性以及在不减速的情况下持续构建的能力。尊重这一成本的路线图才能持久。