从追热点到做系统:我这段时间对 AI 开发工具的长复盘

24 阅读8分钟

这篇不是教程,也不是“XX公司实践揭秘”。

它更像一份阶段性复盘:过去这段时间,我一边做业务,一边被 AI 开发工具的更新速度推着走,焦虑过,误判过,也慢慢摸到一点能站住脚的方法。

你如果也在这个阶段,可能会有同样的感受:

  • 新工具每天都在发布
  • 旧方法还没吃透,新的工作流已经在刷屏
  • 团队内部每周都在问“要不要换栈”“要不要上 agent”

我不打算再写一篇“某工具真香”的文章。那种文章我也看了很多,热度很高,但对我长期最有帮助的,反而是那些把真实代价写清楚的复盘。

这篇就做一件事:把我从“追热点”转到“做系统”的过程讲清楚。


先说结论:我看了开发工具分类 50 篇高热文后,最大的感受

先讲观察,不讲立场。

我把开发工具分类里高热文章按正文读了 50 篇,能看到一个很清晰的结构:

1)最容易起量的是“立刻有用”

比如注册攻略、免费替代、效率工具清单、三步上手、十分钟跑通。它们的共同点不是“深”,而是“读完马上能做”。

2)标题不一定是问句,但一定有结果感

很多高热标题不是“为什么”,而是“发生了什么”和“你能拿到什么”。

3)正文其实并不短

热文看起来轻松,但大多有完整分节、有步骤、有截图或代码、有可复制动作。不是“情绪短文”,而是“低门槛交付文”。

这三点让我反思:

我以前总把“深度”理解成“理论密度”,后来才意识到,平台语境里的深度,很多时候是“能不能把复杂事说成可执行动作”。


我为什么会被速度打懵

说实话,最崩溃的时候,不是技术难,是判断难。

以前做前端,难点往往是“我会不会”。 现在做 AI 相关能力,难点变成“我该不该”。

  • 这个工具现在看起来很强,三个月后会不会被替代?
  • 这个框架接进来,后续迁移成本会不会爆炸?
  • 这个模型今天便宜,明天价格变了怎么办?
  • 这个 agent 能调用工具,权限边界怎么控?

最消耗人的不是实现,而是连续决策。

你会出现一种很矛盾的状态:

  • 每天都很忙
  • 但晚上回看,很难说自己今天构建了什么长期资产

这种“高努力、低掌控”的感觉,比纯加班更容易让人空掉。


我踩过的三个坑(这三件事最伤)

坑一:把工具更新当成个人 KPI

我有一段时间会下意识做一件事:

热榜上有新工具 -> 当天就装 -> 当天就试 -> 当天就想接进业务。

结果是什么?

  • 环境里装了一堆半成品
  • 记了很多零散笔记
  • 真正线上路径反而越来越乱

后来我做了一个很土但很有效的限制:

“每周只允许引入一个新工具做试验;72 小时内不能进主线。”

这个限制一上,焦虑立刻下降。不是因为世界变慢了,而是我终于把节奏拿回来了。

坑二:把 demo 速度错当上线能力

demo 能跑起来,真的不代表它能上线。

我之前有个链路就是典型:

  • 本地单人跑通
  • 看起来很顺
  • 一进多人并发就开始状态互踩

最后排查发现,本质是会话和任务没有明确边界:

  • 同一个 session 被多个请求并发改写
  • 失败重试没有幂等设计
  • 中间状态没落日志,错了只能猜

修这个问题比“第一次做出来”花的时间多得多。

坑三:只看功能,不看治理

AI 工具最容易让人上头的点,是“它能干很多事”。

但工程里真正值钱的不是“能做”,而是“可控地做”。

我以前会先追能力:能不能自动写、自动调、自动改。 现在我先看治理:

  • 这个调用链路可审计吗
  • 失败能回放吗
  • 权限可以最小化吗
  • 问题能快速熔断吗

如果这四条说不清,再强的功能我也不会接主链路。


我现在的做法:把“工具名思维”换成“能力层思维”

我现在把 AI 相关工作拆成五层,每一层只回答一个问题。

第一层:输入层

问题是:消息从哪里来,怎么标准化。

不管是 IM、表单、工单还是文档,都先统一成同一种内部结构,再往下走。

第二层:会话层

问题是:谁的上下文,生命周期多长,能不能并发。

这里最关键的一条是:同一会话串行,跨会话并行。

第三层:执行层

问题是:模型负责什么,工具负责什么。

模型只做决策和组织,不直接承担系统状态管理。

第四层:治理层

问题是:权限、审批、审计、回滚怎么做。

没有治理层,前面三层做得越快,后面出问题越痛。

第五层:观测层

问题是:出错时你靠什么定位。

我现在要求每次调用至少落三类信息:

  • 输入摘要
  • 执行路径
  • 结果状态和耗时

做不到这三条,就不上线。


我给自己定的四个“上线门槛”

这四条很硬,也很实用:

1)可替换

模型或框架替换后,不改业务展示层。

2)可观测

任何一次失败,30 分钟内能定位到链路节点。

3)可控成本

有 token、调用次数、慢请求三个维度的基础监控。

4)可回滚

新链路出问题,能在短时间内切回旧链路,不影响主流程。

以前我觉得这些是“后期优化项”,现在我把它们当“接入前置项”。


再说回“冲击感”:AI 发展快,到底冲击了什么

我现在的感受是,真正的冲击不是“你会不会被替代”,而是“你的工作单位被重写了”。

过去我们的工作单位是“一个功能页面”。 现在越来越像“一个可持续演化的执行系统”。

你不再只交付页面和接口,你要交付:

  • 规则
  • 边界
  • 运行过程
  • 失败处理

这会让很多人一开始很不适应,因为它逼着我们从“写完代码”走到“设计系统行为”。

但换个角度看,这也是机会。

当所有人都在比谁更快接新工具时,真正拉开差距的往往是:

谁先把不确定能力,变成了可管理、可迭代、可复制的组织资产。


我自己的阶段性答案

如果你问我现在最想守住什么,我不会回答“某个模型”或“某个框架”。

我更想守住三件事:

  • 决策节奏
  • 系统边界
  • 复盘习惯

决策节奏,决定你是主动演进还是被热点拖着跑。 系统边界,决定你能不能在快变化里保持稳定交付。 复盘习惯,决定你今天踩的坑会不会在下个月再踩一遍。

这三件事听起来朴素,但它们几乎决定了你能不能在这轮变化里走得久。


写在最后

我现在不会再追求“第一时间把所有新东西都学完”。

我更在意的是:

  • 我的系统能不能承受变化
  • 我的团队能不能理解这套变化
  • 我的每次试验能不能沉淀成下一次的起点

如果你最近也有“明明很忙,却总觉得抓不住重点”的感觉,不是你不努力,很多人都一样。

可以先从一件小事开始:

下周先少引入一个新工具,把一条现有链路的可观测补完整。

你会很快发现,掌控感不是来自“知道更多新名词”,而是来自“把一件事做成可重复的系统”。

这可能就是我这段时间最真实的收获。


最近大家常聊的几类热点,我的处理方式

这里只说处理方式,不做“站队”。

1)ai 编码助手和 agent 编排

我的策略是:

  • 先用于提效场景(脚手架、样板代码、重复改动)
  • 暂不直接接核心业务决策
  • 所有自动化动作都保留人工兜底开关

原因很简单:这类工具提升很快,但稳定性在复杂业务里仍有波动。

2)mcp 与工具生态扩展

我的策略是:

  • 先做“只读能力”接入
  • 再做“低风险写能力”
  • 最后才考虑“高风险执行能力”

这样做会慢一点,但事故率会低很多。

3)本地模型与隐私方案

我的策略是:

  • 明确哪些数据必须本地
  • 明确哪些场景可以云侧
  • 不做“全本地”或“全云端”这种绝对选择

工程上最忌讳的是口号式架构。

4)成本优化与模型切换

我的策略是:

  • 一开始就做模型抽象层
  • 不把业务逻辑绑死在单一厂商接口
  • 提前准备 A/B 路径和降级路径

等到成本压力真的上来再改,往往已经来不及。


我以前总以为,技术人的安全感来自“懂得比别人多”。

现在我更相信,技术人的安全感来自“能把变化变成秩序”。

如果这篇长复盘能给你一个具体可执行的起点,它就值了。