从 Chat 到 Agent:Claude Code 如何重新定义开发者工具

5 阅读6分钟

从 Chat 到 Agent:Claude Code 如何重新定义开发者工具

想象这样一个场景。

2024 年底,你用 Claude Code 重构一个老旧项目。那时它还是个"高级自动补全"。你问一句,它答一句。改完一个文件,再改下一个。

两个小时后,你盯着终端发呆。

同样的活,放在 2025 年的今天,可能只需要 15 分钟。

因为 Claude Code 已经不只是 Chat。它是 Agent。


对话式 AI 的瓶颈

ChatGPT 刚火的时候,我们以为未来就是这样:

人类提问,AI 回答。一轮一轮,直到问题解决。

这种模式的局限很快就暴露了。

第一,上下文太长会丢东西。

一个复杂项目,你可能要跟 AI 交代几十轮背景。说到后面,前面忘了。

第二,单线程太慢。

改 75 个文件里的同一个函数,你得一个一个来。AI 不会累,但你会急死。

第三,需要人一直盯着。

每改一步,AI 都要问"这样可以吗"。你点个"继续",它才肯往下走。

这哪是 AI 辅助编程?这是人辅助 AI 编程。


2025 年的范式转移

Anthropic 在 2025 年做了一个关键决定:

把 Claude Code 从"对话工具"升级为"Agent 运行时"。

什么是 Agent?

简单说,就是能自主决策、自主执行、自主完成任务的东西。

不是你说一句它做一步。是你给个目标,它自己想办法搞定。

Claude Code 现在的能力,可以分成三层:

第一层,基础工具。

读写文件、执行 shell、搜索代码、调用网络。这些老早就有了。

第二层,子代理(Subagent)。

这是真正的质变。

你可以让 Claude Code 同时派出多个"小弟"。每个小弟独立干活,互不影响。

最多 7 个同时跑,10 个任务智能排队。

第三层,Hooks 和编排。

你可以写代码控制 Claude Code 的行为。比如:

  • 执行 git commit 之前,自动跑一遍测试
  • 子代理完成前,检查一遍输出质量
  • 敏感操作必须弹窗确认

这三层加起来,Claude Code 从一个"聪明的聊天机器人"变成了一个"可以编程的代理平台"。


核心能力全景图

1. 子代理:并行执行任务

Claude Code 的 Subagent 设计有几个关键原则:

隔离性。

每个子代理有自己的上下文窗口。它里面怎么折腾,不会污染主代理。

只有最终结果会返回。

不可嵌套。

子代理不能再派子代理。防止无限递归。

不能直接通信。

A 子代理不知道 B 子代理在干嘛。只有主代理能协调它们。

这三个限制看起来是约束,实则是保护。

确保系统不会失控。

2. 三种执行模式

并行模式。

不同领域的任务同时跑。

比如:一个子代理看前端代码,一个看后端 API,一个看数据库 schema。三管齐下。

关键前提:它们操作的是不同文件。

顺序模式。

后一个子代理拿到前一个的结果,继续处理。

适合流水线式的任务。

后台模式。

按 Ctrl+B,把任务丢到后台跑。

主会话继续干别的。完事了通知你。

3. 上下文压缩

长任务最怕什么?上下文超限。

Claude Code 内置了 compact 功能。快满的时候,自动总结前面的内容。

保证不丢关键信息,又不浪费 Token。

4. 检查点(Checkpoints)

随时回滚到任意状态。

改崩了?一键回退。想对比不同方案?切过去看看。

这对实验性工作特别有用。


案例一:NYSE 的工程流程重构

纽约证券交易所(NYSE)去年干了一件事。

他们" rewired their engineering process"——重新连接了整个工程流程。

具体怎么做?

一个工程师接到 Jira ticket。以前,他要:

  1. 读需求
  2. 拉分支
  3. 写代码
  4. 跑测试
  5. 提 PR
  6. 等 review
  7. 合并

现在呢?

他把 ticket 扔给 Claude Code。Agent 自动:

  • 读需求,理解要做什么
  • 拉分支,写代码
  • 跑测试,修 bug
  • 生成 PR 描述
  • 提交

工程师只在关键节点确认一下。

时间从几小时压缩到几十分钟。

NYSE 说,这改变了他们的"工程 DNA"。

不是辅助工具,是基础设施。


案例二:多代理代码审查

Anthropic 自己也在用 Claude Code 做 Code Review。

但不是用一个 Agent 看所有东西。

是同时派出多个子代理,各自专注不同维度:

  • 代理 A:检查逻辑 bug
  • 代理 B:检查安全问题
  • 代理 C:检查性能隐患
  • 代理 D:检查代码风格

它们并行跑,互不影响。

跑完后,主代理汇总结果,生成一份完整的 review 报告。

哪里有问题,为什么有问题,怎么修,都列清楚。

注意:Agent 只提建议,不批准合并。

最终决定权还在人手里。

这种模式比人工 review 快得多。而且不容易漏掉细节。


对开发者意味着什么

Claude Code 的进化,正在改变开发者的角色。

以前,开发者是"写代码的人"。

你一行一行敲,AI 帮你补全、查错。

现在,开发者是"编排代理的人"。

你不写代码,你设计任务。

你不改文件,你派子代理去改。

你不 debug,你让 Agent 去分析日志。

这个转变不容易。

你得学会:

  • 如何把大任务拆成小任务
  • 什么时候并行、什么时候顺序
  • 怎么验证 Agent 的输出
  • 怎么设置边界,防止 Agent 越权

但这些技能会越来越重要。

因为 Agent 不会取代开发者。会用 Agent 的开发者会取代不会用的。


局限与边界

Claude Code Agent 也不是万能的。

第一,子代理之间不能通信。

如果两个子代理需要协作,只能靠主代理中转。有时候效率不高。

第二,Hooks 需要额外开发。

想用好 PreToolUse 这些钩子,你得写 Python 或 TypeScript。

对非专业开发者有门槛。

第三,Token 成本要考虑。

10 个子代理同时跑,费用也乘以 10。

虽然 Anthropic 允许给子代理配置不同的模型(比如用便宜的 Haiku 跑简单任务),但还是得算账。

第四,不是所有任务都适合并行。

有依赖关系的任务,硬要并行只会更慢。


未来展望

Claude Code 的路线图很明显:

Agent 生态。

现在可以定义自定义子代理(放在 .claude/agents/ 目录)。

未来可能出现 Agent 市场。你下载一个"React 专家"Agent,它专门帮你写 React。

Skills 系统。

Beta 版的 Agent Skills 允许打包特定领域的能力。

Excel 处理、PDF 生成、Jira 自动化... 这些都是开箱即用的 Skill。

更深的企业集成。

从 Slack、Jira、PagerDuty 直接触发 Claude Code Agent。

故障来了,Agent 自动分析日志、定位问题、提 PR 修复。

工程师起床一看,问题已经解决了。


写在最后

回头看那个下午。

坐在终端前,一轮一轮地跟 AI 对话,改那堆陈年代码。

当时觉得 AI 很神奇。

现在觉得:那时的 AI 只是"能说话的搜索引擎"。

真正的变革,是 Agent。

不是"我问你答",而是"我给目标,你搞定"。

这个转变,2025 年才刚刚开始。


你准备好从"写代码的人"变成"编排 Agent 的人"了吗?

还是更愿意相信,下一个被 Agent 替代的,不会是自己?