Claude Code 新功能:一个人指挥一支 AI 「施工队」

0 阅读6分钟

Claude Code 新功能:一个人指挥一支 AI 「施工队」

最近 Claude Code 随着 Opus 4.6 一起上线了个实验性功能:Agent Teams。

试用了一下,感觉有点像从「单打独斗」升级到了「团队作战」。

Gemini_Generated_Image_cw9d4ocw9d4ocw9d.png

它能干啥?

简单说,就是让多个 Claude 同时干活。

以前是你跟一个 Claude 对话,它帮你写代码。现在你可以组建一支「AI 施工队」,每个成员负责不同的活儿,同时开工。

比如你要审查一个 Pull Request:

传统方式: 一个 Claude 从头看到尾,可能会关注性能问题,也可能关注安全问题,但很难同时兼顾所有角度。

Agent Teams 方式: 直接说一句「创建一个团队审查这个 PR」,然后 Claude 会:

  • 生成一个专看安全问题的成员
  • 生成一个专看性能问题的成员
  • 生成一个专看测试覆盖率的成员

三个 Claude 各司其职,同时审查,最后把发现汇总给你。

跟普通的「分身术」有什么不同?

Claude Code 之前就有 subagents(子代理)功能,但那更像是「打工仔」——干完活只能向老板汇报,相互之间不能交流。

Agent Teams 不一样:

对比项SubagentsAgent Teams
通信只能向主 Agent 报告成员之间可以直接对话
上下文共享同一个上下文窗口每个成员有独立的上下文
协作不能互相配合可以挑战彼此的结论
控制只能通过主 Agent 管理你可以直接跟任何成员对话

用人话说:subagents 是「临时工」,Agent Teams 是「项目团队」。

怎么用?

功能默认是关闭的,需要手动开启。

方法1:设置环境变量

export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

方法2:改配置文件settings.json 里加上:

{
  "experimental": {
    "agentTeams": true
  }
}

开启之后,用自然语言告诉 Claude 你想干什么就行。

示例提示词:

我要重构认证模块。创建一个 Agent Team:
- 一个成员负责重构代码
- 一个成员负责更新测试
- 一个成员负责检查安全漏洞

Claude 会自动生成团队、分配任务、协调工作。

它适合做什么?

根据官方文档和开发者反馈,这些场景特别合适:

1. 代码审查 一个人审查容易只关注某一类问题。三个 Claude 从不同角度看,能发现更多问题。

2. 调试复杂 Bug 让几个成员并行测试不同的假设,比单线程「试了这个不行再试那个」快得多。

3. 多模块开发 比如你要做一个功能,涉及前端、后端、数据库。每个成员负责一块,互不干扰。

4. 研究和探索 比如「帮我调研三个 OAuth 方案」,让三个成员分别研究 Google、GitHub、Auth0,最后对比结果。

哪些情况别用?

顺序任务 - 比如「先分析需求,再写代码,再写文档」,这种前后依赖的活儿,单 Agent 更合适。

改同一个文件 - 两个成员同时改一个文件会互相覆盖,容易出问题。

简单任务 - 「帮我改个变量名」这种事儿,开团队就是杀鸡用牛刀,token 成本不划算。

成本问题

每个成员都有独立的上下文窗口,意味着 token 用量会成倍增长。

数据对比:

  • 单 Agent:通常用掉 80-90% 的上下文窗口
  • Team 模式:每个成员约用 40% 上下文窗口,但成员数量多

什么时候值得: ✅ 研究、审查、新功能开发 - 并行探索带来的价值超过成本 ❌ 日常任务 - 还是单 Agent 更经济

实战技巧

1. 新手从「只读任务」开始 第一次用建议先试审查代码、调研资料这种不写代码的任务,降低翻车风险。

2. 任务边界要清晰 确保每个成员负责不同的文件或模块,别让他们打架。

3. 定期检查进度 别让团队跑太久不管,有时候方向错了要及时纠正。

4. 清理要规范 用完之后告诉主 Agent「关闭所有成员,清理团队」,别留下孤儿进程。

真实案例:用 16 个 Claude 写了个 C 编译器

Anthropic 官方拿这个功能做了个压力测试:用 16 个并行 Agent 从零写一个 C 编译器。

项目数据:

  • 16 个 Agent 并行工作
  • 近 2000 个 Claude Code 会话
  • API 成本:$20,000
  • 产出:10 万行 Rust 代码
  • 能力:可以编译 Linux 6.9 内核

他们怎么做的:

  1. Git worktrees 隔离 - 每个 Agent 在独立分支干活,测试通过才合并
  2. 任务锁定机制 - 防止两个 Agent 重复做同一件事
  3. 持续集成 - 自动化测试确保新代码不破坏旧功能
  4. 上下文管理 - 维护详细的 README 和进度文件,新 Agent 启动时能快速定位

经验教训:

  • 完全无人监督风险很大,人类定期检查很重要
  • 测试报告要为 AI 优化,不是为人类
  • 上下文管理是成败关键

显示模式选择

运行 Agent Team 有两种模式:

In-process(默认)

  • 所有成员在一个终端里跑
  • 用 Shift+上下箭头切换成员
  • 兼容所有终端

Split-pane(分屏)

  • 每个成员占一个窗格,同时看所有输出
  • 需要 tmux 或 iTerm2
  • 看起来更酷,但不是必需的

新手建议先用默认模式,熟悉之后再折腾分屏。

生态发展

这个功能刚出,已经有一些有意思的动向:

1. GitHub Agent HQ 集成 最新消息(2026年2月),GitHub 现在支持在仓库里直接用 Claude、Codex、Copilot 做 Agent。你可以把 Issue 同时分配给三个 Agent,对比结果。

2. 第三方工具面临挑战 之前有些第三方做多 Agent 编排的工具,现在官方原生支持了,他们需要重新定位。

3. 社区分享 已经有开发者在 Reddit 和 GitHub 上分享自己的 Agent 配置和工作流,生态正在快速成长。

行业趋势

Gartner 的数据挺有意思:

从 2024 Q1 到 2025 Q2,关于多 Agent 系统的咨询量激增了 1,445%

他们预测到 2026 年底,40% 的企业应用会包含特定任务的 AI Agent。

这不是科幻,而是正在发生的事情。

我的看法

Agent Teams 不是万能药,但确实打开了一些新可能。

以前遇到复杂任务,要么自己拆解成小任务逐个完成,要么写个脚本自动化。现在多了个选项:组个 AI 团队并行处理。

值得尝试的点:

  • 多角度审查代码
  • 并行调试复杂问题
  • 对比不同技术方案

需要注意的点:

  • Token 成本会增加
  • 任务拆解要合理
  • 不是所有事情都需要团队

核心还是那句话:工具是死的,关键看怎么用。


使用建议:

如果你已经在用 Claude Code,可以试试这个功能:

  1. 从简单的代码审查开始
  2. 观察不同成员的协作效果
  3. 总结什么场景值得开团队
  4. 逐步扩展到更复杂的任务

如果还没用过 Claude Code,建议先熟悉单 Agent 工作流,再考虑 Agent Teams。

一步一步来,别急。

毕竟,工具再好,也得配合你的节奏才能发挥价值。