Claude Code 新功能：一个人指挥一支 AI 「施工队」Claude Code 新功能：一个人指挥一支 AI 「

Claude Code 新功能：一个人指挥一支 AI 「施工队」

最近 Claude Code 随着 Opus 4.6 一起上线了个实验性功能：Agent Teams。

试用了一下，感觉有点像从「单打独斗」升级到了「团队作战」。

它能干啥？

简单说，就是让多个 Claude 同时干活。

以前是你跟一个 Claude 对话，它帮你写代码。现在你可以组建一支「AI 施工队」，每个成员负责不同的活儿，同时开工。

比如你要审查一个 Pull Request：

传统方式： 一个 Claude 从头看到尾，可能会关注性能问题，也可能关注安全问题，但很难同时兼顾所有角度。

Agent Teams 方式： 直接说一句「创建一个团队审查这个 PR」，然后 Claude 会：

生成一个专看安全问题的成员
生成一个专看性能问题的成员
生成一个专看测试覆盖率的成员

三个 Claude 各司其职，同时审查，最后把发现汇总给你。

跟普通的「分身术」有什么不同？

Claude Code 之前就有 subagents（子代理）功能，但那更像是「打工仔」——干完活只能向老板汇报，相互之间不能交流。

Agent Teams 不一样：

对比项	Subagents	Agent Teams
通信	只能向主 Agent 报告	成员之间可以直接对话
上下文	共享同一个上下文窗口	每个成员有独立的上下文
协作	不能互相配合	可以挑战彼此的结论
控制	只能通过主 Agent 管理	你可以直接跟任何成员对话

用人话说：subagents 是「临时工」，Agent Teams 是「项目团队」。

怎么用？

功能默认是关闭的，需要手动开启。

方法1：设置环境变量

export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

方法2：改配置文件 在 settings.json 里加上：

{
  "experimental": {
    "agentTeams": true
  }
}

开启之后，用自然语言告诉 Claude 你想干什么就行。

示例提示词：

我要重构认证模块。创建一个 Agent Team：
- 一个成员负责重构代码
- 一个成员负责更新测试
- 一个成员负责检查安全漏洞

Claude 会自动生成团队、分配任务、协调工作。

它适合做什么？

根据官方文档和开发者反馈，这些场景特别合适：

1. 代码审查 一个人审查容易只关注某一类问题。三个 Claude 从不同角度看，能发现更多问题。

2. 调试复杂 Bug 让几个成员并行测试不同的假设，比单线程「试了这个不行再试那个」快得多。

3. 多模块开发 比如你要做一个功能，涉及前端、后端、数据库。每个成员负责一块，互不干扰。

4. 研究和探索 比如「帮我调研三个 OAuth 方案」，让三个成员分别研究 Google、GitHub、Auth0，最后对比结果。

哪些情况别用？

❌ 顺序任务 - 比如「先分析需求，再写代码，再写文档」，这种前后依赖的活儿，单 Agent 更合适。

❌ 改同一个文件 - 两个成员同时改一个文件会互相覆盖，容易出问题。

❌ 简单任务 - 「帮我改个变量名」这种事儿，开团队就是杀鸡用牛刀，token 成本不划算。

成本问题

每个成员都有独立的上下文窗口，意味着 token 用量会成倍增长。

数据对比：

单 Agent：通常用掉 80-90% 的上下文窗口
Team 模式：每个成员约用 40% 上下文窗口，但成员数量多

什么时候值得： ✅ 研究、审查、新功能开发 - 并行探索带来的价值超过成本 ❌ 日常任务 - 还是单 Agent 更经济

实战技巧

1. 新手从「只读任务」开始 第一次用建议先试审查代码、调研资料这种不写代码的任务，降低翻车风险。

2. 任务边界要清晰 确保每个成员负责不同的文件或模块，别让他们打架。

3. 定期检查进度 别让团队跑太久不管，有时候方向错了要及时纠正。

4. 清理要规范 用完之后告诉主 Agent「关闭所有成员，清理团队」，别留下孤儿进程。

真实案例：用 16 个 Claude 写了个 C 编译器

Anthropic 官方拿这个功能做了个压力测试：用 16 个并行 Agent 从零写一个 C 编译器。

项目数据：

16 个 Agent 并行工作
近 2000 个 Claude Code 会话
API 成本：$20,000
产出：10 万行 Rust 代码
能力：可以编译 Linux 6.9 内核

他们怎么做的：

Git worktrees 隔离 - 每个 Agent 在独立分支干活，测试通过才合并
任务锁定机制 - 防止两个 Agent 重复做同一件事
持续集成 - 自动化测试确保新代码不破坏旧功能
上下文管理 - 维护详细的 README 和进度文件，新 Agent 启动时能快速定位

经验教训：

完全无人监督风险很大，人类定期检查很重要
测试报告要为 AI 优化，不是为人类
上下文管理是成败关键

显示模式选择

运行 Agent Team 有两种模式：

In-process（默认）

所有成员在一个终端里跑
用 Shift+上下箭头切换成员
兼容所有终端

Split-pane（分屏）

每个成员占一个窗格，同时看所有输出
需要 tmux 或 iTerm2
看起来更酷，但不是必需的

新手建议先用默认模式，熟悉之后再折腾分屏。

生态发展

这个功能刚出，已经有一些有意思的动向：

1. GitHub Agent HQ 集成 最新消息（2026年2月），GitHub 现在支持在仓库里直接用 Claude、Codex、Copilot 做 Agent。你可以把 Issue 同时分配给三个 Agent，对比结果。

2. 第三方工具面临挑战 之前有些第三方做多 Agent 编排的工具，现在官方原生支持了，他们需要重新定位。

3. 社区分享 已经有开发者在 Reddit 和 GitHub 上分享自己的 Agent 配置和工作流，生态正在快速成长。

行业趋势

Gartner 的数据挺有意思：

从 2024 Q1 到 2025 Q2，关于多 Agent 系统的咨询量激增了 1,445%。

他们预测到 2026 年底，40% 的企业应用会包含特定任务的 AI Agent。

这不是科幻，而是正在发生的事情。

我的看法

Agent Teams 不是万能药，但确实打开了一些新可能。

以前遇到复杂任务，要么自己拆解成小任务逐个完成，要么写个脚本自动化。现在多了个选项：组个 AI 团队并行处理。

值得尝试的点：

多角度审查代码
并行调试复杂问题
对比不同技术方案

需要注意的点：

Token 成本会增加
任务拆解要合理
不是所有事情都需要团队

核心还是那句话：工具是死的，关键看怎么用。

使用建议：

如果你已经在用 Claude Code，可以试试这个功能：

从简单的代码审查开始
观察不同成员的协作效果
总结什么场景值得开团队
逐步扩展到更复杂的任务

如果还没用过 Claude Code，建议先熟悉单 Agent 工作流，再考虑 Agent Teams。

一步一步来，别急。

毕竟，工具再好，也得配合你的节奏才能发挥价值。