赛博监工: 如何让AI互相监督

14 阅读12分钟

左右脑互搏:AI 如何用不同角色协作处理同一件事

一个问题,多个视角。让 AI 扮演不同角色,像辩论一样把问题想清楚。

缘起:那个周五的下午

事情要从上个月说起。

我们团队接到了一个新需求:给现有的 SaaS 产品加上 多租户支持。这个改动牵扯的范围很大:

  • 后端要改数据模型(加租户表、改索引)
  • 前端要加租户切换界面
  • API 要加租户隔离逻辑
  • 测试要覆盖多租户场景

刚毕业的小王说:"直接在所有表里加 tenant_id 就行了。"

老张皱了皱眉:"这会影响现有查询性能,你得评估一下。"

前端负责人小李说:"那用户界面怎么设计?切换租户的时候要不要刷新页面?"

测试组长也插话了:"这么多改动,回归测试范围有多大?"

大家七嘴八舌,最后老板拍了板:"下周给个技术方案,要考虑全面。"

那天晚上,我坐在工位上发愁:这问题涉及面太广,我一个人想不全啊。


转机:同事的一句话

第二天中午,隔壁组的老陈端着咖啡走过来,看我愁眉苦脸。

"怎么了?"

我把情况说了一遍。

老陈笑了:"我之前也遇到这种问题,后来用了个工具——Claude Code,它有个特性叫 '左右脑互搏',你可以让多个 AI agent 以不同角色的身份同时分析同一个问题。"

"什么意思?"

"就像咱们开会讨论一样,你可以让一个 AI 扮演后端架构师,一个扮演前端专家,一个扮演测试工程师,一个扮演风险评估师……它们各自从自己的专业角度出发,给你建议。最后你汇总一下,方案就全面多了。"

我眼睛一亮:"这听起来像是我一个人拥有了一个技术团队。"

"对,就是这样。"老陈把电脑转过来,"你看,这就是 Claude Code。"


第一次尝试:让 AI 开个会

那天下午,我按照老陈的指导,尝试用 Claude Code 做了一次"左右脑互搏"。

我先问了 Explore agent:

"帮我搜索一下项目里现有的用户认证、权限相关的代码,看看有没有租户相关的逻辑。"

几秒钟后,Explore agent 给了我一个清晰的报告:

  • 认证逻辑在 src/auth/ 目录
  • 用的是 JWT + Redis 的方案
  • 目前没有租户隔离,所有用户共享数据

然后,我同时启动了四个 agent(真正的"左右脑互搏"):

后端架构师(Plan agent):

"基于现有的 JWT + Redis 方案,设计一个多租户架构,考虑数据隔离、性能影响、迁移成本。"

前端专家(Plan agent):

"设计租户切换的交互方案,考虑用户体验、状态管理、页面刷新策略。"

测试工程师(Plan agent):

"列出多租户功能需要的测试场景,包括功能测试、安全测试、性能测试。"

风险评估师(Plan agent):

"评估多租户改造的风险点,包括数据安全、性能下降、业务中断可能性,给出缓解措施。"

半小时后,四个 agent 都给出了各自的报告。我把它们拼在一起:

角色核心建议
后端架构师用 row-level security,在查询层面加租户过滤,最小化代码改动
前端专家用 React Context 管理租户状态,切换时不刷新页面,局部更新
测试工程师需要覆盖跨租户数据隔离、并发切换、租户数据导出等 15 个场景
风险评估师最大风险是数据泄露,建议加审计日志;次要是索引性能下降,建议监控慢查询

哇,这就是一个完整的技术方案啊!

我把这四份报告整理了一下,发给老板。老板看了之后回复:"这方案挺全面的,考虑得比我想的还细。"

那一刻,我意识到:原来 AI 不是一个"问答机器",而是一个可以组建"虚拟团队"的工具


什么是"左右脑互搏"

"左右脑互搏"是一个比喻:让多个 AI agent 以不同角色的身份,同时处理同一个问题

就像你的大脑里有两个小人:

  • 一个负责"发散":探索可能性、想方案、搞创新
  • 一个负责"收敛":批判质疑、找风险、做决策

但在 Claude Code 里,不只有两个小人,你可以有一整个团队。


Claude Skills 的角色系统

Claude Code 内置了几种基础 agent 类型:

Agent 类型角色定位擅长的任务
Explore探索者快速找文件、搜代码、理解代码库结构
Plan架构师设计实现方案、分析技术选型、评估风险
general-purpose多面手复杂多步骤任务、搜索、综合分析
Bash执行者跑命令、git 操作、测试构建
claude-code-guide向导回答 Claude Code 使用问题

动态添加专业角色

关键是,你可以给 Plan agent 分配不同的"专业角色",让它们从特定角度分析问题。

常用的专业角色包括:

角色分析角度
前端专家组件设计、状态管理、交互体验、性能优化
后端架构师API 设计、数据模型、缓存策略、并发处理
测试工程师测试覆盖、边界场景、自动化方案、回归策略
风险评估师安全漏洞、性能风险、业务中断、合规问题
运维专家部署方案、监控告警、日志收集、容灾备份
产品经理需求拆解、优先级、用户价值、版本规划
DBA索引优化、分库分表、数据迁移、备份恢复

这些角色不是硬编码的,而是你在 prompt 里动态指定的。


实战演示:完整的多角色协作

让我用一个完整的例子演示如何使用。

场景:给项目加全文搜索功能

假设你的项目是一个文档管理 SaaS,现在要加全文搜索。

第一步:让 Explore agent 摸底

"启动 Explore agent,搜索项目中现有的数据查询、搜索相关代码,了解:

  • 用的是什么数据库
  • 现在有搜索功能吗
  • 数据量大概多少"

Explore agent 会快速给你一份报告,比如:

  • 数据库是 PostgreSQL,现有 50 万条文档记录
  • 目前只有简单的 LIKE 搜索,性能很差
  • 没有用任何搜索引擎
第二步:启动四个专业 agent(并行)

现在你可以同时启动四个 Plan agent,给它们分配不同角色:

Agent 1 - 后端架构师:

"你是一个资深的后端架构师。基于 PostgreSQL + 50万数据的现状,设计全文搜索方案,对比三种方案:

  1. PostgreSQL 内置的全文搜索
  2. Elasticsearch
  3. Meilisearch

从性能、成本、复杂度三个维度分析,给出推荐。"

Agent 2 - 前端专家:

"你是一个资深的前端专家。设计搜索功能的用户界面,考虑:

  • 搜索框的交互设计(实时搜索 vs 回车搜索)
  • 搜索结果的展示方式
  • 空状态、加载态、错误态的处理
  • 移动端适配

给出技术选型和组件设计方案。"

Agent 3 - 测试工程师:

"你是一个资深的测试工程师。列出全文搜索功能的测试计划,包括:

  • 功能测试场景
  • 性能测试指标
  • 边界情况(特殊字符、超长关键词)
  • 多语言支持

给出测试用例清单。"

Agent 4 - 运维专家:

"你是一个资深的运维专家。分析全文搜索方案的部署和运维需求,考虑:

  • 资源需求(CPU、内存、磁盘)
  • 部署架构
  • 监控指标
  • 索引更新策略

给出运维方案和成本估算。"

第三步:汇总结果

半小时后,你会得到四份专业报告:

角色核心结论
后端架构师推荐先用 PostgreSQL 全文搜索,成本低;数据量到 500万 再考虑 ES
前端专家用防抖实现实时搜索,结果用虚拟列表渲染,避免卡顿
测试工程师需要测试 23 个场景,包括搜索相关性、分页、排序、高亮
运维专家PostgreSQL 方案不需要额外资源,索引更新用触发器实现

你看,四份报告合起来就是一个完整的技术方案。


如何下载安装 Claude Code

好了,说了这么多,怎么上手呢?

前置要求

  • 操作系统:macOS、Linux 或 Windows(WSL)
  • Node.js:建议 18+ 版本

安装步骤

1. 安装 Claude Code CLI

打开终端,运行:

npm install -g @anthropic-ai/claude-code

或者用 yarn:

yarn global add @anthropic-ai/claude-code
2. 配置 API Key

你需要一个 Anthropic API Key(去 console.anthropic.com 申请)。

然后设置环境变量:

# macOS / Linux
export ANTHROPIC_API_KEY="your-api-key-here"

# 或者写在 ~/.bashrc 或 ~/.zshrc 里
echo 'export ANTHROPIC_API_KEY="your-api-key-here"' >> ~/.zshrc
source ~/.zshrc
3. 在项目中使用

进入你的项目目录:

cd your-project

启动 Claude Code:

claude

第一次启动会引导你授权 GitHub 访问(可选,用于读取代码),然后就可以开始聊天了。

VS Code 插件(推荐)

如果你用 VS Code,可以安装官方插件:

  1. 打开 VS Code,进入 Extensions 面板
  2. 搜索 "Claude Code"
  3. 安装 Anthropic 官方的插件

安装后,你可以:

  • 用快捷键 Cmd + Shift + C(Mac)或 Ctrl + Shift + C(Windows/Linux)打开 Claude 侧边栏
  • 直接在编辑器里选中文本,右键选择 "Ask Claude"

使用技巧:如何发挥"左右脑互搏"的威力

1. 明确每个角色的职责

启动 agent 之前,先把问题拆清楚。比如:

问题:加全文搜索
拆解:
- 数据层:用什么技术?
- 接口层:API 怎么设计?
- 展示层:UI 怎么做?
- 质量保障:怎么测试?

对应角色:
- 后端架构师 → 数据层 + 接口层
- 前端专家 → 展示层
- 测试工程师 → 质量保障

2. 用"如果...会怎样"的问题激发批判性思维

给风险评估师这样的 prompt:

"你是一个挑剔的 Code Reviewer。这个方案有哪些潜在问题?请从安全、性能、可维护性三个角度批判。"

3. 让两个 agent 设计竞争方案

比如技术选型时:

Agent A:你是一个微服务拥护者,说服我用微服务。
Agent B:你是一个单体架构拥护者,说服我用单体架构。

然后让它们互相批判,你来做裁判。

4. 先发散,后收敛

第一步:用 general-purpose agent 做头脑风暴,列出所有可能的方案。

第二步:用 Plan agent 对每个方案做详细分析。

第三步:用风险评估师筛掉高风险方案。

第四步:用产品经理从用户价值角度排序。


"左右脑互搏"的优势

1. 更全面的视角

不同角色的 agent 会关注不同的点,帮你扫除盲区。你自己一个人想的时候,很容易陷入某个细节,忘了全局。

2. 对比和验证

让两个 agent 设计竞争方案,你可以直接对比优劣。这比你自己列 pros/cons 要客观得多。

3. 效率提升

多个 agent 并行工作,比串行跑完要快得多。而且你不用等同事有空,随时可以"开会"。

4. 风险前置

Plan agent 会主动指出潜在问题,避免你写到一半发现方案行不通。

5. 学习效应

看不同角色的分析过程,你会学到很多跨领域的知识。比如后端出身的人,可以从测试工程师的分析里学到测试思维。


什么时候适合用"左右脑互搏"

场景是否推荐原因
修复一个明显的 bug直接修就行,不用兴师动众
加一个简单的小功能单线程处理更快
重构一个模块多个视角帮你避坑
技术选型决策对比方案优劣
架构设计Plan agent 帮你系统性思考
需求评审让产品经理 + 开发 + 测试三个角色一起分析
性能优化后端 + 前端 + 运维多角度诊断
代码审查让挑剔的 Code Reviewer 找问题

简单原则:任务越复杂、不确定性越高、牵涉的角色越多,越适合用"左右脑互搏"


我的使用心得

用了一个月 Claude Code,我最大的感受是:它让我拥有了"召唤技术团队"的能力

以前遇到复杂问题,我需要:

  1. 自己憋半天想方案
  2. 找同事讨论,但大家都很忙
  3. 开会,但会议效率低
  4. 最后方案还不一定全面

现在我可以:

  1. 把问题拆清楚
  2. 启动几个专业 agent
  3. 半小时后拿到多份分析报告
  4. 自己做决策

这像是我的大脑扩容了——不再是一个人在思考,而是一个"虚拟团队"在帮我思考。


小结

"左右脑互搏"本质上是 用多个 AI agent 模拟一个团队

  • 让不同的角色(前端、后端、测试、运维、产品...)各司其职
  • 让它们并行工作、相互补充
  • 最后汇总结果,帮你做出更全面的决策

这比单个 AI 给一个答案要强得多——就像你自己思考时,也希望有人能"唱反调",帮自己发现盲点。

如果你在用 Claude Code,下次遇到复杂任务时,试试这样提问:

"同时启动四个 agent:

  • 后端架构师,分析技术方案
  • 前端专家,分析用户体验
  • 测试工程师,列出测试场景
  • 风险评估师,指出潜在风险

然后汇总成一份完整的技术方案。"

你会发现,AI 不再是一个"问答机器",而是一个能和你一起"脑暴"的团队。


快速上手指南

# 1. 安装
npm install -g @anthropic-ai/claude-code

# 2. 配置 API Key
export ANTHROPIC_API_KEY="your-api-key-here"

# 3. 启动
cd your-project
claude

# 4. 第一次使用,试试这个 prompt
"启动两个 Plan agent:
- 一个扮演后端架构师
- 一个扮演前端专家

让它们分析当前项目的架构,给出改进建议。"

参考资料


用 AI 的方式思考,让 AI 用不同角色帮你思考。 这就是"左右脑互搏"的精髓。

那天下午,我坐在工位上,看着四个 agent 给出的报告,突然明白了一个道理:

重要的不是 AI 能帮你写多少代码,而是它能帮你把问题想多清楚。