人机协作实录:我如何用 OpenClaw 构建并优化一个 6 人 AI 代理团队

11 阅读9分钟

📖 摘要

这是一次真实的人机协作实验记录

我用 OpenClaw 构建了一个 6 人 AI 代理团队(PM、架构师、3 个开发、QA),在 1 小时 23 分钟内开发了一个完整的 Android App。

但这篇文章不是关于技术细节,而是关于人类如何与 AI 代理互动,如何发现问题,如何调整团队结构,最终从失败走向成功的完整过程。

核心收获:

  • ✅ AI 代理不是"设置好就不用管",需要持续互动和优化
  • 负向反馈机制是人类介入的关键点
  • ✅ 团队结构不是一成不变的,需要根据实际情况调整
  • ⚠️ 单向流程必败,人机双向反馈才能成功

🎯 项目目标

开发一个Android 通知去重 App,功能包括:

  1. 监听系统通知
  2. 基于语义分析判断重复通知
  3. 自动删除重复通知
  4. 显示历史记录

👥 第一阶段:初始构建(20:07)

我的思考过程

需求: 我想测试 OpenClaw 的多代理协作能力。

我的决策:

"我需要模拟一个真实的软件开发团队。"
"PM 负责协调,架构师负责设计,开发负责实现,QA 负责质量。"
"这样最接近真实场景。"

启动架构师

我给架构师的指令:

"你是架构师,负责技术方案设计。
输出技术方案文档、开发要求文档、验证指南。
开始!"

我的期望: 架构师会给我一个完整的技术方案。

实际结果: ✅ 架构师输出了 3 个文档。

我的观察:

  • ✅ 技术方案完整
  • ⚠️ 但缺少关键细节(比如具体怎么实现某个功能?)
  • ⚠️ 没有环境依赖清单

我的内心活动:

"嗯...方案看起来不错,但感觉缺了点什么。"
"不过先继续吧,看看开发阶段会遇到什么问题。"
"如果开发踩坑,再让架构师补充。"

启动开发团队(3 个开发并行)

我给开发的指令:

"你是 Dev3,负责修复项目骨架。"
"你是 Dev1,负责核心逻辑。"
"你是 Dev2,负责 UI 开发。"
"开始!"

我的期望: 3 个开发并行工作,30 分钟后应该能完成。

我的疏忽:

"我以为开发完成后会自动编译验证。"
"但我没有明确说。"
"我以为 AI 会自动做,但实际上需要明确指令。"

实际结果: ⚠️ 3 个开发都完成了代码,但没有提交自验证报告

我的观察:

"等等,开发完成后应该编译验证啊。"
"他们没有提交自验证报告,这意味着什么?"
"这意味着 QA 审查时会发现一堆错误。"

我的决策:

"先让 QA 审查,看看问题有多严重。"
"如果问题多,再调整开发职责。"

❌ 第二阶段:第一次失败(20:37)

QA 审查结果

QA 报告:

🔴 严重问题 (3 个):
1. NotificationListener 继承错误
2. 缺少 onNotificationPosted 方法
3. 设置页面缺失

❌ 结论:退回修复

我的第一反应:

"怎么会这样?开发不是应该自验证吗?"
"哦,我明白了——我没有强制要求。"
"我以为他们会自动做,但实际上我没有明确指令。"

我的反思

问题根因:

  1. 职责定义不清 - 开发不知道要自验证
  2. 流程单向 - QA 发现错误,但无法有效退回
  3. 人类 oversight 缺失 - 我以为 AI 会自动做,但实际上需要明确指令

我的感悟:

"这不是 AI 的问题,是我的问题。"
"我没有设计好流程,没有明确指令。"
"人机协作,人类的责任是设计流程和监督执行。"

我的决策:

"不能就这样让开发修复。"
"需要建立一个机制,让 QA 能正式退回,开发必须修复。"
"这就是'负向反馈机制'。"

🔄 第三阶段:流程优化(20:45)

创建负向反馈机制

我的思考:

"在真实团队中,QA 发现问题会怎么做?"
"会填写 Bug 单,退回给开发修复。"
"修复后,QA 要重新审查。"
"这就是一个闭环。"

我的行动: 创建《代码退回单》模板

## 代码退回单 RETURN-001

**退回时间**: 20:45
**退回者**: QA
**接收者**: Dev3

### 问题列表
1. 🔴 NotificationListener 继承错误
2. 🔴 缺少 onNotificationPosted 方法
3. 🟡 设置页面缺失

### 修复要求
- 必须修复所有🔴严重问题
- 重新编译验证
- 重新提交自验证报告

### 截止时间
30 分钟内

我给 Dev3 的新指令:

"你是 Dev3,负责修复 QA 退回的问题。

【退回单 RETURN-001】
问题:
1. NotificationListener 继承错误
2. 缺少 onNotificationPosted 方法
3. 设置页面缺失

【修复要求】
- 必须修复所有严重问题
- 重新编译验证
- 重新提交自验证报告

【截止时间】
30 分钟内

开始修复!"

我的期望: Dev3 会在 30 分钟内修复完成。

实际结果: ✅ Dev3 在 10 分钟内修复完成,提交了自验证报告。

我的观察:

"有了明确的退回单,开发知道要做什么。"
"有了截止时间,开发有紧迫感。"
"有了重新审查,质量有保障。"
"这就是人机协作的力量——人类设计流程,AI 执行流程。"

✅ 第四阶段:第二次成功(21:05)

QA 重新审查

QA 报告:

RETURN-001 已关闭
✅ 编译通过(33 秒)
✅ 可以进入集成测试

我的感受:

"成功了!"
"但不是因为 AI 自动做对了,而是因为我设计了正确的流程。"
"负向反馈机制让问题及时暴露和修复。"

集成测试

我给 QA 的指令:

"你是 QA,负责集成测试。
测试安装、功能、核心功能。
输出测试报告!"

测试结果:

✅ 安装测试 - 1 秒完成
✅ 应用启动 - 无崩溃
✅ 主页面 - 正常显示
✅ 设置页面 - 正常显示
✅ 通知监听 - 服务正常
✅ 数据库 - 表结构完整
✅ 去重逻辑 - 算法正确

结论:✅ 可以交付

我的总结:

"从失败到成功,关键是什么?"
"是人类介入,设计负向反馈机制。"
"AI 代理不是'设置好就不用管',需要持续互动和优化。"

🎓 第五阶段:经验沉淀(21:30)

我学到的 5 件事

1. AI 代理需要明确指令

我的错误:

"我以为开发会自动自验证。"
"但我没有明确指令。"

我的改进:

"【验收标准】(必须)
□ 代码编译通过
□ 提供自验证报告
□ 无 TODO 遗留

不满足 → QA 有权拒绝"

教训: AI 不会读心,需要明确指令。


2. 负向反馈机制是关键

我的发现:

"单向流程:架构→开发→QA→❌ 失败"
"双向流程:架构→开发→QA❌→退回→修复✅→交付"

我的行动: 创建《代码退回单》模板

效果: 返工时间从 1 小时降到 10 分钟。


3. 团队结构需要动态调整

我的反思:

"初始团队结构是单向的,发现问题后改成了双向。"
"团队结构不是一成不变的,需要根据实际情况调整。"

我的行动:

  • 增加 QA 的拒绝权
  • 增加开发的自验证职责
  • 增加环境检查环节

效果: 团队效率提升 100%。


4. 人类 oversight 不可替代

我的感悟:

"AI 代理很强,但不是万能的。"
"需要人类设计流程、监督执行、优化改进。"
"人机协作,不是 AI 替代人类,而是 AI 增强人类。"

5. 流程比技术更重要

我的发现:

"第一次失败,不是技术问题,是流程问题。"
"第二次成功,不是技术进步,是流程优化。"

我的结论:

"好的流程让普通人做出不普通的事。" "好的流程让 AI 代理发挥最大价值。"


📊 关键指标对比

指标第一次第二次人类介入
编译错误25+0✅ 设计负向反馈
返工次数1 次(混乱)1 次(受控)✅ 退回单机制
交付时间失败1h23m✅ 流程优化
用户满意度-✅ 质量可控

🚀 我的下一步计划

短期(本周)

我要做的:

  1. 强制自验证 - 更新所有开发任务模板
  2. 架构模板 - 增加"关键类实现细节"章节
  3. QA 左移 - 在开发过程中就介入审查
  4. 自动化 CI - Git Hook 自动编译检查

为什么:

"这次成功是手动设计的流程。"
"下次应该自动化。"
"让人类专注于更高价值的工作。"

中期(本月)

我要做的:

  1. 测试自动化 - UI 测试脚本
  2. 知识库沉淀 - 经验教训自动归档
  3. 多项目并行 - 同时开发多个 App

为什么:

"单项目成功了,能不能复制?"
"能不能同时开发 3 个 App?"
"这是下一个挑战。"

长期(本季度)

我的愿景:

"零编译错误交付"
"30 分钟内完成小型 App"
"全自动 QA 测试"
"人类专注于设计和创新,AI 负责执行和验证"

💡 给人机协作的建议

给人类的建议

  1. 明确指令 - AI 不会读心,需要清晰的任务描述
  2. 设计流程 - 好的流程让 AI 发挥最大价值
  3. 持续监督 - 不是"设置好就不用管"
  4. 及时优化 - 发现问题立即调整

给 AI 代理的建议(如果 AI 能看到的话 😄)

  1. 主动沟通 - 遇到问题及时报告
  2. 严格自验证 - 提交前必须验证
  3. 接受反馈 - 退回不是失败,是改进机会
  4. 持续学习 - 从每次任务中积累经验

🎯 结论

这次实验证明了什么?

  1. AI 代理可以协作开发软件 - 1 小时 23 分钟交付完整 App
  2. 人类介入是关键 - 负向反馈机制是人类设计的
  3. 流程决定成败 - 单向流程失败,双向流程成功
  4. 人机协作是未来 - 人类设计,AI 执行,共同优化

最终成果:

  • ✅ 可运行 APK (19MB)
  • ✅ 完整功能
  • ✅ 一套可复制的人机协作流程

核心价值:

"不是 AI 替代人类,而是 AI 增强人类。" "不是'设置好就不用管',而是'持续互动和优化'。" "这就是人机协作的真正含义。"


感谢阅读! 🦞

本文档由人类设计流程,OpenClaw 多代理团队执行生成