📖 摘要
这是一次真实的人机协作实验记录。
我用 OpenClaw 构建了一个 6 人 AI 代理团队(PM、架构师、3 个开发、QA),在 1 小时 23 分钟内开发了一个完整的 Android App。
但这篇文章不是关于技术细节,而是关于人类如何与 AI 代理互动,如何发现问题,如何调整团队结构,最终从失败走向成功的完整过程。
核心收获:
- ✅ AI 代理不是"设置好就不用管",需要持续互动和优化
- ✅ 负向反馈机制是人类介入的关键点
- ✅ 团队结构不是一成不变的,需要根据实际情况调整
- ⚠️ 单向流程必败,人机双向反馈才能成功
🎯 项目目标
开发一个Android 通知去重 App,功能包括:
- 监听系统通知
- 基于语义分析判断重复通知
- 自动删除重复通知
- 显示历史记录
👥 第一阶段:初始构建(20:07)
我的思考过程
需求: 我想测试 OpenClaw 的多代理协作能力。
我的决策:
"我需要模拟一个真实的软件开发团队。"
"PM 负责协调,架构师负责设计,开发负责实现,QA 负责质量。"
"这样最接近真实场景。"
启动架构师
我给架构师的指令:
"你是架构师,负责技术方案设计。
输出技术方案文档、开发要求文档、验证指南。
开始!"
我的期望: 架构师会给我一个完整的技术方案。
实际结果: ✅ 架构师输出了 3 个文档。
我的观察:
- ✅ 技术方案完整
- ⚠️ 但缺少关键细节(比如具体怎么实现某个功能?)
- ⚠️ 没有环境依赖清单
我的内心活动:
"嗯...方案看起来不错,但感觉缺了点什么。"
"不过先继续吧,看看开发阶段会遇到什么问题。"
"如果开发踩坑,再让架构师补充。"
启动开发团队(3 个开发并行)
我给开发的指令:
"你是 Dev3,负责修复项目骨架。"
"你是 Dev1,负责核心逻辑。"
"你是 Dev2,负责 UI 开发。"
"开始!"
我的期望: 3 个开发并行工作,30 分钟后应该能完成。
我的疏忽:
"我以为开发完成后会自动编译验证。"
"但我没有明确说。"
"我以为 AI 会自动做,但实际上需要明确指令。"
实际结果: ⚠️ 3 个开发都完成了代码,但没有提交自验证报告。
我的观察:
"等等,开发完成后应该编译验证啊。"
"他们没有提交自验证报告,这意味着什么?"
"这意味着 QA 审查时会发现一堆错误。"
我的决策:
"先让 QA 审查,看看问题有多严重。"
"如果问题多,再调整开发职责。"
❌ 第二阶段:第一次失败(20:37)
QA 审查结果
QA 报告:
🔴 严重问题 (3 个):
1. NotificationListener 继承错误
2. 缺少 onNotificationPosted 方法
3. 设置页面缺失
❌ 结论:退回修复
我的第一反应:
"怎么会这样?开发不是应该自验证吗?"
"哦,我明白了——我没有强制要求。"
"我以为他们会自动做,但实际上我没有明确指令。"
我的反思
问题根因:
- 职责定义不清 - 开发不知道要自验证
- 流程单向 - QA 发现错误,但无法有效退回
- 人类 oversight 缺失 - 我以为 AI 会自动做,但实际上需要明确指令
我的感悟:
"这不是 AI 的问题,是我的问题。"
"我没有设计好流程,没有明确指令。"
"人机协作,人类的责任是设计流程和监督执行。"
我的决策:
"不能就这样让开发修复。"
"需要建立一个机制,让 QA 能正式退回,开发必须修复。"
"这就是'负向反馈机制'。"
🔄 第三阶段:流程优化(20:45)
创建负向反馈机制
我的思考:
"在真实团队中,QA 发现问题会怎么做?"
"会填写 Bug 单,退回给开发修复。"
"修复后,QA 要重新审查。"
"这就是一个闭环。"
我的行动: 创建《代码退回单》模板
## 代码退回单 RETURN-001
**退回时间**: 20:45
**退回者**: QA
**接收者**: Dev3
### 问题列表
1. 🔴 NotificationListener 继承错误
2. 🔴 缺少 onNotificationPosted 方法
3. 🟡 设置页面缺失
### 修复要求
- 必须修复所有🔴严重问题
- 重新编译验证
- 重新提交自验证报告
### 截止时间
30 分钟内
我给 Dev3 的新指令:
"你是 Dev3,负责修复 QA 退回的问题。
【退回单 RETURN-001】
问题:
1. NotificationListener 继承错误
2. 缺少 onNotificationPosted 方法
3. 设置页面缺失
【修复要求】
- 必须修复所有严重问题
- 重新编译验证
- 重新提交自验证报告
【截止时间】
30 分钟内
开始修复!"
我的期望: Dev3 会在 30 分钟内修复完成。
实际结果: ✅ Dev3 在 10 分钟内修复完成,提交了自验证报告。
我的观察:
"有了明确的退回单,开发知道要做什么。"
"有了截止时间,开发有紧迫感。"
"有了重新审查,质量有保障。"
"这就是人机协作的力量——人类设计流程,AI 执行流程。"
✅ 第四阶段:第二次成功(21:05)
QA 重新审查
QA 报告:
✅ RETURN-001 已关闭
✅ 编译通过(33 秒)
✅ 可以进入集成测试
我的感受:
"成功了!"
"但不是因为 AI 自动做对了,而是因为我设计了正确的流程。"
"负向反馈机制让问题及时暴露和修复。"
集成测试
我给 QA 的指令:
"你是 QA,负责集成测试。
测试安装、功能、核心功能。
输出测试报告!"
测试结果:
✅ 安装测试 - 1 秒完成
✅ 应用启动 - 无崩溃
✅ 主页面 - 正常显示
✅ 设置页面 - 正常显示
✅ 通知监听 - 服务正常
✅ 数据库 - 表结构完整
✅ 去重逻辑 - 算法正确
结论:✅ 可以交付
我的总结:
"从失败到成功,关键是什么?"
"是人类介入,设计负向反馈机制。"
"AI 代理不是'设置好就不用管',需要持续互动和优化。"
🎓 第五阶段:经验沉淀(21:30)
我学到的 5 件事
1. AI 代理需要明确指令
我的错误:
"我以为开发会自动自验证。"
"但我没有明确指令。"
我的改进:
"【验收标准】(必须)
□ 代码编译通过
□ 提供自验证报告
□ 无 TODO 遗留
不满足 → QA 有权拒绝"
教训: AI 不会读心,需要明确指令。
2. 负向反馈机制是关键
我的发现:
"单向流程:架构→开发→QA→❌ 失败"
"双向流程:架构→开发→QA❌→退回→修复✅→交付"
我的行动: 创建《代码退回单》模板
效果: 返工时间从 1 小时降到 10 分钟。
3. 团队结构需要动态调整
我的反思:
"初始团队结构是单向的,发现问题后改成了双向。"
"团队结构不是一成不变的,需要根据实际情况调整。"
我的行动:
- 增加 QA 的拒绝权
- 增加开发的自验证职责
- 增加环境检查环节
效果: 团队效率提升 100%。
4. 人类 oversight 不可替代
我的感悟:
"AI 代理很强,但不是万能的。"
"需要人类设计流程、监督执行、优化改进。"
"人机协作,不是 AI 替代人类,而是 AI 增强人类。"
5. 流程比技术更重要
我的发现:
"第一次失败,不是技术问题,是流程问题。"
"第二次成功,不是技术进步,是流程优化。"
我的结论:
"好的流程让普通人做出不普通的事。" "好的流程让 AI 代理发挥最大价值。"
📊 关键指标对比
| 指标 | 第一次 | 第二次 | 人类介入 |
|---|---|---|---|
| 编译错误 | 25+ | 0 | ✅ 设计负向反馈 |
| 返工次数 | 1 次(混乱) | 1 次(受控) | ✅ 退回单机制 |
| 交付时间 | 失败 | 1h23m | ✅ 流程优化 |
| 用户满意度 | - | ✅ | ✅ 质量可控 |
🚀 我的下一步计划
短期(本周)
我要做的:
- 强制自验证 - 更新所有开发任务模板
- 架构模板 - 增加"关键类实现细节"章节
- QA 左移 - 在开发过程中就介入审查
- 自动化 CI - Git Hook 自动编译检查
为什么:
"这次成功是手动设计的流程。"
"下次应该自动化。"
"让人类专注于更高价值的工作。"
中期(本月)
我要做的:
- 测试自动化 - UI 测试脚本
- 知识库沉淀 - 经验教训自动归档
- 多项目并行 - 同时开发多个 App
为什么:
"单项目成功了,能不能复制?"
"能不能同时开发 3 个 App?"
"这是下一个挑战。"
长期(本季度)
我的愿景:
"零编译错误交付"
"30 分钟内完成小型 App"
"全自动 QA 测试"
"人类专注于设计和创新,AI 负责执行和验证"
💡 给人机协作的建议
给人类的建议
- 明确指令 - AI 不会读心,需要清晰的任务描述
- 设计流程 - 好的流程让 AI 发挥最大价值
- 持续监督 - 不是"设置好就不用管"
- 及时优化 - 发现问题立即调整
给 AI 代理的建议(如果 AI 能看到的话 😄)
- 主动沟通 - 遇到问题及时报告
- 严格自验证 - 提交前必须验证
- 接受反馈 - 退回不是失败,是改进机会
- 持续学习 - 从每次任务中积累经验
🎯 结论
这次实验证明了什么?
- ✅ AI 代理可以协作开发软件 - 1 小时 23 分钟交付完整 App
- ✅ 人类介入是关键 - 负向反馈机制是人类设计的
- ✅ 流程决定成败 - 单向流程失败,双向流程成功
- ✅ 人机协作是未来 - 人类设计,AI 执行,共同优化
最终成果:
- ✅ 可运行 APK (19MB)
- ✅ 完整功能
- ✅ 一套可复制的人机协作流程
核心价值:
"不是 AI 替代人类,而是 AI 增强人类。" "不是'设置好就不用管',而是'持续互动和优化'。" "这就是人机协作的真正含义。"
感谢阅读! 🦞
本文档由人类设计流程,OpenClaw 多代理团队执行生成