AI 编程的终极形态:不是更聪明的模型,而是更聪明的协作
你用过 AI 编程工具吗?
大概率用过。从 GitHub Copilot 到 Cursor,从 Windsurf 到各种插件,AI 写代码已经不是什么新鲜事。但你有没有发现一个共同的问题——
不管模型多强,它终究是一个人在干活。
一个问题来了,它自己想。一段代码要改,它自己改。一个架构要设计,它自己设计。就像让一个人同时当产品经理、架构师、前端开发、后端开发、测试工程师……
这不是效率,这是灾难。
今天我想介绍一个不一样的思路:OMO(OhMyOpenAgent) ——把多 Agent 协作架构带进 AI 编程的插件。
核心理念:让专业的人做专业的事
OMO 的核心思想很简单:
一个 Agent 什么都能做,但什么都做不好。专业分工才是正道。
就像一家公司不会让一个人同时负责产品、设计、开发、测试一样,OMO 把不同的能力分配给不同的 Agent,让它们各司其职,协同工作。
这就是 OMO 的 11 个 Agent 全家桶。
四大主力 Agent
🪨 Sisyphus(西西弗斯)— 主编排器
模型: Claude Opus 4.6
如果你用过 OMO,你打交道最多的就是它。Sisyphus 是整个系统的"大脑中枢"——
- 你说一句话,它先判断你的真实意图
- 复杂任务?分解成子任务,分配给最合适的 Agent
- 需要搜索代码?调 Explore
- 需要查文档?调 Librarian
- 遇到难题?问 Oracle
- 计划有漏洞?让 Momus 审查
它的座右铭是: "Humans roll their boulder every day. So do you." 人类每天推石头,AI 也一样。写出来的代码,要跟资深工程师的分不出区别。
关键能力: 能主动调用 7 个辅助 Agent,通过 Category 系统委派执行任务给 Sisyphus-Junior。
🔥 Prometheus(普罗米修斯)— 战略规划师
模型: Claude Opus 4.6
Prometheus 是"面试官"类型的 Agent。你给它一个模糊的需求,它不会急着写代码,而是——
- 先问你的澄清问题
- 分析范围和歧义
- 识别你可能没想到的风险
- 构建一份详细的工作计划
核心约束: 只能创建/编辑 .md 文件,永远不碰代码。这是设计如此——规划师就该只管规划,不该边规划边写代码。
计划保存到 .sisyphus/plans/ 目录,然后交给下一个 Agent 去执行。
适用场景: 多天的大型项目、关键生产环境变更、复杂重构、需要文档化决策的任务。
🗺️ Atlas(阿特拉斯)— Todo 编排执行器
模型: Claude Sonnet 4.6
Prometheus 规划完了,谁来执行?Atlas。
Atlas 是"乐队指挥"——它自己不演奏乐器,但它保证每个乐手在正确的时间做正确的事:
- 读取 Prometheus 的计划
- 分析每个任务的依赖关系
- 分配给专门的 Agent 执行
- 验证执行结果
- 生成最终报告
核心约束: 不能直接调用 task() 或 call_omo_agent——纯粹的编排,不亲自下场。
激活方式: Prometheus 规划完成后,运行 /start-work,Atlas 自动上线。
⚒️ Hephaestus(赫菲斯托斯)— 自主深度工作者
模型: GPT-5.3 Codex
有些任务不是一两步能搞定的。比如"设计一个新插件系统"、"重构整个认证模块"——这类任务需要深入研究、反复思考、多步执行。
这就是 Hephaestus 的领域:
- 目标导向,行动前深入研究
- 先探索代码库的模式和风格
- 再动手实现,确保结果融入现有架构
- 灵感来自 AmpCode 的 deep mode
适用场景: 深度架构推理、复杂多步骤工作、需要自主探索的设计任务。
七大辅助 Agent
四大主力之外,OMO 还配备了 7 个专业辅助 Agent,它们像特种兵一样,在各自领域精准出击:
| Agent | 一句话定位 | 典型触发场景 |
|---|---|---|
| Explore | 代码库上下文搜索 | "这个功能在哪实现的?" "项目怎么处理错误的?" |
| Librarian | 外部参考搜索 | "React 怎么做 X?" "这个库的最佳实践是什么?" |
| Oracle | 高智商只读顾问 | 架构决策、2+ 次修复失败、安全/性能审查 |
| Metis(墨提斯) | 预规划分析 | 需求模糊、任务有歧义、识别 AI 失败点 |
| Momus(摩莫斯) | 计划审查 | 计划写完了,需要检查漏洞和盲点 |
| Multimodal-Looker | 多媒体分析 | 看 PDF、分析图片、理解架构图 |
| Sisyphus-Junior | Category 执行器 | 通过分类系统(visual-engineering、ultrabrain、deep 等)自动分配执行 |
它们怎么协作?
一个典型的协作流程是这样的:
场景:你要求"重构认证模块"
你:"重构认证模块"
↓
[Sisyphus 意图判断]
↓
┌─────────────────────────────────┐
│ 1. Metis 分析:范围?风险?歧义? │
│ 2. Explore 搜索:现有认证代码在哪? │
│ 3. Librarian 查询:业界最佳实践? │
└─────────────────────────────────┘
↓
[Sisyphus 制定计划 + Momus 审查]
↓
[Sisyphus-Junior 分类执行]
↓
[Oracle 自审查]
↓
完成 ✓
另一种路线:大型项目
你:按 Tab → 切换到 Prometheus
↓
[Prometheus 面试式规划]
↓
计划保存到 .sisyphus/plans/
↓
你:/start-work
↓
[Atlas 读取计划,分配任务]
↓
[Hephaestus 深度执行]
↓
完成 ✓
Sisyphus vs Prometheus:我该用谁?
一个常见的疑问:Sisyphus 也能做规划(调用 Metis + Plan + Momus),那 Prometheus 还有什么用?
答案:90% 的场景,Sisyphus 就够了。
| 维度 | Sisyphus | Prometheus |
|---|---|---|
| 专注度 | 规划 + 执行 + 编排 | 只做规划 |
| 输出格式 | Todo list + 直接执行 | 正式的 YAML 计划文件 |
| 流程 | 灵活判断 | 专门的面试流程 |
| 适用 | 日常任务 | 多天大型项目 |
什么时候用 Prometheus?
- 项目跨度大,需要正式文档化的计划
- 需要团队协作,共享计划文件
- 想要严格的"先规划,后执行"流程
什么时候用 Sisyphus?
- 大多数日常开发任务
- 快速迭代、边规划边执行
- 不需要仪式感,只需要效率
适用场景速查
| 你的需求 | 推荐方式 |
|---|---|
| 快速修个 bug / 加个功能 | 直接告诉 Sisyphus |
| 大型项目规划 | Tab → Prometheus → /start-work |
| 深度自主架构工作 | Tab → Hephaestus |
| 搜索代码在哪 | Sisyphus 自动调用 Explore |
| 查外部库文档 | Sisyphus 自动调用 Librarian |
| 架构决策咨询 | Sisyphus 自动调用 Oracle |
| 需求模糊需要澄清 | Sisyphus 自动调用 Metis |
| 计划需要审查 | Sisyphus 自动调用 Momus |
最后
OMO 的力量不来自某个超级模型,而来自专业分工 + 协作编排。
就像好的公司不是靠一个全能员工,而是靠每个岗位上的专业人才,加上一个优秀的经理把它们串起来。
Sisyphus 是那个经理。Explore、Librarian、Oracle 是各领域的专家。Prometheus、Atlas、Hephaestus 是三条不同的工作流水线。
让专业的人做专业的事——这就是 AI 编程的终极形态。
如果你对某个 Agent 的具体用法感兴趣,欢迎留言讨论。