AI 编程的终极形态：不是更聪明的模型，而是更聪明的协作AI 编程的终极形态：不是更聪明的模型，而是更聪明的协作你用过

AI 编程的终极形态：不是更聪明的模型，而是更聪明的协作

你用过 AI 编程工具吗？

大概率用过。从 GitHub Copilot 到 Cursor，从 Windsurf 到各种插件，AI 写代码已经不是什么新鲜事。但你有没有发现一个共同的问题——

不管模型多强，它终究是一个人在干活。

一个问题来了，它自己想。一段代码要改，它自己改。一个架构要设计，它自己设计。就像让一个人同时当产品经理、架构师、前端开发、后端开发、测试工程师……

这不是效率，这是灾难。

今天我想介绍一个不一样的思路：OMO（OhMyOpenAgent） ——把多 Agent 协作架构带进 AI 编程的插件。

核心理念：让专业的人做专业的事

OMO 的核心思想很简单：

一个 Agent 什么都能做，但什么都做不好。专业分工才是正道。

就像一家公司不会让一个人同时负责产品、设计、开发、测试一样，OMO 把不同的能力分配给不同的 Agent，让它们各司其职，协同工作。

这就是 OMO 的 11 个 Agent 全家桶。

四大主力 Agent

🪨 Sisyphus（西西弗斯）— 主编排器

模型： Claude Opus 4.6

如果你用过 OMO，你打交道最多的就是它。Sisyphus 是整个系统的"大脑中枢"——

你说一句话，它先判断你的真实意图
复杂任务？分解成子任务，分配给最合适的 Agent
需要搜索代码？调 Explore
需要查文档？调 Librarian
遇到难题？问 Oracle
计划有漏洞？让 Momus 审查

它的座右铭是： "Humans roll their boulder every day. So do you." 人类每天推石头，AI 也一样。写出来的代码，要跟资深工程师的分不出区别。

关键能力： 能主动调用 7 个辅助 Agent，通过 Category 系统委派执行任务给 Sisyphus-Junior。

🔥 Prometheus（普罗米修斯）— 战略规划师

模型： Claude Opus 4.6

Prometheus 是"面试官"类型的 Agent。你给它一个模糊的需求，它不会急着写代码，而是——

先问你的澄清问题
分析范围和歧义
识别你可能没想到的风险
构建一份详细的工作计划

核心约束： 只能创建/编辑 .md 文件，永远不碰代码。这是设计如此——规划师就该只管规划，不该边规划边写代码。

计划保存到 .sisyphus/plans/ 目录，然后交给下一个 Agent 去执行。

适用场景： 多天的大型项目、关键生产环境变更、复杂重构、需要文档化决策的任务。

🗺️ Atlas（阿特拉斯）— Todo 编排执行器

模型： Claude Sonnet 4.6

Prometheus 规划完了，谁来执行？Atlas。

Atlas 是"乐队指挥"——它自己不演奏乐器，但它保证每个乐手在正确的时间做正确的事：

读取 Prometheus 的计划
分析每个任务的依赖关系
分配给专门的 Agent 执行
验证执行结果
生成最终报告

核心约束： 不能直接调用 task() 或 call_omo_agent——纯粹的编排，不亲自下场。

激活方式： Prometheus 规划完成后，运行 /start-work，Atlas 自动上线。

⚒️ Hephaestus（赫菲斯托斯）— 自主深度工作者

模型： GPT-5.3 Codex

有些任务不是一两步能搞定的。比如"设计一个新插件系统"、"重构整个认证模块"——这类任务需要深入研究、反复思考、多步执行。

这就是 Hephaestus 的领域：

目标导向，行动前深入研究
先探索代码库的模式和风格
再动手实现，确保结果融入现有架构
灵感来自 AmpCode 的 deep mode

适用场景： 深度架构推理、复杂多步骤工作、需要自主探索的设计任务。

七大辅助 Agent

四大主力之外，OMO 还配备了 7 个专业辅助 Agent，它们像特种兵一样，在各自领域精准出击：

Agent	一句话定位	典型触发场景
Explore	代码库上下文搜索	"这个功能在哪实现的？" "项目怎么处理错误的？"
Librarian	外部参考搜索	"React 怎么做 X？" "这个库的最佳实践是什么？"
Oracle	高智商只读顾问	架构决策、2+ 次修复失败、安全/性能审查
Metis（墨提斯）	预规划分析	需求模糊、任务有歧义、识别 AI 失败点
Momus（摩莫斯）	计划审查	计划写完了，需要检查漏洞和盲点
Multimodal-Looker	多媒体分析	看 PDF、分析图片、理解架构图
Sisyphus-Junior	Category 执行器	通过分类系统（visual-engineering、ultrabrain、deep 等）自动分配执行

它们怎么协作？

一个典型的协作流程是这样的：

场景：你要求"重构认证模块"

你："重构认证模块"
        ↓
   [Sisyphus 意图判断]
        ↓
   ┌─────────────────────────────────┐
   │ 1. Metis 分析：范围？风险？歧义？   │
   │ 2. Explore 搜索：现有认证代码在哪？  │
   │ 3. Librarian 查询：业界最佳实践？   │
   └─────────────────────────────────┘
        ↓
   [Sisyphus 制定计划 + Momus 审查]
        ↓
   [Sisyphus-Junior 分类执行]
        ↓
   [Oracle 自审查]
        ↓
   完成 ✓

另一种路线：大型项目

你：按 Tab → 切换到 Prometheus
        ↓
   [Prometheus 面试式规划]
        ↓
   计划保存到 .sisyphus/plans/
        ↓
   你：/start-work
        ↓
   [Atlas 读取计划，分配任务]
        ↓
   [Hephaestus 深度执行]
        ↓
   完成 ✓

Sisyphus vs Prometheus：我该用谁？

一个常见的疑问：Sisyphus 也能做规划（调用 Metis + Plan + Momus），那 Prometheus 还有什么用？

答案：90% 的场景，Sisyphus 就够了。

维度	Sisyphus	Prometheus
专注度	规划 + 执行 + 编排	只做规划
输出格式	Todo list + 直接执行	正式的 YAML 计划文件
流程	灵活判断	专门的面试流程
适用	日常任务	多天大型项目

什么时候用 Prometheus？

项目跨度大，需要正式文档化的计划
需要团队协作，共享计划文件
想要严格的"先规划，后执行"流程

什么时候用 Sisyphus？

大多数日常开发任务
快速迭代、边规划边执行
不需要仪式感，只需要效率

适用场景速查

你的需求	推荐方式
快速修个 bug / 加个功能	直接告诉 Sisyphus
大型项目规划	`Tab` → Prometheus → `/start-work`
深度自主架构工作	`Tab` → Hephaestus
搜索代码在哪	Sisyphus 自动调用 Explore
查外部库文档	Sisyphus 自动调用 Librarian
架构决策咨询	Sisyphus 自动调用 Oracle
需求模糊需要澄清	Sisyphus 自动调用 Metis
计划需要审查	Sisyphus 自动调用 Momus

最后

OMO 的力量不来自某个超级模型，而来自专业分工 + 协作编排。

就像好的公司不是靠一个全能员工，而是靠每个岗位上的专业人才，加上一个优秀的经理把它们串起来。

Sisyphus 是那个经理。Explore、Librarian、Oracle 是各领域的专家。Prometheus、Atlas、Hephaestus 是三条不同的工作流水线。

让专业的人做专业的事——这就是 AI 编程的终极形态。

如果你对某个 Agent 的具体用法感兴趣，欢迎留言讨论。