AI 编程的终极形态:不是更聪明的模型,而是更聪明的协作

0 阅读6分钟

AI 编程的终极形态:不是更聪明的模型,而是更聪明的协作

你用过 AI 编程工具吗?

大概率用过。从 GitHub Copilot 到 Cursor,从 Windsurf 到各种插件,AI 写代码已经不是什么新鲜事。但你有没有发现一个共同的问题——

不管模型多强,它终究是一个人在干活。

一个问题来了,它自己想。一段代码要改,它自己改。一个架构要设计,它自己设计。就像让一个人同时当产品经理、架构师、前端开发、后端开发、测试工程师……

这不是效率,这是灾难。

今天我想介绍一个不一样的思路:OMO(OhMyOpenAgent) ——把多 Agent 协作架构带进 AI 编程的插件。


核心理念:让专业的人做专业的事

OMO 的核心思想很简单:

一个 Agent 什么都能做,但什么都做不好。专业分工才是正道。

就像一家公司不会让一个人同时负责产品、设计、开发、测试一样,OMO 把不同的能力分配给不同的 Agent,让它们各司其职,协同工作。

这就是 OMO 的 11 个 Agent 全家桶


四大主力 Agent

🪨 Sisyphus(西西弗斯)— 主编排器

模型: Claude Opus 4.6

如果你用过 OMO,你打交道最多的就是它。Sisyphus 是整个系统的"大脑中枢"——

  • 你说一句话,它先判断你的真实意图
  • 复杂任务?分解成子任务,分配给最合适的 Agent
  • 需要搜索代码?调 Explore
  • 需要查文档?调 Librarian
  • 遇到难题?问 Oracle
  • 计划有漏洞?让 Momus 审查

它的座右铭是: "Humans roll their boulder every day. So do you." 人类每天推石头,AI 也一样。写出来的代码,要跟资深工程师的分不出区别。

关键能力: 能主动调用 7 个辅助 Agent,通过 Category 系统委派执行任务给 Sisyphus-Junior。


🔥 Prometheus(普罗米修斯)— 战略规划师

模型: Claude Opus 4.6

Prometheus 是"面试官"类型的 Agent。你给它一个模糊的需求,它不会急着写代码,而是——

  1. 先问你的澄清问题
  2. 分析范围和歧义
  3. 识别你可能没想到的风险
  4. 构建一份详细的工作计划

核心约束: 只能创建/编辑 .md 文件,永远不碰代码。这是设计如此——规划师就该只管规划,不该边规划边写代码。

计划保存到 .sisyphus/plans/ 目录,然后交给下一个 Agent 去执行。

适用场景: 多天的大型项目、关键生产环境变更、复杂重构、需要文档化决策的任务。


🗺️ Atlas(阿特拉斯)— Todo 编排执行器

模型: Claude Sonnet 4.6

Prometheus 规划完了,谁来执行?Atlas。

Atlas 是"乐队指挥"——它自己不演奏乐器,但它保证每个乐手在正确的时间做正确的事:

  1. 读取 Prometheus 的计划
  2. 分析每个任务的依赖关系
  3. 分配给专门的 Agent 执行
  4. 验证执行结果
  5. 生成最终报告

核心约束: 不能直接调用 task()call_omo_agent——纯粹的编排,不亲自下场。

激活方式: Prometheus 规划完成后,运行 /start-work,Atlas 自动上线。


⚒️ Hephaestus(赫菲斯托斯)— 自主深度工作者

模型: GPT-5.3 Codex

有些任务不是一两步能搞定的。比如"设计一个新插件系统"、"重构整个认证模块"——这类任务需要深入研究、反复思考、多步执行。

这就是 Hephaestus 的领域:

  • 目标导向,行动前深入研究
  • 先探索代码库的模式和风格
  • 再动手实现,确保结果融入现有架构
  • 灵感来自 AmpCode 的 deep mode

适用场景: 深度架构推理、复杂多步骤工作、需要自主探索的设计任务。


七大辅助 Agent

四大主力之外,OMO 还配备了 7 个专业辅助 Agent,它们像特种兵一样,在各自领域精准出击:

Agent一句话定位典型触发场景
Explore代码库上下文搜索"这个功能在哪实现的?" "项目怎么处理错误的?"
Librarian外部参考搜索"React 怎么做 X?" "这个库的最佳实践是什么?"
Oracle高智商只读顾问架构决策、2+ 次修复失败、安全/性能审查
Metis(墨提斯)预规划分析需求模糊、任务有歧义、识别 AI 失败点
Momus(摩莫斯)计划审查计划写完了,需要检查漏洞和盲点
Multimodal-Looker多媒体分析看 PDF、分析图片、理解架构图
Sisyphus-JuniorCategory 执行器通过分类系统(visual-engineering、ultrabrain、deep 等)自动分配执行

它们怎么协作?

一个典型的协作流程是这样的:

场景:你要求"重构认证模块"

你:"重构认证模块"
        ↓
   [Sisyphus 意图判断]
        ↓
   ┌─────────────────────────────────┐
   │ 1. Metis 分析:范围?风险?歧义?   │
   │ 2. Explore 搜索:现有认证代码在哪?  │
   │ 3. Librarian 查询:业界最佳实践?   │
   └─────────────────────────────────┘
        ↓
   [Sisyphus 制定计划 + Momus 审查]
        ↓
   [Sisyphus-Junior 分类执行]
        ↓
   [Oracle 自审查]
        ↓
   完成 ✓

另一种路线:大型项目

你:按 Tab → 切换到 Prometheus
        ↓
   [Prometheus 面试式规划]
        ↓
   计划保存到 .sisyphus/plans/
        ↓
   你:/start-work
        ↓
   [Atlas 读取计划,分配任务]
        ↓
   [Hephaestus 深度执行]
        ↓
   完成 ✓

Sisyphus vs Prometheus:我该用谁?

一个常见的疑问:Sisyphus 也能做规划(调用 Metis + Plan + Momus),那 Prometheus 还有什么用?

答案:90% 的场景,Sisyphus 就够了。

维度SisyphusPrometheus
专注度规划 + 执行 + 编排只做规划
输出格式Todo list + 直接执行正式的 YAML 计划文件
流程灵活判断专门的面试流程
适用日常任务多天大型项目

什么时候用 Prometheus?

  • 项目跨度大,需要正式文档化的计划
  • 需要团队协作,共享计划文件
  • 想要严格的"先规划,后执行"流程

什么时候用 Sisyphus?

  • 大多数日常开发任务
  • 快速迭代、边规划边执行
  • 不需要仪式感,只需要效率

适用场景速查

你的需求推荐方式
快速修个 bug / 加个功能直接告诉 Sisyphus
大型项目规划Tab → Prometheus → /start-work
深度自主架构工作Tab → Hephaestus
搜索代码在哪Sisyphus 自动调用 Explore
查外部库文档Sisyphus 自动调用 Librarian
架构决策咨询Sisyphus 自动调用 Oracle
需求模糊需要澄清Sisyphus 自动调用 Metis
计划需要审查Sisyphus 自动调用 Momus

最后

OMO 的力量不来自某个超级模型,而来自专业分工 + 协作编排

就像好的公司不是靠一个全能员工,而是靠每个岗位上的专业人才,加上一个优秀的经理把它们串起来。

Sisyphus 是那个经理。Explore、Librarian、Oracle 是各领域的专家。Prometheus、Atlas、Hephaestus 是三条不同的工作流水线。

让专业的人做专业的事——这就是 AI 编程的终极形态。


如果你对某个 Agent 的具体用法感兴趣,欢迎留言讨论。