oh-my-agent — 面向实战的多 AI IDE 智能体调控框架oh-my-agent 通过流程而非提示词管控 A

让智能体"做一个 TODO 应用"，它确实会做出点什么。问题在于，它经常做出来的东西驴唇不对马嘴，跑出预定范围，还反复犯同样的错误。

为了解决这些问题，早期出现了 AGENTS.md，近来又有了 Skills 这类结构化方案。但看看实际分享出来的 Skills，几个通病很明显：

最关键的库版本信息缺失。角色描述止步于"You are a Senior engineer"之类的空话。几个关键词就能讲清的内容，偏要写成长篇大论，白白浪费 token。

结果就是，模型既不能好好遵循这些 Skills，上下文也白白耗掉了，时间一长就变成了没人想打开的死代码。

[思路]

oh-my-agent 想用流程而非提示词来解决这个问题。智能体出错时，不是简单地说一句"重来"，而是记录它为什么出错，并在下一次执行中加以改进。

核心机制是 Clarification Debt（CD）计分。当智能体误解需求或越出范围时，会累积分数：

超过 50 分，必须编写 Root Cause Analysis（RCA）；超过 80 分，会话直接中断。总结出的经验会沉淀到 lessons-learned.md，从下一次会话起立即生效。提示词写得再简单，流程也能帮你兜住。

除此之外，为了防止智能体自行其是，还设有几个通用协议：

Clarification Protocol — 将需求模糊度分为 LOW / MEDIUM / HIGH。LOW 直接推进，MEDIUM 给出选项，HIGH 停下来先把事情说清楚。

Difficulty Guide — 将任务划分为 Simple / Medium / Complex，按需调整协议深度。

Context Budget — 按模型设定 token 预算，减少不必要的上下文开销。

这种思路与 OpenAI 提出的 Harness Engineering 一脉相承。用好智能体，不是一句提示词能解决的，关键在于你用什么样的结构去管控它。

oh-my-agent 在项目目录内统一管理这些内容。

.agents/ = SSOT — 技能、工作流、配置全部放在 .agents/ 目录下，作为唯一可信数据源，不绑定任何特定 IDE。

基于角色的智能体团队 — 基础角色包括 PM、QA、Frontend、Backend、Mobile、Debug，本次新增了 DB Agent 和 TF Infra Agent。

以工作流为中心的编排 — 规划、评审、调试、并行执行构成基本流程。新增的 /brainstorm 工作流在写代码之前先做设计探索：代码库分析 → 澄清提问 → 方案建议 → 用户确认 → 保存设计文档，之后衔接 /plan → 实现。

/coordinate 追求速度——快速迭代，出了问题再修。PM 拆解任务、调度智能体，QA 做一轮评审。遇到 CRITICAL/HIGH 级别问题就重跑该任务，整体是一个轻量高效的 7 步循环。

/ultrawork 则强调质量把关。分为 PLAN → IMPL → VERIFY → REFINE → SHIP 五个阶段，每个阶段都有门禁，过不了就不能往下走。17 个步骤中有 11 个是评审；REFINE 阶段还会做文件拆分、去重、副作用分析和死代码清理。

看起来可能有些过头，但编程的抽象层级从机器语言到高级语言、再到自然语言一路攀升，验证只会变得越来越重要——相信大家对此不会有异议。

一个月前，这个项目以 oh-my-ag 的名字亮相，当时是 Antigravity 专属的编排器。但这段时间里，多个 AI IDE 开始把 .agents/skills/ 作为项目技能路径，继续绑定单一 IDE 已经没有意义。于是扩展为通用调控框架，更名为 oh-my-agent。

curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/main/cli/install.sh | bash

支持 Antigravity、Claude Code、Codex CLI、Cursor 等主流 AI IDE。

如果你已经在用 AI IDE，不妨试一试。说到底，开发者的目标是同时把控 QCD（Quality, Cost, Delivery）。智能体开发也不例外——oh-my-agent 就是带着这个信念做出来的。