oh-my-agent — 面向实战的多 AI IDE 智能体调控框架

23 阅读4分钟

让智能体"做一个 TODO 应用",它确实会做出点什么。问题在于,它经常做出来的东西驴唇不对马嘴,跑出预定范围,还反复犯同样的错误。

为了解决这些问题,早期出现了 AGENTS.md,近来又有了 Skills 这类结构化方案。但看看实际分享出来的 Skills,几个通病很明显:

最关键的库版本信息缺失。 角色描述止步于"You are a Senior engineer"之类的空话。 几个关键词就能讲清的内容,偏要写成长篇大论,白白浪费 token。

结果就是,模型既不能好好遵循这些 Skills,上下文也白白耗掉了,时间一长就变成了没人想打开的死代码。

[思路]

oh-my-agent 想用流程而非提示词来解决这个问题。智能体出错时,不是简单地说一句"重来",而是记录它为什么出错,并在下一次执行中加以改进。

核心机制是 Clarification Debt(CD)计分。当智能体误解需求或越出范围时,会累积分数:

  • clarify: +10 — 简单的确认提问
  • correct: +25 — 因误解意图而修正方向
  • redo: +40 — 因越界而回滚重来
  • 未确认 Charter 就动手: +15
  • 修改了允许范围外的文件: +20
  • 重复同一错误: x1.5 倍率

超过 50 分,必须编写 Root Cause Analysis(RCA);超过 80 分,会话直接中断。总结出的经验会沉淀到 lessons-learned.md,从下一次会话起立即生效。提示词写得再简单,流程也能帮你兜住。

除此之外,为了防止智能体自行其是,还设有几个通用协议:

Clarification Protocol — 将需求模糊度分为 LOW / MEDIUM / HIGH。LOW 直接推进,MEDIUM 给出选项,HIGH 停下来先把事情说清楚。

Difficulty Guide — 将任务划分为 Simple / Medium / Complex,按需调整协议深度。

Context Budget — 按模型设定 token 预算,减少不必要的上下文开销。

这种思路与 OpenAI 提出的 Harness Engineering 一脉相承。用好智能体,不是一句提示词能解决的,关键在于你用什么样的结构去管控它。

[项目结构]

oh-my-agent 在项目目录内统一管理这些内容。

.agents/ = SSOT — 技能、工作流、配置全部放在 .agents/ 目录下,作为唯一可信数据源,不绑定任何特定 IDE。

基于角色的智能体团队 — 基础角色包括 PM、QA、Frontend、Backend、Mobile、Debug,本次新增了 DB Agent 和 TF Infra Agent。

  • DB Agent:SQL / NoSQL / Vector DB 建模,含 ISO 27001 安全建议
  • TF Infra Agent:多云 Terraform,OPA / Sentinel 策略,ISO 42000 系列管控指南

以工作流为中心的编排 — 规划、评审、调试、并行执行构成基本流程。新增的 /brainstorm 工作流在写代码之前先做设计探索:代码库分析 → 澄清提问 → 方案建议 → 用户确认 → 保存设计文档,之后衔接 /plan → 实现。

[两种编排模式]

/coordinate 追求速度——快速迭代,出了问题再修。PM 拆解任务、调度智能体,QA 做一轮评审。遇到 CRITICAL/HIGH 级别问题就重跑该任务,整体是一个轻量高效的 7 步循环。

/ultrawork 则强调质量把关。分为 PLAN → IMPL → VERIFY → REFINE → SHIP 五个阶段,每个阶段都有门禁,过不了就不能往下走。17 个步骤中有 11 个是评审;REFINE 阶段还会做文件拆分、去重、副作用分析和死代码清理。

看起来可能有些过头,但编程的抽象层级从机器语言到高级语言、再到自然语言一路攀升,验证只会变得越来越重要——相信大家对此不会有异议。

[项目扩展背景]

一个月前,这个项目以 oh-my-ag 的名字亮相,当时是 Antigravity 专属的编排器。但这段时间里,多个 AI IDE 开始把 .agents/skills/ 作为项目技能路径,继续绑定单一 IDE 已经没有意义。于是扩展为通用调控框架,更名为 oh-my-agent。

[快速开始]

curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/main/cli/install.sh | bash

支持 Antigravity、Claude Code、Codex CLI、Cursor 等主流 AI IDE。

如果你已经在用 AI IDE,不妨试一试。说到底,开发者的目标是同时把控 QCD(Quality, Cost, Delivery)。智能体开发也不例外——oh-my-agent 就是带着这个信念做出来的。

🔗 GitHub: first-fluke/oh-my-agent