Aegis:把哲科思维融入Spec coding的Superpowers中,眼前一亮的新一代体验上线了

0 阅读8分钟

Spec Coding的新一代体验:Aegis

20万star明星项目superpowers的升级版

如果你也遇到过“AI 写得很快,但任务最后还是要人重新收拾”的情况,Aegis 想解决的正是这个问题。

过去一年,AI coding agent 的能力进步非常快。它们能读代码、改文件、跑测试、写文档,甚至能跨多个步骤完成一个功能。

但很多团队真正遇到的瓶颈,已经不是“AI 会不会写代码”,而是:

· 它有没有先搞清楚任务边界?

· 它有没有读项目里的真实基线和约束?

· 它是不是一边修 bug,一边偷偷加了新的 fallback?

· 它说“完成了”的时候,有没有 fresh verification?

· 长任务压缩上下文或换会话后,它还能不能接得住?

· 架构漂移、ADR、旧逻辑退休这些事情,有没有被及时记录?

这就是我们做 Aegis 的原因。

Aegis 不是另一个 IDE,也不是新的 AI 模型。它是一个面向 AI coding agent 的 Method Pack:一套可安装、可触发、可验证的工作方法,让 agent 在真实工程任务里更稳、更清楚、更可审计。

GitHub:github.com/GanyuanRan/…

Gitcode: gitcode.com/m0_67899281…

一句话理解 Aegis

02-workflow-routing.jpg Aegis = 给 AI coding agent 用的工程纪律层。

它让 agent 在动手之前先判断任务类型、读取必要基线、明确影响面和验证方式;在完成之前拿出证据,而不是只说“应该好了”。

Aegis 当前的正式定位是:

Aegis Method Pack (runtime-ready)

这句话很重要。它意味着 Aegis 现在负责的是:

· skills 和 workflow discipline

· 多宿主可安装的方法包分发

· 任务 framing、debugging、planning、review、verification 等工作流

· runtime-ready 的 drafts / hints / projections

· evidence bundle、checkpoint、drift check 等可交接材料

它不负责:

· 最终 runtime core

· authoritative GateDecision

· authoritative PolicySnapshot

· 最终 completion authority

换句话说,Aegis 不冒充“最终裁判”。它先把 agent 的工作过程变得可靠。

AI Coding 真正缺的,不只是更强的模型

很多 AI coding 失败案例,看起来像“模型没写对”,但根因往往是流程问题。

比如一个登录 bug:

· 用户说“偶发跳回登录页”。

· Agent 直接打开 auth 文件开始改。

· 它可能补一个重试,或者加一个兜底刷新。

· 测试跑了一个局部用例,返回“已修复”。

· 结果线上还有另一个 consumer 仍然走旧 token owner。

这里真正缺的不是“更努力写代码”,而是:

1. 先定义问题:复现条件是什么?影响谁?验收标准是什么?

2. 再调查 owner:token 的 source of truth 是谁?producer / consumer 在哪里?

3. 再制定最小切片:改哪个 owner,退休哪个 fallback?

4. 最后验证:用什么命令、日志、测试证明真的覆盖了风险?

Aegis 把这些动作变成 agent 的工作纪律,而不是靠每次 prompt 临场发挥。

Aegis 怎么工作:先路由,再执行

转存失败,建议直接上传图片文件 

Aegis 的入口不是“所有任务都走一套重流程”。相反,它很强调 fast path cheapness:简单任务就轻量处理,复杂任务才进入完整 workflow。

一次典型任务会先经过路由判断:

· 简单问答、版本状态、小文案:fast path

· bug、失败测试、异常行为:systematic-debugging

· 产品、架构、contract、跨模块不清:brainstorming

· 已批准需求,需要拆任务:writing-plans

· 多步骤、易丢上下文任务:long-task-continuation

· 完成、发布、交付前:verification-before-completion

这样做的好处是:Aegis 不会把简单问题复杂化,也不会让高风险任务裸奔。

Aegis 的 6 个核心亮点

03-core-highlights.jpg

1. Baseline-first:先看项目事实,再动手

Aegis 鼓励 agent 在非简单任务前先读项目的 authority source:README、AGENTS.md、ADR、current docs、架构文档、测试说明等。

这能减少一种常见错误:agent 只根据当前对话印象行动,却忽略仓库已经写明的边界和约束。

2. Evidence-before-claims:完成前必须有证据

Aegis 不鼓励 agent 轻易说“完成了”。

在 verification-before-completion 中,agent 需要说明:

· 跑了什么命令或检查

· exit status 是什么

· 覆盖了哪些范围

· 哪些范围没有覆盖

· 剩余风险是什么

这会显著降低“看起来好了”的假完成。

3. Debugging 不先猜修复,而是先找 owner

系统性 debugging 不应该从“我来改几行”开始,而应该先稳定症状、复现路径、真实 owner、数据流和回归证据。

Aegis 强调 root-cause-first,避免 bug fix 变成 fallback 堆叠。

4. Long-task continuation:长任务不中断

真实工程任务经常跨很多步骤:调研、计划、实现、测试、review、修复、发布。

Aegis 用 todo checkpoint、resume hint、drift check、evidence refs 等方式,让长任务在上下文压缩、会话重启或多 agent handoff 后仍然能接续。

5. Dual-track governance:修复和退休旧逻辑一起看

很多系统变复杂,不是因为新逻辑错,而是旧逻辑没有退休。

Aegis 要求在 bug fix、refactor、compat cleanup、governance cleanup 里同时看两条线:

· Repair Track:修了什么,证据是什么。

· Retirement Track:旧 owner、旧 fallback、旧路径如何处理。

这能减少“修一次,多一层历史包袱”的工程腐蚀。

6. ADR Auto Backfill:重要决策不要只留在聊天里

Aegis v1.4.3 强化了 completion-time ADR Backfill Check。

当一次任务产生了架构决策、兼容边界变化、baseline sync 问题或旧逻辑退休信号时,agent 会在完成前检查是否需要:

· 创建 ADR

· 修订 ADR

· supersede 旧 ADR

· 或明确跳过原因

这不是 runtime authority,而是方法包层面的 advisory signal。它的价值是提醒团队:重要决策不要只留在一次聊天记录里。

一个具体例子:修 bug 时 Aegis 会改变什么?

没有 Aegis 时,常见流程可能是:

用户:登录后偶发跳回登录页,帮我修一下。
Agent:我检查 auth 逻辑,做了一个 token refresh fallback,测试通过,完成。

有 Aegis 时,agent 更可能这样工作:

  1. 判断这是 bug / regression,进入 systematic-debugging。
  2. 先确认复现条件、影响范围和验收标准。
  3. 读取 auth 相关 baseline / docs / tests。
  4. 找 token producer、consumer、cache、refresh owner。
  5. 区分真实缺陷、架构漂移和历史 fallback。
  6. 做最小修复,并说明是否需要退休旧路径。
  7. 跑测试和必要回归。
  8. 完成前提供 Evidence Card。
  9. 如果产生架构决策,触发 ADR Backfill Check。

这不是为了让流程变慢,而是为了少返工。

为什么说 Aegis 适合团队使用?

个人使用 AI coding agent,最怕的是它“自信但没证据”。

团队使用 AI coding agent,更怕的是:

· 每个人 prompt 风格不同,agent 行为不稳定。

· 重要约束只在口头或聊天里,没有进入仓库事实源。

· review 只看 diff,没有看 baseline 和 ADR。

· 长任务跨会话后,新的 agent 不知道之前为什么这么做。

Aegis 的价值在于把这些东西变成可复用的 method layer:

· 让不同 agent 使用相似的问题定义方式。

· 让完成声明绑定证据。

· 让 review 关注 baseline/current authority。

· 让长任务有 checkpoint 和 resume state。

· 让重要架构信号进入 ADR backfill 检查。

对团队来说,这比“某一次 prompt 写得很好”更重要。

安装方式:让你的 Agent 自己装

Aegis 支持多种 AI coding host 的安装路径,例如 Codex、OpenCode、Claude Code、CodeBuddy、DeepSeek-TUI、Trae 等。

如果你使用的是 Codex / Claude / OpenCode 这类 agent,可以直接让它读取仓库并选择正确安装方式:

Please read the installation instructions in github.com/GanyuanRan/… carefully, identify the correct path for my AI coding host, install Aegis globally, restart or reload the host if needed, then run complete-install verification from the Aegis method-pack root with python scripts/aegis-doctor.py --write-config --json. Treat the install as complete only if the JSON output includes "ok": true, "workspaceSupport": "available", and "configStatus": "configured"; if the host uses a separate skill discovery directory, also verify it with --discovery-root <path>.

如果你已经安装过,也可以让 agent 更新到最新版本,并重新跑 doctor 验证。

Aegis 不是什么?

为了避免误解,这里也说清楚 Aegis 的边界。

Aegis 不是:

· 新 IDE

· 新模型

· 自动替你做最终架构裁决的 runtime core

· 让所有任务都变重的流程框架

· 用 prompt 假装拥有 completion authority 的系统

Aegis 是:

· agent-facing 的方法包

· workflow discipline

· evidence / baseline / verification 的执行习惯

· 面向未来 runtime core 的 runtime-ready 输入和投影

这也是它现阶段最实际的价值:不用等完整平台落地,你现在就可以先让 AI coding agent 工作得更稳。

适合谁尝试?

如果你符合下面任意一种情况,Aegis 值得试一下:

· 你经常让 AI agent 修 bug、写功能、重构或整理文档。

· 你遇到过 agent 说完成了,但后来发现没有验证充分。

· 你的项目有 ADR、baseline、架构约束或复杂兼容边界。

· 你希望团队里的 AI 使用方式更统一,而不是每个人各写各的 prompt。

· 你需要处理长任务、多步骤任务或跨会话任务。

最后

AI coding 的下一阶段,不只是“生成更多代码”。

更重要的是:让 agent 能够理解目标、尊重边界、保留证据、处理长任务,并在完成前知道自己还缺什么。

这就是 Aegis 想做的事情。

如果你也希望 AI coding agent 不只是快,而是更稳、更清楚、更可审计,欢迎试用 Aegis:

GitHub:github.com/GanyuanRan/…

也欢迎 star、提 issue,或者把你真实使用中的任务样本反馈给我们。