Aegis：把哲科思维融入Spec coding的Superpowers中，眼前一亮的新一代体验上线了Spec Codi

Spec Coding的新一代体验：Aegis

20万star明星项目superpowers的升级版

如果你也遇到过“AI 写得很快，但任务最后还是要人重新收拾”的情况，Aegis 想解决的正是这个问题。

过去一年，AI coding agent 的能力进步非常快。它们能读代码、改文件、跑测试、写文档，甚至能跨多个步骤完成一个功能。

但很多团队真正遇到的瓶颈，已经不是“AI 会不会写代码”，而是：

· 它有没有先搞清楚任务边界？

· 它有没有读项目里的真实基线和约束？

· 它是不是一边修 bug，一边偷偷加了新的 fallback？

· 它说“完成了”的时候，有没有 fresh verification？

· 长任务压缩上下文或换会话后，它还能不能接得住？

· 架构漂移、ADR、旧逻辑退休这些事情，有没有被及时记录？

这就是我们做 Aegis 的原因。

Aegis 不是另一个 IDE，也不是新的 AI 模型。它是一个面向 AI coding agent 的 Method Pack：一套可安装、可触发、可验证的工作方法，让 agent 在真实工程任务里更稳、更清楚、更可审计。

GitHub：github.com/GanyuanRan/…

Gitcode: gitcode.com/m0_67899281…

一句话理解 Aegis

Aegis = 给 AI coding agent 用的工程纪律层。

它让 agent 在动手之前先判断任务类型、读取必要基线、明确影响面和验证方式；在完成之前拿出证据，而不是只说“应该好了”。

Aegis 当前的正式定位是：

Aegis Method Pack (runtime-ready)

这句话很重要。它意味着 Aegis 现在负责的是：

· skills 和 workflow discipline

· 多宿主可安装的方法包分发

· 任务 framing、debugging、planning、review、verification 等工作流

· runtime-ready 的 drafts / hints / projections

· evidence bundle、checkpoint、drift check 等可交接材料

它不负责：

· 最终 runtime core

· authoritative GateDecision

· authoritative PolicySnapshot

· 最终 completion authority

换句话说，Aegis 不冒充“最终裁判”。它先把 agent 的工作过程变得可靠。

AI Coding 真正缺的，不只是更强的模型

很多 AI coding 失败案例，看起来像“模型没写对”，但根因往往是流程问题。

比如一个登录 bug：

· 用户说“偶发跳回登录页”。

· Agent 直接打开 auth 文件开始改。

· 它可能补一个重试，或者加一个兜底刷新。

· 测试跑了一个局部用例，返回“已修复”。

· 结果线上还有另一个 consumer 仍然走旧 token owner。

这里真正缺的不是“更努力写代码”，而是：

1. 先定义问题：复现条件是什么？影响谁？验收标准是什么？

2. 再调查 owner：token 的 source of truth 是谁？producer / consumer 在哪里？

3. 再制定最小切片：改哪个 owner，退休哪个 fallback？

4. 最后验证：用什么命令、日志、测试证明真的覆盖了风险？

Aegis 把这些动作变成 agent 的工作纪律，而不是靠每次 prompt 临场发挥。

Aegis 怎么工作：先路由，再执行

转存失败，建议直接上传图片文件

Aegis 的入口不是“所有任务都走一套重流程”。相反，它很强调 fast path cheapness：简单任务就轻量处理，复杂任务才进入完整 workflow。

一次典型任务会先经过路由判断：

· 简单问答、版本状态、小文案：fast path

· bug、失败测试、异常行为：systematic-debugging

· 产品、架构、contract、跨模块不清：brainstorming

· 已批准需求，需要拆任务：writing-plans

· 多步骤、易丢上下文任务：long-task-continuation

· 完成、发布、交付前：verification-before-completion

这样做的好处是：Aegis 不会把简单问题复杂化，也不会让高风险任务裸奔。

Aegis 的 6 个核心亮点

1. Baseline-first：先看项目事实，再动手

Aegis 鼓励 agent 在非简单任务前先读项目的 authority source：README、AGENTS.md、ADR、current docs、架构文档、测试说明等。

这能减少一种常见错误：agent 只根据当前对话印象行动，却忽略仓库已经写明的边界和约束。

2. Evidence-before-claims：完成前必须有证据

Aegis 不鼓励 agent 轻易说“完成了”。

在 verification-before-completion 中，agent 需要说明：

· 跑了什么命令或检查

· exit status 是什么

· 覆盖了哪些范围

· 哪些范围没有覆盖

· 剩余风险是什么

这会显著降低“看起来好了”的假完成。

3. Debugging 不先猜修复，而是先找 owner

系统性 debugging 不应该从“我来改几行”开始，而应该先稳定症状、复现路径、真实 owner、数据流和回归证据。

Aegis 强调 root-cause-first，避免 bug fix 变成 fallback 堆叠。

4. Long-task continuation：长任务不中断

真实工程任务经常跨很多步骤：调研、计划、实现、测试、review、修复、发布。

Aegis 用 todo checkpoint、resume hint、drift check、evidence refs 等方式，让长任务在上下文压缩、会话重启或多 agent handoff 后仍然能接续。

5. Dual-track governance：修复和退休旧逻辑一起看

很多系统变复杂，不是因为新逻辑错，而是旧逻辑没有退休。

Aegis 要求在 bug fix、refactor、compat cleanup、governance cleanup 里同时看两条线：

· Repair Track：修了什么，证据是什么。

· Retirement Track：旧 owner、旧 fallback、旧路径如何处理。

这能减少“修一次，多一层历史包袱”的工程腐蚀。

6. ADR Auto Backfill：重要决策不要只留在聊天里

Aegis v1.4.3 强化了 completion-time ADR Backfill Check。

当一次任务产生了架构决策、兼容边界变化、baseline sync 问题或旧逻辑退休信号时，agent 会在完成前检查是否需要：

· 创建 ADR

· 修订 ADR

· supersede 旧 ADR

· 或明确跳过原因

这不是 runtime authority，而是方法包层面的 advisory signal。它的价值是提醒团队：重要决策不要只留在一次聊天记录里。

一个具体例子：修 bug 时 Aegis 会改变什么？

没有 Aegis 时，常见流程可能是：

用户：登录后偶发跳回登录页，帮我修一下。
Agent：我检查 auth 逻辑，做了一个 token refresh fallback，测试通过，完成。

有 Aegis 时，agent 更可能这样工作：

判断这是 bug / regression，进入 systematic-debugging。
先确认复现条件、影响范围和验收标准。
读取 auth 相关 baseline / docs / tests。
找 token producer、consumer、cache、refresh owner。
区分真实缺陷、架构漂移和历史 fallback。
做最小修复，并说明是否需要退休旧路径。
跑测试和必要回归。
完成前提供 Evidence Card。
如果产生架构决策，触发 ADR Backfill Check。

这不是为了让流程变慢，而是为了少返工。

为什么说 Aegis 适合团队使用？

个人使用 AI coding agent，最怕的是它“自信但没证据”。

团队使用 AI coding agent，更怕的是：

· 每个人 prompt 风格不同，agent 行为不稳定。

· 重要约束只在口头或聊天里，没有进入仓库事实源。

· review 只看 diff，没有看 baseline 和 ADR。

· 长任务跨会话后，新的 agent 不知道之前为什么这么做。

Aegis 的价值在于把这些东西变成可复用的 method layer：

· 让不同 agent 使用相似的问题定义方式。

· 让完成声明绑定证据。

· 让 review 关注 baseline/current authority。

· 让长任务有 checkpoint 和 resume state。

· 让重要架构信号进入 ADR backfill 检查。

对团队来说，这比“某一次 prompt 写得很好”更重要。

安装方式：让你的 Agent 自己装

Aegis 支持多种 AI coding host 的安装路径，例如 Codex、OpenCode、Claude Code、CodeBuddy、DeepSeek-TUI、Trae 等。

如果你使用的是 Codex / Claude / OpenCode 这类 agent，可以直接让它读取仓库并选择正确安装方式：

Please read the installation instructions in github.com/GanyuanRan/… carefully, identify the correct path for my AI coding host, install Aegis globally, restart or reload the host if needed, then run complete-install verification from the Aegis method-pack root with python scripts/aegis-doctor.py --write-config --json. Treat the install as complete only if the JSON output includes "ok": true, "workspaceSupport": "available", and "configStatus": "configured"; if the host uses a separate skill discovery directory, also verify it with --discovery-root <path>.

如果你已经安装过，也可以让 agent 更新到最新版本，并重新跑 doctor 验证。

Aegis 不是什么？

为了避免误解，这里也说清楚 Aegis 的边界。

Aegis 不是：

· 新 IDE

· 新模型

· 自动替你做最终架构裁决的 runtime core

· 让所有任务都变重的流程框架

· 用 prompt 假装拥有 completion authority 的系统

Aegis 是：

· agent-facing 的方法包

· workflow discipline

· evidence / baseline / verification 的执行习惯

· 面向未来 runtime core 的 runtime-ready 输入和投影

这也是它现阶段最实际的价值：不用等完整平台落地，你现在就可以先让 AI coding agent 工作得更稳。

适合谁尝试？

如果你符合下面任意一种情况，Aegis 值得试一下：

· 你经常让 AI agent 修 bug、写功能、重构或整理文档。

· 你遇到过 agent 说完成了，但后来发现没有验证充分。

· 你的项目有 ADR、baseline、架构约束或复杂兼容边界。

· 你希望团队里的 AI 使用方式更统一，而不是每个人各写各的 prompt。

· 你需要处理长任务、多步骤任务或跨会话任务。

最后

AI coding 的下一阶段，不只是“生成更多代码”。

更重要的是：让 agent 能够理解目标、尊重边界、保留证据、处理长任务，并在完成前知道自己还缺什么。

这就是 Aegis 想做的事情。

如果你也希望 AI coding agent 不只是快，而是更稳、更清楚、更可审计，欢迎试用 Aegis：

GitHub：github.com/GanyuanRan/…

也欢迎 star、提 issue，或者把你真实使用中的任务样本反馈给我们。