你有没有发现一个问题:让 AI 写一个函数很快,让它在一个持续迭代的项目里保持纪律却几乎不可能。
上周写的登录模块,这周改需求时 AI 已经不记得当时为什么这样设计了。PRD 散落在对话记录里,测试用例靠每次重新生成,commit message 全是 "update"。
AI 编程的瓶颈不在生成能力,在于缺乏可追踪的工程闭环。
问题拆解
我用 Claude Code 做了半年项目,踩过的坑大概可以归为三类:
1. 规划不可追溯
对话式 AI 的致命伤——所有设计决策都埋在聊天记录里。三天后你自己都找不到当时为什么选了方案 B 而不是方案 A。团队协作时更灾难,新成员根本无法理解项目的演化路径。
2. 执行无纪律
"帮我加个注册功能",AI 直接改五个文件,commit 一坨东西。没有依赖顺序,没有原子提交,回滚基本靠运气。测试?不存在的。
3. 反馈不闭环
上线后用户反馈注册转化低,你看了眼数据,然后呢?这些反馈怎么关联到当初的设计决策?怎么驱动下一个版本的优先级调整?大多数团队的回答是:凭感觉。
Zeus 的解法
我花了一段时间设计并开源了 Zeus——一个给 AI 辅助开发加上工程纪律的操作系统。核心思路就一句话:让 AI 的每一次产出都可追踪、可审计、可归因。
架构设计
Zeus 定义了一套严格的项目资产结构:
.zeus/
main/
config.json # 项目配置 & 北极星指标
specs/ # 设计规格文档(不是聊天记录)
prd.json # 结构化用户故事
task.json # 带依赖关系的执行任务
roadmap.json # 版本路线图
evolution.md # 版本演化日志
feedback/ # 用户反馈归因
ai-logs/ # AI 决策日志(为什么这么做)
schemas/ # 所有 JSON 文件的 schema 校验
scripts/ # 执行引擎
hooks/ # Git commit 规范 hook
这不是又一个脚手架工具。这是一套 JSON Schema 驱动的状态机,每个阶段有明确的输入/输出契约。
工作流:五个阶段,环环相扣
init → brainstorm → plan → execute → feedback → (evolve → ...)
/zeus:init — 初始化工作区,定义项目的北极星指标(不是随便填的,这个指标会贯穿整个项目的决策归因链)。
/zeus:brainstorm --full — 结构化设计对话。AI 不是自由发挥,而是按 spec.schema.json 的约束输出设计文档。设计决策被记录,不是遗忘在对话流中。
/zeus:plan — 把 spec 拆解为 prd.json(用户故事)和 task.json(执行任务)。关键:任务之间有依赖关系,形成 DAG,执行时按 wave 拆分,每个 wave 的任务可以并行。
/zeus:execute — 按 wave 执行。每个任务对应一个原子 commit,commit message 遵循 feat(T-003): xxx 的规范(通过 git hook 强制校验)。不是一坨改动,而是可回滚的原子操作。
/zeus:feedback — 录入用户反馈,AI 做归因分析:这个反馈应该关联到哪个设计决策?是否需要触发版本演化?这就是闭环。
Agent 模型
Zeus 不是单体设计,而是阶段化 Agent 委派:
| Agent | 职责 |
|---|---|
zeus-researcher | 上下文探索、依赖风险检查 |
zeus-planner | spec 拆解、执行资产构建 |
zeus-executor | wave 执行编排、质量门禁 |
zeus-analyst | 反馈归因、演化判定 |
zeus-tester | AI 自动生成多平台测试流程 |
zeus-docs | 双语文档一致性校验 |
每个 Agent 只做一件事,做彻底。不是万能助手,是专业工具。
版本演化机制
这是 Zeus 区别于所有 AI 编程工具的地方:版本演化轨道。
当反馈数据表明当前版本无法满足需求时,/zeus:evolve 会创建新的版本目录 .zeus/v2/,继承主版本的上下文,但允许独立演化。旧版本不受影响,新版本可以试错。
这不是 git branch——这是一套完整的、从 spec 到 execution 到 feedback 的并行演化体系。
实际使用感受
用了 Zeus 之后最明显的变化:
- 不怕中断 — 所有上下文在
.zeus/里,换个终端甚至换个 AI 运行时都能无缝恢复 - commit 可读 — 每个 commit 对应一个任务,message 自带任务 ID,回溯问题极快
- 需求变更有据可查 —
evolution.md记录了每次变更的 why,不是黑箱 - 反馈驱动迭代 — 用户反馈不再凭感觉排优先级,归因分析直接告诉你该改哪里
技术细节补充
- 所有 JSON 文件都有对应的 JSON Schema 校验(
.zeus/schemas/) - 测试用例 AI 自动生成,支持 Android / Chrome / iOS 三个平台
- Git commit hook 强制校验 commit message 格式
- AI 每次执行必须在
ai-logs/追加决策日志:Why / What / Impact - MIT 开源,可以直接 clone 用
适合谁?
- 用 Claude Code / Cursor 等工具做项目的独立开发者
- 想给 AI 辅助开发加上工程纪律的小团队
- 对「AI 编程」感兴趣但觉得缺乏可控性的工程师
- 需要长期维护 AI 辅助项目的团队 lead
仓库地址
GitHub: github.com/huifer/zeus
如果这个方向对你有价值,欢迎 Star 和讨论。AI 编程的工程化才刚开始,需要更多人一起定义标准。