AI 写代码已经不稀奇了,但你见过 AI 先头脑风暴、再写设计文档、然后用 TDD 写代码、最后自己做 Code Review 的吗?——Superpowers 就是干这个的。
一个真实的场景
你让 Claude Code 帮你实现一个功能。它很快给出了代码,看起来能跑。但两天后你发现:
- 没有测试,改一行代码不知道会不会炸
- 架构设计全凭 AI 自由发挥,跟项目现有风格格格不入
- 边界条件没考虑,线上出了 Bug 才发现
- 代码是能用,但没人敢重构
根本原因不是 AI 不够聪明,而是它缺少工程纪律。它不会在动手前先想清楚,不会写测试再写实现,不会在完成后自查。
Superpowers 就是为了解决这个问题——它不是让 AI 更聪明,而是让 AI 更专业。
Superpowers 是什么?
Superpowers 是一个开源的 AI 编程智能体技能框架,由 Jesse Vincent 创建。它通过一套可组合的「技能(Skills)」,给 Claude Code 注入了结构化的软件工程方法论:
- 动手前先头脑风暴,把需求想清楚
- 写代码前先制定计划,把任务拆细
- 写实现前先写测试,严格 TDD
- 完成后自动代码审查,确保质量
- 遇到 Bug 用系统性调试,不靠猜
一句话概括:它把"高级工程师的工作习惯"变成了 AI 的默认行为。
项目数据
| 指标 | 数据 |
|---|---|
| GitHub Stars | 93.4k+ |
| 最新版本 | v5.0.5(2026.03.17) |
| 开源协议 | MIT |
| 支持平台 | Claude Code、Cursor、Codex、OpenCode、Gemini CLI |
| 官方收录 | Anthropic 官方插件市场认证 |
为什么需要 Superpowers?
AI 编程的现状问题
当前 AI 编程助手普遍存在一个行为模式:收到指令就开始写代码。这很快,但也很危险。
传统 AI 编程流程:
用户说"实现 X" → AI 立刻写代码 → 输出结果 → 有 Bug → 打补丁 → 又有 Bug → ...
这就像一个"只管写代码不管工程质量"的初级开发者——速度快,但返工更多。
Superpowers 的解法
Superpowers 流程:
用户说"实现 X"
→ 头脑风暴(需求澄清、方案探讨)
→ 设计文档(用户确认后才动手)
→ 任务拆解(每个子任务 2-5 分钟)
→ TDD 实现(先写测试、再写代码)
→ 代码审查(自动检查质量)
→ 验证完成(跑通所有测试才算完)
先想清楚,再动手。写了测试,才写代码。完成了验证,才敢说完成。
这套方法论对人类工程师来说是常识,但对 AI 来说需要被明确「教会」——这就是 Superpowers 做的事。
核心技能详解
Superpowers 包含 15 个可组合的技能,覆盖软件开发的完整生命周期。以下是最核心的几个:
1. 头脑风暴(Brainstorming)
触发时机:任何需要创建新功能、构建组件、修改行为的场景
这是 Superpowers 的「入口技能」。当你提出一个需求时,Claude 不会立刻写代码,而是进入苏格拉底式的对话:
- 询问你的技术偏好和约束条件
- 探索多种实现方案的利弊
- 将设计分段展示,逐段确认
- 最终输出一份经过你确认的设计文档
关键机制:技能内置了一个硬性门禁——在设计被确认之前,禁止写任何实现代码。
用户:帮我实现一个实时通知系统
Claude(启用 Superpowers):
在开始实现之前,我想先了解几个问题:
1. 通知的传输方式偏好 WebSocket 还是 SSE?
2. 需要支持离线消息队列吗?
3. 通知的持久化用什么方案?Redis 还是数据库?
4. 预期的并发规模是多少?
...(逐步细化,直到方案明确)
2. 测试驱动开发(TDD)
触发时机:任何功能实现或 Bug 修复
严格执行 Red-Green-Refactor 循环:
| 阶段 | 做什么 | 不做什么 |
|---|---|---|
| Red | 写一个会失败的测试,运行确认失败 | 不写任何实现代码 |
| Green | 写最少的代码让测试通过 | 不做多余的优化 |
| Refactor | 在测试全绿的前提下重构 | 不引入新功能 |
内置反模式检测:如果出现以下情况,技能会要求从头来过:
- 在测试之前写了实现代码
- 测试一写出来就直接通过了(说明测试没有针对性)
- 无法解释测试为什么会失败
3. 系统性调试(Systematic Debugging)
触发时机:遇到任何 Bug、测试失败或异常行为
分 4 个阶段进行:
- 信息收集:复现问题,获取错误信息、堆栈、日志
- 假设生成:基于证据列出可能的原因,排列优先级
- 假设验证:逐个验证或排除,找到根因
- 修复与验证:修复问题,编写回归测试,确认修复有效
核心原则:不猜。每一步都要有证据支撑,不靠直觉修 Bug。
4. 计划编写(Writing Plans)
触发时机:多步骤任务、多文件修改、架构变更
将大任务拆解为 2-5 分钟 的微任务,每个任务包含:
- 精确的文件路径
- 具体的代码变更说明
- 完整的验证步骤
- 与其他任务的依赖关系
示例:实现用户认证系统
任务 1(3min):创建 User 模型和数据库迁移
- 文件:src/models/user.js, migrations/001_create_users.sql
- 验证:运行迁移,确认表结构正确
任务 2(4min):实现密码哈希和验证工具
- 文件:src/utils/password.js
- 验证:测试 hashPassword() 和 verifyPassword()
任务 3(5min):实现注册接口
- 文件:src/routes/auth.js, tests/auth.test.js
- 验证:测试通过,包括重复注册和参数校验
...
5. 子 Agent 并行开发(Subagent-Driven Development)
触发时机:执行计划中有多个独立任务
将独立的任务分配给多个子 Agent 并行执行,每个 Agent:
- 在隔离环境中工作
- 遵循 TDD 流程
- 完成后经过两阶段审查:
- 第一阶段:检查是否符合计划规格
- 第二阶段:检查代码质量
效果:原本串行 1 小时的工作,并行后可能 15-20 分钟完成。
6. 代码审查(Code Review)
分为两个方向:
请求审查(Requesting):完成任务后自动触发
- 检查是否符合原始计划
- 运行所有测试
- 按严重级别分类问题(Critical / Major / Minor)
- Critical 问题阻止合并
接受审查(Receiving):收到他人反馈后
- 不盲目接受所有建议
- 技术性验证每条反馈的正确性
- 对不合理的建议提出异议
- 对合理的建议编写测试后再修改
7. 其他技能
| 技能 | 用途 |
|---|---|
| verification-before-completion | 完成声明前必须运行验证命令,用证据说话 |
| executing-plans | 分批执行计划,每批之间设置人工检查点 |
| dispatching-parallel-agents | 面对 2+ 个独立任务时并发执行 |
| using-git-worktrees | 在隔离的 Git Worktree 中开发,保护主分支 |
| finishing-a-development-branch | 开发完成后引导合并/PR/清理流程 |
| writing-skills | 按框架规范创建新技能 |
安装方式
Claude Code(推荐)
官方市场安装(最简单):
/plugin install superpowers@claude-plugins-official
自定义市场安装:
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
更新插件:
/plugin update superpowers
其他平台
| 平台 | 安装方式 |
|---|---|
| Cursor | Agent Chat 中输入 /add-plugin superpowers |
| Codex | 请求 Claude 获取并执行安装脚本 |
| OpenCode | 请求 Claude 获取并执行安装脚本 |
| Gemini CLI | gemini extensions install https://github.com/obra/superpowers |
验证安装
安装完成后输入 /help,如果看到以下命令说明安装成功:
/superpowers:brainstorm/superpowers:write-plan/superpowers:execute-plan
实际工作流演示
以「实现一个实时聊天功能」为例,展示完整流程:
第一步:头脑风暴
你:帮我在现有项目中加一个实时聊天功能
Claude(自动激活 brainstorming 技能):
好的,在开始设计之前,我想确认几个关键问题:
1. 聊天的范围:是 1v1 私聊、群聊、还是都要支持?
2. 消息类型:纯文本还是需要支持图片/文件?
3. 实时性方案:WebSocket、SSE、还是轮询?
4. 历史消息:需要持久化吗?存多久?
5. 在线状态:需要显示用户在线/离线吗?
(你逐一回答后,Claude 输出分段设计文档,你确认后进入下一步)
第二步:制定计划
Claude(自动激活 writing-plans 技能):
已将需求拆解为 12 个微任务:
✅ 任务 1:WebSocket 服务端配置(3min)
✅ 任务 2:消息数据模型设计(2min)
✅ 任务 3:聊天室创建/加入 API(4min)
✅ 任务 4:消息发送/接收逻辑(5min)
✅ 任务 5:前端聊天组件 UI(5min)
... 共 12 个任务
是否批准这个计划?
第三步:TDD 实现
Claude(自动激活 TDD 技能):
开始任务 4:消息发送/接收逻辑
[Red] 编写测试:
- test: 发送消息后应广播给同房间所有用户
- test: 未认证用户发送消息应被拒绝
- test: 消息应持久化到数据库
❌ 3 个测试全部失败(符合预期)
[Green] 编写最小实现...
✅ 3 个测试全部通过
[Refactor] 提取公共方法,优化错误处理...
✅ 重构后测试仍全部通过
第四步:代码审查
Claude(自动激活 code-review 技能):
审查结果:
- ✅ 所有 12 个任务符合计划规格
- ✅ 测试覆盖率 91%
- ⚠️ Minor:chatRoom.js 第 42 行可以用 optional chaining 简化
- ⚠️ Minor:建议给 WebSocket 心跳加个超时配置
无 Critical/Major 问题,可以合并。
使用前后对比
| 维度 | 不用 Superpowers | 用 Superpowers |
|---|---|---|
| 启动方式 | 收到指令直接写代码 | 先头脑风暴确认需求和方案 |
| 测试策略 | 没有测试,或事后补测试 | 严格 TDD,先测试后实现 |
| 任务管理 | 一大坨任务一口气做完 | 拆成 2-5 分钟的微任务 |
| 开发速度 | 单线程顺序执行 | 多 Agent 并行(3-4 倍提速) |
| 代码审查 | 完全依赖人工 | AI 自动审查 + 人工确认 |
| 调试方式 | 试错法,改了再看 | 系统性根因分析,改一次改对 |
| 质量保证 | 随缘(50-60% 可靠) | 企业级(85-95% 测试覆盖) |
| 自主运行 | 很快就需要人工干预 | 可连续自主工作数小时 |
核心优势
1. 工程纪律的强制执行
不是"建议你写测试",而是不写测试就不让你继续。不是"建议你先想清楚",而是没有设计文档就不让你写代码。
这正是 AI 编程最缺的东西——纪律。
2. 显著的效率提升
虽然头脑风暴和计划编写会花 10-20 分钟的前期时间,但:
- 更少的返工和 Bug 修复
- 并行执行带来的直接提速
- 测试保障下的无畏重构
实际体验:整体开发效率提升 2-3 倍。
3. 可预测的输出质量
传统 AI 编程的输出质量高度不稳定——同一个需求问两次可能得到完全不同的结果。Superpowers 通过流程约束让输出质量收敛到一个可预测的水平。
4. 平台无关
不只是 Claude Code 能用。Cursor、Codex、OpenCode、Gemini CLI 都支持,技能是通用的。
5. 完全开源可定制
MIT 协议,所有技能的逻辑完全透明。你可以:
- 修改现有技能的行为
- 用
writing-skills技能创建自己的技能 - 根据团队规范定制流程
适用角色
| 角色 | 适用场景 |
|---|---|
| 后端工程师 | 用 TDD 技能确保 API 接口的正确性和边界覆盖 |
| 前端工程师 | 用头脑风暴技能在动手前理清组件设计和状态管理 |
| 全栈开发者 | 用并行 Agent 同时推进前后端任务 |
| 技术负责人 | 将 Superpowers 作为团队 AI 编程规范的基线 |
| 独立开发者 | 一个人 + Superpowers = 一个有纪律的小团队 |
| 开源贡献者 | 用计划和审查技能确保 PR 质量 |
什么时候该用 / 不该用
适合使用
- 需要长期维护的正式项目
- 多文件、多模块的复杂功能
- 对质量和测试覆盖率有要求的场景
- 团队协作项目(统一 AI 工作规范)
- 重构现有代码(系统性调试 + TDD 保护)
可以不用
- 一次性脚本或临时工具
- 几行代码的简单修改
- 纯探索性的原型验证
- 紧急 Hotfix(时间极其有限)
常见问题
Q:安装后 Claude 变慢了? 前几次使用会有 10-20 分钟的头脑风暴和计划开销。这是「磨刀不误砍柴工」——实现阶段会快很多,总时间通常更短。用 5-10 次后会越来越顺。
Q:可以只用部分技能吗? 可以。技能是自动触发的,但你可以在对话中明确说"跳过头脑风暴,直接写代码"来绕过特定技能。不过不建议经常这么做。
Q:会不会过度工程化? 对于简单任务确实可能。如果你只是改个文案或修个 typo,Superpowers 的流程会显得多余。但对中大型任务,这套流程是物超所值的。
Q:支持哪些编程语言? Superpowers 是方法论框架,不绑定语言。JavaScript、Python、Go、Rust、Java 等都适用。
Q:和 Claude Code 自带能力有什么区别? Claude Code 自带的是"能力"(会写代码、会调试、会用工具),Superpowers 给的是"方法论"(什么时候该做什么、怎么做、做完怎么验证)。两者是互补关系。
写在最后
Superpowers 的核心理念其实很朴素:好的软件工程实践不应该只是人类工程师的自觉,也应该成为 AI 的默认行为。
先想后做、测试先行、代码审查、系统调试——这些道理我们都懂,但在追求速度的 AI 编程时代,恰恰是这些"慢"的步骤保证了最终的质量和速度。
安装只需要一行命令:
/plugin install superpowers@claude-plugins-official
试一次你就会明白,AI 编程的天花板不是模型能力,而是工程方法论。
项目地址:github.com/obra/superp… 作者:Jesse Vincent(@obra) Discord 社区:discord.gg/Jd8Vphy9jq
如果这篇文章对你有帮助,欢迎点赞收藏。有使用心得或问题,欢迎评论区交流。