60 天 60 万行代码,35% 是测试代码。Y Combinator 总裁 Garry Tan 开源了他的 AI 工程系统——gstack。我用了一周,感觉背后站了一个虚拟工程团队。
📖 目录
- gstack 是什么?
- 谁是 Garry Tan?
- 60 天 60 万行代码:数据说话
- 15 个专家角色详解
- Sprint 流程:Think→Plan→Build→Review→Test→Ship→Reflect
- 实战:30 分钟完成一个功能
- 并行开发:一个人同时跑 10-15 个 sprint
- 安装与配置(手把手)
- gstack vs 其他方案
- 我的真实使用体验
gstack 是什么?
一句话总结:gstack 把 Claude Code 变成一个你真正管理的虚拟工程团队。
它不是另一个工具集,不是一堆 prompt 模板的合集。gstack 是一套完整的软件工程工厂——由 YC CEO Garry Tan 亲自设计并开源(MIT 协议),包含 15 个专家角色 + 6 个安全工具,全部以 slash 命令的形式在 Claude Code 中运行。
你可以把它理解为:
┌─────────────────────────────────────────────────────┐
│ gstack 虚拟团队 │
├─────────────────────────────────────────────────────┤
│ 🎯 CEO → 重新思考产品方向 │
│ 📐 工程经理 → 锁定架构和数据流 │
│ 🎨 设计师 → 捕捉 AI 生成的"塑料感"代码 │
│ 🔍 资深审查员 → 发现会在生产环境爆炸的 bug │
│ ✅ QA 负责人 → 真实浏览器点击测试 │
│ 🚀 发布工程师 → 一键发布 PR │
│ 🛡️ 安全卫士 → 防止你执行破坏性命令 │
│ ... + 更多专家角色 │
└─────────────────────────────────────────────────────┘
所有角色都是免费的,MIT 许可,Markdown 格式,开箱即用。
谁是 Garry Tan?
如果你在科技圈混过,一定听过这个名字:
| 身份 | 说明 |
|---|---|
| 🎯 YC CEO | Y Combinator 总裁兼 CEO,投资过 Coinbase、Instacart、Rippling(估值千亿美元) |
| 💻 工程师 | Palantir 早期员工,设计了 Palantir 的 logo |
| 🚀 创业者 | 联合创办 Posterous(后来卖给了 Twitter) |
| 🎨 设计师 | 产品设计师出身,打造了 Bookface(YC 内部社交网络) |
2013 年,他用 772 个 GitHub contributions 构建了 Bookface。
2026 年,他用 1,237 个 contributions(还在增加)向全世界展示了什么是 AI 原生开发。
关键在于——他同时还在做 YC CEO 的全部工作。这不是全职编码的产出。
60 天 60 万行代码:数据说话
Garry 在 gstack 的 README 中披露的数据:
过去 60 天:
- 600,000+ 行生产代码
- 35% 是测试代码
- 日均 10,000-20,000 行可用代码
过去 7 天(/retro 统计):
- 140,751 行新增
- 362 个 commits
- ~115k 净 LOC
一个人,日均万行代码。 这个数字放在 2024 年以前是不可想象的。
Garry 的原话:
"We are at the dawn of something real — one person shipping at a scale that used to require a team of twenty."
我们正处在一个新时代的黎明——一个人以过去需要 20 人团队的规模交付代码。
15 个专家角色详解
gstack 的核心是 15 个各有专长的 AI 专家角色,分为四大类:
🎯 产品与规划类
/office-hours - YC Office Hours
角色:YC 导师 职责:在你写第一行代码之前,重新定义问题
你说:"我想做一个每日简报应用"
它听完后说:
"等等,你描述的其实是一个'个人首席参谋 AI',
不是'每日简报应用'。
让我挑战你的 4 个前提...
让我生成 3 种实现方案...
让我写一份设计文档..."
核心能力:
- 6 个强制性问题重构你的产品思路
- 挑战你的前提假设
- 生成多种实现方案
- 输出设计文档自动流入下游环节
/plan-ceo-review - CEO / 创始人评审
角色:挑剔的 CEO 职责:找到藏在需求里的 10 星级产品
提供 4 种评审模式:
- Expansion(扩展)—— 这个功能可以更大
- Selective Expansion(选择性扩展)—— 只扩展值得的部分
- Hold Scope(保持范围)—— 刚好,别加了
- Reduction(缩减)—— 砍掉,MVP 不需要
/plan-eng-review - 工程经理评审
角色:严谨的工程经理 职责:锁定架构、数据流、边界条件
输出内容:
- ASCII 数据流图
- 状态机图
- 错误路径分析
- 测试矩阵
- 失败模式分析
- 安全关注点
/plan-design-review - 高级设计师评审
角色:挑剔的设计师 职责:每个设计维度 0-10 分评分
特点:
- 解释什么是 10 分的标准
- 自动编辑计划以达到 10 分
- AI Slop 检测(自动识别 AI 生成的"塑料感"设计)
- 每个设计选择只问你一次
/design-consultation - 设计伙伴
角色:设计合作伙伴 职责:从零构建完整设计系统
能力:
- 研究竞品
- 提出安全选择和创意风险方案
- 生成真实产品 mockup
- 编写 DESIGN.md
🔍 质量与测试类
/review - 员工工程师审查
角色:资深工程师 职责:发现那些通过了 CI 但在生产环境会爆炸的 bug
特点:
- 自动修复明显问题
- 标记完整性缺口
- 支持跨模型分析(配合
/codex使用)
/investigate - 调试专家
角色:系统调试员 职责:系统性根因分析
铁律:没有调查就没有修复。
流程:
- 追踪数据流
- 测试假设
- 3 次失败后停止,不再盲目尝试
/qa - QA 负责人
角色:QA 负责人 职责:测试应用、发现 bug、修复、验证
核心能力:
- 真实浏览器点击测试(不是模拟!)
- 原子化 commit 修复
- 为每个修复生成回归测试
- 自动验证修复结果
Garry 说:"/qa was a massive unlock. It let me go from 6 to 12 parallel workers."
/qa 是一个巨大的突破,它让我从 6 个并行 worker 增加到 12 个。
/qa-only - QA 报告员
与 /qa 相同的测试方法,但只报告不修复——适合你想自己动手修的情况。
🚀 发布与文档类
/ship - 发布工程师
角色:发布工程师 职责:一键发布
流程:
- 同步 main 分支
- 运行测试
- 审计覆盖率
- 推送
- 创建 PR
特点:
- 如果没有测试框架,自动 bootstrap
- 每次运行产生覆盖率审计
- 自动调用
/document-release
/document-release - 技术作家
角色:文档工程师 职责:更新所有文档以匹配刚发布的内容
自动更新:
- README
- ARCHITECTURE
- CONTRIBUTING
- CLAUDE.md
- TODOS
Garry 说:"/document-release is the engineer you never had."
/document-release 是你从未拥有过的那个工程师。
📊 反思与工具类
/retro - 工程经理复盘
角色:工程经理 职责:团队感知的每周复盘
输出:
- 每人 breakdown(工作量分布)
- 交付 streak(连续交付天数)
- 测试健康趋势
- 增长机会
/browse - QA 工程师(浏览器)
角色:给 AI 一双眼睛 职责:真实 Chromium 浏览器、真实点击、真实截图
性能:~100ms 每命令
🛡️ 安全与辅助类
| 命令 | 角色 | 职责 |
|---|---|---|
/codex | 第二意见 | 跨模型独立审查(支持 3 种模式:pass/fail、主动挑战、开放咨询) |
/careful | 安全卫士 | 破坏性命令前警告(rm -rf、DROP TABLE、force-push) |
/freeze | 编辑锁定 | 限制文件编辑范围到一个目录 |
/guard | 全面安全 | /careful + /freeze 的组合 |
/unfreeze | 解锁 | 移除 /freeze 的边界限制 |
/gstack-upgrade | 自更新 | 升级到最新版 |
Sprint 流程
gstack 的核心是一套 Sprint 流程,每个 sprint 完成一个完整功能:
Think → Plan → Build → Review → Test → Ship → Reflect
↓ ↓ ↓ ↓ ↓ ↓ ↓
office ceo build review qa ship retro
hours review
实际对话示例
你:我想做一个每日简报应用给团队用
你:/office-hours
Claude: [询问痛点——具体例子,不是假设]
[挑战你的框架]
[生成 3 种实现方案]
[推荐最窄的楔子]
[写设计文档 → 自动流入下游]
你:/plan-ceo-review
[阅读设计文档,挑战范围,运行 10 星评审]
你:/plan-eng-review
[ASCII 数据流图、状态机、错误路径]
[测试矩阵、失败模式、安全关注点]
你:批准计划,退出计划模式
[写入 2,400 行代码,跨越 11 个文件,约 8 分钟]
你:/review
[AUTO-FIXED] 2 个问题
[ASK] 竞态条件 → 你批准修复
你:/qa https://staging.myapp.com
[打开真实浏览器,点击流程,发现并修复 bug]
你:/ship
Tests: 42 → 51 (+9 新增)
PR: github.com/you/app/pull/42
⏱️ 时间估算
| 阶段 | 时间 |
|---|---|
/office-hours | 3-5 分钟 |
/plan-ceo-review | 2-3 分钟 |
/plan-eng-review | 3-5 分钟 |
| Build | 5-10 分钟 |
/review | 2-3 分钟 |
/qa | 5-10 分钟 |
/ship | 2-3 分钟 |
| 总计 | 约 30 分钟 |
一个完整功能,从想法到 PR,30 分钟。
实战:30 分钟完成一个功能
以"添加用户登录功能"为例,走一遍完整流程:
Step 1: /office-hours(3 分钟)
你:我想给用户加登录功能
Claude: 等等,你真正需要的是什么?
- 只是邮箱 + 密码?
- 还是需要 OAuth(Google/GitHub)?
- 是否需要 MFA?
- 用户会话如何管理?
让我写一份认证设计文档...
Step 2: /plan-ceo-review(2 分钟)
[挑战范围]
[建议先用 Magic Link,后期再加密码]
[推荐 Auth0 或 Supabase Auth]
Step 3: /plan-eng-review(4 分钟)
[生成数据流图]
[定义 session schema]
[列出边界情况]
[生成测试计划]
Step 4: Build(8 分钟)
[自动写入 800 行代码]
- 用户模型
- 登录 API
- Session 管理
- 前端表单
Step 5: /review(3 分钟)
[发现密码未哈希] → 自动修复
[发现 CSRF 保护缺失] → 请求你批准修复
Step 6: /qa(7 分钟)
[打开真实浏览器]
[测试登录流程]
[发现移动端布局问题]
[修复并验证]
[生成回归测试]
Step 7: /ship(3 分钟)
[同步 main]
[运行测试:35 → 42]
[推送]
[创建 PR: github.com/you/app/pull/15]
[更新文档]
总计:30 分钟。从想法到可合并的 PR。
并行开发
gstack 最强大的地方在于——你可以同时运行 10-15 个 sprint。
🌳 Git Worktrees 方案
# 主分支
main/
# 并行功能分支(每个独立工作树)
feature-briefing-ui/
feature-calendar-integration/
feature-news-sources/
feature-email-digest/
feature-slack-bot/
...
Garry 的并行策略
每天 10-15 个并行 sprint
每个 sprint 一个功能分支
每个分支一个 Claude Code 会话
早上启动所有会话
下午审查所有 PR
晚上合并
实现方式
- Git Worktrees —— 每个功能独立工作目录
- 多 Claude 会话 —— tmux 或独立终端
- 智能审查路由 —— gstack 自动判断需要什么审查
- Review Readiness Dashboard —— 发布前状态一览
安装与配置
🚀 快速安装
方法 1:全局安装(推荐)
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup
方法 2:项目级安装
git clone https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup --host auto
方法 3:Codex 用户
git clone https://github.com/garrytan/gstack.git ~/.codex/skills/gstack
cd ~/.codex/skills/gstack && ./setup --host codex
📝 配置 CLAUDE.md
添加 gstack 部分到你的 CLAUDE.md:
## gstack
使用 gstack 的 /browse 技能进行所有网页浏览,
不要使用 mcp__claude-in-chrome__* 工具。
可用技能:
/office-hours, /plan-ceo-review, /plan-eng-review,
/plan-design-review, /design-consultation, /review,
/ship, /browse, /qa, /qa-only, /design-review,
/setup-browser-cookies, /retro, /investigate,
/document-release, /codex, /careful, /freeze,
/guard, /unfreeze, /gstack-upgrade
✅ 验证安装
cd .claude/skills/gstack && ./setup
如果技能不工作,运行上面的命令重新构建。
gstack vs 其他方案
| 特性 | gstack | everything-claude-code | BMAD | Superpowers |
|---|---|---|---|---|
| 定位 | 虚拟工程团队 | 性能优化系统 | SDLC 方法论 | 工程超能力 |
| 核心 | 15 个专家角色 | 28 Agents + 116 Skills | PRD 驱动 | TDD 优先 |
| 流程 | Think→Ship→Reflect | Plan→Execute→Review | Spec→Build | Test→Code |
| 特色 | CEO/Designer 评审 | 12 语言生态 | 22+ 平台 | Iron Laws |
| 创始人 | Garry Tan (YC) | Affaan Mustafa | BMAD 社区 | Jesse Vincent |
选择建议
| 场景 | 推荐 |
|---|---|
| 创始人/CEO 亲自开发 | gstack ⭐⭐⭐⭐⭐ |
| 追求极致性能 | everything-claude-code ⭐⭐⭐⭐⭐ |
| 需要完整 SDLC | BMAD ⭐⭐⭐⭐ |
| TDD 实践 | Superpowers ⭐⭐⭐⭐⭐ |
| 新手入门 | gstack ⭐⭐⭐⭐ |
我的真实使用体验
说实话,我第一次装 gstack 的时候,内心是怀疑的——又是 prompt 模板合集吧?
用了一周之后,我的感受是:这玩意儿确实像是请了 20 个大佬给我当助理。
最让我惊艳的三个点:
1. /office-hours 逼我重新思考需求
以前让 AI 写代码,上来就问"用什么技术栈"。gstack 的 /office-hours 先反问你 6 个问题,帮你重新定义问题。很多时候,你以为你要做 A,其实你需要的是 B。
2. /review 真的能发现生产级 bug
不是那种"你的变量名不规范"的审查。它会发现竞态条件、内存泄漏、安全漏洞——那些过了 CI 但上线会炸的问题。
3. /qa 用真实浏览器测试
不是 mock,不是模拟。它真的打开浏览器,点击按钮,填写表单,发现问题。然后自动修复 + 生成回归测试。
适合谁用?
- ✅ 技术创始人/CEO,还想亲自写代码
- ✅ 独立开发者,想一个人干一个团队的活
- ✅ 技术负责人,想给每个 PR 加上严格的审查和 QA
- ✅ Claude Code 新手,结构化角色比空白 prompt 友好得多
核心哲学
Garry 的设计理念值得每个开发者思考:
1. 流程胜过工具
"gstack is a process, not a collection of tools."
gstack 是一套流程,不是一堆工具的集合。
2. 设计是核心
"Design is at the heart. /design-consultation doesn't just pick fonts."
设计是核心。/design-consultation 不只是帮你选字体。
3. QA 是突破
"/qa was a massive unlock."
/qa 是一个巨大的突破。
4. 测试一切
"Test everything. 100% test coverage is the goal."
测试一切。100% 测试覆盖率是目标。
5. 文档自动更新
"/document-release is the engineer you never had."
/document-release 是你从未拥有过的那个工程师。
结语
gstack 不是另一个工具集。它是一个人如何像 20 人团队一样交付的系统。
Garry Tan 用 60 天 60 万行代码证明了这个系统的有效性。
现在,这个系统开源了。
Fork it. Improve it. Make it yours.
参考资料:
本文基于 gstack 官方文档和实战经验编写,最后更新:2026-04-20