我用 gstack 给自己请了 20 个大佬做助理:YC CEO 的 AI 工程系统实战教程

65 阅读12分钟

60 天 60 万行代码,35% 是测试代码。Y Combinator 总裁 Garry Tan 开源了他的 AI 工程系统——gstack。我用了一周,感觉背后站了一个虚拟工程团队。

📖 目录


gstack 是什么?

一句话总结:gstack 把 Claude Code 变成一个你真正管理的虚拟工程团队。

它不是另一个工具集,不是一堆 prompt 模板的合集。gstack 是一套完整的软件工程工厂——由 YC CEO Garry Tan 亲自设计并开源(MIT 协议),包含 15 个专家角色 + 6 个安全工具,全部以 slash 命令的形式在 Claude Code 中运行。

你可以把它理解为:

┌─────────────────────────────────────────────────────┐
│                    gstack 虚拟团队                   │
├─────────────────────────────────────────────────────┤
│  🎯 CEO          → 重新思考产品方向                  │
│  📐 工程经理      → 锁定架构和数据流                  │
│  🎨 设计师       → 捕捉 AI 生成的"塑料感"代码         │
│  🔍 资深审查员    → 发现会在生产环境爆炸的 bug         │
│  ✅ QA 负责人     → 真实浏览器点击测试                │
│  🚀 发布工程师    → 一键发布 PR                      │
│  🛡️ 安全卫士     → 防止你执行破坏性命令               │
│  ... + 更多专家角色                                  │
└─────────────────────────────────────────────────────┘

所有角色都是免费的,MIT 许可,Markdown 格式,开箱即用。


谁是 Garry Tan?

如果你在科技圈混过,一定听过这个名字:

身份说明
🎯 YC CEOY Combinator 总裁兼 CEO,投资过 Coinbase、Instacart、Rippling(估值千亿美元)
💻 工程师Palantir 早期员工,设计了 Palantir 的 logo
🚀 创业者联合创办 Posterous(后来卖给了 Twitter)
🎨 设计师产品设计师出身,打造了 Bookface(YC 内部社交网络)

2013 年,他用 772 个 GitHub contributions 构建了 Bookface。

2026 年,他用 1,237 个 contributions(还在增加)向全世界展示了什么是 AI 原生开发。

关键在于——他同时还在做 YC CEO 的全部工作。这不是全职编码的产出。


60 天 60 万行代码:数据说话

Garry 在 gstack 的 README 中披露的数据:

过去 60 天:
  - 600,000+ 行生产代码
  - 35% 是测试代码
  - 日均 10,000-20,000 行可用代码

过去 7 天(/retro 统计):
  - 140,751 行新增
  - 362 个 commits
  - ~115k 净 LOC

一个人,日均万行代码。 这个数字放在 2024 年以前是不可想象的。

Garry 的原话:

"We are at the dawn of something real — one person shipping at a scale that used to require a team of twenty."

我们正处在一个新时代的黎明——一个人以过去需要 20 人团队的规模交付代码。


15 个专家角色详解

gstack 的核心是 15 个各有专长的 AI 专家角色,分为四大类:

🎯 产品与规划类

/office-hours - YC Office Hours

角色:YC 导师 职责:在你写第一行代码之前,重新定义问题

你说:"我想做一个每日简报应用"

它听完后说:
"等等,你描述的其实是一个'个人首席参谋 AI',
不是'每日简报应用'。

让我挑战你的 4 个前提...
让我生成 3 种实现方案...
让我写一份设计文档..."

核心能力

  • 6 个强制性问题重构你的产品思路
  • 挑战你的前提假设
  • 生成多种实现方案
  • 输出设计文档自动流入下游环节

/plan-ceo-review - CEO / 创始人评审

角色:挑剔的 CEO 职责:找到藏在需求里的 10 星级产品

提供 4 种评审模式:

  • Expansion(扩展)—— 这个功能可以更大
  • Selective Expansion(选择性扩展)—— 只扩展值得的部分
  • Hold Scope(保持范围)—— 刚好,别加了
  • Reduction(缩减)—— 砍掉,MVP 不需要

/plan-eng-review - 工程经理评审

角色:严谨的工程经理 职责:锁定架构、数据流、边界条件

输出内容:

  • ASCII 数据流图
  • 状态机图
  • 错误路径分析
  • 测试矩阵
  • 失败模式分析
  • 安全关注点

/plan-design-review - 高级设计师评审

角色:挑剔的设计师 职责:每个设计维度 0-10 分评分

特点:

  • 解释什么是 10 分的标准
  • 自动编辑计划以达到 10 分
  • AI Slop 检测(自动识别 AI 生成的"塑料感"设计)
  • 每个设计选择只问你一次

/design-consultation - 设计伙伴

角色:设计合作伙伴 职责:从零构建完整设计系统

能力:

  • 研究竞品
  • 提出安全选择和创意风险方案
  • 生成真实产品 mockup
  • 编写 DESIGN.md

🔍 质量与测试类

/review - 员工工程师审查

角色:资深工程师 职责:发现那些通过了 CI 但在生产环境会爆炸的 bug

特点:

  • 自动修复明显问题
  • 标记完整性缺口
  • 支持跨模型分析(配合 /codex 使用)

/investigate - 调试专家

角色:系统调试员 职责:系统性根因分析

铁律:没有调查就没有修复。

流程:

  1. 追踪数据流
  2. 测试假设
  3. 3 次失败后停止,不再盲目尝试

/qa - QA 负责人

角色:QA 负责人 职责:测试应用、发现 bug、修复、验证

核心能力

  • 真实浏览器点击测试(不是模拟!)
  • 原子化 commit 修复
  • 为每个修复生成回归测试
  • 自动验证修复结果

Garry 说:"/qa was a massive unlock. It let me go from 6 to 12 parallel workers."

/qa 是一个巨大的突破,它让我从 6 个并行 worker 增加到 12 个。

/qa-only - QA 报告员

/qa 相同的测试方法,但只报告不修复——适合你想自己动手修的情况。


🚀 发布与文档类

/ship - 发布工程师

角色:发布工程师 职责:一键发布

流程:

  1. 同步 main 分支
  2. 运行测试
  3. 审计覆盖率
  4. 推送
  5. 创建 PR

特点:

  • 如果没有测试框架,自动 bootstrap
  • 每次运行产生覆盖率审计
  • 自动调用 /document-release

/document-release - 技术作家

角色:文档工程师 职责:更新所有文档以匹配刚发布的内容

自动更新:

  • README
  • ARCHITECTURE
  • CONTRIBUTING
  • CLAUDE.md
  • TODOS

Garry 说:"/document-release is the engineer you never had."

/document-release 是你从未拥有过的那个工程师。


📊 反思与工具类

/retro - 工程经理复盘

角色:工程经理 职责:团队感知的每周复盘

输出:

  • 每人 breakdown(工作量分布)
  • 交付 streak(连续交付天数)
  • 测试健康趋势
  • 增长机会

/browse - QA 工程师(浏览器)

角色:给 AI 一双眼睛 职责:真实 Chromium 浏览器、真实点击、真实截图

性能:~100ms 每命令


🛡️ 安全与辅助类

命令角色职责
/codex第二意见跨模型独立审查(支持 3 种模式:pass/fail、主动挑战、开放咨询)
/careful安全卫士破坏性命令前警告(rm -rfDROP TABLE、force-push)
/freeze编辑锁定限制文件编辑范围到一个目录
/guard全面安全/careful + /freeze 的组合
/unfreeze解锁移除 /freeze 的边界限制
/gstack-upgrade自更新升级到最新版

Sprint 流程

gstack 的核心是一套 Sprint 流程,每个 sprint 完成一个完整功能:

ThinkPlanBuildReviewTestShipReflect
  ↓      ↓       ↓       ↓        ↓      ↓       ↓
office  ceo    build   review    qa    ship    retro
hours  review

实际对话示例

你:我想做一个每日简报应用给团队用

你:/office-hours
Claude: [询问痛点——具体例子,不是假设]
        [挑战你的框架]
        [生成 3 种实现方案]
        [推荐最窄的楔子]
        [写设计文档 → 自动流入下游]

你:/plan-ceo-review
[阅读设计文档,挑战范围,运行 10 星评审]

你:/plan-eng-review
[ASCII 数据流图、状态机、错误路径]
[测试矩阵、失败模式、安全关注点]

你:批准计划,退出计划模式
[写入 2,400 行代码,跨越 11 个文件,约 8 分钟]

你:/review
[AUTO-FIXED] 2 个问题
[ASK] 竞态条件 → 你批准修复

你:/qa https://staging.myapp.com
[打开真实浏览器,点击流程,发现并修复 bug]

你:/ship
Tests: 4251 (+9 新增)
PR: github.com/you/app/pull/42

⏱️ 时间估算

阶段时间
/office-hours3-5 分钟
/plan-ceo-review2-3 分钟
/plan-eng-review3-5 分钟
Build5-10 分钟
/review2-3 分钟
/qa5-10 分钟
/ship2-3 分钟
总计约 30 分钟

一个完整功能,从想法到 PR,30 分钟。


实战:30 分钟完成一个功能

以"添加用户登录功能"为例,走一遍完整流程:

Step 1: /office-hours(3 分钟)

你:我想给用户加登录功能

Claude: 等等,你真正需要的是什么?
  - 只是邮箱 + 密码?
  - 还是需要 OAuth(Google/GitHub)?
  - 是否需要 MFA?
  - 用户会话如何管理?

让我写一份认证设计文档...

Step 2: /plan-ceo-review(2 分钟)

[挑战范围]
[建议先用 Magic Link,后期再加密码]
[推荐 Auth0 或 Supabase Auth]

Step 3: /plan-eng-review(4 分钟)

[生成数据流图]
[定义 session schema]
[列出边界情况]
[生成测试计划]

Step 4: Build(8 分钟)

[自动写入 800 行代码]
  - 用户模型
  - 登录 API
  - Session 管理
  - 前端表单

Step 5: /review(3 分钟)

[发现密码未哈希] → 自动修复
[发现 CSRF 保护缺失] → 请求你批准修复

Step 6: /qa(7 分钟)

[打开真实浏览器]
[测试登录流程]
[发现移动端布局问题]
[修复并验证]
[生成回归测试]

Step 7: /ship(3 分钟)

[同步 main]
[运行测试:35 → 42]
[推送]
[创建 PR: github.com/you/app/pull/15]
[更新文档]

总计:30 分钟。从想法到可合并的 PR。


并行开发

gstack 最强大的地方在于——你可以同时运行 10-15 个 sprint

🌳 Git Worktrees 方案

# 主分支
main/

# 并行功能分支(每个独立工作树)
feature-briefing-ui/
feature-calendar-integration/
feature-news-sources/
feature-email-digest/
feature-slack-bot/
...

Garry 的并行策略

每天 10-15 个并行 sprint
每个 sprint 一个功能分支
每个分支一个 Claude Code 会话

早上启动所有会话
下午审查所有 PR
晚上合并

实现方式

  • Git Worktrees —— 每个功能独立工作目录
  • 多 Claude 会话 —— tmux 或独立终端
  • 智能审查路由 —— gstack 自动判断需要什么审查
  • Review Readiness Dashboard —— 发布前状态一览

安装与配置

🚀 快速安装

方法 1:全局安装(推荐)

git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack
cd ~/.claude/skills/gstack && ./setup

方法 2:项目级安装

git clone https://github.com/garrytan/gstack.git ~/gstack
cd ~/gstack && ./setup --host auto

方法 3:Codex 用户

git clone https://github.com/garrytan/gstack.git ~/.codex/skills/gstack
cd ~/.codex/skills/gstack && ./setup --host codex

📝 配置 CLAUDE.md

添加 gstack 部分到你的 CLAUDE.md:

## gstack

使用 gstack 的 /browse 技能进行所有网页浏览,
不要使用 mcp__claude-in-chrome__* 工具。

可用技能:
/office-hours, /plan-ceo-review, /plan-eng-review,
/plan-design-review, /design-consultation, /review,
/ship, /browse, /qa, /qa-only, /design-review,
/setup-browser-cookies, /retro, /investigate,
/document-release, /codex, /careful, /freeze,
/guard, /unfreeze, /gstack-upgrade

✅ 验证安装

cd .claude/skills/gstack && ./setup

如果技能不工作,运行上面的命令重新构建。


gstack vs 其他方案

特性gstackeverything-claude-codeBMADSuperpowers
定位虚拟工程团队性能优化系统SDLC 方法论工程超能力
核心15 个专家角色28 Agents + 116 SkillsPRD 驱动TDD 优先
流程Think→Ship→ReflectPlan→Execute→ReviewSpec→BuildTest→Code
特色CEO/Designer 评审12 语言生态22+ 平台Iron Laws
创始人Garry Tan (YC)Affaan MustafaBMAD 社区Jesse Vincent

选择建议

场景推荐
创始人/CEO 亲自开发gstack ⭐⭐⭐⭐⭐
追求极致性能everything-claude-code ⭐⭐⭐⭐⭐
需要完整 SDLCBMAD ⭐⭐⭐⭐
TDD 实践Superpowers ⭐⭐⭐⭐⭐
新手入门gstack ⭐⭐⭐⭐

我的真实使用体验

说实话,我第一次装 gstack 的时候,内心是怀疑的——又是 prompt 模板合集吧?

用了一周之后,我的感受是:这玩意儿确实像是请了 20 个大佬给我当助理。

最让我惊艳的三个点:

1. /office-hours 逼我重新思考需求

以前让 AI 写代码,上来就问"用什么技术栈"。gstack 的 /office-hours 先反问你 6 个问题,帮你重新定义问题。很多时候,你以为你要做 A,其实你需要的是 B。

2. /review 真的能发现生产级 bug

不是那种"你的变量名不规范"的审查。它会发现竞态条件、内存泄漏、安全漏洞——那些过了 CI 但上线会炸的问题。

3. /qa 用真实浏览器测试

不是 mock,不是模拟。它真的打开浏览器,点击按钮,填写表单,发现问题。然后自动修复 + 生成回归测试

适合谁用?

  • ✅ 技术创始人/CEO,还想亲自写代码
  • ✅ 独立开发者,想一个人干一个团队的活
  • ✅ 技术负责人,想给每个 PR 加上严格的审查和 QA
  • ✅ Claude Code 新手,结构化角色比空白 prompt 友好得多

核心哲学

Garry 的设计理念值得每个开发者思考:

1. 流程胜过工具

"gstack is a process, not a collection of tools."

gstack 是一套流程,不是一堆工具的集合。

2. 设计是核心

"Design is at the heart. /design-consultation doesn't just pick fonts."

设计是核心。/design-consultation 不只是帮你选字体。

3. QA 是突破

"/qa was a massive unlock."

/qa 是一个巨大的突破。

4. 测试一切

"Test everything. 100% test coverage is the goal."

测试一切。100% 测试覆盖率是目标。

5. 文档自动更新

"/document-release is the engineer you never had."

/document-release 是你从未拥有过的那个工程师。


结语

gstack 不是另一个工具集。它是一个人如何像 20 人团队一样交付的系统

Garry Tan 用 60 天 60 万行代码证明了这个系统的有效性。

现在,这个系统开源了。

Fork it. Improve it. Make it yours.


参考资料


本文基于 gstack 官方文档和实战经验编写,最后更新:2026-04-20