gstack 全面解析:YC 总裁如何利用 AI 每天编写 10,000 行代码

TL; DR 关键要点
- gstack 是 YC 总裁 Garry Tan 开发的开源 Claude Code 工程系统,包含 18 种专家角色和 7 种工具,涵盖从产品构思到代码发布的整个冲刺周期。
- 核心理念不是“让 AI 写更多代码”,而是让 AI Agents 扮演不同角色:CEO 负责产品方向,工程经理锁定架构,QA 用真实浏览器测试,发布工程师一键部署。
- Garry Tan 声称,在使用该系统 60 天内,他编写了 60 万行生产代码(其中 35% 是测试),每天产出 1 万到 2 万行可用代码,同时还担任 YC CEO。
- 所有技能都是纯 Markdown 文件,采用 MIT 许可证开源,30 秒即可安装,支持 Claude Code、Codex、Gemini CLI 和 Cursor 等多个平台。
- 该项目在发布一周内获得了超过 33,000 个 GitHub 星标,也引发了“这不就是一堆提示词吗?”等激烈争论。
一个人,60 天,60 万行代码
2026 年 3 月,YC 总裁 Garry Tan 在西南偏南(SXSW)对 Bill Gurley 说了一句话,让全场鸦雀无声:“我现在每天只睡四个小时,因为我太兴奋了。我觉得我得了赛博精神病(AI 狂热症)。” 1
两天前,他在 GitHub 上开源了一个名为 gstack 的项目。这不仅仅是一个普通的开发工具,而是他过去几个月使用 Claude Code 编程的完整工作系统。他展示的数据令人震惊:过去 60 天内编写了超过 60 万行生产代码,其中 35% 是测试;最近 7 天的数据显示,新增了 140,751 行代码,362 次提交,净代码量约为 115,000 行。所有这些都发生在他全职担任 YC CEO 期间。 2
本文适合正在使用或考虑使用 AI 编程工具的开发者和技术创始人,以及对“AI 如何改变个人生产力”感兴趣的创业者和内容创作者。本文将深入剖析 gstack 的核心架构、工作流设计、安装使用方法,以及其背后的“AI Agent 角色扮演”方法论。

gstack 的核心架构:将 Claude Code 变成一个虚拟工程团队
gstack 的核心思想可以用一句话概括:不要将 AI 视为一个万能助手,而是将其拆解成一个虚拟团队,每个成员各司其职。
传统的 AI 编程是打开一个聊天窗口,同一个 AI 既写代码、又审阅代码、又测试、又部署。问题在于,在同一个会话中编写的代码,又由同一个会话审阅,很容易陷入“自我肯定”的循环。Reddit r/aiagents 上的一个用户精准总结道:“斜杠命令强制在不同角色之间切换上下文,打破了在同一会话中编写和审阅的阿谀奉承式螺旋。” 3
gstack 的解决方案是 18 种专家角色 + 7 种工具,每个角色对应一个斜杠命令:
产品和规划层:
/office-hours:YC 合伙人模型,使用 6 个强制性问题,帮助你在编写代码前明确产品方向。
/plan-ceo-review:CEO 级别的提案审阅,提供扩展、收缩、维护和策划四种模式。
/plan-eng-review:工程经理锁定架构,输出 ASCII 架构图、测试矩阵和故障模式分析。
/plan-design-review:高级设计师对每个设计维度从 0 到 10 进行评分,并解释 10 分是什么样子。
/design-consultation:设计合伙人,从零开始构建完整的UI设计系统。
开发和审阅层:
/review:高级工程师角色,专门寻找通过 CI 但会在生产环境中爆炸的 bug。
/investigate:系统性地进行根本原因调试,铁律是:“不调查,不修复。”
/design-review:设计师和程序员,审阅后直接通过原子提交修复问题。
/codex:调用 OpenAI Codex CLI 进行独立代码审阅,实现跨模型交叉验证。
测试和发布层:
/qa:QA 负责人,打开真实的 Chromium 浏览器,点击并测试所有流程,发现并修复 bug,并生成回归测试。
/qa-only:纯报告模式 QA,只报告 bug,不修改代码。
/ship:发布工程师,同步主分支,运行测试,审计覆盖率,推送代码,打开 PR——所有这些都通过一个命令完成。
/document-release:技术文档工程师,自动更新与当前发布相关的所有文档。
/retro:工程经理主持每周回顾,输出个人贡献、发布节奏和测试健康趋势。
安全和工具层:
/careful:危险命令警告,在执行rm -rf、DROP TABLE、force-push之前弹出警告。
/freeze:编辑锁定,将文件修改范围限制在指定目录。
/guard:/careful+/freeze的组合,最高安全级别。
/browse:赋予 Agent “眼睛”,一个真实的 Chromium 浏览器,每个命令大约 100 毫秒响应。
这些并非一堆散乱的工具。这些角色按照思考 → 规划 → 构建 → 审阅 → 测试 → 发布 → 反思的顺序串联起来,每个阶段的输出都会自动馈送到下一个阶段。/office-hours 生成的设计文档由 /plan-ceo-review 阅读;/plan-eng-review 编写的测试计划由 /qa 执行;/review 发现的 bug 由 /ship 验证是否已修复。 2

gstack 为何点燃了整个开发者社区
gstack 在发布一周内获得了超过 33,000 个 GitHub 星标和 4,000 个分支,登顶 Product Hunt,Garry Tan 的原始推文获得了 84.9 万次浏览、3,700 个赞和 5,500 次保存。TechCrunch 和 MarkTechPost 等主流科技媒体也对此进行了报道。 1 4
但争议也同样激烈。YouTuber Mo Bitar 制作了一段名为“AI 正在让 CEO 产生妄想”的视频,指出 gstack 本质上就是“一堆文本文件中的提示词”。Free Agency 创始人 Sherveen Mashayekhi 在 Product Hunt 上直言不讳:“如果你不是 YC 的 CEO,这东西永远不会登上 Product Hunt。” 1
有趣的是,当 TechCrunch 记者请 ChatGPT、Gemini 和 Claude 评估 gstack 时,三者都给出了积极评价。ChatGPT 说:“真正的洞察是,当您模拟一个工程组织结构时,AI 编程效果最佳,而不是简单地说‘帮我编写这个功能’。” Gemini 称其“复杂精妙”,认为 gstack“并没有让编程变得更容易,而是让编程变得更正确。” 1
这场争论的本质并非技术问题。33,000 个星标和“一堆 Markdown 文件”这两个事实可以同时成立。真正的分歧在于:当 AI 将“精心编写的 Markdown 文件”转化为可复制的工程方法论时,这究竟是创新还是仅仅是包装?
从零开始:gstack 安装与实战工作流
30 秒安装
gstack 的安装极其简单。打开 Claude Code 终端,粘贴以下命令:
``bash
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
``
安装完成后,将 gstack 配置块添加到项目的 CLAUDE.md 文件中,列出可用的技能。整个过程不到 30 秒。如果你还使用 Codex 或其他支持 SKILL.md 标准的 Agents,安装脚本会自动检测并将其安装到相应的目录中。
先决条件:你需要安装 Claude Code、Git 和 Bun v1.0+。
一个完整的实战工作流
假设你想创建一个日历摘要应用。以下是 gstack 的典型工作流:
- 进入
/office-hours并描述你的想法。 gstack 不会立即开始编写代码,而是会像 YC 合伙人一样审问你:你的用户是谁?他们有什么具体的痛点?现有解决方案的不足之处在哪里?它可能会告诉你:“你谈论的是一个日历摘要应用,但你真正构建的是一个个人幕僚 AI。”
- 运行
/plan-ceo-review。 从 CEO 的角度阅读上一步生成的设计文档,挑战你的范围和优先级,并进行 10 个维度的审阅。
- 运行
/plan-eng-review。 锁定技术架构,输出数据流图、状态机、错误路径和测试矩阵。
- 批准计划,开始编码。 Claude 在大约 8 分钟内编写了 11 个文件中的 2,400 行代码。
- 运行
/review。 自动修复 2 个明显问题,标记 1 个竞态条件供你确认。
- 运行
/qa https://staging.myapp.com。 打开真实浏览器,点击并测试所有流程,发现并修复一个 bug,并生成一个回归测试。
- 运行
/ship。 测试从 42 个增加到 51 个(新增 9 个测试),PR 自动创建。
八个命令,从想法到部署。这不是一个副驾驶;这是一个团队。
并行性才是真正的杀手级功能
一个冲刺大约需要 30 分钟。但真正改变游戏规则的是,你可以同时运行 10 到 15 个冲刺。不同的功能,不同的分支,不同的 Agents,全部并行运行。Garry Tan 使用 Conductor 来协调多个 Claude Code 会话,每个会话都在独立的 Workspace 中运行。这就是他每天产出 10,000+ 行生产代码的秘密。
结构化的冲刺流程是并行能力的前提。没有流程,十个 Agents 就是十个混乱的源头。有了思考 → 规划 → 构建 → 审阅 → 测试 → 发布的工作流,每个 Agent 都知道它需要做什么以及何时停止。你像 CEO 管理团队一样管理它们:专注于关键决策,让它们自己运行其余部分。 2

常见故障排除
- 技能未显示? 运行
cd ~/.claude/skills/gstack && ./setup
/browse失败? 运行cd ~/.claude/skills/gstack && bun install && bun run build
- 版本过旧? 运行
/gstack-upgrade,或在~/.gstack/config.yaml中设置auto_upgrade: true
AI Agent 角色扮演:gstack 背后的方法论
gstack 最有价值的部分可能不是 25 个斜杠命令,而是其背后的思维模式。该项目包含一个 ETHOS.md 文件,记录了 Garry Tan 的工程哲学。有几个核心概念值得解构:
“煮沸湖泊”: 不要仅仅修修补补;要彻底解决问题。当你发现一个 bug 时,不要只修复那一个;相反,要问“为什么会出现这种类型的 bug”,然后在架构层面消除整个问题类别。
“先搜索再构建”: 在编写任何代码之前,先搜索现有解决方案。这个概念直接体现在 /investigate 的“铁律”中:不调查,不修复;如果连续三次修复失败,你必须停止并重新调查。
“黄金时代”: Garry Tan 认为我们正处于 AI 编程的黄金时代。模型每周都在变得更强大,现在学会与 AI 协作的人将获得巨大的先发优势。
这种方法论的核心洞察是,AI 能力的边界不在于模型本身,而在于你赋予它的角色定义和流程约束。一个没有角色边界的 AI Agent 就像一个没有明确职责的团队;它似乎无所不能,但实际上却一事无成。
这个概念正在超越编程领域。在内容创作和知识管理场景中,YouMind 的技能生态系统也采用了类似的方法。你可以在 YouMind 中创建专门的技能来处理特定任务:一个技能用于研究和信息收集,另一个用于文章撰写,第三个用于 SEO 优化。每个技能都有明确的角色定义和输出规范,就像 gstack 中的 /review 和 /qa 各司其职一样。YouMind 的 技能市场 也支持用户创建和分享技能,形成了一个类似于 gstack 开源社区的协作生态系统。当然,YouMind 专注于学习、研究和创作场景,而非代码开发;两者在各自领域相得益彰。
常见问题
问:gstack 免费吗?我需要付费才能使用所有功能吗?
答:gstack 完全免费,采用 MIT 开源许可证,没有付费版本,也没有等待列表。所有 18 种专家角色和 7 种工具都包含在内。你需要一个 Claude Code 订阅(由 Anthropic 提供),但 gstack 本身是免费的。安装只需一个 git clone 命令,耗时 30 秒。
问:gstack 只能与 Claude Code 一起使用吗?它支持其他 AI 编程工具吗?
答:gstack 最初是为 Claude Code 设计的,但现在支持多个 AI Agents。通过 SKILL.md 标准,它兼容 Codex、Gemini CLI 和 Cursor。安装脚本会自动检测你的环境并配置相应的 Agent。但是,一些基于 Hook 的安全功能(如 /careful、/freeze)在非 Claude 平台上会降级为文本提示模式。
问:“60 天内 60 万行代码”是真的吗?这个数据可信吗?
答:Garry Tan 已在 GitHub 上公开分享了他的贡献图,2026 年有 1,237 次提交。他还公开分享了最近 7 天的 /retro 统计数据:新增 140,751 行代码,362 次提交。需要注意的是,这些数据包括 AI 生成的代码和 35% 的测试代码,并非全部手写。批评者认为代码行数不等于质量,这是一个合理的问题。但 Garry Tan 的观点是,通过结构化的审阅和测试流程,AI 生成代码的质量是可控的。
问:我不是开发者,gstack 对我有什么价值?
答:gstack 最大的启发不在于具体的斜杠命令,而在于“AI Agent 角色扮演”的方法论。无论你是内容创作者、研究员还是项目经理,都可以从这种方法中学习:不要让一个 AI 做所有事情,而是为不同的任务定义不同的角色、流程和质量标准。这个概念适用于任何需要 AI 协作的场景。
问:gstack 与普通的 Claude Code 提示词有什么根本区别?
答:区别在于系统性。普通提示词是一次性指令,而 gstack 是一个链式工作流。每个技能的输出都会自动成为下一个技能的输入,形成一个完整的思考 → 规划 → 构建 → 审阅 → 测试 → 发布 → 反思的闭环。此外,gstack 内置了安全防护措施(/careful、/freeze、/guard),以防止 AI 在调试过程中意外修改不相关的代码。这种“流程治理”是单一提示词无法实现的。
总结
gstack 的价值不在于 Markdown 文件本身,而在于它验证了一种范式:AI 编程的未来不是“更智能的副驾驶”,而是“更好的团队管理”。当你将 AI 从一个模糊的、万能的助手,拆解成具有特定职责的专家角色,并通过结构化的流程将它们连接起来时,个人的生产力可以发生质的飞跃。
有三个核心要点值得铭记。首先,角色扮演比泛化更有效:赋予 AI 清晰的职责边界,远比给它一个宽泛的提示词更有效。其次,流程是并行的前提:没有思考 → 规划 → 构建 → 审阅 → 测试 → 发布 的结构,多个 Agents 并行运行只会制造混乱。第三,Markdown 即代码:在 LLM 时代,精心编写的 Markdown 文件就是可执行的工程方法论,这种认知转变正在重塑整个开发者工具生态系统。
模型每周都在变得更强大。现在学会与 AI 协作的人,将在即将到来的竞争中拥有巨大优势。无论你是开发者、创作者还是创业者,不妨从今天开始:用 gstack 改造你的编程工作流,并将“AI Agent 角色扮演”方法论应用到你自己的场景中。扮演你的 AI,让它从一个模糊的助手变成一个精准的团队。
参考文献
[1] Why Garry Tan's Claude Code setup has gotten so much love—and hate
[3] Reddit user's in-depth review of gstack
[5] Reddit user adapts gstack for C++ development