gstack の完全な内訳: YC の社長が AI を使用して毎日 10,000 行のコードを書く方法

TL; DR 主要なポイント
- gstack は、YC 社長 Garry Tan 氏によるオープンソースの Claude Code エンジニアリング システムで、製品のアイデア出しからコードリリースまでのスプリントサイクル全体をカバーする 18 のエキスパートロールと 7 つのツールを備えています。
- その核心的なアイデアは、「AI にもっとコードを書かせる」ことではなく、AI エージェントをロールプレイさせることです。CEO は製品の方向性を担当し、エンジニアリングマネージャーはアーキテクチャを確定し、QA は実際のブラウザでテストし、リリースエンジニアはワンクリックでデプロイします。
- Garry Tan 氏は、このシステムを使用して 60 日間で 60 万行のプロダクションコード(うち 35% はテスト)を記述し、YC の CEO を務めながら、毎日 1 万〜2 万行の利用可能なコードを生成したと主張しています。
- すべてのスキルは純粋な Markdown ファイルであり、MIT ライセンスの下でオープンソース化されており、30 秒でインストールでき、Claude Code、Codex、Gemini CLI、Cursor を複数のプラットフォームでサポートしています。
- このプロジェクトは、ローンチから 1 週間以内に 33,000 以上の GitHub スターを獲得し、「これは単なるプロンプトの集まりではないか?」といった激しい議論も巻き起こしました。
一人で、60 日間で、60 万行のコード
2026 年 3 月、YC 社長 Garry Tan 氏は SXSW で Bill Gurley 氏に、会場全体を静まり返らせるような発言をしました。「興奮しすぎて、今は 1 日 4 時間しか寝ていません。サイバーサイコシス(AI 狂信)にかかっていると思います。」1
その 2 日前、彼は gstack と呼ばれるプロジェクトを GitHub でオープンソース化していました。これは単なる普通の開発ツールではなく、過去数ヶ月間にわたる Claude Code を用いたプログラミングのための彼の完全な作業システムでした。彼が提示したデータは驚くべきものでした。過去 60 日間で 60 万行以上のプロダクションコードが書かれ、そのうち 35% はテストでした。過去 7 日間の統計では、140,751 行が追加され、362 コミットがあり、約 115,000 行の純粋なコードが生成されました。これらすべては、彼が YC の CEO としてフルタイムで勤務している間に起こったことです。2
この記事は、AI プログラミングツールを使用している、または使用を検討している開発者や技術系創業者、そして「AI が個人の生産性をどのように変えているか」に興味を持つ起業家やコンテンツクリエーターに適しています。この記事では、gstack のコアアーキテクチャ、ワークフロー設計、インストールと使用方法、そしてその背後にある「AI エージェントのロールプレイング」手法を深く掘り下げていきます。

gstack のコアアーキテクチャ:Claude Code を仮想エンジニアリングチームに変える
gstack の核心的なアイデアは、一言で要約できます。「AI を万能なアシスタントとして扱うのではなく、それぞれが特定の責任を持つ仮想チームに分解する」ことです。
従来の AI プログラミングでは、単一のチャットウィンドウを開き、同じ AI がコードを書き、コードをレビューし、テストし、デプロイします。問題は、同じセッションで書かれたコードが同じセッションでレビューされるため、「自己肯定」のサイクルに陥りやすいことです。Reddit の r/aiagents のユーザーは、これを正確に要約しています。「スラッシュコマンドは、異なるロール間でコンテキストスイッチを強制し、同じセッションで書かれたコードをレビューするおべっかを使うようなスパイラルを断ち切る。」3
gstack のソリューションは、18 のエキスパートロールと 7 つのツールで構成されており、各ロールはスラッシュコマンドに対応しています。
製品と計画レイヤー:
/office-hours: YC パートナーモデル。コードを書く前に、6 つの必須質問を使用して製品の方向性を明確にするのに役立ちます。
/plan-ceo-review: CEO レベルの提案レビュー。拡張、縮小、維持、キュレーションの 4 つのモードを提供します。
/plan-eng-review: エンジニアリングマネージャーがアーキテクチャを確定し、ASCII アーキテクチャ図、テストマトリックス、障害モード分析を出力します。
/plan-design-review: シニアデザイナーが各デザインディメンションを 0 から 10 で評価し、10 がどのようなものかを説明します。
/design-consultation: デザインパートナー。ゼロから完全なデザインシステムを構築します。
開発とレビューレイヤー:
/review: シニアエンジニアの役割。CI を通過するが本番環境で爆発する可能性のあるバグを特に探します。
/investigate: 体系的な根本原因デバッグ。「調査なしに修正なし」という鉄のルールがあります。
/design-review: デザイナー兼プログラマー。レビュー後にアトミックコミットで問題を直接修正します。
/codex: 独立したコードレビューのために OpenAI Codex CLI を呼び出し、クロスモデルのクロスバリデーションを可能にします。
テストとリリースレイヤー:
/qa: QA リード。実際の Chromium ブラウザを開いてすべてのフローをクリックしてテストし、バグを見つけて修正し、回帰テストを生成します。
/qa-only: 純粋なレポートモードの QA。バグを報告するだけで、コードは修正しません。
/ship: リリースエンジニア。メインブランチを同期し、テストを実行し、カバレッジを監査し、コードをプッシュし、PR を開きます。これらすべてを 1 つのコマンドで行います。
/document-release: 技術ドキュメントエンジニア。現在のリリースに関連するすべてのドキュメントを自動的に更新します。
/retro: エンジニアリングマネージャーが週次レビューを主導し、個々の貢献、リリース頻度、テスト健全性のトレンドを出力します。
セキュリティとツールレイヤー:
/careful: 危険なコマンド警告。rm -rf、DROP TABLE、force-pushの実行前に警告を表示します。
/freeze: 編集ロック。ファイル変更の範囲を特定のディレクトリに制限します。
/guard:/careful+/freezeの組み合わせ。最高レベルのセキュリティです。
/browse: エージェントに「目」を与えます。実際の Chromium ブラウザで、コマンドあたり約 100ms の応答時間です。
これらは単なる散らばったツールの集まりではありません。これらの役割は、Think → Plan → Build → Review → Test → Ship → Reflect の順序で連鎖しており、各ステージの出力は自動的に次のステージに供給されます。/office-hours で生成された設計ドキュメントは /plan-ceo-review で読み込まれ、/plan-eng-review で書かれたテスト計画は /qa で実行され、/review で見つかったバグは /ship で修正が検証されます。2

gstack が開発者コミュニティ全体を熱狂させた理由
ローンチから 1 週間以内に、gstack は 33,000 以上の GitHub スターと 4,000 のフォークを獲得し、Product Hunt でトップになり、Garry Tan 氏の元のツイートは 84.9 万回表示され、3,700 のいいねと 5,500 の保存を記録しました。TechCrunch や MarkTechPost などの主要なテクノロジーメディアもこれを報じました。1 4
しかし、論争も同様に激しいものでした。YouTuber の Mo Bitar 氏は、「AI は CEO を妄想的にしている」というタイトルの動画を作成し、gstack は本質的に「テキストファイル内のプロンプトの集まり」であると指摘しました。Free Agency の創設者 Sherveen Mashayekhi 氏は Product Hunt で、「あなたが YC の CEO でなければ、こんなものは Product Hunt には載らないだろう」と率直に述べました。1
興味深いことに、TechCrunch の記者が ChatGPT、Gemini、Claude に gstack を評価させたところ、3 つすべてが肯定的なレビューをしました。ChatGPT は、「AI プログラミングが最も効果的に機能するのは、単に『この機能の作成を手伝ってほしい』と言うのではなく、エンジニアリング組織構造をシミュレートするときであるという真の洞察がある」と述べました。Gemini はこれを「洗練されている」と呼び、gstack は「プログラミングを容易にするのではなく、プログラミングをより正確にする」と信じていました。1
この議論の本質は、実際には技術的なものではありません。33,000 のスターと「一連の Markdown ファイル」という事実は、同時に真実であり得ます。本当の相違点は、「よく書かれた Markdown ファイル」が再現可能なエンジニアリング手法に変わるとき、これがイノベーションなのか、それとも単なるパッケージングなのかという点にあります。
ゼロから:gstack のインストールと実践的なワークフロー
30 秒でインストール
gstack のインストールは非常に簡単です。Claude Code ターミナルを開き、次のコマンドを貼り付けます。
``bash
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
``
インストール後、プロジェクトの CLAUDE.md ファイルに gstack の設定ブロックを追加し、利用可能なスキルをリストします。プロセス全体は 30 秒もかかりません。Codex や SKILL.md 標準をサポートする他のエージェントも使用している場合、セットアップスクリプトは自動的にそれらを検出し、対応するディレクトリにインストールします。
前提条件: Claude Code、Git、および Bun v1.0+ がインストールされている必要があります。
完全な実践的ワークフロー
カレンダーブリーフアプリを作成したいとします。典型的な gstack ワークフローは次のとおりです。
- `/office-hours` に入り、アイデアを説明します。 gstack はすぐにコードを書き始めるのではなく、YC パートナーのように質問してきます。ユーザーは誰ですか?どのような具体的な問題点がありますか?既存のソリューションはどこが不十分ですか?「あなたはカレンダーブリーフアプリについて話していますが、実際に構築しているのはパーソナルチーフオブスタッフ AI です」と教えてくれるかもしれません。
- `/plan-ceo-review` を実行します。 前のステップで生成された設計ドキュメントを読み込み、CEO の視点からスコープと優先順位に異議を唱え、10 のレビューディメンションを実行します。
- `/plan-eng-review` を実行します。 技術アーキテクチャを確定し、データフロー図、ステートマシン、エラーパス、テストマトリックスを出力します。
- 計画を承認し、コーディングを開始します。 Claude は約 8 分で 11 ファイルにわたる 2,400 行のコードを記述します。
- `/review` を実行します。 2 つの明白な問題を自動的に修正し、1 つの競合状態を確認のためにフラグ付けします。
- `/qa https://staging.myapp.com` を実行します。 実際のブラウザを開き、すべてのフローをクリックしてテストし、バグを見つけて修正し、回帰テストを生成します。
- `/ship` を実行します。 テストは 42 から 51 に増加し(+9 の新しいテスト)、PR が自動的に作成されます。
アイデアからデプロイまで、8 つのコマンド。これはコパイロットではなく、チームです。
並列処理こそが真のキラー機能
1 回のスプリントは約 30 分かかります。しかし、真にゲームを変えるのは、10〜15 のスプリントを同時に実行できることです。異なる機能、異なるブランチ、異なるエージェントがすべて並行して動作します。Garry Tan 氏は Conductor を使用して、複数の Claude Code セッションをそれぞれ独立したワークスペースでオーケストレーションしています。これが、彼が毎日 10,000 行以上のプロダクションコードを生成する秘密です。
構造化されたスプリントプロセスは、並列処理機能の前提条件です。プロセスがなければ、10 人のエージェントは 10 の混乱の原因となります。Think → Plan → Build → Review → Test → Ship のワークフローがあれば、各エージェントはいつ何をすべきかを知り、いつ停止すべきかを知っています。あなたは CEO がチームを管理するように彼らを管理します。つまり、主要な決定に集中し、残りは彼らに任せるのです。2

一般的なトラブルシューティング
- スキルが表示されない場合:
cd ~/.claude/skills/gstack && ./setupを実行します。
/browseが失敗した場合:cd ~/.claude/skills/gstack && bun install && bun run buildを実行します。
- 古いバージョン:
/gstack-upgradeを実行するか、~/.gstack/config.yamlでauto_upgrade: trueを設定します。
AI エージェントのロールプレイング:gstack の背後にある方法論
gstack の最も価値のある部分は、25 のスラッシュコマンドではなく、その背後にある考え方かもしれません。このプロジェクトには、Garry Tan 氏のエンジニアリング哲学を文書化した ETHOS.md ファイルが含まれています。いくつかの核心的な概念を分解する価値があります。
「湖を沸騰させる」: 物事をただ繕うのではなく、問題を徹底的に解決します。バグを見つけたら、その 1 つだけを修正するのではなく、「なぜこの種のバグが発生するのか」を問い、アーキテクチャレベルで問題のクラス全体を排除します。
「構築する前に検索する」: コードを書く前に、既存のソリューションを検索します。この概念は、/investigate の「鉄のルール」に直接反映されています。調査なしに修正なし。3 回連続で修正が失敗した場合は、停止して再調査する必要があります。
「黄金時代」: Garry Tan 氏は、私たちは AI プログラミングの黄金時代にいると信じています。モデルは毎週強力になっており、今 AI と協力することを学ぶ人々は、大きな先行者利益を得るでしょう。
この方法論の核心的な洞察は、AI の能力の限界はモデル自体にあるのではなく、あなたがそれに与える役割定義とプロセス制約にあるということです。役割の境界がない AI エージェントは、明確な責任がないチームのようなものです。すべてができるように見えますが、実際には何も上手にできません。
この概念はプログラミングを超えて広がっています。コンテンツ作成や知識管理のシナリオでは、YouMind のスキルエコシステムも同様の方法論を採用しています。YouMind では、特定のタスクを処理するために特化したスキルを作成できます。例えば、調査と情報収集のためのスキル、記事作成のためのスキル、SEO 最適化のためのスキルなどです。各スキルには、gstack の /review や /qa がそれぞれ独自の責任を持つように、明確な役割定義と出力仕様があります。YouMind の Skill Marketplace も、ユーザーがスキルを作成・共有することをサポートしており、gstack のオープンソースコミュニティと同様の協力的なエコシステムを形成しています。もちろん、YouMind はコード開発ではなく、学習、研究、作成のシナリオに焦点を当てており、両者はそれぞれの分野で互いに補完し合っています。
FAQ
Q: gstack は無料ですか?すべての機能を使用するために料金を支払う必要がありますか?
A: gstack は完全に無料で、MIT オープンソースライセンスの下で提供されており、有料版や待機リストはありません。18 のエキスパートロールと 7 つのツールがすべて含まれています。Claude Code のサブスクリプション(Anthropic が提供)は必要ですが、gstack 自体は無料です。インストールには git clone コマンド 1 つだけで、30 秒かかります。
Q: gstack は Claude Code でしか使えませんか?他の AI プログラミングツールはサポートしていますか?
A: gstack は元々 Claude Code 向けに設計されましたが、現在は複数の AI エージェントをサポートしています。SKILL.md 標準を通じて、Codex、Gemini CLI、Cursor と互換性があります。インストールスクリプトは、環境を自動的に検出し、対応するエージェントを設定します。ただし、一部のフックベースのセキュリティ機能(/careful、/freeze など)は、Claude 以外のプラットフォームではテキストプロンプトモードに機能が低下します。
Q: 「60 日間で 60 万行のコード」は本当ですか?このデータは信頼できますか?
A: Garry Tan 氏は、GitHub で彼の貢献グラフを公開しており、2026 年には 1,237 コミットがありました。また、過去 7 日間の /retro 統計も公開しており、140,751 行が追加され、362 コミットがありました。このデータには AI が生成したコードと 35% のテストコードが含まれており、すべてが手書きではないことに注意することが重要です。批評家は、コードの行数が品質とイコールではないと主張していますが、これは妥当な疑問です。しかし、Garry Tan 氏の見解は、構造化されたレビューとテストプロセスがあれば、AI が生成したコードの品質は制御可能であるというものです。
Q: 私は開発者ではありませんが、gstack は私にとってどのような価値がありますか?
A: gstack の最大のインスピレーションは、特定のスラッシュコマンドではなく、「AI エージェントのロールプレイング」という方法論にあります。コンテンツクリエーター、研究者、プロジェクトマネージャーのいずれであっても、このアプローチから学ぶことができます。つまり、1 つの AI にすべてを任せるのではなく、異なるタスクに対して異なる役割、プロセス、品質基準を定義するということです。この概念は、AI とのコラボレーションを必要とするあらゆるシナリオに適用できます。
Q: gstack と通常の Claude Code プロンプトの根本的な違いは何ですか?
A: 違いは体系性にあります。通常のプロンプトは単発の指示ですが、gstack は連鎖的なワークフローです。各スキルの出力は自動的に次のスキルの入力となり、Think → Plan → Build → Review → Test → Ship → Reflect という完全な閉ループを形成します。さらに、gstack には、デバッグ中に AI が誤って無関係なコードを修正するのを防ぐための安全ガードレール(/careful、/freeze、/guard)が組み込まれています。この「プロセスガバナンス」は、単一のプロンプトでは達成できません。
まとめ
gstack の価値は Markdown ファイル自体にあるのではなく、それが検証するパラダイムにあります。AI プログラミングの未来は、「より賢いコパイロット」ではなく、「より良いチーム管理」にあるということです。AI を漠然とした万能アシスタントから、特定の責任を持つエキスパートロールに分解し、構造化されたプロセスでそれらを接続することで、個人の生産性は質的に変化する可能性があります。
覚えておくべき 3 つの核心的なポイントがあります。第一に、ロールプレイングは汎化よりも効果的です。AI に明確な責任の境界を与えることは、広範なプロンプトを与えるよりもはるかに効果的です。第二に、プロセスは並列処理の前提条件です。Think → Plan → Build → Review → Test → Ship の構造がなければ、並行して実行される複数のエージェントは混乱を生むだけです。第三に、Markdown はコードです。LLM 時代において、よく書かれた Markdown ファイルは実行可能なエンジニアリング手法であり、この認識の変化は開発者ツールエコシステム全体を再構築しています。
モデルは毎週強力になっています。今 AI と協力することを学ぶ人々は、来るべき競争において大きな優位性を持つでしょう。開発者、クリエーター、起業家のいずれであっても、今日から始めることを検討してください。gstack でプログラミングワークフローを変革し、「AI エージェントのロールプレイング」方法論を自身のシナリオに適用してください。AI をロールプレイさせ、漠然としたアシスタントから正確なチームに変えましょう。
参考文献
[1] Why Garry Tan's Claude Code setup has gotten so much love—and hate
[3] Reddit user's in-depth review of gstack
[5] Reddit user adapts gstack for C++ development