gstack 완벽 분석: YC 사장이 AI를 활용해 매일 10,000줄의 코드를 작성하는 방법

TL; DR 핵심 요약
- gstack은 YC 사장 Garry Tan이 개발한 오픈 소스 Claude Code 엔지니어링 시스템으로, 제품 아이디어 구상부터 코드 릴리스까지 전체 스프린트 주기를 포괄하는 18개의 전문가 역할과 7개의 도구를 제공합니다.
- 핵심 아이디어는 "AI가 더 많은 코드를 작성하게 하는 것"이 아니라 AI 에이전트를 역할극하는 것입니다. CEO는 제품 방향을 책임지고, 엔지니어링 관리자는 아키텍처를 확정하며, QA는 실제 브라우저로 테스트하고, 릴리스 엔지니어는 한 번의 클릭으로 배포합니다.
- Garry Tan은 이 시스템을 사용하여 60일 만에 60만 줄의 프로덕션 코드(그 중 35%는 테스트)를 작성했으며, 매일 1만~2만 줄의 사용 가능한 코드를 생산했다고 주장합니다. 이 모든 것은 YC CEO로 재직하면서 이루어졌습니다.
- 모든 스킬은 MIT 라이선스 하에 오픈 소스로 제공되는 순수 Markdown 파일이며, 30초 만에 설치할 수 있고, 여러 플랫폼에서 Claude Code, Codex, Gemini CLI, Cursor를 지원합니다.
- 이 프로젝트는 출시 일주일 만에 3만 3천 개 이상의 GitHub 스타를 얻었으며, "이게 그냥 프롬프트 묶음 아니야?"와 같은 격렬한 논쟁을 불러일으키기도 했습니다.
한 사람, 60일, 60만 줄의 코드
2026년 3월, YC 사장 Garry Tan은 SXSW에서 Bill Gurley에게 방 전체를 침묵시킨 말을 했습니다. "너무 신나서 하루에 4시간밖에 못 자요. 사이버 정신병(AI 광신)에 걸린 것 같아요." 1
이틀 전, 그는 GitHub에 gstack이라는 프로젝트를 오픈 소스로 공개했습니다. 이것은 단순한 개발 도구가 아니라 지난 몇 달 동안 Claude Code로 프로그래밍한 그의 완전한 작업 시스템이었습니다. 그가 제시한 데이터는 놀라웠습니다. 지난 60일 동안 작성된 60만 줄 이상의 프로덕션 코드 중 35%가 테스트 코드였습니다. 지난 7일간의 통계는 140,751줄 추가, 362개 커밋, 약 115,000줄의 순 코드였습니다. 이 모든 것은 그가 YC CEO로 풀타임으로 재직하면서 일어났습니다. 2
이 글은 AI 프로그래밍 도구를 사용 중이거나 사용을 고려하는 개발자와 기술 창업자, 그리고 "AI가 개인 생산성을 어떻게 변화시키고 있는가"에 관심 있는 기업가 및 콘텐츠 제작자에게 적합합니다. 이 글은 gstack의 핵심 아키텍처, 워크플로 설계, 설치 및 사용 방법, 그리고 그 이면에 있는 "AI 에이전트 역할극" 방법론을 심층적으로 분석할 것입니다.

gstack의 핵심 아키텍처: Claude Code를 가상 엔지니어링 팀으로 전환
gstack의 핵심 아이디어는 한 문장으로 요약할 수 있습니다. AI를 만능 비서로 취급하지 말고, 각각의 특정 책임을 가진 가상 팀으로 나누세요.
기존의 AI 프로그래밍은 단일 채팅 창을 열어 동일한 AI가 코드를 작성하고, 코드를 검토하고, 테스트하고, 배포하는 방식입니다. 문제는 동일한 세션에서 작성된 코드가 동일한 세션에 의해 검토되어 쉽게 "자기 확증"의 순환으로 이어진다는 것입니다. Reddit의 r/aiagents 사용자는 이를 정확하게 요약했습니다. "슬래시 명령은 다른 역할 간의 컨텍스트 전환을 강제하여, 동일한 세션에서 작성하고 검토하는 아첨적인 나선형을 깨뜨립니다." 3
gstack의 해결책은 18개의 전문가 역할 + 7개의 도구이며, 각 역할은 슬래시 명령에 해당합니다.
제품 및 기획 계층:
/office-hours: YC 파트너 모델로, 코드를 작성하기 전에 6가지 필수 질문을 사용하여 제품 방향을 명확히 하는 데 도움을 줍니다.
/plan-ceo-review: CEO 수준의 제안 검토로, 확장, 축소, 유지, 큐레이트의 네 가지 모드를 제공합니다.
/plan-eng-review: 엔지니어링 관리자가 아키텍처를 확정하고, ASCII 아키텍처 다이어그램, 테스트 매트릭스, 실패 모드 분석을 출력합니다.
/plan-design-review: 선임 디자이너가 각 디자인 차원을 0에서 10까지 평가하고, 10점이 어떤 모습인지 설명합니다.
/design-consultation: 디자인 파트너로, 처음부터 완전한 디자인 시스템을 구축합니다.
개발 및 검토 계층:
/review: 선임 엔지니어 역할로, CI를 통과하지만 프로덕션에서 폭발할 수 있는 버그를 특별히 찾습니다.
/investigate: 체계적인 근본 원인 디버깅으로, "조사 없이는 수정도 없다"는 철칙을 따릅니다.
/design-review: 디자이너 및 프로그래머로, 검토 후 원자적 커밋으로 문제를 직접 수정합니다.
/codex: 독립적인 코드 검토를 위해 OpenAI Codex CLI를 호출하여 교차 모델 교차 검증을 가능하게 합니다.
테스트 및 릴리스 계층:
/qa: QA 리더로, 실제 Chromium 브라우저를 열어 모든 흐름을 클릭하고 테스트하며, 버그를 찾아 수정하고, 회귀 테스트를 생성합니다.
/qa-only: 순수 보고 모드 QA로, 버그만 보고하고 코드를 수정하지 않습니다.
/ship: 릴리스 엔지니어로, 메인 브랜치를 동기화하고, 테스트를 실행하고, 커버리지를 감사하고, 코드를 푸시하고, PR을 엽니다. 이 모든 것을 하나의 명령으로 수행합니다.
/document-release: 기술 문서 엔지니어로, 현재 릴리스와 관련된 모든 문서를 자동으로 업데이트합니다.
/retro: 엔지니어링 관리자가 주간 검토를 주도하며, 개별 기여, 릴리스 주기, 테스트 상태 추세를 출력합니다.
보안 및 도구 계층:
/careful: 위험한 명령 경고로,rm -rf,DROP TABLE,force-push를 실행하기 전에 경고를 팝업합니다.
/freeze: 편집 잠금으로, 파일 수정 범위를 지정된 디렉터리로 제한합니다.
/guard:/careful+/freeze의 조합으로, 최고 보안 수준입니다.
/browse: 에이전트에게 "눈"을 제공하는 실제 Chromium 브라우저로, 명령당 약 100ms의 응답 시간을 가집니다.
이것들은 흩어져 있는 도구들의 모음이 아닙니다. 이 역할들은 생각 → 계획 → 구축 → 검토 → 테스트 → 배포 → 반영의 순서로 연결되어 있으며, 각 단계의 출력은 다음 단계로 자동으로 전달됩니다. /office-hours에서 생성된 디자인 문서는 /plan-ceo-review에서 읽히고, /plan-eng-review에서 작성된 테스트 계획은 /qa에서 실행되며, /review에서 발견된 버그는 /ship에서 수정 여부가 확인됩니다. 2

gstack이 전체 개발자 커뮤니티를 열광시킨 이유
출시 일주일 만에 gstack은 3만 3천 개 이상의 GitHub 스타와 4천 개의 포크를 얻었고, Product Hunt에서 1위를 차지했으며, Garry Tan의 원본 트윗은 84만 9천 회 조회, 3,700개 좋아요, 5,500개 저장을 기록했습니다. TechCrunch, MarkTechPost와 같은 주류 기술 미디어에서도 보도되었습니다. 1 4
그러나 논란도 그만큼 거셌습니다. 유튜버 Mo Bitar는 "AI가 CEO들을 망상에 빠뜨리고 있다"는 제목의 영상을 만들며 gstack이 본질적으로 "텍스트 파일에 담긴 프롬프트 묶음"이라고 지적했습니다. Free Agency의 창립자 Sherveen Mashayekhi는 Product Hunt에서 노골적으로 "당신이 YC의 CEO가 아니라면, 이 물건은 Product Hunt에 절대 올라오지 못했을 것"이라고 말했습니다. 1
흥미롭게도 TechCrunch 기자가 ChatGPT, Gemini, Claude에게 gstack을 평가해달라고 요청했을 때, 세 모델 모두 긍정적인 평가를 내렸습니다. ChatGPT는 "진정한 통찰력은 AI 프로그래밍이 단순히 '이 기능을 작성하는 데 도움을 주세요'라고 말하는 것보다 엔지니어링 조직 구조를 시뮬레이션할 때 가장 잘 작동한다는 것입니다."라고 말했습니다. Gemini는 이를 "정교하다"고 부르며, gstack이 "프로그래밍을 더 쉽게 만드는 것이 아니라, 프로그래밍을 더 정확하게 만든다"고 믿었습니다. 1
이 논쟁의 본질은 사실 기술적인 것이 아닙니다. 3만 3천 개의 스타와 "프롬프트 묶음"이라는 사실은 동시에 참일 수 있습니다. 진정한 차이점은 다음과 같습니다. AI가 "잘 작성된 Markdown 파일"을 복제 가능한 엔지니어링 방법론으로 바꿀 때, 이것이 혁신인가 아니면 단순한 포장인가?
처음부터: gstack 설치 및 실제 워크플로
30초 설치
gstack의 설치는 매우 간단합니다. Claude Code 터미널을 열고 다음 명령어를 붙여넣으세요.
``bash
git clone https://github.com/garrytan/gstack.git ~/.claude/skills/gstack && cd ~/.claude/skills/gstack && ./setup
``
설치 후, 프로젝트의 CLAUDE.md 파일에 gstack 구성 블록을 추가하여 사용 가능한 스킬을 나열합니다. 전체 과정은 30초도 걸리지 않습니다. SKILL.md 표준을 지원하는 Codex 또는 다른 에이전트를 사용하는 경우, 설정 스크립트가 자동으로 이를 감지하고 해당 디렉터리에 설치합니다.
전제 조건: Claude Code, Git, Bun v1.0+가 설치되어 있어야 합니다.
완전한 실제 워크플로
캘린더 요약 앱을 만들고 싶다고 가정해 봅시다. 다음은 일반적인 gstack 워크플로입니다.
- `/office-hours`를 입력하고 아이디어를 설명합니다. gstack은 즉시 코드를 작성하지 않고, YC 파트너처럼 질문을 던질 것입니다. 사용자는 누구인가요? 어떤 구체적인 문제점을 가지고 있나요? 기존 솔루션은 어디에서 부족한가요? "캘린더 요약 앱에 대해 이야기하고 있지만, 실제로는 개인 비서 AI를 만들고 있습니다."라고 말할 수도 있습니다.
- `/plan-ceo-review`를 실행합니다. 이전 단계에서 생성된 디자인 문서를 읽고, CEO 관점에서 범위와 우선순위에 이의를 제기하며, 10가지 차원의 검토를 수행합니다.
- `/plan-eng-review`를 실행합니다. 기술 아키텍처를 확정하고, 데이터 흐름 다이어그램, 상태 머신, 오류 경로, 테스트 매트릭스를 출력합니다.
- 계획을 승인하고 코딩을 시작합니다. Claude는 약 8분 만에 11개 파일에 걸쳐 2,400줄의 코드를 작성합니다.
- `/review`를 실행합니다. 2개의 명백한 문제를 자동으로 수정하고, 1개의 경쟁 조건을 확인하도록 플래그를 지정합니다.
- `/qa https://staging.myapp.com`을 실행합니다. 실제 브라우저를 열고, 모든 흐름을 클릭하고 테스트하며, 버그를 찾아 수정하고, 회귀 테스트를 생성합니다.
- `/ship`을 실행합니다. 테스트가 42개에서 51개로 증가하고(새로운 테스트 9개), PR이 자동으로 생성됩니다.
아이디어부터 배포까지 8개의 명령. 이것은 코파일럿이 아니라 팀입니다.
병렬 처리가 진정한 핵심 기능입니다.
단일 스프린트는 약 30분이 걸립니다. 그러나 진정으로 판도를 바꾸는 것은 10~15개의 스프린트를 동시에 실행할 수 있다는 것입니다. 서로 다른 기능, 서로 다른 브랜치, 서로 다른 에이전트가 모두 병렬로 실행됩니다. Garry Tan은 Conductor를 사용하여 여러 Claude Code 세션을 오케스트레이션하며, 각 세션은 독립적인 작업 공간에서 실행됩니다. 이것이 그가 매일 1만 줄 이상의 프로덕션 코드를 생산하는 비결입니다.
구조화된 스프린트 프로세스는 병렬 처리 기능의 전제 조건입니다. 프로세스 없이는 10개의 에이전트가 10개의 혼돈의 원천이 됩니다. 생각 → 계획 → 구축 → 검토 → 테스트 → 배포 워크플로를 통해 각 에이전트는 무엇을 해야 하고 언제 멈춰야 하는지 압니다. 당신은 CEO가 팀을 관리하는 것처럼 그들을 관리합니다. 핵심 결정에 집중하고 나머지는 그들 스스로 실행하게 합니다. 2

일반적인 문제 해결
- 스킬이 표시되지 않나요?
cd ~/.claude/skills/gstack && ./setup을 실행하세요.
/browse가 실패했나요?cd ~/.claude/skills/gstack && bun install && bun run build를 실행하세요.
- 오래된 버전인가요?
/gstack-upgrade를 실행하거나~/.gstack/config.yaml에서auto_upgrade: true로 설정하세요.
AI 에이전트 역할극: gstack의 방법론
gstack의 가장 가치 있는 부분은 25개의 슬래시 명령이 아니라 그 이면에 있는 사고방식일 수 있습니다. 이 프로젝트에는 Garry Tan의 엔지니어링 철학을 문서화한 ETHOS.md 파일이 포함되어 있습니다. 몇 가지 핵심 개념은 다음과 같습니다.
"호수를 끓여라(Boil the Lake)": 단순히 임시방편으로 해결하지 말고, 문제를 철저히 해결하세요. 버그를 발견했을 때, 그 버그 하나만 고치지 말고, "왜 이런 종류의 버그가 발생하는가"를 묻고, 아키텍처 수준에서 문제의 전체 클래스를 제거하세요.
"구축하기 전에 검색하라(Search Before Building)": 코드를 작성하기 전에 기존 솔루션을 검색하세요. 이 개념은 /investigate의 "철칙"에 직접적으로 반영됩니다. 조사 없이는 수정도 없고, 세 번 연속 수정이 실패하면 멈추고 다시 조사해야 합니다.
"황금 시대(Golden Age)": Garry Tan은 우리가 AI 프로그래밍의 황금 시대에 살고 있다고 믿습니다. 모델은 매주 강력해지고 있으며, 지금 AI와 협력하는 방법을 배우는 사람들은 엄청난 선점 이점을 얻을 것입니다.
이 방법론의 핵심 통찰력은 AI 능력의 경계가 모델 자체에 있는 것이 아니라, 당신이 부여하는 역할 정의와 프로세스 제약에 있다는 것입니다. 역할 경계가 없는 AI 에이전트는 명확한 책임이 없는 팀과 같습니다. 모든 것을 할 수 있는 것처럼 보이지만, 실제로는 아무것도 제대로 하지 못합니다.
이 개념은 프로그래밍을 넘어 확장되고 있습니다. 콘텐츠 제작 및 지식 관리 시나리오에서 YouMind의 Skills 생태계는 유사한 방법론을 채택합니다. YouMind에서 특정 작업을 처리하기 위한 전문 Skills를 만들 수 있습니다. 하나는 연구 및 정보 수집용, 다른 하나는 기사 작성용, 세 번째는 SEO 최적화용입니다. 각 Skill은 gstack의 /review 및 /qa가 각각의 책임을 가지는 것처럼 명확한 역할 정의와 출력 사양을 가집니다. YouMind의 Skill Marketplace는 또한 사용자가 Skills를 만들고 공유하는 것을 지원하여 gstack의 오픈 소스 커뮤니티와 유사한 협업 생태계를 형성합니다. 물론 YouMind는 코드 개발이 아닌 학습, 연구 및 생성 시나리오에 중점을 둡니다. 이 둘은 각자의 분야에서 서로를 보완합니다.
FAQ
Q: gstack은 무료인가요? 모든 기능을 사용하려면 비용을 지불해야 하나요?
A: gstack은 MIT 오픈 소스 라이선스 하에 완전히 무료이며, 유료 버전이나 대기 목록이 없습니다. 18개의 전문가 역할과 7개의 도구가 모두 포함되어 있습니다. Claude Code 구독(Anthropic 제공)이 필요하지만, gstack 자체는 무료입니다. 설치는 하나의 git clone 명령만 필요하며 30초가 걸립니다.
Q: gstack은 Claude Code에서만 사용할 수 있나요? 다른 AI 프로그래밍 도구도 지원하나요?
A: gstack은 원래 Claude Code용으로 설계되었지만, 이제 여러 AI 에이전트를 지원합니다. SKILL.md 표준을 통해 Codex, Gemini CLI, Cursor와 호환됩니다. 설치 스크립트가 자동으로 환경을 감지하고 해당 에이전트를 구성합니다. 그러나 일부 훅 기반 보안 기능(예: /careful, /freeze)은 Claude가 아닌 플랫폼에서는 텍스트 프롬프트 모드로 저하됩니다.
Q: "60일 만에 60만 줄의 코드"가 사실인가요? 이 데이터는 신뢰할 수 있나요?
A: Garry Tan은 2026년에 1,237개의 커밋이 있는 GitHub 기여 그래프를 공개적으로 공유했습니다. 그는 또한 지난 7일간의 /retro 통계도 공개적으로 공유했습니다. 140,751줄 추가, 362개 커밋. 이 데이터에는 AI 생성 코드와 35%의 테스트 코드가 포함되어 있으며, 모두 수동으로 작성된 것은 아니라는 점에 유의해야 합니다. 비평가들은 코드 줄 수가 품질과 같지 않다고 주장하는데, 이는 합리적인 질문입니다. 그러나 Garry Tan의 견해는 구조화된 검토 및 테스트 프로세스를 통해 AI 생성 코드의 품질을 제어할 수 있다는 것입니다.
Q: 저는 개발자가 아닌데, gstack이 저에게 어떤 가치를 주나요?
A: gstack의 가장 큰 영감은 특정 슬래시 명령이 아니라 "AI 에이전트 역할극" 방법론에 있습니다. 콘텐츠 제작자, 연구원, 프로젝트 관리자 등 누구든지 이 접근 방식에서 배울 수 있습니다. 하나의 AI가 모든 것을 하게 하지 말고, 다른 작업에 대해 다른 역할, 프로세스 및 품질 표준을 정의하세요. 이 개념은 AI 협업이 필요한 모든 시나리오에 적용됩니다.
Q: gstack과 일반 Claude Code 프롬프트의 근본적인 차이점은 무엇인가요?
A: 차이점은 체계성에 있습니다. 일반 프롬프트는 일회성 지시인 반면, gstack은 연결된 워크플로입니다. 각 스킬의 출력은 다음 스킬의 입력이 자동으로 되어, 생각 → 계획 → 구축 → 검토 → 테스트 → 배포 → 반영의 완전한 폐쇄 루프를 형성합니다. 또한 gstack에는 AI가 디버깅 중에 관련 없는 코드를 실수로 수정하는 것을 방지하기 위한 내장 안전 장치(/careful, /freeze, /guard)가 있습니다. 이러한 "프로세스 거버넌스"는 단일 프롬프트로는 달성할 수 없습니다.
요약
gstack의 가치는 Markdown 파일 자체에 있는 것이 아니라, 그것이 검증하는 패러다임에 있습니다. AI 프로그래밍의 미래는 "더 똑똑한 코파일럿"에 관한 것이 아니라 "더 나은 팀 관리"에 관한 것입니다. AI를 모호하고 만능인 비서에서 특정 책임을 가진 전문가 역할로 나누고, 구조화된 프로세스로 연결하면 개인의 생산성은 질적인 변화를 겪을 수 있습니다.
기억해야 할 세 가지 핵심 사항이 있습니다. 첫째, 일반화보다 역할극이 더 효과적입니다. AI에 명확한 책임 경계를 부여하는 것이 광범위한 프롬프트를 주는 것보다 훨씬 효과적입니다. 둘째, 프로세스는 병렬 처리의 전제 조건입니다. 생각 → 계획 → 구축 → 검토 → 테스트 → 배포 구조 없이는 병렬로 실행되는 여러 에이전트가 혼돈만 초래할 것입니다. 셋째, Markdown은 코드입니다. LLM 시대에는 잘 작성된 Markdown 파일이 실행 가능한 엔지니어링 방법론이며, 이러한 인지적 변화는 전체 개발자 도구 생태계를 재편하고 있습니다.
모델은 매주 강력해지고 있습니다. 지금 AI와 협력하는 방법을 배우는 사람들은 다가오는 경쟁에서 엄청난 이점을 가질 것입니다. 개발자, 크리에이터, 기업가 등 누구든지 오늘부터 시작하는 것을 고려해 보세요. gstack으로 프로그래밍 워크플로를 혁신하고, "AI 에이전트 역할극" 방법론을 자신의 시나리오에 적용해 보세요. AI를 역할극하여 모호한 비서에서 정밀한 팀으로 바꾸세요.
참고 자료
[1] Why Garry Tan's Claude Code setup has gotten so much love—and hate
[3] Reddit user's in-depth review of gstack
[5] Reddit user adapts gstack for C++ development