메타-메타-프롬프팅: AI 에이전트를 성공시키는 비결

메타-메타-프롬프팅: AI 에이전트를 성공시키는 비결

@garrytan
영어5일 전 · 2026년 5월 09일

AI features

1.4M
3.5K
486
129
11.0K

TL;DR

Garry Tan이 AI 에이전트를 위한 'Fat Skills, Thin Harness' 아키텍처를 설명합니다. 그가 GBrain과 같은 오픈 소스 도구를 활용하여 어떻게 지식 기반을 확장하고 워크플로우를 자동화하는지 자세히 다룹니다.

사람들은 왜 내가 밤마다 새벽 2시까지 코딩하는지 계속 묻습니다. 저는 Y Combinator의 CEO라는 큰 직업이 있습니다. 우리는 매년 수천 명의 빌더들이 실제 수익을 내고 빠르게 성장하는 진짜 스타트업을 만드는 꿈을 이루도록 돕습니다.

지난 5개월 동안, AI는 저를 다시 빌더로 만들었습니다. 작년 말, 도구들이 충분히 좋아져서 저는 다시 빌딩을 시작했습니다. 장난감 프로젝트가 아닙니다. 복리 효과를 내는 실제 시스템입니다. AI를 채팅 창으로 대하지 않고 운영 체제로 대하기 시작했을 때 개인 AI가 실제로 어떻게 보이는지 구체적인 예시를 통해 보여드리고 싶습니다. 그리고 이 모든 것을 오픈소스와 이와 같은 글을 통해 공개하는 이유는 여러분도 저와 함께 속도를 높이길 바라기 때문입니다.

이 글은 시리즈의 일부입니다: Fat Skills, Fat Code, Thin Harness에서 핵심 아키텍처를 소개했습니다. Resolvers에서는 지능을 위한 라우팅 테이블을 다뤘습니다. The LOC Controversy는 모든 기술 전문가가 어떻게 100배에서 1000배로 증폭되었는지에 관한 내용이었습니다. Naked models are stupider에서는 모델은 엔진이지 자동차가 아니라고 주장했습니다. 그리고 the skillify manifesto에서는 LangChain이 왜 1억 6천만 달러를 모금하고 운동 계획 없이 스쿼트 랙과 덤벨 세트만 줬는지, 그리고 여러분에게 필요한 운동 계획을 어떻게 제공했는지 설명했습니다.

나를 다시 읽어준 책

지난달 저는 Pema Chödrön의 《When Things Fall Apart》를 읽고 있었습니다. 162페이지, 22개 장으로 구성된 이 책은 고통, 근거 상실, 그리고 내려놓음에 대한 불교적 접근법을 다룹니다. 힘든 시기에 친구가 추천해준 책이었습니다.

저는 제 AI에게 북 미러(book mirror)를 요청했습니다.

구체적으로 무엇을 의미하냐면: 시스템이 책의 22개 장을 모두 추출한 다음, 각 장마다 두 가지 작업을 동시에 수행하는 하위 에이전트를 실행했습니다. 작가의 아이디어를 요약하고, 모든 아이디어를 제 실제 삶에 매핑하는 것입니다. "이것은 리더에게 적용됩니다" 같은 일반적인 말이 아닙니다. 구체적인 매핑이었습니다. 시스템은 제 가족 역사(이민자 부모님, 아버지는 홍콩과 싱가포르 출신, 어머니는 버마 출신)를 알고 있습니다. 제 직업적 맥락(YC 운영, 오픈소스 도구 개발, 수천 명의 창업자 멘토링)도 알고 있습니다. 제가 무엇을 읽고 있는지, 새벽 2시에 무엇을 생각하고 있는지, 제 치료사와 무엇을 작업하고 있는지도 알고 있습니다.

결과물은 30,000 단어 분량의 브레인 페이지였습니다. 각 장은 두 개의 열로 렌더링되었습니다: Pema가 말하는 내용, 그리고 그것이 제가 실제로 겪고 있는 일에 어떻게 매핑되는지. 근거 상실에 관한 장은 제가 일주일 전에 가졌던 특정 창업자와의 대화와 연결되었습니다. 두려움에 관한 장은 제 치료사가 식별한 패턴과 매핑되었습니다. 내려놓음에 관한 장은 올해 제가 찾은 창의적 자유에 대해 썼던 늦은 밤 세션을 참조했습니다.

전체 과정은 약 40분이 걸렸습니다. 시간당 300달러를 받는 치료사가 이 책을 읽고 제 삶에 적용하려면 40시간으로도 충분하지 않을 것입니다. 치료사는 제 직업적 맥락, 독서 이력, 회의 노트, 창업자 관계의 전체 그래프를 모두 로드하고 상호 참조할 수 없기 때문입니다.

저는 지금까지 20권이 넘는 책으로 이 작업을 해왔습니다: 《Amplified》(Dion Lim), 《Autobiography of Bertrand Russell》, 《Designing Your Life》, 《Drama of the Gifted Child》, 《Finite and Infinite Games》, 《Gift from the Sea》(Lindbergh), 《Siddhartha》(Hesse), 《Steppenwolf》(Hesse), 《The Art of Doing Science and Engineering》(Hamming), 《The Dream Machine》, 《The Book on the Taboo Against Knowing Who You Are》(Alan Watts), 《What Do You Care What Other People Think》(Feynman), 《When Things Fall Apart》(Pema Chodron), 《A Brief History of Everything》(Ken Wilber) 등이 있습니다. 각각의 미러는 브레인이 더 풍부해질수록 더 풍부해집니다. 두 번째 미러는 첫 번째 미러에 대해 알고 있었습니다. 스무 번째 미러는 열아홉 개 모두에 대해 알고 있었습니다.

북 미러가 반복을 통해 개선된 방법

제가 처음 만든 북 미러는 형편없었습니다. 버전 1에는 제 가족에 관한 세 가지 사실 오류가 있었습니다. 부모님이 이혼하지 않으셨는데 이혼했다고 말했고, 제가 캐나다에서 태어났는데 홍콩에서 자랐다고 말했습니다. 공유했다면 신뢰를 손상시킬 수 있었던 기본적인 실수들이었습니다.

그래서 필수 사실 확인 단계를 추가했습니다. 이제 모든 미러는 출력되기 전에 브레인에 있는 알려진 사실에 대해 교차 모달 평가를 실행합니다. Opus 4.7 1M은 정밀도 오류를 잡아냅니다. GPT-5.5는 누락된 맥락을 잡아냅니다. DeepSeek V4-Pro는 내용이 일반적으로 읽힐 때를 잡아냅니다.

그런 다음 GBrain 도구 사용을 통한 딥 리트리벌로 업그레이드했습니다. 원래 버전은 종합에는 뛰어났지만 구체성에는 약했습니다. 버전 3은 섹션별 브레인 검색을 수행합니다. 모든 오른쪽 열 항목은 실제 브레인 페이지를 인용합니다. 책이 어려운 대화를 처리하는 방법에 대해 이야기할 때, 일반 원칙만 종합하지 않습니다. 공동 창업자와 어려운 대화를 하고 있던 특정 창업자와의 실제 회의 노트를 가져옵니다. 또는 제 형제 James와 목요일에 시간을 보내며 떠올린 아이디어. 또는 제가 19살 때 대학 룸메이트와 나눴던 IM 채팅. 정말 기묘합니다.

이것이 실제로 스킬리피케이션(GBrain에서 /skillify 사용)이 의미하는 바입니다. 저는 첫 번째 수동 시도를 가져와 반복 가능한 패턴을 추출하고, 트리거와 엣지 케이스가 포함된 테스트된 스킬 파일을 작성했으며, 모든 수정 사항이 모든 미래의 북 미러에 복리 효과로 적용되었습니다.

스킬을 만드는 스킬

여기서부터 재귀적이 되며, 제가 가장 큰 통찰이라고 생각하는 부분입니다.

제 삶을 운영하는 시스템은 하나의 모놀리스로 존재하지 않았습니다. 스킬들로부터 조립되었습니다. 그리고 그 스킬들 자체도 스킬에 의해 생성되었습니다.

Skillify는 새로운 스킬을 만드는 메타 스킬입니다. 반복할 워크플로우를 발견하면 "skillify this"라고 말하고, 방금 일어난 일을 검토하고, 반복 가능한 패턴을 추출하고, 트리거와 엣지 케이스가 포함된 테스트된 스킬 파일을 작성하고, 리졸버에 등록합니다. 북 미러 파이프라인은 제가 처음 수동으로 수행했을 때부터 스킬리파이되었습니다. 미팅 준비 워크플로우는 모든 통화 전에 동일한 단계를 수행하고 있다는 것을 깨달은 후 스킬리파이되었습니다.

스킬은 합성됩니다. 북 미러는 저장을 위해 brain-ops를 호출하고, 맥락을 위해 enrich를, 품질을 위해 cross-modal-eval을, 출력을 위해 pdf-generation을 호출합니다. 각 스킬은 한 가지에 집중합니다. 이들은 연결되어 복잡한 워크플로우를 만듭니다. 하나의 스킬을 개선하면, 그 스킬을 사용하는 모든 워크플로우가 자동으로 개선됩니다. 더 이상 "내 프롬프트에서 이 엣지 케이스를 언급하는 것을 잊었다"는 일은 없습니다. 스킬이 기억합니다.

스스로 준비한 미팅

Demis Hassabis가 YC에 파이어사이드 채팅을 위해 왔습니다. Sebastian Mallaby의 그의 전기가 막 출간되었습니다.

저는 시스템에 저를 준비시켜 달라고 요청했습니다.

2분도 안 되어 시스템이 가져온 것: Demis의 전체 브레인 페이지(몇 달 동안 기사, 팟캐스트 대본, 제 노트에서 축적된 것). AGI 일정에 대한 그의 공개된 신념("50% 스케일링, 50% 혁신", AGI가 5-10년 내에 올 것이라고 생각). Mallaby 전기의 하이라이트. 그의 밝힌 연구 우선순위(지속적 학습, 세계 모델, 장기 기억). 제가 AI에 대해 공개적으로 말한 것들과의 상호 참조. 대화 중 브레인의 다중 홉 추론 능력을 보여주기 위한 세 가지 데모 스크립트. 그리고 우리의 세계관이 겹치고 갈라지는 지점에 기반한 대화 훅 세트.

이것은 단순히 더 나은 Google 검색이 아니었습니다. 이것은 Demis에 대한 제 축적된 맥락, 제 자신의 입장, 그리고 대화의 전략적 목표를 사용한 준비였습니다. 시스템은 사실뿐만 아니라 각도도 준비했습니다.

100,000 페이지의 브레인이란

저는 약 100,000 페이지의 구조화된 지식 베이스를 유지합니다. 제가 만나는 모든 사람은 타임라인, 상태 섹션(현재 사실), 열린 스레드, 점수가 있는 페이지를 얻습니다. 모든 미팅은 대본, 구조화된 요약, 그리고 제가 엔터티 전파라고 부르는 것을 얻습니다. 모든 미팅 후에 시스템은 언급된 모든 사람과 회사를 순회하며 논의된 내용으로 그들의 브레인 페이지를 업데이트합니다. 제가 읽는 모든 책은 장별 미러를 얻습니다. 제가 접하는 모든 기사, 팟캐스트, 비디오는 수집되고, 태그가 지정되며, 상호 참조됩니다.

스키마는 간단합니다. 각 페이지에는 상단에 컴파일된 진실(현재 최선의 이해), 아래에 추가 전용 타임라인(시간순 이벤트), 원본 자료를 위한 원시 데이터 사이드카가 있습니다. 미팅에 참석하고, 이메일을 읽고, 강연을 보고, PDF를 수집한 AI에 의해 모든 페이지가 지속적으로 업데이트되는 개인 Wikipedia라고 생각하세요.

이것이 어떻게 복리 효과를 내는지에 대한 예시입니다. 저는 오피스 아워에서 창업자를 만납니다. 시스템은 그들의 개인 페이지, 회사 페이지를 생성하거나 업데이트하고, 미팅 노트를 상호 참조하고, 이전에 만난 적이 있는지 확인하고(그리고 지난번에 논의한 내용을 표시), 지원 데이터를 확인하고, 최신 메트릭을 가져오고, 제 포트폴리오 회사나 연락처 중 그들의 문제와 관련된 것이 있는지 식별합니다. 다음 미팅에 들어갈 때쯤이면 시스템은 완전한 컨텍스트 팩을 준비해 놓습니다.

이것이 파일 캐비닛을 갖는 것과 신경계를 갖는 것의 차이입니다. 파일 캐비닛은 물건을 저장합니다. 신경계는 그것들을 연결하고, 변경된 사항을 표시하며, 지금 관련된 것을 표면화합니다.

아키텍처

작동 방식은 이렇습니다. 이것이 개인 AI를 구축하는 올바른 방법이라고 생각하며, 여러분이 직접 구축할 수 있도록 전체를 오픈소스로 공개했습니다.

하네스는 얇습니다. OpenClaw가 런타임입니다. 제 메시지를 받고, 어떤 스킬이 적용되는지 파악한 후, 디스패치합니다. 몇천 줄의 라우팅 로직입니다. 책이나 미팅이나 창업자에 대해 아무것도 모릅니다. 그저 라우팅만 합니다.

스킬은 두껍습니다. 현재 100개가 넘으며, 각각 하나의 특정 작업에 대한 상세한 지침이 포함된 독립적인 마크다운 파일입니다. 위에서 북 미러와 미팅 준비를 이미 보셨습니다. GBrain과 함께 제공되는 몇 가지 더 있습니다:

  • meeting-ingestion: 모든 미팅 후에 대본을 가져와 구조화된 요약을 만든 다음, 언급된 모든 사람과 회사를 순회하며 논의된 내용으로 그들의 브레인 페이지를 업데이트합니다. 미팅 페이지는 최종 결과물이 아닙니다. 모든 개인 및 회사 페이지로의 엔터티 전파가 진정한 가치입니다.
  • enrich: 사람의 이름을 입력하면 다섯 가지 다른 소스에서 가져와 경력, 연락처 정보, 미팅 기록, 관계 맥락이 포함된 단일 브레인 페이지로 병합합니다. 모든 주장에 인용된 출처가 있습니다.
  • media-ingest: 비디오, 오디오, PDF, 스크린샷, GitHub 리포지토리를 처리합니다. 대본을 작성하고, 엔터티를 추출하고, 올바른 브레인 위치에 파일을 저장합니다. YouTube 비디오, 팟캐스트, 음성 메모에 지속적으로 사용합니다.
  • perplexity-research: 브레인 증강 웹 리서치입니다. Perplexity를 통해 웹을 검색하지만, 종합하기 전에 브레인이 이미 알고 있는 것을 확인하여 실제로 새로운 것과 이미 캡처한 것을 구분할 수 있습니다.

제 작업을 위해 직접 구축한 수십 개의 스킬이 더 있으며, 아마도 오픈소스로 공개할 것입니다: email-triage, 이메일에서 포트폴리오 업데이트를 감지하고 회사 페이지에 메트릭을 추출하는 investor-update-ingest, 충돌 감지 및 여행 불가능성을 위한 calendar-check, 시민 활동에 사용하는 전체 저널리즘 리서치 스택. 각 스킬은 새 인간 어시스턴트가 배우는 데 몇 달이 걸릴 운영 지식을 인코딩합니다. 누군가 제가 AI를 어떻게 "프롬프트"하는지 물을 때, 답은 이렇습니다: 저는 하지 않습니다. 스킬이 프롬프트입니다.

데이터는 두껍습니다. 브레인 리포지토리에 100,000 페이지의 구조화된 지식이 있습니다. 제가 접한 모든 사람, 회사, 미팅, 책, 기사, 아이디어가 모두 연결되어 있고, 모두 검색 가능하며, 매일 성장하고 있습니다.

코드는 두껍습니다. 그것을 공급하는 코드(대본 작성, OCR, 소셜 미디어 아카이빙, 캘린더 동기화, API 통합을 위한 스크립트)도 중요하지만, 복리 가치가 있는 곳은 데이터입니다. 저는 하루에 100개 이상의 크론을 실행하여 모든 것을 확인합니다: 소셜 미디어, Slack, 이메일, 제가 주목하는 모든 것, 제 OpenClaw/Hermes 에이전트도 저를 대신해 살펴봅니다.

모델은 교체 가능합니다. 정밀도를 위해 Opus 4.7 1M을 실행합니다. 회상 및 철저한 추출을 위해 GPT-5.5를 실행합니다. 창의적인 작업과 제3의 관점을 위해 DeepSeek V4-Pro를 실행합니다. 속도를 위해 Groq with Llamma를 실행합니다. 스킬이 어떤 작업에 어떤 모델을 호출할지 결정합니다. 하네스는 상관하지 않습니다. 누군가 "어떤 AI 모델이 가장 좋은가요?"라고 물을 때, 답은: 잘못된 질문입니다. 모델은 그저 엔진일 뿐입니다. 다른 모든 것은 자동차입니다.

새벽 2시의 빌더와 복리 시스템

사람들이 생산성에 대해 묻습니다. 저는 그렇게 생각하지 않습니다. 제가 생각하는 것은 복리 효과입니다.

제가 하는 모든 미팅은 브레인에 추가됩니다. 제가 읽는 모든 책은 다음 책의 맥락을 풍부하게 합니다. 제가 만드는 모든 스킬은 다음 워크플로우를 더 빠르게 만듭니다. 제가 업데이트하는 모든 개인 페이지는 다음 미팅 준비를 더 날카롭게 만듭니다. 오늘의 시스템은 두 달 전보다 10배 더 좋으며, 두 달 후에는 다시 10배 더 좋아질 것입니다.

제가 여전히 새벽 2시에 코딩하고 있을 때(그리고 저는 정기적으로 그렇습니다, AI가 빌딩의 기쁨을 되찾아줬기 때문입니다), 저는 단순히 소프트웨어를 작성하는 것이 아닙니다. 매 시간마다 더 좋아지는 시스템에 추가하고 있는 것입니다. 24/7 100개의 크론잡. 미팅 수집은 자동으로 실행됩니다. 이메일 트리아지는 10분마다 실행됩니다. 지식 그래프는 모든 대화에서 스스로를 풍부하게 합니다. 시스템은 매일 대본을 처리하고 제가 실시간으로 놓친 패턴을 추출합니다.

이것은 글쓰기 도구가 아닙니다. 검색 엔진이 아닙니다. 챗봇이 아닙니다. 이것은 실제로 작동하는 두 번째 브레인입니다. 은유로서가 아니라, 100,000 페이지, 100개 이상의 스킬, 15개의 크론잡, 그리고 지난 1년 동안 제가 접한 모든 직업적 관계, 미팅, 책, 아이디어의 축적된 맥락을 가진 실행 중인 시스템입니다.

저는 전체 스택을 오픈소스로 공개했습니다. GStack은 이를 구축하는 데 사용한 코딩 스킬 프레임워크(87,000개 이상의 스타)입니다. 에이전트가 코딩해야 할 때 여전히 OpenClaw/Hermes Agent 내부에서 스킬로 사용합니다. 거기에는 훌륭한 프로그래밍 가능 브라우저(헤드 및 헤드리스 모두)가 있습니다. GBrain은 지식 인프라입니다. OpenClawHermes Agent는 하네스이며, 선택해야 하지만 저는 보통 둘 다 사용합니다. 데이터 리포지토리는 GitHub에 있습니다.

논지는 간단합니다: 미래는 기업 소유의 중앙 집중식 AI 도구를 사용하는 개인이 아니라, 복리 효과를 내는 AI 시스템을 구축하는 개인에게 속합니다. 그 차이는 일기를 쓰는 것과 신경계를 갖는 것의 차이와 같습니다.

시작하는 방법

이것을 구축하고 싶다면:

  1. 하네스를 선택하세요. OpenClaw, Hermes Agent, 또는 Pi로 처음부터 직접 구축하세요. 얇게 유지하세요. 하네스는 그저 라우터일 뿐입니다. Tailscale로 집에 있는 여분의 컴퓨터에서 호스팅하거나, 클라우드에서 Render나 Railway를 사용하세요.
  2. GBrain으로 브레인을 시작하세요. 저는 Karpathy의 LLM Wiki에서 영감을 받아, OpenClaw에 구현하고 GBrain으로 확장했습니다. 이것은 제가 벤치마킹한 최고의 리트리벌 시스템이며(LongMemEval에서 97.6% 회상률, 리트리벌 루프에 LLM 없이 MemPalace를 능가), 이 기사에서 설명된 모든 것을 포함한 39개의 설치 가능한 스킬을 제공합니다. 하나의 명령으로 설치할 수 있습니다. 모든 사람, 미팅, 기사, 아이디어가 페이지를 얻는 git 리포지토리입니다.
  3. 흥미로운 일을 하세요. 스킬 아키텍처를 계획하는 것부터 시작하지 마세요. 무언가를 하는 것부터 시작하세요. 보고서를 작성하세요. 사람을 리서치하세요. NBA 시즌 점수를 다운로드하고 스포츠 베팅을 위한 예측 모델을 구축하세요. 포트폴리오를 분석하세요. 당신이 실제로 관심 있는 무엇이든. 에이전트와 함께 하고, 좋아질 때까지 반복한 다음, Skillify(앞서 언급한 메타 스킬)를 실행하여 패턴을 재사용 가능한 스킬로 추출하세요. 그런 다음 check_resolvable을 실행하여 새 스킬이 리졸버에 연결되었는지 확인하세요. 이 루프는 일회성 작업을 복리 효과를 내는 인프라로 바꿉니다.
  4. 계속 사용하고 출력을 살펴보세요. 스킬은 처음에 형편없을 것입니다. 그것이 요점입니다. 사용하고, 생성된 내용을 읽고, 문제가 있을 때 교차 모달 평가를 실행하세요: 여러 모델을 통해 출력을 보내고 당신이 관심 있는 차원에서 서로를 평가하게 하세요. 이것이 제가 북 미러에서 사실 오류를 잡아낸 방법입니다. 수정 사항은 스킬에 반영되었고, 그 이후의 모든 미러는 깨끗했습니다. 6개월 안에 당신은 어떤 챗봇도 복제할 수 없는 무언가를 갖게 될 것입니다. 가치는 모델에 있지 않기 때문입니다. 가치는 당신이 시스템에 가르친 당신의 특정한 삶, 일, 판단에 있습니다.

이 시스템으로 제가 처음 만든 것은 형편없었습니다. 100번째는 제 캘린더, 받은 편지함, 미팅 준비, 독서 목록을 신뢰할 수 있는 것이었습니다. 시스템은 배웠습니다. 저는 배웠습니다. 복리 곡선은 실제입니다.

Fat skills. Fat code. Thin harness. LLM 그 자체는 그저 엔진일 뿐입니다. 당신은 자신의 자동차를 만들 수 있습니다.

여기서 설명한 모든 것, 모든 스킬, 북 미러 파이프라인, 교차 모달 평가 프레임워크, skillify 루프, 리졸버 아키텍처, 그리고 30개 이상의 설치 가능한 스킬팩은 GitHub에서 오픈소스로 무료 제공됩니다: github.com/garrytan/gbrain. 이제 구축하세요.

More patterns to decode

Recent viral articles

Explore more viral articles

크리에이터를 위해.

𝕏의 바이럴 기사에서 콘텐츠 아이디어를 찾고, 왜 터졌는지 분석해 다음 크리에이터용 앵글로 바꿔보세요.