코딩 없이 Karpathy 스타일의 AI 지식 베이스 구축하기

FOMO 에 빠진 당신, Karpathy 에게 또 한 번 당하셨나요?
지난주, Andrej Karpathy 는 이제 더 이상 많은 AI 토큰을 코드 작성에 쓰지 않고, 대신 개인 지식 베이스를 구축하는 데 사용한다는 트윗을 올렸습니다. 이 트윗은 1700 만 회 이상의 조회수를 기록하며 전 세계 AI 커뮤니티에서 큰 화제가 되었습니다.

거장이 다시 한번 FOMO(소외되는 것에 대한 두려움)를 불러일으키니, 다들 한 번쯤 시도해보고 싶어 합니다.
하지만 실제로 해보면 알게 될 것입니다. 이 방법이 이론적으로는 매우 강력할지 모르나, 실행 단계에서는 적지 않은 문제에 부딪히게 된다는 것을요.
문제 1. 높은 설정 진입 장벽
Karpathy 가 LLM 으로 지식 베이스를 구축하는 방식은 이렇습니다. 원시 소재를 LLM 에 던져주고, RAG 나 벡터 데이터베이스를 사용하는 대신 오직 LLM 의 힘만으로 요약, 백링크, 개념 인덱스가 포함된 마크다운(markdown) 지식 베이스로 '하드 컴파일'하는 것입니다.
이 트윗은 600 자 남짓입니다. 솔직히 코딩을 할 줄 아는 사람에게 이 프로세스는 그리 복잡하지 않습니다.
하지만 엔지니어 거장인 Karpathy 가 툭 던진 몇 마디는 겉보기엔 단순해 보여도, 그 안에는 방대한 '암묵지'가 숨어 있습니다. 그렇지 않았다면 그가 트윗을 올린 후, 이를 따라 하는 단계별(step by step) 구축 튜토리얼이 그렇게 많이 쏟아져 나오지는 않았을 것입니다.
그런데 이런 튜토리얼들을 열어보면, 이 역시 엔지니어들이 쓴 것임을 알 수 있습니다. 내용이 꽤 상세하긴 합니다. raw/, wiki/, outputs/ 라는 3 단계 폴더를 만드는 법, 터미널에서 Claude Code 를 설정하는 법, LLM 이 마크다운 형식으로 출력하도록 시스템 프롬프트를 작성하는 법 등등...
하지만 엔지니어는 소수입니다. 대다수의 지식 노동자들에게 이러한 튜토리얼은 여전히 거대한 학습 비용을 요구하며, 이것이 바로 왜 그렇게 큰 FOMO 가 발생했는지를 설명해 줍니다.
소셜 미디어 블로거, 브랜드 마케팅 담당자, 논문을 쓰는 대학원생, 강의 자료를 준비하는 선생님, 산업 트렌드를 분석하는 투자자 — 이들은 매일 '정보 수집 → 정보 이해 → 콘텐츠 생산'의 과정을 반복합니다. 어쩌면 엔지니어보다 AI 지식 시스템이 더 절실한 사람들일지도 모릅니다. 그런데 이들에게 터미널 환경을 설정하고, 마크다운을 쓰고, 프롬프트를 조정하라고요?
현실적이지 않습니다.
코드를 모르는 대다수는 여전히 터미널과 명령줄 인터페이스(CLI)에 대한 공포를 극복해야만 합니다.
도구는 사용자를 위해 존재해야지, 사용자가 도구에 맞춰 자신을 희생해서는 안 됩니다.
문제 2. '지식 베이스'라는 거대한 함정
Karpathy 는 LLM 을 활용해 '정보 정리'의 비용을 획기적으로 낮췄습니다. 예전에는 직접 요약을 쓰고, 태그를 달고, 링크를 연결해야 했지만, 이제는 LLM 에게 맡김으로써 '제2의 뇌'를 만드는 방식이 한 단계 진화했습니다.
하지만 목적지는 변하지 않았습니다. 이 지식 베이스는 오직 '읽기' 위한 용도에 머뭅니다.
단순히 연구나 학습이 목적이라면 '자동으로 잘 정리된 지식 베이스'만으로도 충분할 것입니다.
하지만 지식 노동자의 본질은 문서 작업자이고, 문서 작업자의 본질은 창작자입니다. 모든 지식 노동자의 진짜 업무는 지식을 수집하는 것이 아니라, 지식을 활용해 콘텐츠를 창조하는 것입니다.
일상 업무에서 이루어지는 모든 학습과 연구의 종착점은 콘텐츠 생산입니다. 이는 단순히 예쁜 위키(wiki)를 갖는 것만으로는 최종적인 업무를 완수할 수 없음을 의미합니다.
'지식 베이스'라는 개념은 화려한 막다른 골목과 같습니다. 당신이 얻는 것은 '보이는 것이 전부인' 가짜 만족감일 뿐, '생산과 결과물'이 주는 실질적인 보상은 없습니다.
따라서 지식 베이스의 본질은 '생산성 포르노'와 같습니다. '수확'의 쾌감을 완벽하게 흉내 내지만, 생산성이라는 결과물은 제공하지 않기 때문입니다.
실제 사례를 통해 그 차이를 설명해 보겠습니다.
Karpathy 의 사례를 예로 들어보죠. 당신이 AI 기업의 마케터라고 가정해 봅시다. 그의 트윗을 보고 화제성을 활용해 이 주제로 일련의 콘텐츠를 만들고 싶어 졌습니다.
Karpathy 의 방식을 따른다면 다음과 같은 단계를 거쳐야 합니다.
- 그의 트윗, 아이디어 파일, 관련 평론 기사들을 스크립트로 긁어 raw/ 폴더에 다운로드합니다.
- Node.js 를 설치하고, 터미널에서 Claude Code 를 설치한 뒤, 명령 파일을 작성하여 Claude Code 가 이 소재들을 몇 편의 위키 기사로 컴파일하게 합니다.
- Obsidian 이나 다른 마크다운 편집기를 다운로드해야 비로소 'LLM Knowledge Base'에 관한 구조화된 지식 베이스를 마주하게 됩니다.
- 그리고 나서, 빈 문서를 열고 직접 글을 쓰기 시작합니다.
Nick Spisak 의 LLM 지식 베이스 구축 시연
4 단계는 차치하더라도, 앞선 세 단계만으로도 터미널 사용법, Node.js 설치, API 키 설정, 프롬프트 작성, Obsidian 다운로드 등이 필요합니다. 대다수의 사람에게는 지식 베이스를 구축하기도 전에 도구 체계의 복잡함에 가로막혀 포기하게 되는 수준입니다.
설령 이 모든 과정을 통과해 4 단계에 도달했다 하더라도, 당신은 다시 원점으로 돌아온 셈입니다. 지식 베이스가 내용을 이해하는 데 도움은 주었지만, 글쓰기, 이미지 제작, 발행 등은 여전히 당신이 처음부터 직접 해야 하기 때문입니다.
그렇다면 이 두 가지 문제를 동시에 해결하고, 결과물 생산 중심의 '제2의 뇌'를 손쉽게 구축할 방법은 없을까요?
있습니다. 지금 당신이 읽고 있는 이 글이 바로 그런 방식으로 만들어졌습니다. 전 과정에서 저는 오직 하나의 도구, YouMind 만을 사용했습니다. 구체적인 단계를 보여드리겠습니다.
구체적으로 어떻게 하나요?
첫 번째 단계: 소재 수집
브라우저에서 YouMind 를 열고, 새로운 Board(프로젝트 공간이라고 이해하시면 됩니다)를 만든 뒤 관련 소재를 모두 저장합니다.
- 웹 기사: 링크를 붙여넣으면 본문 전체를 자동으로 수집합니다.
- YouTube 영상: 링크를 붙여넣으면 자막과 내용을 자동으로 가져옵니다.
- PDF 논문: 직접 업로드합니다.
- 팟캐스트: 링크를 붙여넣으면 오디오를 자동으로 분석합니다.
- 개인적인 생각: 메모장에 바로 적습니다.

이것이 바로 Karpathy 의 raw/ 폴더 역할을 하지만, 수동으로 다운로드하거나 파일 시스템을 조작할 필요가 전혀 없습니다.
두 번째 단계: AI 이해 및 대화
소재가 저장되면 Board 내에서 AI 와 직접 대화할 수 있습니다. AI 가 참고하는 문맥(Context)은 인터넷의 막연한 정보가 아니라, 우리가 직접 큐레이션한 이 주제와 관련된 1 차 자료들입니다.
AI 에게 이렇게 물어볼 수 있습니다.
- "이 기사들의 핵심 관점에는 어떤 차이가 있지?"
- "Karpathy 의 방식과 Tiago Forte 의 PARA 방법론의 본질적인 차이점은 뭐야?"
- "이 소재들을 바탕으로 가장 써볼 만한 주제 3 가지만 뽑아줘."

이 과정이 Karpathy 의 위키 컴파일 과정에 해당합니다. 하지만 차이점은 LLM 이 자동으로 위키 세트를 생성할 때까지 기다리는 것이 아니라, 대화를 통해 능동적으로 이해의 방향을 이끌어간다는 점입니다.
세 번째 단계: 이해에서 창작으로
이 단계가 핵심적인 차별점입니다. Karpathy 의 워크플로우는 이전 단계에서 끝납니다. 하지만 YouMind 에서는 자연어를 사용해 AI 에게 이해를 넘어 창작 단계로 넘어가도록 명령할 수 있습니다.
- 소재와 대화 내용을 바탕으로 구조가 완벽한 블로그 초안 생성
- 대화와 이해한 내용을 바탕으로 트위터(X)에 올리기 좋은 짧은 콘텐츠 추출
- 핵심 논점을 시각화한 인포그래픽 제작
- 즉석에서 발표 자료(Slides) 생성

이 모든 결과물은 소재, 대화 기록과 함께 동일한 Board 에 저장됩니다. 이들은 고립된 파일이 아니라, 하나의 지식 연결 고리 위에 있는 서로 다른 노드들입니다.
네 번째 단계: 지식의 지속적인 성장
Board 는 한 번 쓰고 버리는 것이 아닙니다. 정기적인 작업을 설정하여 YouMind 가 주기적으로 Karpathy 의 트윗 업데이트를 자동으로 수집하고 동일한 Board 에 저장하도록 함으로써, 지식의 복리 효과를 누릴 수 있습니다.

이것이 바로 '제2의 뇌'가 지녀야 할 진정한 모습입니다. 단순히 쌓아두는 것이 아니라, 아웃풋을 만들어내는 것이죠.
Karpathy 의 방법과 YouMind 를 비교해 보면, 'AI 제2의 뇌'에 대한 두 가지 서로 다른 철학을 엿볼 수 있습니다.
Karpathy LLM 지식 베이스 | YouMind | |
|---|---|---|
대상 | 엔지니어 | 창작자, 지식 노동자 |
구축 비용 | Node.js, 터미널, Obsidian, Claude Code | YouMind 브라우저 버전으로 즉시 사용 가능 |
핵심 동작 | 소재 → 지식 베이스 (wiki) | 소재 → 이해 → 창작 |
AI 의 역할 | 사서 (정리, 인덱싱) | 협업자 (대화, 이해, 공동 창작) |
최종 목적 | 읽기 및 연구 | 생산 및 배포 |
지식 형태 | 마크다운 파일 | 멀티모달, 시각화 콘텐츠 (글, 이미지, Slides, 웹페이지, 영상 등) |
정보 불안의 진정한 해법
마지막으로 흥미로운 점 하나를 말씀드리겠습니다.
Karpathy 는 40 만 자에 달하는 위키를 만들었습니다. 하지만 생각해 보세요. 전 세계 사람들이 인용하는 것은 무엇일까요? 그 위키가 아니라 그의 트윗, 그의 영상, 그가 쓴 글입니다. 그의 마크다운 파일은 그 자신만 보지만, 그의 트윗은 1200 만 명이 봅니다.
진정한 지식 베이스는 시스템이 아니라 사람입니다.
당신이 글 한 편으로 어떤 사안을 꿰뚫어 설명했을 때, 사람들이 당신의 글을 저장하고 당신의 관점을 인용한다면 — 당신이 바로 그들의 지식 베이스가 되는 것입니다.
이것이 바로 지식 불안에 대한 해답입니다. 불안해하는 사람은 시스템이 대신 이해해 줄 것이라 믿으며 시스템에 정보를 쏟아붓습니다. 하지만 진정으로 영향력 있는 사람은 자신의 이해를 밖으로 출력(Output)하여 스스로를 타인의 정보원이 되게 합니다.
전자는 정보가 끝이 없기에 영원히 불안하지만, 후자는 표현을 통해 이해를 완성했기에 불안하지 않습니다.
그러므로 문제는 '어떻게 더 좋은 지식 베이스를 만들 것인가'가 아니라, '어떻게 스스로가 지식 베이스가 될 것인가'입니다. 답은 간단합니다. 지속적으로 아웃풋을 내는 것입니다.
YouMind 가 하는 일은 당신이 정보의 소비자에서 정보의 원천으로 거듭나도록 돕는 것입니다.
본 콘텐츠와 이미지는 에디터와 YouMind 가 공동으로 제작하였습니다.