지금 집에 놀고 있는 컴퓨터가 하나 있을 겁니다. 덮개가 닫힌 노트북, 선반 위의 Mac mini, 책상 아래에서 Spotify 켤 때만 부팅했다가 다시 꺼지는 구형 게이밍 PC. 전력만 먹고 공간만 차지하며 당신 삶에 아무 기여도 하지 않습니다.
한편, 신용카드 명세서에는 AI 구독료로 매달 $412가 빠져나가고 있습니다. Claude Max, ChatGPT Pro, Cursor, Perplexity, 가입한 것조차 까먹은 전사 도구 두 개, 한 번 쓰고 만 "글쓰기 도우미"까지. 집에서 조용히 먼지만 쌓이는 하드웨어 하나에 들어갈 컴퓨팅 자원을 빌리는 데 연간 $4,944를 쓰고 있는 셈입니다.
2026년, 이 두 사실이 충돌합니다. 시장에서 가장 비싼 구독 서비스 뒤에 있는 모델들이 이제는 그 구독료 세 달 치보다 저렴한 하드웨어에서 돌아갑니다. 게다가 이 기계는 모델만 돌리는 게 아닙니다. 당신이 자는 동안, 당신이 설정한 일정에 따라, 당신이 직접 할 시간이 없는 일을 처리합니다.
이 글에서는 하드웨어를 고르고, 두뇌(모델)를 고르고, 그 상자가 실제로 어떤 일을 하는지 보여드립니다. 더 이상 당신이 버튼을 누르지 않아도 말이죠.
상자 고르기
살 만한 옵션 네 가지. 두 개는 작고 조용한 컴퓨터이고, 두 개는 기존 데스크톱에 꽂는 카드입니다.
조용한 길이 더 쉽습니다. Mac mini M4, $599는 대부분의 사람들이 선택하는 지점입니다. 모든 로컬 AI 설정이 결국 여기로 향하는 이유는 하나의 설계 선택 때문입니다. 일반 PC는 시스템 RAM과 GPU VRAM 사이에서 데이터를 복사하며, 카드가 가진 용량에 제한됩니다. Apple Silicon은 하나의 메모리 풀을 공유합니다. 모델은 한 번 로드되고, 두 프로세서가 같은 곳에서 읽습니다. 16GB가 탑재된 $599 버전은 두 배 가격의 Windows 머신보다 7-8B 모델을 더 빠르게 실행합니다. 14B 모델을 원한다면 32GB로 업그레이드하세요. M4 Pro($1,399, 48GB)로 올라가면 샌드위치만 한 크기에서 Llama급 70B 모델을 돌릴 수 있습니다. 전력 소비는 8~25W, 팬은 조용하고, 전기세는 월 $4 정도입니다. 하드웨어에 대해 다시는 생각하고 싶지 않다면 이 상자가 정답입니다.

Mac Studio M3 Ultra, $4,199는 같은 아이디어의 타협 없는 버전입니다. 기본 구성은 96GB 통합 메모리, 최대 192GB입니다. 이 이상은 여섯 자리 가격표가 붙은 서버 랙 영역입니다. 192GB는 현재 존재하는 가장 큰 오픈웨이트 모델을 압축 없이, 풀 사이즈로 로드합니다. 시장에서 가장 비싼 구독 서비스와 같은 무게급입니다. 풀로드 시 전기세는 월 $14 정도이며, 월 $200짜리 구독 하나와 비교하면 22개월에 손익분기점을 넘깁니다. 이 기계들은 7~10년은 갑니다. 오늘날 월 $400 이상의 구독료를 내고 있거나, 업무상 데이터가 기기를 절대 떠날 수 없는 사람을 위한 상자입니다. 변호사, 의사, 취재원을 보호해야 하는 기자, 금융 분석가...

기존 데스크톱을 사용하고 싶다면, 카드 두 개가 있습니다. Tesla M40 24GB, eBay에서 중고 $130. NVIDIA가 2015년에 $3,500에 출시한 데이터센터용 카드입니다. 오래전에 서버 팜에서 퇴역하여 중고 시장에 $150 미만으로 흘러들어왔습니다. 24GB VRAM은 새 RTX 5090과 동일합니다. 대부분의 벤치마크에서 프론티어 모델에 맞서는 27B 모델을 실행하기에 충분합니다. 단점: 디스플레이 출력이 없어 모니터용 메인 GPU를 따로 써야 하고, 내장 팬이 없어 3D 프린팅된 슈라우드와 Noctua 팬에 $25를 추가해야 하며, EPS to PCIe 어댑터가 $10 필요합니다. 총 약 $165. Pro 구독 하나만으로 2주 만에 본전을 뽑습니다.

중고 RTX 3090, $700. 로컬 AI에서 중요한 것은 GPU 세대보다 VRAM이며, 3090은 2026년 현재 가격 대비 VRAM 승자입니다. 새 RTX 5090은 32GB에 $3,800입니다. 중고 4090은 24GB에 $2,000입니다. 5년 된 3090은 4090과 같은 24GB를 가지고 있으며 $650~$750에 판매됩니다. 동일한 사용 가능 모델 크기, 70~80% 속도, 1/3 가격. 기존 게이밍 PC에 꽂으면 총 약 $850, 27B 모델을 초당 25~30토큰으로 실행합니다. 중고 카드 구매 시 두 가지 규칙: 판매자 평점 98% 이상, 채굴 관련 제품은 거르세요. 고열 작동은 메모리 칩을 죽입니다. 게이밍은 전력을...
한마디로 고르자면:
1조용하고, 설정 제로, 영원히 작동 -> Mac mini M4, $5992월 $400+ 구독 중이거나 데이터 보안 필수 -> Mac Studio M3 Ultra, $4,1993데스크톱 보유, 최저가 진입 -> Tesla M40, $1304게이밍 PC 보유, 가성비 최고 -> 중고 RTX 3090, $700
어느 것을 고르든 설치는 세 줄의 명령어로 끝나며, 모든 계층에서 동일합니다:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen2.5:32b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

두뇌 고르기
하드웨어는 몸통입니다. 생각에는 여전히 지능이 필요하며, 가장 많은 비용을 절약하는 방법은 하나 이상을 사용하는 것입니다.
Claude Sonnet은 헤비급입니다. 진정한 추론이 필요한 작업에 투입하세요. 15개의 출처를 분석하고 가장 강력한 주장들을 서로 비교하는 것. 노트 보관함에 있는 400개의 노트 중 새 글과 연결되는 것을 결정하는 것. 입력 토큰 100만 개당 약 $3입니다. 복잡한 다단계 사고에서는 아직 로컬 모델이 따라올 수 없습니다.
Claude Haiku는 값싼 일꾼입니다. 태깅, 검증, 아침 브리핑에 표시할 세 가지 옵션 중 선택. Sonnet보다 약 12배 저렴합니다. 호출당 1센트 미만의 작업입니다.
로컬 모델은 상자의 VRAM에 맞는 무엇이든, 데이터를 외부로 보내지 않는 작업자입니다. 기기에서 실행되며, 토큰당 비용을 지불하고 싶지 않거나 민감한 콘텐츠를 서버로 보내고 싶지 않은 전사, 요약 등 모든 작업을 처리합니다. 전기세 외에는 무료입니다.
가장 많은 비용을 절약하는 규칙: 태깅에 Sonnet을 쓰지 말고, 사고에 Haiku를 쓰지 말며, 로컬이 충분히 처리할 수 있는 작업에 민감한 콘텐츠를 외부로 보내지 마세요. 당신의 상자는 버너를 혼합할 수 있습니다. 계란 삶으려고 튀김기를 켜지 마세요.
당신이 자는 동안 하는 일
항상 켜져 있는 상자가 채팅 탭을 대체하는 것뿐이라면 낭비입니다. 요점은 당신 없이도 일하게 하는 것입니다. 모든 작업은 동일한 4단계 형태를 가집니다:
1트리거 -> 무언가 시작합니다 (일정, 새 파일, 웹훅)2실행 -> 작업이 이루어집니다3검증 -> 결과가 엄격한 규칙에 대해 확인됩니다4반복 -> 실패한 부분을 수정하거나, 통과하면 중단합니다
첫 주말에 설정할 가치가 있는 세 가지 작업.
문지기. 받은 편지함을 감시합니다. 새 이메일마다 세 가지 더미로 분류됩니다: 답장 필요, 참고용, 휴지통. 첫 번째 더미에는 두 줄짜리 초안 답변이 작성되어 승인만 하면 됩니다. 아침에 일어나면 미리 작성된 네 개의 답변을 보고, 세 개는 보내고, 하나는 수정합니다. 받은 편지함은 7분 만에 끝납니다.
지도 제작자. 노트 폴더에 상주합니다. 저장한 모든 글, 드롭한 모든 YouTube 링크, 도착한 모든 회의 기록이 처리됩니다: 한 줄 요약, 세 가지 주요 주장, 가장 강력한 인용문 추출, 그리고 새 노트는 같은 주제의 기존 노트에 연결됩니다. 검증 규칙: 노트에 네 가지 요소가 모두 있고 기존 노트에 대한 위키 링크가 하나 이상 있어야 합니다. 잡동사니는 "낮은 신호"로 태그되어 건너뜁니다. 두 달 후, "나중에 읽기" 더미는 죽은 탭들의 무덤이 아니라 검색 가능한 주장과 인용문의 아카이브로 변신합니다.

감시자. 대부분의 시간 동안 아무것도 하지 않습니다. 그것이 임무입니다. 당신이 감시하라고 지정한 항목 목록을 지켜봅니다. Telegram 채널의 키워드, 특정 채용 공고, Amazon의 가격. 감시자는 당신이 설정한 임계값을 실제로 넘는 움직임이 있을 때만 휴대폰으로 알림을 보냅니다. Haiku로 실행됩니다. 하루에 1센트 미만입니다.
살아남는 작업과 조용히 돈을 태우는 작업을 구분하는 세 가지 규칙: 검증은 느낌이 아닌 엄격한 규칙이어야 합니다. 작업은 시도한 것을 기억해야 합니다. 작업은 포기할 때를 알아야 합니다. 이 중 하나라도 건너뛰면 결과 대신 토큰 청구서를 받고 일어나게 됩니다.
계산
1하드웨어 (일회성) $130 ~ $4,1992전기세 $4 ~ $14 / 월3선택: 구독 하나 유지 $20 / 월
기존 구독 스택: 월 $412, 연간 $4,944.
최저가 진입 시 새 스택: 하드웨어 $130 + 연간 전기세 $96 + 유지 구독 연간 $240 = 첫해 $466, 이후 매년 $336. 상자 가격을 포함해 첫해부터 청구서의 90%를 할인받는 셈입니다. Mac Studio조차 월 $200짜리 구독 하나와 22개월에 손익분기점을 넘고, 그 후로는 10년 동안 순수한 절약입니다.
아무것도 사기 전에 먼저 체험해보세요
지금 당장, 아무 채팅에서, 프롬프트 하나만으로 작업을 느낄 수 있습니다:
1당신은 작업이 기준을 충족할 때까지 루프로 작업합니다.23작업: [정확히 무엇을 생성할지 설명]45성공 기준 (엄격함, 관대한 통과 없음):6- [기준 1]7- [기준 2]8- [기준 3]910루프 프로토콜, 매 턴마다 반복:111. 계획 - 다음 단계 하나를 명시합니다.122. 실행 - 작업을 생성하거나 개선합니다.133. 검증 - 각 기준을 1-10점으로 냉혹하게 평가합니다.144. 결정 - 모든 점수가 8점 이상이면 "최종"을 출력하고 중단합니다.15 그렇지 않으면 "반복 중"을 출력하고 가장 약한 부분을 수정합니다.1617모든 기준이 8점 이상이 될 때까지 완료라고 하지 마십시오.18질문하지 마십시오. 합리적인 가정을 하고 계속 진행하십시오.
초안을 작성하고, 스스로 평가하고, 약점을 찾고, 다시 쓰고, 반복합니다. 이것이 바로 한 문단으로 만든 작업입니다. 빠진 것은 중요한 부분입니다: 당신이 여전히 트리거라는 점입니다. 탭을 닫으면 사라집니다.
이런 작업을 일주일에 세 번 수동으로 실행한다면, 상자에 영구 자리를 얻을 자격이 있습니다. 두 번 이상 사용하지 않는다면, 어떤 하드웨어도 구해주지 못합니다.
이 순서대로 하세요
일반 채팅에서 수동 실행 하나를 안정적으로 만드세요. 그것을 스크립트로 바꾸세요. 스크립트를 실제 검증 게이트와 실제 중단 조건으로 감싸세요. 그런 다음에만 일정에 넣으세요. 순서를 건너뛰는 것은 정확히 작업이 잘못된 입력으로 밤새 실행되고 당신이 자는 동안 조용히 비용을 발생시키는 방법입니다.
요점
하루 23시간 동안 아무것도 하지 않는 집의 컴퓨터는 잘못된 기계였습니다. 당신만이 무엇을 할지 지시했기 때문에 유휴 상태였습니다. 올바른 기계는 기다리지 않습니다. 당신이 저녁 식사 중일 때, 자고 있을 때, 관련 없는 회의 중일 때 실행됩니다. 결과물은 아침에 휴대폰으로 나타나고, 당신은 그것으로 무엇을 할지 결정합니다.
$130 GPU에 들어갈 컴퓨팅 자원을 빌리는 것을 그만두세요. 상자를 사세요. 작업하는 동안 푹 주무세요.
이와 같은 더 많은 분석을 원하시면, 2~3일에 한 번씩 게시합니다.
Telegram — https://t.me/GipArcAI





