가장 저렴한 것은 $249이며, 7B 모델을 하루 종일 실행합니다
팔로우
@antisadh 하세요. 이번 달에 이런 콘텐츠가 4개 더 나옵니다. 팔로우를 놓치면 돈을 놓치는 겁니다.
토마스는 28세, 포르투에 살며, 핀테크 회사에서 QA 엔지니어로 일했습니다. 그러다 3월에 은행 앱을 열어보니 카드 잔고가 -€187이었습니다. 그는 ChatGPT Pro, Claude Code Max, Cursor, GitHub Copilot, Gemini Advanced에 매달 $459를 지불하고 있었고, 월세가 연체되기 전까지는 총액을 인지하지 못했습니다.
그는 그날 밤 OLX에서 중고 RTX 3090을 €680에 구매하고, $20짜리 ChatGPT Plus 하나만 남기고 모두 취소했습니다. 4개월 후, 그 카드는 구매 비용의 두 배를 벌어들였습니다. 이제 같은 GPU는 그가 잠든 동안 Vast.ai에서 스스로를 대여해 주며, 추가로 월 $520을 벌어들입니다.
그는 Claude Code Max가 제공하던 것보다 더 큰 모델을 로컬에서 실행합니다.
이것은 소수의 자랑이 아닙니다. Apple Store는 1분기에 Mac Mini가 물리적으로 품절되었는데, 이는 개발자들이 이를 홈 AI 서버로 전환하고 있었기 때문입니다. NVIDIA는 7B 모델을 로컬에서 실행하는 $249 개발자 키트를 출시했습니다. AMD의 CEO는 Claude Pro가 제공하는 것보다 더 큰 모델을 실행하는 $1,700 미니 PC에 직접 서명했습니다. 2024년에 합리적이었던 전체 구독 스택은 2026년 중반에 무너졌으며, 거의 아무도 이에 대해 명확히 이야기하지 않습니다.
파트 1
대부분의 개발자가 인지하지 못하는 연간 $5,508
대부분의 사람들은 AI 지출을 합산하지 않습니다. 구독료는 개별적으로는 작아 보이고 월별 카드 명세서 속에 숨어 있습니다.
2026년에 진지한 AI 사용자가 사용하는 스택:
1Claude Code Max (20x) $200/월 $2,400/년2ChatGPT Pro $200/월 $2,400/년3Gemini Advanced $20/월 $240/년4GitHub Copilot $19/월 $228/년5Cursor Pro $20/월 $240/년67헤비 유저 합계 $459/월 $5,508/년
연간 $5,508입니다. 다른 사람의 컴퓨터에서 실행되고, 데이터를 해당 서버로 보내며, 가장 필요할 때(월요일 아침, 금요일 저녁, 출시일) 정확히 속도 제한을 거는 소프트웨어를 위한 비용입니다.
아래 지도의 모든 장치는 이 반복 청구서를 일회성 하드웨어 구매와 월 $2~$9의 전기료로 전환합니다. 어떤 등급을 선택하든 계산 방식은 동일합니다:
11년 차: $5,508 절약 $249 ~ $1,700 지출 + $50 ~ $200 전기료22년 차: $11,016 절약 $100 전기료33년 차: $16,524 절약 $100 전기료
3년 차가 되면, 지도상의 가장 비싼 장치조차도 투자 비용의 6~10배를 회수합니다. 이는 파트 6의 임대 수익 경로를 고려하기 전의 이야기입니다.
파트 2
레벨 1: Jetson Orin Nano Super, $249, 진입점
젠슨 황이 말도 안 되는 가격에 발표한 제품입니다: $249에 전용 NVIDIA GPU가 탑재된, 카드 한 벌보다 작은 컴퓨터. 아마존에서 좋은 저녁 식사 값보다 싼 가격에 배송됩니다.
실행 가능한 모델: Llama 3.2 (3B), Mistral 7B, Gemma 2 (9B), DeepSeek R1 (1.5B), Qwen 2.5 (7B). 모두 무료, 모두 로컬, 모두 영원히. 7B 모델은 사람들이 일상적으로 ChatGPT Plus를 사용하는 작업의 약 80%를 처리합니다. 초안 작성, 요약, 코딩 스크립트, 빠른 Q&A.
처리하지 못하는 작업: 복잡한 다단계 추론, 8K 토큰 이상의 큰 컨텍스트 윈도우, 프론티어 모델 수준의 지능이 필요한 모든 것.
간략 사양: 8GB 통합 메모리, 67 TOPS AI 성능, 7~25W 전력 소모, 24/7 실행 시 월 전기료 약 $2. 단일 $20 ChatGPT Plus 구독 대비 손익분기점은 13개월. Claude Code Max 대비 손익분기점은 6주.
이 장치는 월 $20의 ChatGPT Plus를 사용하고 그만두고 싶은 사람을 위한 제품입니다.
파트 3
레벨 2: Mac Mini M4, $599, 기본 선택
Apple Store는 2026년 초에 Mac Mini가 품절되었는데, 이는 제품 출시 때문이 아니었습니다. 개발자들은 M4 칩 내부의 통합 메모리 아키텍처가 어떤 가격대에서든 구매할 수 있는 가장 효율적인 AI 추론 머신 중 하나라는 사실을 알아냈기 때문입니다.
두 가지 등급이 중요합니다:
1Mac Mini M4 $599 16GB 메모리, 8B 모델을 쾌적하게 실행2Mac Mini M4 Pro $1,399 48GB 메모리, 70B 모델을 로컬에서 실행
기본 $599 모델은 8B 파라미터 모델을 쾌적하게 실행합니다. $1,399 M4 Pro(48GB)는 Llama 3.3 70B를 실행하는데, 이는 현재 소비자 하드웨어에서 실행할 수 있는 GPT-4에 가장 가까운 모델입니다.
이것이 잘 작동하는 이유: 일반 PC에서는 데이터가 시스템 RAM과 GPU VRAM 사이를 지속적으로 복사하여 추론 속도를 저하시킵니다. Apple Silicon에서는 CPU와 GPU가 하나의 메모리 풀을 공유하므로 모델이 한 번 로드되고 두 프로세서가 동일한 위치에서 읽습니다. 이것이 $599 Mac Mini가 동일한 벤치마크에서 $1,500 Windows AI 머신을 능가하는 이유입니다.
한 개발자가 2026년 4월 XDA에서 전환 과정을 문서화했는데, Claude Pro를 Mac Mini M4 설정으로 대체하고 "생산성이 전혀 떨어지지 않았다"고 보고했습니다. $200/월 Claude Code Max 대비 손익분기점은 기본 모델 3개월, Pro 모델 7개월입니다.

파트 4
레벨 3: 중고 RTX 3090, $700, 최고의 가성비
지난 2년간 출시된 모든 GPU는 AI에 대해 동일한 결함이 있습니다: 메모리 부족. RTX 5090은 32GB에 $3,800입니다. RTX 4090은 24GB에 $2,000 이상입니다. 5년 된 RTX 3090도 24GB이며, eBay에서 중고로 $700입니다.
로컬 AI의 경우, 칩 세대보다 VRAM이 더 중요합니다. 2020년 카드(24GB)는 2024년 카드(12GB)를 항상 능가합니다. RTX 3090은 단순히 저렴할 뿐만 아니라, 이 특정 작업에서는 더 작은 최신 형제들보다 실질적으로 더 우수합니다.
이를 가치 있게 만드는 모델: Qwen 3.6 27B. 알리바바가 2026년 초에 조용히 출시했으며, 벤치마크 결과는 인터넷을 뒤흔들었습니다.
1벤치마크 Qwen 3.6 27B (무료, 로컬) Claude 4.5 Opus ($200/월)2RealWorldQA (비전) 84.1 77.03IFBench (명령어) 76.5 58.04AIME 2026 (수학) 91.3 93.35MMLU (지식) 83.2% ~82%
무료 로컬 실행 가능한 27B 모델이 Anthropic의 플래그십을 비전에서 7포인트, 명령어에서 18포인트 차이로 이겼습니다. 이 장치는 이미 PC를 보유하고 있고 카드만 추가하면 되는 사람을 위한 제품입니다. eBay에서 98% 이상의 피드백을 받은 판매자로부터 구매하고, 메모리 오류 확인을 위해 GPU-Z 스크린샷을 요청하며, "채굴 장비 출신"이라고 설명된 카드는 피하십시오.
Claude Code Max 대비 손익분기점은 3.5개월입니다. 그 후로는 카드가 물리적으로 고장날 때까지 순수한 절약이며, 3090의 경우 일반적으로 5~8년입니다.
파트 5
레벨 4: GMKtec EVO-X2, $1,700, 로컬 프론티어급
CES 2026에서 AMD의 CEO 리사 수는 뒤에 작은 검은색 상자를 두고 무대에 섰습니다. 몇 달 후, 상하이에서 열린 AMD AI 개발자 데이에서 그녀는 동일한 장치로 걸어가 직접 서명했습니다. 그 장치는 GMKtec EVO-X2입니다.
단일 실리콘에서 2000억 파라미터 모델을 실행할 수 있는 최초의 x86 칩입니다. Linux에서 최대 110GB의 사용 가능한 VRAM으로, Qwen3-235B를 완전하고 부드럽게 실행할 수 있으며, DeepSeek-V3 및 Llama 3.3 70B를 양자화 트릭 없이 실행할 수 있습니다.
1모델 필요 VRAM EVO-X2 결과2Qwen3-235B ~110GB 완전히, 부드럽게 실행3DeepSeek-V3 ~100GB 쾌적하게 실행4Llama 3.3 70B ~42GB 빠름, 여유 공간 충분5Qwen 3.6 27B ~16GB 매우 빠름, 일상용
CES에서 AMD의 자체 주장: 이 칩은 DeepSeek R1 추론에서 NVIDIA RTX 5080보다 3배 이상 뛰어난 성능을 보였습니다. 도시락 크기의 미니 PC가 $1,000 이상의 개별 그래픽 카드를 실제 AI 워크로드에서 능가한 것입니다.
이 장치는 AI 사용이 로컬에서 70B~235B 모델을 필요로 하는 사람, 즉 ChatGPT Pro와 Claude Code Max에 월 $200씩 지불하고 수요일까지 속도 제한에 도달하는 사람들을 위한 제품입니다. 손익분기점은 약 9~10개월입니다. 3년 동안 이 장치는 구독을 유지하는 것에 비해 약 $13,000를 절약합니다.
파트 6
레벨 5: 하드웨어를 활용하여 절약 대신 수익 창출
로컬에서 AI를 실행하는 동일한 하드웨어는 AI를 실행하는 다른 사람들에게 스스로를 대여할 수 있습니다. 암호화폐 채굴자들이 이를 가장 먼저 알아냈습니다. 이더리움 병합이 GPU 비트코인 채굴을 종료시킨 후, 그들은 장비를 AI 추론 렌탈 플랫폼으로 돌려 암호화폐 채굴보다 시간당 1.5~4배 더 많은 수익을 얻기 시작했습니다.
1GPU 채굴 ($/월) AI 렌탈 ($/월) 차이2RTX 3090 $40~90 $200~400 4~5배3RTX 4090 $80~150 $500~1,000 5~7배4RTX 5090 $120~200 $700~1,400 5~7배5A100 80GB 해당 없음 $1,200~2,500 해당 없음6H100 해당 없음 $2,500~5,000 해당 없음
이를 수행하는 플랫폼: Vast.ai, Clore.ai, io.net, RunPod, Akash, Salad. 이들은 15~25%를 수수료로 가져가고 나머지를 달러 또는 스테이블코인으로 지불합니다. 책상 위에 놓인 하나의 RTX 4090은 스스로를 대여하여 월 $500~$1,000를 창출합니다. 8개의 소규모 팜은 월 $4,000~$8,000를 창출하며, 암호화폐가 제공하지 못한 안정적인 현금 흐름을 제공합니다.
한때 TikTok에 넘쳐나던 채굴장은 더 이상 비트코인을 채굴하지 않습니다. 그들은 렌탈 플랫폼을 통해 ChatGPT, Claude, Gemini를 위한 AI 토큰을 파밍하고 있습니다. OpenAI와 Anthropic은 조용히 그 컴퓨팅 파워를 채굴장에서 저렴하게 구매하여 $200/월에 다시 판매합니다.
이미 4090을 소유하고 있거나 설정할 예산이 있다면, 이는 계산을 완전히 뒤집습니다. 월 $200를 절약하는 대신, 카드당 월 $400~$800를 벌게 됩니다.

파트 7
위의 모든 장치에서 실행되는 하나의 소프트웨어 스택
어떤 장치를 선택하든 소프트웨어 스택은 동일합니다. 이것은 로컬 AI가 이제 성숙했다는 가장 강력한 신호 중 하나입니다. 경쟁하는 5개의 도구가 아니라 모든 곳에서 작동하는 하나의 깔끔한 스택입니다.
1런타임: Ollama (무료, 오픈소스)2인터페이스: Open WebUI (브라우저 속의 개인 ChatGPT)3코딩 에이전트: 로컬 Ollama를 가리키는 Claude Code4모델: Qwen 3.6 27B, DeepSeek R1, Llama 3.3 70B,5 Mistral 7B, Gemma 2 9B
설정은 모든 장치에서 동일합니다. 하나의 명령으로 Ollama를 설치하고, RAM이 허용하는 가장 큰 모델을 가져온 후, Claude Code를 localhost로 지정합니다. 동일한 세 줄의 bash 명령이 $249 Jetson과 $1,700 EVO-X2에서 모두 작동합니다:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen3.6:27b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude
그게 전부입니다. 이제 Claude Code는 Anthropic의 서버 대신 로컬 모델과 통신하며, 동일한 명령어, 동일한 워크플로우, API 비용 제로, 속도 제한 제로, 네트워크 외부로 나가는 데이터 제로를 사용합니다.
파트 8
누가 무엇을 사야 하는가: 결정 트리
잘못된 장치는 이유를 모르고 구매하는 장치입니다. AI를 실제로 사용하는 방식에 맞게 장치를 선택하십시오:
1ChatGPT Plus에 월 $20 지불하는 경우 → Jetson Orin Nano $2492AI API에 월 $200 지불하는 경우 → Mac Mini M4 $5993헤비 Claude Code 사용자인 경우 → Mac Mini M4 Pro $1,3994 또는 RTX 3090 $7005200B+ 모델(프론티어 작업)이 필요한 경우 → GMKtec EVO-X2 $1,7006이미 4090이 장착된 게이밍 PC가 있는 경우 → Mac 건너뛰고, 카드 추가7절약 대신 수익 창출을 원하는 경우 → GPU 렌탈 팜 설정8최고의 가성비를 원하는 경우 → 기존 PC에 중고 RTX 30909설정 제로, 그냥 작동하기를 원하는 경우 → Mac Mini M410법률/의료 업무(프라이버시)를 하는 경우 → 모든 장치 가능, 모두 로컬
대부분의 사람들이 실제로 하게 되는 하이브리드 경로입니다. 로컬 하드웨어는 일상 작업의 80%를 무료로 처리합니다. 단일 $20/월 ChatGPT Plus 또는 Claude Pro 구독은 나머지 20%, 즉 모든 벤치마크 포인트가 중요한 진정으로 어려운 프론티어 수준 추론을 위해 유지됩니다. 총 월 비용: $459 대신 $23.
파트 9
토마스의 첫 6개월 결과
11개월 차: -$459 전체 구독 스택의 마지막 달22개월 차: -$680 OLX에서 중고 RTX 3090 구매33개월 차: +$41 ChatGPT Plus $20만 유지, $439 절약44개월 차: +$620 GPU를 Vast.ai에 등록, 첫 $580 렌탈 수익55개월 차: +$687 일관된 Vast 수익66개월 차: +$720 동일 설정, 자동 운영
복리 효과: 6개월 차에 GPU는 완전히 자체 비용을 회수했으며, 월 $459의 구독료를 대체하고 추가로 월 $500~$700의 렌탈 수익을 창출합니다. 1개월 차에서 6개월 차까지의 총 변화는 동일한 하드웨어가 모든 작업을 수행하는 상태에서 그에게 유리한 월 $1,179입니다.
12개월 동안 구독 스택을 유지하는 것과 비교하여 현금 흐름 차이는 $14,148입니다. 3년 동안은 $42,000입니다. 단 하나의 €680 중고 카드에서 나온 결과입니다.

파트 10
기회의 창
6개월 전만 해도 이 글은 불가능했을 것입니다. 모델이 충분히 작지 않았고, 하드웨어가 충분히 저렴하지 않았으며, 구독료가 충분히 비싸지 않았고, 오픈소스가 충분히 신뢰할 수 없었습니다. 이 네 가지 모두가 2025년 말과 2026년 중반 사이에 동시에 바뀌었습니다.
지난 3년 동안 AI를 구축한 회사들은 항상 자사의 데이터 센터가 필요할 것이라고 가정했습니다. 그 가정은 깨졌습니다. $249 상자는 7B 모델을 실행합니다. $599 Mac Mini는 14B 모델을 실행합니다. $700 중고 GPU는 비전 벤치마크에서 Claude를 능가하는 모델을 실행합니다. $1,700 미니 PC는 2350억 파라미터를 로컬에서 실행합니다. 데이터 센터가 거실로 들어왔습니다.
가장 비싼 옵션을 선택할 필요는 없습니다. 이들 중 어떤 것을 사용하기 위해 개발자일 필요도 없습니다. 설정은 세 가지 명령어입니다. 소프트웨어는 무료입니다. 전기료는 한 달에 커피 한 잔 값보다 적습니다.
로컬 하드웨어가 따라잡을 수 없었을 때는 구독이 합리적이었습니다. 하드웨어가 따라잡았습니다. 자신의 레벨을 선택하고 다른 사람의 컴퓨팅 파워에 대한 비용 지불을 중단하십시오.
이 글은 아무도 제대로 이야기하지 않는 AI 수익원과 비용 절감에 대한 진행 중인 시리즈의 6부였습니다. 7부는 다음 주에 공개되며, GPU 렌탈 팜 설정을 분석합니다: 카드 8개, 아파트 하나, 월 $4,000~8,000의 수동적 AI 컴퓨트 렌탈 수익.
/팔로우 @antisadh 하시면 공개 당일 피드에 표시됩니다/





