最も安いのは $249、7B モデルを終日稼働
フォロー
@antisadh をお願いします。今月、あと 4 回の情報公開を予定しています。フォローを逃すと、チャンスを逃します。
トマスは 28 歳、ポルト在住。フィンテック企業で QA エンジニアとして働いていましたが、3 月に銀行アプリを開くと、カード残高が -187 ユーロになっていました。ChatGPT Pro、Claude Code Max、Cursor、GitHub Copilot、Gemini Advanced に毎月 $459 を支払っており、家賃の引き落としができなくなるまでその総額に気づかなかったのです。
彼はその夜、OLX で中古の RTX 3090 を €680 で購入。$20 の ChatGPT Plus 1 つ以外のサブスクリプションをすべて解約し、4 か月後にはそのカードは購入代金の 2 倍以上を回収していました。現在、同じ GPU は就寝中に Vast.ai でレンタルされ、さらに月 $520 の追加収入を生み出しています。
彼は Claude Code Max が提供していたものよりも大規模なモデルをローカルで実行しています。
これはニッチな自慢話ではありません。Apple Store では第 1 四半期に Mac Mini が物理的に品切れになりました。開発者がそれを自宅の AI サーバーに改造していたからです。NVIDIA は $249 の開発者キットを発表し、7B モデルをローカルで実行可能にしました。AMD の CEO は自ら $1,700 のミニ PC にサインを入れましたが、これは Claude Pro が提供するものよりも大規模なモデルを実行できます。2024 年に理にかなっていたサブスクリプションのスタックは 2026 年半ばまでに崩壊し、そのことを明確に語る人はほとんどいません。
パート 1
開発者が気づいていない年間 $5,508 の出費
ほとんどの人は AI への支出を合計していません。サブスクリプションは個別には小さく見え、毎月のカード明細に紛れ込んでいます。
2026 年に本格的な AI ユーザーが利用するスタック:
1Claude Code Max (20x) $200/月 $2,400/年2ChatGPT Pro $200/月 $2,400/年3Gemini Advanced $20/月 $240/年4GitHub Copilot $19/月 $228/年5Cursor Pro $20/月 $240/年67ヘビーユーザー合計 $459/月 $5,508/年
年間 $5,508。他人のコンピューターで動作し、あなたのデータを彼らのサーバーに送信し、最も必要とするタイミング(月曜の朝、金曜の夕方、ローンチ日)に正確にレート制限をかけるソフトウェアに対して。
下のマップにあるすべてのデバイスは、その毎月の請求を、一度限りのハードウェア購入と月々 $2 ~ $9 の電気代に変えます。どの層を選んでも計算式は同じです:
11 年目: $5,508 節約 $249 ~ $1,700 支出 + $50 ~ $200 電気代22 年目: $11,016 節約 $100 電気代33 年目: $16,524 節約 $100 電気代
3 年目までには、マップ上の最も高価なデバイスでさえ、6 倍から 10 倍以上の投資回収が完了します。これはパート 6 で説明するレンタル収入の可能性を考慮する前の話です。
パート 2
レベル 1: Jetson Orin Nano Super、$249、エントリーポイント
ジェンセン・フアンは、ありえない価格でこれを発表しました。$249 で、トランプカードより小さい専用 NVIDIA GPU を搭載したコンピューター。Amazon から、素敵なディナーより安い価格で出荷されます。
実行可能なモデル:Llama 3.2 (3B)、Mistral 7B、Gemma 2 (9B)、DeepSeek R1 (1.5B)、Qwen 2.5 (7B)。すべて無料、すべてローカル、すべて永久に。7B モデルは、人々が日常的に ChatGPT Plus を使用する目的の約 80% を処理できます。下書き、要約、コーディングスクリプト、簡単な Q&A。
処理できないもの:複雑なマルチステップ推論、8K トークンを超える大規模コンテキストウィンドウ、フロンティアモデルのインテリジェンスを必要とするもの。
スペック概要:8GB ユニファイドメモリ、67 TOPS AI パフォーマンス、7 ~ 25W 消費電力、24 時間 365 日稼働で月々約 $2 の電気代。単一の $20 ChatGPT Plus サブスクリプションに対する損益分岐点は 13 か月。Claude Code Max に対する損益分岐点は 6 週間。
これは、月 $20 の ChatGPT Plus を支払っていて、単にそれをやめたいと考えている人向けのデバイスです。
パート 3
レベル 2: Mac Mini M4、$599、デフォルトの選択肢
Apple Store は 2026 年初頭に Mac Mini を品切れにしましたが、それは製品発表のためではありませんでした。開発者は、M4 チップ内部のユニファイドメモリアーキテクチャが、どんな価格帯でも購入できる最も効率的な AI 推論マシンの 1 つであることを理解したのです。
重要な 2 つのグレード:
1Mac Mini M4 $599 16GB メモリ、8B モデルを快適に実行2Mac Mini M4 Pro $1,399 48GB メモリ、70B モデルをローカル実行
ベースの $599 モデルは 8B パラメータモデルを快適に実行します。$1,399 の M4 Pro(48GB)は Llama 3.3 70B を実行します。これは、現在コンシューマーハードウェアで実行できる GPT-4 に最も近いものです。
これが非常にうまく機能する理由:通常の PC では、データはシステム RAM と GPU VRAM の間で常にコピーされ、推論速度が低下します。Apple Silicon では CPU と GPU が 1 つのメモリプールを共有するため、モデルは 1 回ロードされ、両方のプロセッサが同じ場所から読み取ります。これが、$599 の Mac Mini が同じベンチマークで $1,500 の Windows AI マシンを凌駕する理由です。
ある開発者は 2026 年 4 月に XDA でこの切り替えを文書化し、Claude Pro を Mac Mini M4 セットアップに置き換え、「生産性はまったく低下しなかった」と報告しました。月 $200 の Claude Code Max に対する損益分岐点は、ベースモデルで 3 か月、Pro で 7 か月です。

パート 4
レベル 3: 中古 RTX 3090、$700、最高のコストパフォーマンス
過去 2 年間にリリースされたすべての GPU には、AI にとって同じ欠点があります。メモリ不足です。RTX 5090 は 32GB で $3,800。RTX 4090 は 24GB で $2,000 以上。5 年前の RTX 3090 も 24GB で、eBay で中古 $700。
ローカル AI にとって、VRAM はチップ世代よりも重要です。2020 年の 24GB カードは、2024 年の 12GB カードに常に勝ります。RTX 3090 は単に安いだけでなく、この特定のジョブにおいて、より新しい小型の兄弟機種よりも積極的に優れています。
これを価値あるものにするモデル:Qwen 3.6 27B。Alibaba は 2026 年初頭に静かにこれをリリースし、ベンチマークはインターネットを震撼させました。
1ベンチマーク Qwen 3.6 27B (無料、ローカル) Claude 4.5 Opus ($200/月)2RealWorldQA (ビジョン) 84.1 77.03IFBench (指示) 76.5 58.04AIME 2026 (数学) 91.3 93.35MMLU (知識) 83.2% ~82%
無料でローカル実行可能な 27B モデルが、Anthropic のフラッグシップをビジョンで 7 ポイント、指示で 18 ポイント上回っています。これは、すでに PC を持っていて、カードを追加するだけでいい人向けのデバイスです。98% 以上のフィードバック評価の eBay 販売者から購入し、GPU-Z のスクリーンショットを依頼してメモリエラーを確認し、「マイニングリグからの出品」と説明されているカードは避けてください。
Claude Code Max に対する損益分岐点は 3.5 か月。その後、カードは物理的に故障するまで純粋な節約になります。3090 の場合、通常 5 ~ 8 年です。
パート 5
レベル 4: GMKtec EVO-X2、$1,700、フロンティア級をローカルで
CES 2026 で、AMD の CEO リサ・スーは、背後に小さな黒い箱を置いてステージに立ちました。数か月後、上海での AMD AI デベロッパーデーで、彼女は同じデバイスに歩み寄り、自らサインをしました。そのデバイスが GMKtec EVO-X2 です。
これは、単一のシリコン上で 2000 億パラメータモデルを実行できる初の x86 チップです。Linux 上で最大 110GB の使用可能な VRAM を備え、量子化トリックなしで Qwen3-235B を完全かつスムーズに実行でき、DeepSeek-V3 や Llama 3.3 70B も実行できます。
1モデル 必要 VRAM EVO-X2 での結果2Qwen3-235B ~110GB 完全、スムーズに実行3DeepSeek-V3 ~100GB 快適に実行4Llama 3.3 70B ~42GB 高速、余裕あり5Qwen 3.6 27B ~16GB 非常に高速、日常使いに最適
CES での AMD 自身の主張:このチップは、DeepSeek R1 推論において NVIDIA RTX 5080 を 3 倍以上上回りました。ランチボックスサイズのミニ PC が、実際の AI ワークロードで $1,000 以上のディスクリートグラフィックスカードを打ち負かすのです。
これは、AI の使用において 70B から 235B モデルをローカルで実行する必要がある人向けのデバイスです。つまり、ChatGPT Pro と Claude Code Max を合わせて月 $200 を支払い、水曜日までにレート制限に達してしまう人々です。損益分岐点は約 9 ~ 10 か月。3 年間で、サブスクリプションに留まる場合と比較して約 $13,000 の節約になります。
パート 6
レベル 5: ハードウェアを活用して、節約ではなく収入を得る
ローカルで AI を実行するのと同じハードウェアが、AI を実行している他の人にレンタルできます。暗号通貨マイナーが最初にこれを発見しました。イーサリアムのマージが GPU によるビットコインマイニングを事実上終わらせた後、彼らはリグを AI 推論レンタルプラットフォームに向け、暗号通貨マイニングで得ていた時給の 1.5 倍から 4 倍を稼ぎ始めました。
1GPU マイニング ($/月) AI レンタル ($/月) 差2RTX 3090 $40 ~ 90 $200 ~ 400 4~5 倍3RTX 4090 $80 ~ 150 $500 ~ 1,000 5~7 倍4RTX 5090 $120 ~ 200 $700 ~ 1,400 5~7 倍5A100 80GB n/a $1,200 ~ 2,500 n/a6H100 n/a $2,500 ~ 5,000 n/a
これを実現しているプラットフォーム:Vast.ai、Clore.ai、io.net、RunPod、Akash、Salad。彼らは 15 ~ 25% を取り、残りをドルまたはステーブルコインで支払います。机の上にある 1 枚の RTX 4090 は、レンタルで月 $500 ~ $1,000 を生み出します。8 枚の小規模ファームは、暗号通貨が決して提供しなかった安定したキャッシュフローで、月 $4,000 ~ $8,000 を稼ぎ出します。
かつて TikTok 中にあったマイニングファームは、もはやビットコインをマイニングしていません。レンタルプラットフォームを通じて、ChatGPT、Claude、Gemini 向けの AI トークンを生成しています。OpenAI と Anthropic は、その計算リソースをファームから静かに安く購入し、月 $200 で顧客に販売しているのです。
すでに 4090 を所有しているか、セットアップする予算がある場合、これにより計算式が完全に変わります。月 $200 を節約する代わりに、カード 1 枚あたり月 $400 ~ $800 を稼ぎます。

パート 7
上記すべてのデバイスで動作する単一のソフトウェアスタック
どのデバイスを選んでも、ソフトウェアスタックは同じです。これは、ローカル AI が今や成熟していることを示す最も強力なシグナルの 1 つです。競合する 5 つのツールではなく、どこでも動作する 1 つのクリーンなスタックです。
1ランタイム: Ollama (無料、オープンソース)2インターフェース: Open WebUI (ブラウザ内のプライベート ChatGPT)3コーディングエージェント: Claude Code をローカルの Ollama に指定4モデル: Qwen 3.6 27B、DeepSeek R1、Llama 3.3 70B、5 Mistral 7B、Gemma 2 9B
セットアップはすべてのデバイスで同じです。1 つのコマンドで Ollama をインストールし、RAM が許す最大のモデルをプルし、Claude Code を localhost に向けます。同じ 3 行の bash が、$249 の Jetson でも $1,700 の EVO-X2 でも動作します:
1curl -fsSL https://ollama.com/install.sh | sh2ollama pull qwen3.6:27b3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude
これだけです。Claude Code は Anthropic のサーバーではなくローカルモデルと通信し、同じコマンド、同じワークフローを使用し、API コストはゼロ、レート制限はゼロ、データがネットワーク外に出ることはありません。
パート 8
誰が何を買うべきか:決定木
間違ったデバイスとは、理由を知らずに購入するデバイスです。AI の実際の使用方法にデバイスを合わせてください:
1月 $20 の ChatGPT Plus を支払っている場合 → Jetson Orin Nano $2492AI API に月 $200 支払っている場合 → Mac Mini M4 $5993ヘビーな Claude Code ユーザーの場合 → Mac Mini M4 Pro $1,3994 または RTX 3090 $7005200B+ モデル(フロンティア作業)が必要な場合 → GMKtec EVO-X2 $1,7006すでに 4090 搭載のゲーミング PC を持っている場合 → Mac はスキップ、カード追加7節約ではなく収入を得たい場合 → GPU レンタルファーム構築8コストパフォーマンスを最大化したい場合 → 既存 PC に中古 RTX 30909ゼロセットアップ、すぐに使いたい場合 → Mac Mini M410法律/医療業務(プライバシー)の場合 → どのデバイスでも可、すべてローカル
ほとんどの人が実際に行うのはハイブリッドな方法です。ローカルハードウェアは日常的なタスクの 80% を無料で処理します。月 $20 の ChatGPT Plus または Claude Pro サブスクリプション 1 つは、残りの 20%、つまりすべてのベンチマークポイントが重要となる本当に難しいフロンティアレベルの推論のために残しておきます。月々の総コスト:$23。$459 の代わりに。
パート 9
トマスの最初の 6 か月の結果
11 か月目: -$459 フルサブスクリプションスタックの最後の月22 か月目: -$680 OLX で中古 RTX 3090 を購入33 か月目: +$41 ChatGPT Plus $20 のみ維持、$439 節約44 か月目: +$620 GPU を Vast.ai に出品、初回 $580 レンタル55 か月目: +$687 安定した Vast 収入66 か月目: +$720 同じセットアップ、放置
複利効果:6 か月目で GPU は完全に元が取れ、月 $459 のサブスクリプションを置き換え、さらに月 $500 ~ $700 のレンタル収入を生み出しています。1 か月目から 6 か月目までのトータルの変化は、同じハードウェアがすべての作業を行う中で、彼にとって月 $1,179 のプラスです。
12 か月間の差は、サブスクリプションスタックに留まる場合と比較して、キャッシュフローで $14,148 です。3 年間では $42,000。たった 1 枚の €680 の中古カードから。

パート 10
チャンスの窓
6 か月前、この記事は不可能でした。モデルは十分に小さくなく、ハードウェアは十分に安くなく、サブスクリプションは十分に高くなく、オープンソースは十分に信頼できませんでした。2025 年後半から 2026 年半ばにかけて、これら 4 つすべてが同時に変化しました。
過去 3 年間 AI を構築してきた企業は、常に自社のデータセンターが必要であると想定していました。その想定は崩れました。$249 のボックスが 7B モデルを実行します。$599 の Mac Mini が 14B モデルを実行します。$700 の中古 GPU が、ビジョンベンチマークで Claude を凌駕するモデルを実行します。$1,700 のミニ PC が 2350 億パラメータをローカルで実行します。データセンターがリビングルームに移動しました。
最も高価なオプションを選ぶ必要はありません。どれを使うにも開発者である必要はありません。セットアップは 3 つのコマンドです。ソフトウェアは無料です。電気代は月々のコーヒー代よりも安いです。
ローカルハードウェアが追いつかなかったとき、サブスクリプションは理にかなっていました。ハードウェアは追いつきました。自分のレベルを選び、他人の計算リソースにお金を払うのをやめましょう。
これは、誰も適切に語っていない AI 収入源とコスト削減に関する進行中のシリーズのパート 6 でした。パート 7 は来週公開され、GPU レンタルファームのセットアップを詳しく解説します:8 枚のカード、1 つのアパート、月 $4,000 ~ $8,000 のパッシブ AI コンピュートレンタル。
/フォロー @antisadh して、公開日にあなたのフィードに届くようにしましょう/





