サブスクリプションを卒業する：ローカル AI 実行に最適なハードウェア 5 選

最も安いのは $249、7B モデルを終日稼働

フォロー
@antisadh をお願いします。今月、あと 4 回の情報公開を予定しています。フォローを逃すと、チャンスを逃します。

トマスは 28 歳、ポルト在住。フィンテック企業で QA エンジニアとして働いていましたが、3 月に銀行アプリを開くと、カード残高が -187 ユーロになっていました。ChatGPT Pro、Claude Code Max、Cursor、GitHub Copilot、Gemini Advanced に毎月 $459 を支払っており、家賃の引き落としができなくなるまでその総額に気づかなかったのです。

彼はその夜、OLX で中古の RTX 3090 を €680 で購入。$20 の ChatGPT Plus 1 つ以外のサブスクリプションをすべて解約し、4 か月後にはそのカードは購入代金の 2 倍以上を回収していました。現在、同じ GPU は就寝中に Vast.ai でレンタルされ、さらに月 $520 の追加収入を生み出しています。

彼は Claude Code Max が提供していたものよりも大規模なモデルをローカルで実行しています。

これはニッチな自慢話ではありません。Apple Store では第 1 四半期に Mac Mini が物理的に品切れになりました。開発者がそれを自宅の AI サーバーに改造していたからです。NVIDIA は $249 の開発者キットを発表し、7B モデルをローカルで実行可能にしました。AMD の CEO は自ら $1,700 のミニ PC にサインを入れましたが、これは Claude Pro が提供するものよりも大規模なモデルを実行できます。2024 年に理にかなっていたサブスクリプションのスタックは 2026 年半ばまでに崩壊し、そのことを明確に語る人はほとんどいません。

パート 1

開発者が気づいていない年間 $5,508 の出費

ほとんどの人は AI への支出を合計していません。サブスクリプションは個別には小さく見え、毎月のカード明細に紛れ込んでいます。

2026 年に本格的な AI ユーザーが利用するスタック：

text

1Claude Code Max (20x)   $200/月   $2,400/年
2ChatGPT Pro             $200/月   $2,400/年
3Gemini Advanced         $20/月    $240/年
4GitHub Copilot          $19/月    $228/年
5Cursor Pro              $20/月    $240/年
6
7ヘビーユーザー合計      $459/月   $5,508/年

年間 $5,508。他人のコンピューターで動作し、あなたのデータを彼らのサーバーに送信し、最も必要とするタイミング（月曜の朝、金曜の夕方、ローンチ日）に正確にレート制限をかけるソフトウェアに対して。

下のマップにあるすべてのデバイスは、その毎月の請求を、一度限りのハードウェア購入と月々 $2 ～ $9 の電気代に変えます。どの層を選んでも計算式は同じです：

text

11 年目:  $5,508 節約   $249 ～ $1,700 支出 + $50 ～ $200 電気代
22 年目:  $11,016 節約  $100 電気代
33 年目:  $16,524 節約  $100 電気代

3 年目までには、マップ上の最も高価なデバイスでさえ、6 倍から 10 倍以上の投資回収が完了します。これはパート 6 で説明するレンタル収入の可能性を考慮する前の話です。

パート 2

レベル 1: Jetson Orin Nano Super、$249、エントリーポイント

ジェンセン・フアンは、ありえない価格でこれを発表しました。$249 で、トランプカードより小さい専用 NVIDIA GPU を搭載したコンピューター。Amazon から、素敵なディナーより安い価格で出荷されます。

実行可能なモデル：Llama 3.2 (3B)、Mistral 7B、Gemma 2 (9B)、DeepSeek R1 (1.5B)、Qwen 2.5 (7B)。すべて無料、すべてローカル、すべて永久に。7B モデルは、人々が日常的に ChatGPT Plus を使用する目的の約 80% を処理できます。下書き、要約、コーディングスクリプト、簡単な Q&A。

処理できないもの：複雑なマルチステップ推論、8K トークンを超える大規模コンテキストウィンドウ、フロンティアモデルのインテリジェンスを必要とするもの。

スペック概要：8GB ユニファイドメモリ、67 TOPS AI パフォーマンス、7 ～ 25W 消費電力、24 時間 365 日稼働で月々約 $2 の電気代。単一の $20 ChatGPT Plus サブスクリプションに対する損益分岐点は 13 か月。Claude Code Max に対する損益分岐点は 6 週間。

これは、月 $20 の ChatGPT Plus を支払っていて、単にそれをやめたいと考えている人向けのデバイスです。

パート 3

レベル 2: Mac Mini M4、$599、デフォルトの選択肢

Apple Store は 2026 年初頭に Mac Mini を品切れにしましたが、それは製品発表のためではありませんでした。開発者は、M4 チップ内部のユニファイドメモリアーキテクチャが、どんな価格帯でも購入できる最も効率的な AI 推論マシンの 1 つであることを理解したのです。

重要な 2 つのグレード：

text

1Mac Mini M4        $599     16GB メモリ、8B モデルを快適に実行
2Mac Mini M4 Pro    $1,399   48GB メモリ、70B モデルをローカル実行

ベースの $599 モデルは 8B パラメータモデルを快適に実行します。$1,399 の M4 Pro（48GB）は Llama 3.3 70B を実行します。これは、現在コンシューマーハードウェアで実行できる GPT-4 に最も近いものです。

これが非常にうまく機能する理由：通常の PC では、データはシステム RAM と GPU VRAM の間で常にコピーされ、推論速度が低下します。Apple Silicon では CPU と GPU が 1 つのメモリプールを共有するため、モデルは 1 回ロードされ、両方のプロセッサが同じ場所から読み取ります。これが、$599 の Mac Mini が同じベンチマークで $1,500 の Windows AI マシンを凌駕する理由です。

ある開発者は 2026 年 4 月に XDA でこの切り替えを文書化し、Claude Pro を Mac Mini M4 セットアップに置き換え、「生産性はまったく低下しなかった」と報告しました。月 $200 の Claude Code Max に対する損益分岐点は、ベースモデルで 3 か月、Pro で 7 か月です。

パート 4

レベル 3: 中古 RTX 3090、$700、最高のコストパフォーマンス

過去 2 年間にリリースされたすべての GPU には、AI にとって同じ欠点があります。メモリ不足です。RTX 5090 は 32GB で $3,800。RTX 4090 は 24GB で $2,000 以上。5 年前の RTX 3090 も 24GB で、eBay で中古 $700。

ローカル AI にとって、VRAM はチップ世代よりも重要です。2020 年の 24GB カードは、2024 年の 12GB カードに常に勝ります。RTX 3090 は単に安いだけでなく、この特定のジョブにおいて、より新しい小型の兄弟機種よりも積極的に優れています。

これを価値あるものにするモデル：Qwen 3.6 27B。Alibaba は 2026 年初頭に静かにこれをリリースし、ベンチマークはインターネットを震撼させました。

text

1ベンチマーク               Qwen 3.6 27B (無料、ローカル)   Claude 4.5 Opus ($200/月)
2RealWorldQA (ビジョン)     84.1                          77.0
3IFBench (指示)             76.5                          58.0
4AIME 2026 (数学)           91.3                          93.3
5MMLU (知識)                83.2%                         ~82%

無料でローカル実行可能な 27B モデルが、Anthropic のフラッグシップをビジョンで 7 ポイント、指示で 18 ポイント上回っています。これは、すでに PC を持っていて、カードを追加するだけでいい人向けのデバイスです。98% 以上のフィードバック評価の eBay 販売者から購入し、GPU-Z のスクリーンショットを依頼してメモリエラーを確認し、「マイニングリグからの出品」と説明されているカードは避けてください。

Claude Code Max に対する損益分岐点は 3.5 か月。その後、カードは物理的に故障するまで純粋な節約になります。3090 の場合、通常 5 ～ 8 年です。

パート 5

レベル 4: GMKtec EVO-X2、$1,700、フロンティア級をローカルで

CES 2026 で、AMD の CEO リサ・スーは、背後に小さな黒い箱を置いてステージに立ちました。数か月後、上海での AMD AI デベロッパーデーで、彼女は同じデバイスに歩み寄り、自らサインをしました。そのデバイスが GMKtec EVO-X2 です。

これは、単一のシリコン上で 2000 億パラメータモデルを実行できる初の x86 チップです。Linux 上で最大 110GB の使用可能な VRAM を備え、量子化トリックなしで Qwen3-235B を完全かつスムーズに実行でき、DeepSeek-V3 や Llama 3.3 70B も実行できます。

text

1モデル           必要 VRAM    EVO-X2 での結果
2Qwen3-235B       ~110GB       完全、スムーズに実行
3DeepSeek-V3      ~100GB       快適に実行
4Llama 3.3 70B    ~42GB        高速、余裕あり
5Qwen 3.6 27B     ~16GB        非常に高速、日常使いに最適

CES での AMD 自身の主張：このチップは、DeepSeek R1 推論において NVIDIA RTX 5080 を 3 倍以上上回りました。ランチボックスサイズのミニ PC が、実際の AI ワークロードで $1,000 以上のディスクリートグラフィックスカードを打ち負かすのです。

これは、AI の使用において 70B から 235B モデルをローカルで実行する必要がある人向けのデバイスです。つまり、ChatGPT Pro と Claude Code Max を合わせて月 $200 を支払い、水曜日までにレート制限に達してしまう人々です。損益分岐点は約 9 ～ 10 か月。3 年間で、サブスクリプションに留まる場合と比較して約 $13,000 の節約になります。

パート 6

レベル 5: ハードウェアを活用して、節約ではなく収入を得る

ローカルで AI を実行するのと同じハードウェアが、AI を実行している他の人にレンタルできます。暗号通貨マイナーが最初にこれを発見しました。イーサリアムのマージが GPU によるビットコインマイニングを事実上終わらせた後、彼らはリグを AI 推論レンタルプラットフォームに向け、暗号通貨マイニングで得ていた時給の 1.5 倍から 4 倍を稼ぎ始めました。

text

1GPU             マイニング ($/月)   AI レンタル ($/月)   差
2RTX 3090        $40 ～ 90          $200 ～ 400          4～5 倍
3RTX 4090        $80 ～ 150         $500 ～ 1,000        5～7 倍
4RTX 5090        $120 ～ 200        $700 ～ 1,400        5～7 倍
5A100 80GB       n/a                $1,200 ～ 2,500      n/a
6H100            n/a                $2,500 ～ 5,000      n/a

これを実現しているプラットフォーム：Vast.ai、Clore.ai、io.net、RunPod、Akash、Salad。彼らは 15 ～ 25% を取り、残りをドルまたはステーブルコインで支払います。机の上にある 1 枚の RTX 4090 は、レンタルで月 $500 ～ $1,000 を生み出します。8 枚の小規模ファームは、暗号通貨が決して提供しなかった安定したキャッシュフローで、月 $4,000 ～ $8,000 を稼ぎ出します。

かつて TikTok 中にあったマイニングファームは、もはやビットコインをマイニングしていません。レンタルプラットフォームを通じて、ChatGPT、Claude、Gemini 向けの AI トークンを生成しています。OpenAI と Anthropic は、その計算リソースをファームから静かに安く購入し、月 $200 で顧客に販売しているのです。

すでに 4090 を所有しているか、セットアップする予算がある場合、これにより計算式が完全に変わります。月 $200 を節約する代わりに、カード 1 枚あたり月 $400 ～ $800 を稼ぎます。

パート 7

上記すべてのデバイスで動作する単一のソフトウェアスタック

どのデバイスを選んでも、ソフトウェアスタックは同じです。これは、ローカル AI が今や成熟していることを示す最も強力なシグナルの 1 つです。競合する 5 つのツールではなく、どこでも動作する 1 つのクリーンなスタックです。

text

1ランタイム:      Ollama (無料、オープンソース)
2インターフェース: Open WebUI (ブラウザ内のプライベート ChatGPT)
3コーディングエージェント: Claude Code をローカルの Ollama に指定
4モデル:         Qwen 3.6 27B、DeepSeek R1、Llama 3.3 70B、
5                Mistral 7B、Gemma 2 9B

セットアップはすべてのデバイスで同じです。1 つのコマンドで Ollama をインストールし、RAM が許す最大のモデルをプルし、Claude Code を localhost に向けます。同じ 3 行の bash が、$249 の Jetson でも $1,700 の EVO-X2 でも動作します：

bash

1curl -fsSL https://ollama.com/install.sh | sh
2ollama pull qwen3.6:27b
3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

これだけです。Claude Code は Anthropic のサーバーではなくローカルモデルと通信し、同じコマンド、同じワークフローを使用し、API コストはゼロ、レート制限はゼロ、データがネットワーク外に出ることはありません。

パート 8

誰が何を買うべきか：決定木

間違ったデバイスとは、理由を知らずに購入するデバイスです。AI の実際の使用方法にデバイスを合わせてください：

text

1月 $20 の ChatGPT Plus を支払っている場合         → Jetson Orin Nano  $249
2AI API に月 $200 支払っている場合                  → Mac Mini M4       $599
3ヘビーな Claude Code ユーザーの場合                → Mac Mini M4 Pro   $1,399
4                                                    または RTX 3090    $700
5200B+ モデル（フロンティア作業）が必要な場合       → GMKtec EVO-X2     $1,700
6すでに 4090 搭載のゲーミング PC を持っている場合   → Mac はスキップ、カード追加
7節約ではなく収入を得たい場合                       → GPU レンタルファーム構築
8コストパフォーマンスを最大化したい場合             → 既存 PC に中古 RTX 3090
9ゼロセットアップ、すぐに使いたい場合               → Mac Mini M4
10法律/医療業務（プライバシー）の場合                → どのデバイスでも可、すべてローカル

ほとんどの人が実際に行うのはハイブリッドな方法です。ローカルハードウェアは日常的なタスクの 80% を無料で処理します。月 $20 の ChatGPT Plus または Claude Pro サブスクリプション 1 つは、残りの 20%、つまりすべてのベンチマークポイントが重要となる本当に難しいフロンティアレベルの推論のために残しておきます。月々の総コスト：$23。$459 の代わりに。

パート 9

トマスの最初の 6 か月の結果

text

11 か月目:  -$459    フルサブスクリプションスタックの最後の月
22 か月目:  -$680    OLX で中古 RTX 3090 を購入
33 か月目:  +$41     ChatGPT Plus $20 のみ維持、$439 節約
44 か月目:  +$620    GPU を Vast.ai に出品、初回 $580 レンタル
55 か月目:  +$687    安定した Vast 収入
66 か月目:  +$720    同じセットアップ、放置

複利効果：6 か月目で GPU は完全に元が取れ、月 $459 のサブスクリプションを置き換え、さらに月 $500 ～ $700 のレンタル収入を生み出しています。1 か月目から 6 か月目までのトータルの変化は、同じハードウェアがすべての作業を行う中で、彼にとって月 $1,179 のプラスです。

12 か月間の差は、サブスクリプションスタックに留まる場合と比較して、キャッシュフローで $14,148 です。3 年間では $42,000。たった 1 枚の €680 の中古カードから。

パート 10

チャンスの窓

6 か月前、この記事は不可能でした。モデルは十分に小さくなく、ハードウェアは十分に安くなく、サブスクリプションは十分に高くなく、オープンソースは十分に信頼できませんでした。2025 年後半から 2026 年半ばにかけて、これら 4 つすべてが同時に変化しました。

過去 3 年間 AI を構築してきた企業は、常に自社のデータセンターが必要であると想定していました。その想定は崩れました。$249 のボックスが 7B モデルを実行します。$599 の Mac Mini が 14B モデルを実行します。$700 の中古 GPU が、ビジョンベンチマークで Claude を凌駕するモデルを実行します。$1,700 のミニ PC が 2350 億パラメータをローカルで実行します。データセンターがリビングルームに移動しました。

最も高価なオプションを選ぶ必要はありません。どれを使うにも開発者である必要はありません。セットアップは 3 つのコマンドです。ソフトウェアは無料です。電気代は月々のコーヒー代よりも安いです。

ローカルハードウェアが追いつかなかったとき、サブスクリプションは理にかなっていました。ハードウェアは追いつきました。自分のレベルを選び、他人の計算リソースにお金を払うのをやめましょう。

これは、誰も適切に語っていない AI 収入源とコスト削減に関する進行中のシリーズのパート 6 でした。パート 7 は来週公開され、GPU レンタルファームのセットアップを詳しく解説します：8 枚のカード、1 つのアパート、月 $4,000 ～ $8,000 のパッシブ AI コンピュートレンタル。

/フォロー @antisadh して、公開日にあなたのフィードに届くようにしましょう/

月額 200 ドルの AI サブスクリプションを不要にする 5 つのデバイス

開発者が気づいていない年間 $5,508 の出費

レベル 1: Jetson Orin Nano Super、$249、エントリーポイント

レベル 2: Mac Mini M4、$599、デフォルトの選択肢

レベル 3: 中古 RTX 3090、$700、最高のコストパフォーマンス

レベル 4: GMKtec EVO-X2、$1,700、フロンティア級をローカルで

レベル 5: ハードウェアを活用して、節約ではなく収入を得る

上記すべてのデバイスで動作する単一のソフトウェアスタック

誰が何を買うべきか：決定木

トマスの最初の 6 か月の結果

チャンスの窓

Turn one viral article into a full content workflow

最近のバイラル記事

本番環境の AI エージェント 2 体で運用する 4 層メモリ・アーキテクチャ

SECZ のトークン化：Securitize が上場初日に自社株式をオンチェーン化

AI 時代のキャリア戦略

Cowork エンジニアリング：チャットウィンドウから自律型同僚へと進化する 14 ステップのロードマップ

DISH DBS および DISH Wireless が連邦破産法第 11 条を申請

X Platform が X Token のプレセールを開始し、X Wallet を導入

月額 200 ドルの AI サブスクリプションを不要にする 5 つのデバイス

開発者が気づいていない年間 $5,508 の出費

レベル 1: Jetson Orin Nano Super、$249、エントリーポイント

レベル 2: Mac Mini M4、$599、デフォルトの選択肢

レベル 3: 中古 RTX 3090、$700、最高のコストパフォーマンス

レベル 4: GMKtec EVO-X2、$1,700、フロンティア級をローカルで

レベル 5: ハードウェアを活用して、節約ではなく収入を得る

上記すべてのデバイスで動作する単一のソフトウェアスタック

誰が何を買うべきか：決定木

トマスの最初の 6 か月の結果

チャンスの窓

Turn one viral article into a full content workflow

あなたの Markdown をきれいな 𝕏 記事に

最近のバイラル記事

本番環境の AI エージェント 2 体で運用する 4 層メモリ・アーキテクチャ

SECZ のトークン化：Securitize が上場初日に自社株式をオンチェーン化

AI 時代のキャリア戦略

Cowork エンジニアリング：チャットウィンドウから自律型同僚へと進化する 14 ステップのロードマップ

DISH DBS および DISH Wireless が連邦破産法第 11 条を申請

X Platform が X Token のプレセールを開始し、X Wallet を導入