如何利用本地硬體取代每月 412 美元的 AI 訂閱服務

你家中有一台機器目前正閒置著。一台闔上蓋子的筆電、架子上的 Mac mini、桌下那台為了播 Spotify 而開機、用完又關機的老舊遊戲 PC。它耗電、佔空間，對你的人生毫無貢獻。

與此同時，你的信用卡帳單顯示每月要花 $412 美元在 AI 訂閱服務上：Claude Max、ChatGPT Pro、Cursor、Perplexity、兩個你忘了曾註冊的轉錄工具、一個只用過一次的「寫作助手」。每年 $4,944 美元，只為租用那些你家裡那台安靜的硬體就足以運算的算力。

到了 2026 年，這兩件事將會碰撞。那些市面上最貴訂閱背後的相同模型，現在可以在成本不到三個月訂閱費的硬體上運行。而且這台機器不僅能跑模型，它還能在你睡覺時、按照你設定的排程、自動執行那些你永遠沒時間親手做的事情。

這篇文章會幫你選好硬體、選好「大腦」，並告訴你：當你不再扮演按鈕的人，那台機器實際能做什麼。

挑選主機

以下四個選項值得入手：兩台是迷你靜音電腦，另外兩張是擴充卡，可插進你現有的桌機。

靜音路線比較簡單。Mac mini M4，$599 美元，是多數人的歸宿。所有本機 AI 的配置最終都會指向這裡，原因在於一個設計選擇：一般 PC 需要在系統 RAM 與 GPU VRAM 之間複製資料，容量受限於顯示卡；而 Apple Silicon 共享同一個記憶體池——模型載入一次，CPU 和 GPU 都從同一位置讀取。$599 的 16GB 版本運行 7-8B 模型的速度，比價格翻倍的 Windows 機器還快。升級到 32GB 可跑 14B 模型；再升級到 M4 Pro（$1,399，48GB），你就能在三明治大小的機器上運行 Llama 等級的 70B 模型。功耗僅 8 到 25W，風扇保持靜音，每月電費約 $4 美元。這台主機適合那些從此不想再煩惱硬體的人。

Mac Studio M3 Ultra，$4,199 美元，是同一個概念的無妥協版本。基礎配置為 96GB 統一記憶體，最高可達 192GB。超過這個等級，你就得踏入六位數的伺服器機架領域。192GB 可載入目前最大規模的開放權重模型，完整尺寸，無需任何壓縮技巧。與市場上最貴的訂閱服務屬於同一重量級。滿載功耗約 $14 美元/月，對比單一 $200 美元/月的訂閱，第 22 個月即可回本。這些機器可以使用 7 到 10 年。這台主機適合那些目前每月花費 $400+ 美元訂閱的人，或者工作內容依法不得離開其裝置的人——律師、醫生、保護消息來源的記者、金融分析師。

如果你傾向使用現有桌機，有兩張顯卡可選。Tesla M40 24GB，eBay 二手 $130 美元。 這是 NVIDIA 在 2015 年以 $3,500 美元發售的資料中心顯卡，早已從伺服器農場退役，大量流入次級市場，價格不到 $150 美元。24GB VRAM，與全新的 RTX 5090 相同。足以運行一個 27B 模型，在多數基準測試中與前沿模型不相上下。缺點：沒有顯示輸出（需保留主 GPU 接螢幕）、沒有內建風扇（需加 $25 美元購買 3D 列印支架和 Noctua 風扇）、需要一個 EPS 轉 PCIe 轉接頭（$10 美元）。總共約 $165 美元。只需兩週就能從一個 Pro 訂閱的費用中回本。

二手 RTX 3090，$700 美元。 對本機 AI 來說，VRAM 容量比 GPU 世代更重要，而 3090 在 2026 年仍然是價格與 VRAM 比值的冠軍。全新的 RTX 5090 有 32GB，要價 $3,800 美元；二手 4090 有 24GB，售價 $2,000 美元；而五年前的 3090 同樣擁有 24GB，只賣 $650 到 $750 美元。可運行的模型大小相同，速度達到 70～80%，價格僅三分之一。插進現有遊戲 PC，總成本約 $850 美元，能以每秒 25 到 30 個 tokens 的速度運行 27B 模型。選購二手卡有兩個原則：賣家評價 98% 以上，且避開任何提及「挖礦」的卡。高溫運作會損壞記憶體晶片，遊戲時的功耗負載較輕。

一句話總結：

text

1想要安靜、零設定、一勞永逸        → Mac mini M4，$599 美元
2每月訂閱 $400+ 美元或有隱私需求  → Mac Studio M3 Ultra，$4,199 美元
3已有桌機、最便宜入門              → Tesla M40，$130 美元
4已有遊戲 PC、最佳性價比           → 二手 RTX 3090，$700 美元

無論你選哪一個，安裝都只需要三個指令，各等級完全相同：

bash

1curl -fsSL https://ollama.com/install.sh | sh
2ollama pull qwen2.5:32b
3ANTHROPIC_BASE_URL=http://localhost:11434/v1 claude

挑選大腦

硬體是身體，思考仍需要一個心智。而最能省錢的技巧，就是使用不只一個。

Claude Sonnet 是重量級選手。把它用在需要真正推理的工作上：從 15 個來源中提取資訊，權衡最有力的論點；判斷你筆記庫中 400 則筆記裡，哪一篇與新文章有關聯。每百萬輸入 tokens 約 $3 美元。目前尚無本機模型能在複雜的多步驟思考上與之匹敵。

Claude Haiku 是廉價助手。用於標籤分類、合理性檢查、從三個選項中挑出一個放進你的晨間簡報。價格約為 Sonnet 的 1/12。這類工作每次呼叫成本不到一美分。

本機模型——取決於你主機的 VRAM——則是永遠不送出資料的工人。它存在於你的機器上，處理轉錄、摘要等任務，既能避免按 token 付費，又不必將敏感內容傳送到伺服器。電費之外完全免費。

最省錢的規則：不要用 Sonnet 做標籤，不要用 Haiku 做思考，不要把私人內容傳出去——如果本機就能處理好的話。你的主機可以靈活調配火力，就像你不會為了煮一顆蛋而開啟油炸鍋。

你在睡覺時它能做什麼

一台永遠開機的主機，如果只是取代一個聊天分頁，那就浪費了。重點是讓它在你不在時工作。每項任務都有相同的四段結構：

text

1觸發   → 某個事件啟動它（排程、新檔案、webhook）
2執行   → 工作開始運作
3驗證   → 根據硬規則檢查結果
4疊代   → 修正失敗的部分，或通過則停止

以下三項任務值得在第一個週末設定好。

守門員。監視你的收件匣。每封新郵件會被分成三類：需要回覆、僅供參考、垃圾郵件。第一類郵件會自動生成兩行的草稿回覆，你只需核准即可。早上醒來你會看到四封預先寫好的回覆，按三下「送出」、編輯一封。七分鐘內處理完收件匣。

製圖師。存在你的筆記資料夾中。你儲存的每篇文章、丟進去的每個 YouTube 連結、放進去的每份會議記錄，都會被處理：一行摘要、三個主要論點、抽取出最強的一句話，並將新筆記連結到相同主題的現有筆記。驗證規則：筆記必須包含全部四項，且至少有一個維基連結連到現有筆記。無用內容會被標記為「低訊號」並略過。兩個月後，你的「稍後閱讀」堆疊就會變成一個可搜尋的論點與引言檔案庫，而不是分頁的墳場。

守望者。大多數時候什麼也不做——這就是它的工作。它監視你指定的清單：Telegram 頻道裡的關鍵字、某個特定的職缺、亞馬遜上的某個價格。只有當某個東西真的超過你設定的門檻時，守望者才會通知你的手機。它使用 Haiku 運行，每天成本不到一美分。

區分「能存活下來的任務」與「悄悄燒錢的任務」的三條規則：驗證必須是硬規則，而不是模糊的感覺；任務必須記得自己嘗試過什麼；任務必須知道何時放棄。跳過任何一條，你醒來時看到的會是一張 token 帳單，而不是成果。

算帳

text

1硬體（一次性）          $130 至 $4,199 美元
2電費                    $4 至 $14 美元 / 月
3選擇性：保留一個訂閱   $20 美元 / 月

舊訂閱組合：$412 美元/月，$4,944 美元/年。

新組合（以最便宜入門）：$130 硬體 + $96 電費/年 + $240 保留一個訂閱/年 = 第一年 $466 美元，之後每年 $336 美元。第一年就省下 90% 的帳單（含主機）。就算是 Mac Studio，對比單一 $200 美元/月的訂閱，也在第 22 個月回本，之後在那台機器持續運作的十年裡，都是純節省。

先試玩，再決定買不買

你現在就能在任何聊天工具裡，只用一段提示詞，感受一下任務的運作方式：

text

1你將以迴圈方式工作，直到任務達到標準。
2
3任務：[準確描述你想要的產出]
4
5成功標準（嚴格，不允許模糊通過）：
6- [標準 1]
7- [標準 2]
8- [標準 3]
9
10迴圈協議，每輪重複：
111. 規劃   - 說明下一步要做什麼。
122. 執行   - 產生或改進作品。
133. 驗證   - 對每一項標準給出 1-10 分，誠實且嚴厲。
144. 判斷   - 如果所有分數都在 8 分以上，輸出「FINAL」並停止。
15           否則輸出「ITERATING」，並修正最弱的項目。
16
17在所有標準都達到 8 分以上之前，絕不宣告完成。
18不要問我問題。做出合理的假設然後繼續。