達成 67% Token 節省：Claude Code 的「升級」策略

「唉，我又碰到 Claude Code 的使用上限了！😭 也太小氣了吧！💢」我懂這種感覺。但說不定問題出在你的操作方法？→ 那該怎麼辦？→ 讀這篇文章 → 搞懂省 token 的方法 → 大家都能解決問題！！！！

讓我們直接進入正題！！！

你是否曾在使用 Claude Code 時遇過這種情況？

・輸入到一半突然跳出「已達使用上限」

・明明付了 $200/月的方案，卻每隔幾小時就遇到速率限制

・因為擔心上限而無法專注，生產力下降

・每個月都在煩惱要不要升級方案來避開限制

・重要工作做到一半被迫中斷，最後只好跑去用其他 AI

海外擁有 67 萬追蹤者的頂尖 AI 影響者 Miles Deutscher（@milesdeutscher）的一篇文章，目前正以 335 萬個讚爆紅中 😳

他自己在使用 $200/月的 Anthropic 方案時，也曾每天碰到速率限制。然而，透過「重新理解 Claude 的基本機制」，他在過去三週內完全沒遇過 token 上限。

今天，我就來簡單明瞭地拆解這些內容 👇

原文在此：https://x.com/milesdeutscher/status/2049618781841031551

■ 𝗦𝘁𝗲𝗽 𝟭：𝗣𝗹𝗮𝗻𝗻𝗶𝗻𝗴（徹底分開規劃與執行）

Miles 首先指出：「不要用 Claude Opus 來腦力激盪。」

很多人大概都這樣做。你想到一個點子，就丟給 Opus 來回討論。不知不覺 30 分鐘過去了，然後就達到上限。聽起來很熟悉吧？

Miles 深入研究後發現的事實是：

「純文字聊天本身消耗的 token 並不多。真正大量消耗的是編碼、建構、設計這類執行型任務。」

換句話說，只要清楚區分「思考要做什麼」（規劃）與「實際動手做」（執行）這兩個階段，就能大幅減少高成本模型的消耗。

Miles 提供了一個具體對比。假設兩個人製作同樣的記帳 App：

A 君：只花 2 分鐘規劃，就用薄弱的設計開始建構。結果：重做了 3 次。

B 君：花 20 分鐘規劃，把設計定案，一次就完成建構。

B 君在這項任務上就省下了約 67% 的 token。換算成成本差距是 $1.50。考慮到一天有許多任務，一個月下來就是幾十美元的差距。

對於使用 Claude Code 的人來說，按 Shift+Tab×2 進入的「Plan Mode」，正是體現這個理念的功能。

在 Plan Mode 中，Claude 專注於設計與規劃，不會寫程式碼。這表示你可以在不消耗執行 token 的情況下，把架構與方針定下來。

此外，Miles 的做法是連規劃階段本身也交給更便宜的模型。與其用 Opus 來回討論，Haiku 就夠了。Haiku 對於腦力激盪來說已經夠聰明，而且成本便宜好幾個數量級。

實踐要點：

・用 Haiku 進行發想、腦力激盪與設計

・等到設計定案、「準備好要建構」時，再切換到 Opus

・養成在 Claude Code 中每次都用 Plan Mode（Shift+Tab×2）的習慣

・「思考時間」省得越多，「重做次數」就越多，最後全盤皆輸

■ 𝗦𝘁𝗲𝗽 𝟮：𝗖𝗵𝗮𝘁 𝗟𝗲𝗻𝗴𝘁𝗵（聊天長度主宰一切）

Miles 說，過長的聊天是沉默的殺手。這是許多人忽略的最大陷阱。

機制是這樣的：每次你發送訊息，Claude 都會重新讀取該聊天中的整個上下文。也就是說：

・當聊天有 10 則訊息時：它會讀取 10 則訊息的 token

・當聊天有 100 則訊息時：它會讀取 100 則訊息的 token

隨著聊天變長，每則訊息的成本會呈指數級增長。而且成本還不是唯一的問題。隨著舊資訊混雜進來，Claude 輸出本身的品質也會下降。它會被不相關的過去上下文牽著走，偏離目標的回答也會增加。

Miles 有兩個解決方案。

𝟭. 善用 𝗣𝗿𝗼𝗷𝗲𝗰𝘁𝘀

如果你反覆做同一類型的任務，請在一個 Project 內建立多個子聊天，而不是一個超長的聊天。

Miles 自己有一個專門寫 X 文章的 Project，每次寫新文章時就開一個新聊天。由於 Project 設定（Instructions）會在所有聊天中共享，所以不需要每次都重新解釋「我是這樣的人，請用這種風格寫作」。

更聰明的是，在 Project Instructions 中加入這句話：

「請注意我正在設法節省帳戶用量。回答時請簡潔，並在適當的時候建議我何時該開新聊天，或提供其他有助於減少 token 用量的提示。」

光這樣，Claude 本身就會變成 token 節省顧問。它會開始告訴你：「大概是時候換到新聊天了。」

𝟮. 用 Mega Prompts 壓縮上下文轉移

如果你無論如何都想把當前聊天的上下文帶到新聊天，請在聊天結束時說：

「我要換到新聊天了；請給我一個提示，讓我能重新開始這個對話，同時不遺失我們從這個對話中累積的任何上下文。」

Claude 會產生一個單一提示，壓縮整個上下文。只要把這個提示貼到新聊天的開頭，就能以輕量聊天重新開始，而不會遺失上下文。

要記住的金科玉律：

「三個短聊天」在 token 效率上遠遠勝過「一個超長聊天」。如果不確定，就開新聊天。光這樣就能大幅降低碰到上限的頻率。

■ 𝗦𝘁𝗲𝗽 𝟯：𝗣𝗿𝗼𝗽𝗲𝗿 𝗠𝗲𝗺𝗼𝗿𝘆（把 Claude 的記憶保存在外部檔案中）

Claude 最大的弱點之一就是它會忘記上下文。

預設情況下，Claude 幾乎不記得你的偏好或過去的指示。結果就是：

・每次都要解釋相同的前提條件 → 消耗 token

・重複過去已經修正過的錯誤 → 為了再次修正而消耗互動 token

・忘記偏好而給出不必要的輸出 → 消耗重做的 token

Miles 介紹了一種從根本上打破這個惡性循環的方法。

方法很簡單。在你的桌面上建立一個資料夾，在裡面放兩個 Markdown 檔案。

𝗜𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻𝘀.𝗠𝗗（指示檔）

用來寫給 Claude 的永久規則與指示的檔案。

範例結構：

・## Who you are → 你的角色／專業領域

・## What you do → 期望 Claude 表現的行為

・## Rules → 希望它嚴格遵守的規則

然後把最重要的一行放在這裡：

「隨著時間更新 Memory.MD，記錄我的偏好。」

有了這個指示，Claude 就會自動把對話中學到的你的偏好與修正，寫入第二個檔案。

𝗠𝗲𝗺𝗼𝗿𝘆.𝗠𝗗（記憶檔）

一個作為 Claude「第二個大腦」的檔案。越用越聰明。

範例結構：

・## Preferences → 偏好的風格、格式

・## Corrections → 過去修正過的事項

・## Patterns → 反覆使用的模式

具體範例：如果你說一次「不要使用 em dash」，Claude 就會把它記錄在這個檔案中。從下一次開始，即使你什麼都不說，em dash 也不會出現。如果你說「用 ■ 取代 # 作為標題」，那也會被記錄下來。

只要把這個資料夾附加到 Claude Code/Cowork，設定就完成了。由於 Claude 每次都會讀取資料夾的內容，所以上下文可以在不同聊天之間維持。

Miles 說，一旦開始使用，就回不去了。花在重新解釋上的 token 變成零，這在體驗上意義重大。

■ 𝗦𝘁𝗲𝗽 𝟰：𝗠𝗼𝗱𝗲𝗹 𝗦𝘁𝗮𝗰𝗸𝗶𝗻𝗴 & 𝗦𝗲𝗹𝗲𝗰𝘁𝗶𝗼𝗻（妥善運用模型，省下 90%）

「什麼都用 Opus 4.7 根本是浪費，」Miles 斷言。

人們常犯的錯誤是認為「反正永遠用最聰明的模型就沒問題」。但這就像「開法拉利去巷口便利商店」。

Miles 實踐的是「升級法」。

Haiku（輕量任務）→ Sonnet（中等任務）→ Opus（繁重任務／最終收尾）

按照這個順序開始，只有在能力真的不足時才切換到更高階的模型。根據他的經驗，90% 的任務用 Opus 以外的模型就足夠了，Opus 真正需要的只有剩下的 10%。

進一步微調：

・𝗘𝘅𝘁𝗲𝗻𝗱𝗲𝗱 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴：平常保持關閉。只在複雜推理或數學任務時開啟。開啟時 token 消耗會暴增，所以只在真正必要時使用。

・𝗦𝘁𝘆𝗹𝗲𝘀（風格設定）：你可以從 Claude 主畫面切換到「簡潔」風格。光這樣就能讓回答變得短而簡單，大幅減少輸出 token。很多人甚至不知道有這個功能。

・𝗟𝗼𝘄 𝗘𝗳𝗳𝗼𝗿𝘁：在 Claude Code 中，你可以選擇「低」努力模式。這對於簡單任務已經足夠，而且能提高處理速度。

另外，別忘了 Claude 以外的選項。對於新聞搜尋、研究、摘要這類簡單任務，免費或便宜的開源模型如 Kimi 或 DeepSeek 就夠了。把 Claude 的配額留給「只有 Claude 才能做的事」。

■ 𝗦𝘁𝗲𝗽 𝟱：𝗧𝗼𝗼𝗹 𝗦𝗽𝗹𝗶𝘁𝘁𝗶𝗻𝗴（策略性地為每個工具分配配額）

大多數人沒注意到的事實：每個 Claude 工具都有各自獨立的使用參數。

具體來說：

・Claude Code / Claude Chat → 共用同一個方案的用量配額

・Claude Design → 完全獨立的配額

如果你不知道這個機制，會發生什麼事？例如，你用 Claude Code 製作 UI 設計稿。這會消耗 Code/Chat 的配額。但獨立的工具 Claude Design 卻有完全沒用到的配額。如果你在 Claude Design 中做同樣的設計任務，就可以完全避免消耗 Code/Chat 的配額。

讓每個工具做它原本設計來做的事，是最划算的。

Miles 的規則：

・編碼 → Claude Code

・設計 → Claude Design

・對話／分析 → Claude Chat

・讓每個工具做它擅長的事，不要強迫它做不擅長的事。

■ 𝗕𝗼𝗻𝘂𝘀 𝗧𝗶𝗽𝘀（可以立即使用的額外技巧集）