達成 67% Token 節省:Claude Code 的「升級」策略

@ClaudeCode_love
日語2 個月前 · 2026年5月04日
366K
551
47
4
1.3K

TL;DR

本指南概述了一種優化 Claude Code 使用的熱門策略,重點在於將規劃與執行分開、使用外部記憶體檔案,並在 Haiku、Sonnet 與 Opus 模型之間進行策略性升級,以避免觸發速率限制。

「唉,我又碰到 Claude Code 的使用上限了!😭 也太小氣了吧!💢」我懂這種感覺。但說不定問題出在你的操作方法?→ 那該怎麼辦?→ 讀這篇文章 → 搞懂省 token 的方法 → 大家都能解決問題!!!!

讓我們直接進入正題!!!

你是否曾在使用 Claude Code 時遇過這種情況?

Claude Code Studio - inline image

・輸入到一半突然跳出「已達使用上限」

・明明付了 $200/月的方案,卻每隔幾小時就遇到速率限制

・因為擔心上限而無法專注,生產力下降

・每個月都在煩惱要不要升級方案來避開限制

・重要工作做到一半被迫中斷,最後只好跑去用其他 AI

海外擁有 67 萬追蹤者的頂尖 AI 影響者 Miles Deutscher(@milesdeutscher)的一篇文章,目前正以 335 萬個讚爆紅中 😳

Claude Code Studio - inline image

他自己在使用 $200/月的 Anthropic 方案時,也曾每天碰到速率限制。然而,透過「重新理解 Claude 的基本機制」,他在過去三週內完全沒遇過 token 上限。

今天,我就來簡單明瞭地拆解這些內容 👇

原文在此:https://x.com/milesdeutscher/status/2049618781841031551

■ 𝗦𝘁𝗲𝗽 𝟭:𝗣𝗹𝗮𝗻𝗻𝗶𝗻𝗴(徹底分開規劃與執行)

Claude Code Studio - inline image

Miles 首先指出:「不要用 Claude Opus 來腦力激盪。」

很多人大概都這樣做。你想到一個點子,就丟給 Opus 來回討論。不知不覺 30 分鐘過去了,然後就達到上限。聽起來很熟悉吧?

Miles 深入研究後發現的事實是:

「純文字聊天本身消耗的 token 並不多。真正大量消耗的是編碼、建構、設計這類執行型任務。」

換句話說,只要清楚區分「思考要做什麼」(規劃)與「實際動手做」(執行)這兩個階段,就能大幅減少高成本模型的消耗。

Miles 提供了一個具體對比。假設兩個人製作同樣的記帳 App:

Claude Code Studio - inline image

A 君:只花 2 分鐘規劃,就用薄弱的設計開始建構。結果:重做了 3 次。

B 君:花 20 分鐘規劃,把設計定案,一次就完成建構。

B 君在這項任務上就省下了約 67% 的 token。換算成成本差距是 $1.50。考慮到一天有許多任務,一個月下來就是幾十美元的差距。

對於使用 Claude Code 的人來說,按 Shift+Tab×2 進入的「Plan Mode」,正是體現這個理念的功能。

Claude Code Studio - inline image

在 Plan Mode 中,Claude 專注於設計與規劃,不會寫程式碼。這表示你可以在不消耗執行 token 的情況下,把架構與方針定下來。

此外,Miles 的做法是連規劃階段本身也交給更便宜的模型。與其用 Opus 來回討論,Haiku 就夠了。Haiku 對於腦力激盪來說已經夠聰明,而且成本便宜好幾個數量級。

實踐要點:

・用 Haiku 進行發想、腦力激盪與設計

・等到設計定案、「準備好要建構」時,再切換到 Opus

・養成在 Claude Code 中每次都用 Plan Mode(Shift+Tab×2)的習慣

・「思考時間」省得越多,「重做次數」就越多,最後全盤皆輸

■ 𝗦𝘁𝗲𝗽 𝟮:𝗖𝗵𝗮𝘁 𝗟𝗲𝗻𝗴𝘁𝗵(聊天長度主宰一切)

Claude Code Studio - inline image

Miles 說,過長的聊天是沉默的殺手。這是許多人忽略的最大陷阱。

機制是這樣的:每次你發送訊息,Claude 都會重新讀取該聊天中的整個上下文。也就是說:

Claude Code Studio - inline image

・當聊天有 10 則訊息時:它會讀取 10 則訊息的 token

・當聊天有 100 則訊息時:它會讀取 100 則訊息的 token

隨著聊天變長,每則訊息的成本會呈指數級增長。而且成本還不是唯一的問題。隨著舊資訊混雜進來,Claude 輸出本身的品質也會下降。它會被不相關的過去上下文牽著走,偏離目標的回答也會增加。

Miles 有兩個解決方案。

𝟭. 善用 𝗣𝗿𝗼𝗷𝗲𝗰𝘁𝘀

Claude Code Studio - inline image

如果你反覆做同一類型的任務,請在一個 Project 內建立多個子聊天,而不是一個超長的聊天。

Miles 自己有一個專門寫 X 文章的 Project,每次寫新文章時就開一個新聊天。由於 Project 設定(Instructions)會在所有聊天中共享,所以不需要每次都重新解釋「我是這樣的人,請用這種風格寫作」。

更聰明的是,在 Project Instructions 中加入這句話:

「請注意我正在設法節省帳戶用量。回答時請簡潔,並在適當的時候建議我何時該開新聊天,或提供其他有助於減少 token 用量的提示。」

光這樣,Claude 本身就會變成 token 節省顧問。它會開始告訴你:「大概是時候換到新聊天了。」

𝟮. 用 Mega Prompts 壓縮上下文轉移

Claude Code Studio - inline image

如果你無論如何都想把當前聊天的上下文帶到新聊天,請在聊天結束時說:

「我要換到新聊天了;請給我一個提示,讓我能重新開始這個對話,同時不遺失我們從這個對話中累積的任何上下文。」

Claude 會產生一個單一提示,壓縮整個上下文。只要把這個提示貼到新聊天的開頭,就能以輕量聊天重新開始,而不會遺失上下文。

要記住的金科玉律:

Claude Code Studio - inline image

「三個短聊天」在 token 效率上遠遠勝過「一個超長聊天」。如果不確定,就開新聊天。光這樣就能大幅降低碰到上限的頻率。

■ 𝗦𝘁𝗲𝗽 𝟯:𝗣𝗿𝗼𝗽𝗲𝗿 𝗠𝗲𝗺𝗼𝗿𝘆(把 Claude 的記憶保存在外部檔案中)

Claude Code Studio - inline image

Claude 最大的弱點之一就是它會忘記上下文。

預設情況下,Claude 幾乎不記得你的偏好或過去的指示。結果就是:

・每次都要解釋相同的前提條件 → 消耗 token

・重複過去已經修正過的錯誤 → 為了再次修正而消耗互動 token

・忘記偏好而給出不必要的輸出 → 消耗重做的 token

Miles 介紹了一種從根本上打破這個惡性循環的方法。

方法很簡單。在你的桌面上建立一個資料夾,在裡面放兩個 Markdown 檔案。

Claude Code Studio - inline image

𝗜𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻𝘀.𝗠𝗗(指示檔)

用來寫給 Claude 的永久規則與指示的檔案。

範例結構:

・## Who you are → 你的角色/專業領域

・## What you do → 期望 Claude 表現的行為

・## Rules → 希望它嚴格遵守的規則

然後把最重要的一行放在這裡:

「隨著時間更新 Memory.MD,記錄我的偏好。」

有了這個指示,Claude 就會自動把對話中學到的你的偏好與修正,寫入第二個檔案。

𝗠𝗲𝗺𝗼𝗿𝘆.𝗠𝗗(記憶檔)

一個作為 Claude「第二個大腦」的檔案。越用越聰明。

範例結構:

・## Preferences → 偏好的風格、格式

・## Corrections → 過去修正過的事項

・## Patterns → 反覆使用的模式

具體範例:如果你說一次「不要使用 em dash」,Claude 就會把它記錄在這個檔案中。從下一次開始,即使你什麼都不說,em dash 也不會出現。如果你說「用 ■ 取代 # 作為標題」,那也會被記錄下來。

Claude Code Studio - inline image

只要把這個資料夾附加到 Claude Code/Cowork,設定就完成了。由於 Claude 每次都會讀取資料夾的內容,所以上下文可以在不同聊天之間維持。

Miles 說,一旦開始使用,就回不去了。花在重新解釋上的 token 變成零,這在體驗上意義重大。

■ 𝗦𝘁𝗲𝗽 𝟰:𝗠𝗼𝗱𝗲𝗹 𝗦𝘁𝗮𝗰𝗸𝗶𝗻𝗴 & 𝗦𝗲𝗹𝗲𝗰𝘁𝗶𝗼𝗻(妥善運用模型,省下 90%)

「什麼都用 Opus 4.7 根本是浪費,」Miles 斷言。

Claude Code Studio - inline image

人們常犯的錯誤是認為「反正永遠用最聰明的模型就沒問題」。但這就像「開法拉利去巷口便利商店」。

Miles 實踐的是「升級法」。

Claude Code Studio - inline image

Haiku(輕量任務)→ Sonnet(中等任務)→ Opus(繁重任務/最終收尾)

按照這個順序開始,只有在能力真的不足時才切換到更高階的模型。根據他的經驗,90% 的任務用 Opus 以外的模型就足夠了,Opus 真正需要的只有剩下的 10%。

進一步微調:

Claude Code Studio - inline image

・𝗘𝘅𝘁𝗲𝗻𝗱𝗲𝗱 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴:平常保持關閉。只在複雜推理或數學任務時開啟。開啟時 token 消耗會暴增,所以只在真正必要時使用。

・𝗦𝘁𝘆𝗹𝗲𝘀(風格設定):你可以從 Claude 主畫面切換到「簡潔」風格。光這樣就能讓回答變得短而簡單,大幅減少輸出 token。很多人甚至不知道有這個功能。

・𝗟𝗼𝘄 𝗘𝗳𝗳𝗼𝗿𝘁:在 Claude Code 中,你可以選擇「低」努力模式。這對於簡單任務已經足夠,而且能提高處理速度。

另外,別忘了 Claude 以外的選項。對於新聞搜尋、研究、摘要這類簡單任務,免費或便宜的開源模型如 Kimi 或 DeepSeek 就夠了。把 Claude 的配額留給「只有 Claude 才能做的事」。

■ 𝗦𝘁𝗲𝗽 𝟱:𝗧𝗼𝗼𝗹 𝗦𝗽𝗹𝗶𝘁𝘁𝗶𝗻𝗴(策略性地為每個工具分配配額)

Claude Code Studio - inline image

大多數人沒注意到的事實:每個 Claude 工具都有各自獨立的使用參數。

具體來說:

Claude Code Studio - inline image

・Claude Code / Claude Chat → 共用同一個方案的用量配額

・Claude Design → 完全獨立的配額

如果你不知道這個機制,會發生什麼事?例如,你用 Claude Code 製作 UI 設計稿。這會消耗 Code/Chat 的配額。但獨立的工具 Claude Design 卻有完全沒用到的配額。如果你在 Claude Design 中做同樣的設計任務,就可以完全避免消耗 Code/Chat 的配額。

讓每個工具做它原本設計來做的事,是最划算的。

Miles 的規則:

・編碼 → Claude Code

・設計 → Claude Design

・對話/分析 → Claude Chat

・讓每個工具做它擅長的事,不要強迫它做不擅長的事。

■ 𝗕𝗼𝗻𝘂𝘀 𝗧𝗶𝗽𝘀(可以立即使用的額外技巧集)

Claude Code Studio - inline image

・購買額外點數:在考慮升級方案(例如 $20→$100)之前,還有個選項是只買幾美元的額外點數。當你月底稍微不夠用時,這樣就夠了。

・Claude Skills:建立技能來自動化重複性任務。與其每次都解釋同樣的流程,不如把它存成技能,用一個指令執行。

・用量追蹤:養成定期檢查使用狀態的習慣。在 Claude Code 中,可以用 /Usage 指令立即查看。如果你知道「還剩多少 %」,就能調整使用方式。

・Overview Section:新加入的功能,可以一目了然地看到用量狀態的儀表板。

・接近上限時改變行為:當剩餘少於 20% 時,有意識地切換模式,例如改用 Haiku、關閉 Extended Thinking、保持聊天簡短等。

■ 總結:用這個方法,三週內達到零上限

Claude Code Studio - inline image

Miles 說,自從實踐這 5 個步驟以來,他在三週內完全沒碰到 token 上限。而且他沒有改變 $200/月的方案。

整理重點:

Claude Code Studio - inline image

・Step 1:用 Haiku 規劃,用 Opus 執行。光是分開階段就能減少 67%。

・Step 2:保持聊天簡短,用 Projects 管理。3 個短聊天 > 1 個長聊天。

・Step 3:用 Memory.MD 將記憶外部化,讓重新解釋的成本歸零。

・Step 4:使用升級法,把 90% 交給 Opus 以外的模型。同時善用 Styles 與 Effort 設定。

・Step 5:了解每個工具用量配額的差異,做對的事用對的工具。

老實說,AI 使用成本在未來變便宜的可能性很小。反而隨著模型效能提升,token 單價有上漲的趨勢。因此,現在學會「正確的使用方法」,直接就能帶來長期的節省。

正如 Miles 所說,問題不在於「方案太便宜」,而在於「使用方法不對」。只要正確使用,在現有方案下過上沒有上限的生活,完全是可行的。

覺得這篇文章有點幫助的人。

Claude Code Studio - inline image

𝗖𝗹𝗮𝘂𝗱𝗲 𝗖𝗼𝗱𝗲 𝗦𝘁𝘂𝗱𝗶𝗼 @ 𝗝𝗮𝗽𝗮𝗻(@ClaudeCode_love)是由三位 Claude Code 愛好者經營的帳號。

我們每天發布關於 CLI 實戰運用與自動化的內容。

目前正與一家上市公司共同開發 AI Agent。

我們平常的貼文 👇

・使用 Claude Code 與 Claude 的實際產品開發案例

・Claude Code 活用術 / Vibe Coding / 開發趨勢整理

・來自海外的 Claude Code 最新資訊

從開發理念到設計、實作與改善,

我們彙整海外與一手資訊,目標是讓能運作的產品問世,而不只是「做完」。

如果有興趣,歡迎追蹤看看 👀 我相信會對你有幫助!

存到 YouMind

使用 YouMind 深度閱讀爆款文章

保存原文、追問細節、總結觀點,並在一個 AI 工作空間裡把爆款文章沉澱成可複用筆記。

了解 YouMind

更多可拆解樣本

近期爆款文章

探索更多爆款文章