トークン消費量を 67% 削減：Claude Code のための「エスカレーション」戦略

「うああ今日もClaude Codeの使用制限きた😭ケチ！💢」気持ちはわかります。でも、それあなたの運用方法が悪いのかも？→じゃあどうすれば？→この記事を見る→トークンの節約法を理解→誰でも解決！！！！

ではいきましょう！！！

皆さんClaude Codeを使っていて、こんな経験ありませんか？

・プロンプトの途中で突然「使用制限に達しました」と表示される

・$200/月のプランなのに数時間ごとにレート制限に引っかかる

・制限を気にしながら使うせいで、集中力が途切れて生産性が落ちる

・制限回避のためにプランをアップグレードすべきか毎月悩んでいる

・重要な作業の途中で止まるから、結局別のAIに逃げてしまう

海外で67万フォロワーを持つAI活用のトップインフルエンサー Miles Deutscher（@milesdeutscher）が書いた記事が335万いいねの大バズ中😳

彼自身も$200/月のAnthropicプランを使いながら、日常的にレート制限に引っかかっていたそう。しかし「Claudeの仕組みを根本から理解し直した」ことで、過去3週間は一度もトークン制限に到達していないとのこと。

今回はその内容をわかりやすく噛み砕いて解説します👇

元ポストはこちら：https://x.com/milesdeutscher/status/2049618781841031551

■ 𝗦𝘁𝗲𝗽 𝟭：𝗣𝗹𝗮𝗻𝗻𝗶𝗻𝗴（計画と実行を完全に分離する）

Milesが最初に指摘するのは「Claude Opusでブレストするな」という点。

これ、やっている人かなり多いはず。アイデアが浮かんだらとりあえずOpusに投げて壁打ちする。気づいたら30分経っていて、制限に到達。心当たりありませんか？

Milesが深掘りして発見した事実はこうです。

「テキストチャット自体はトークンをそこまで消費しない。本当に消費するのは、コーディング・ビルド・デザインなどの実行系タスク」

つまり、何を作るかを考えるフェーズ（計画）と、実際に作るフェーズ（実行）を明確に分けるだけで、高コストモデルの消費量が激減する。

Milesは具体的な比較を出しています。同じファイナンス追跡アプリを作る2人の場合：

Person A：計画に2分しか使わず、設計が甘いままビルド開始。結果、3回作り直し

Person B：計画に20分かけて設計を固め、ビルドは1回で完了

Person Bはこのタスク単体で約67%のトークンを節約。金額にして$1.50の差。これが1日に何タスクもあると考えると、月単位では数十ドルの差になる。

Claude Codeを使っている人なら、Shift+Tab×2で入れる「Plan Mode」がまさにこの思想を体現した機能です。

Plan Modeに入ると、Claudeはコードを書かずに設計・計画に集中する。つまり実行トークンを消費せずに、アーキテクチャや方針を固められる。

さらに、計画フェーズ自体も安いモデルに任せるのがMiles流。Opusで壁打ちする代わりに、Haikuで十分。Haikuはブレスト用途なら十分賢く、コストは桁違いに安い。

実践ポイント：

・アイデア出し・壁打ち・設計はHaikuで行う

・設計が固まり「あとは作るだけ」になってからOpusに切り替える

・Claude CodeならPlan Mode（Shift+Tab×2）を毎回使う癖をつける

・「考える時間」をケチるほど、「作り直す回数」が増えてトータルで損する

■ 𝗦𝘁𝗲𝗽 𝟮：𝗖𝗵𝗮𝘁 𝗟𝗲𝗻𝗴𝘁𝗵（チャットの長さが全てを支配する）

長いチャットはサイレントキラーだとMilesは言います。これは多くの人が見落としている最大の落とし穴。

仕組みはこうです。Claudeは毎回メッセージを送るたびに、そのチャット内の全コンテキストを読み直している。つまり：

・チャットが10メッセージの時：10メッセージ分のトークンを読む

・チャットが100メッセージの時：100メッセージ分のトークンを読む

チャットが長くなるほど、1メッセージあたりのコストが雪だるま式に増えていく。しかも問題はコストだけじゃない。古い情報が混ざることで、Claudeの出力品質自体が劣化する。関係ない過去の文脈に引っ張られて、的外れな回答が増える。

Milesの解決策は2つ。

𝟭. 𝗣𝗿𝗼𝗷𝗲𝗰𝘁𝘀を活用する

繰り返し同じ種類のタスクをやるなら、1つの長大なチャットではなく、Projectの中に複数のサブチャットを作る。

Miles自身はX執筆用のProjectを持っていて、新しい記事を書くたびに新規チャットを開いている。Projectの設定（Instructions）は全チャットで共有されるから、毎回「自分はこういう人で、こういうスタイルで書いて」と説明し直す必要がない。

さらに賢いのが、Project Instructionsにこの1文を入れておくこと：

「Be cognisant of the fact I'm trying to save account usage. Be concise in your answers, and when appropriate, advise me on when I should start a new chat or any other tips that may help me reduce token usage.」

これだけで、Claude自身がトークン節約のアドバイザーになってくれる。「そろそろ新しいチャットに移った方がいいですよ」と教えてくれるようになる。

𝟮. メガプロンプトで文脈を圧縮引き継ぎ

どうしても今のチャットの文脈を次に持っていきたい場合。チャットの最後にこう言う：

「I'm moving to a new chat; give me a prompt I can use to restart this session without losing any of our context from this conversation.」

Claudeが全文脈を圧縮した1つのプロンプトを生成してくれる。これを新規チャットの最初に貼るだけで、文脈ロスなく軽量なチャットで再スタートできる。

覚えておくべき鉄則：

「1つの超長チャット」より「3つの短いチャット」の方がトークン効率は圧倒的に良い。迷ったら新しいチャットを開く。これだけで制限に到達する頻度が激減する。

■ 𝗦𝘁𝗲𝗽 𝟯：𝗣𝗿𝗼𝗽𝗲𝗿 𝗠𝗲𝗺𝗼𝗿𝘆（Claudeの記憶を外部ファイルで永続化する）

Claudeの最大の弱点の1つ。それは文脈を忘れることです。

デフォルトのClaudeは、あなたの好みや過去の指示をほとんど覚えていない。結果として何が起きるか：

・毎回同じ前提条件を説明する → その分トークンを消費

・過去に修正したミスを繰り返す → 再度修正のやり取りでトークンを消費

・好みを忘れて不要な出力をする → リテイクでトークンを消費

この悪循環を根本から断ち切る方法をMilesは紹介しています。

やり方はシンプル。PCのデスクトップにフォルダを1つ作り、中に2つのMarkdownファイルを置く。

𝗜𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝗶𝗼𝗻𝘀.𝗠𝗗（指示書）

Claudeへの恒久的なルールと指示を書くファイル。

構成例：

・## Who you are → 自分の役割・専門性

・## What you do → Claudeに期待する振る舞い

・## Rules → 絶対に守らせたいルール

そして最も重要な1行をここに入れる：

「Update Memory.MD with my preferences over time.」

この指示があることで、Claudeが会話の中で学んだあなたの好みや修正を、自動的に2つ目のファイルに書き込んでくれる。

𝗠𝗲𝗺𝗼𝗿𝘆.𝗠𝗗（記憶ファイル）

Claudeの「第二の脳」として機能するファイル。使えば使うほど賢くなっていく。

構成例：

・## Preferences → 好みのスタイル、フォーマット

・## Corrections → 過去に修正された事項

・## Patterns → 繰り返し使うパターン

具体例：あなたが「emダッシュを使わないで」と一度言えば、Claudeがこのファイルに記録する。次回以降、何も言わなくてもemダッシュは出てこなくなる。「見出しは##じゃなくて■を使って」と言えば、それも記録される。

このフォルダをClaude Code/Coworkにアタッチするだけで設定完了。フォルダの中身はClaudeが毎回読み込むので、チャットをまたいでも文脈が保持される。

一度使い始めたら、もう元には戻れないとMilesは言っています。再説明にかかっていたトークンがゼロになるのは、体感としてかなり大きい。

■ 𝗦𝘁𝗲𝗽 𝟰：𝗠𝗼𝗱𝗲𝗹 𝗦𝘁𝗮𝗰𝗸𝗶𝗻𝗴 & 𝗦𝗲𝗹𝗲𝗰𝘁𝗶𝗼𝗻（モデルの使い分けで90%を節約）

「Opus 4.7を全てに使うのは完全な無駄遣い」とMilesは断言しています。

多くの人がやりがちなのは、「一番賢いモデルを常に使えば間違いない」という思考。でもこれは「近所のコンビニに行くのにフェラーリを出す」ようなもの。

Milesが実践しているのは「エスカレート方式」。

Haiku（軽いタスク）→ Sonnet（中程度のタスク）→ Opus（重いタスク・最終仕上げ）

この順番で始めて、本当に能力が足りない時だけ上のモデルに切り替える。実感として、90%のタスクはOpus以外で十分に処理でき、Opusが本当に必要なのは残り10%だけだとのこと。

さらに細かいチューニング：

・𝗘𝘅𝘁𝗲𝗻𝗱𝗲𝗱 𝗧𝗵𝗶𝗻𝗸𝗶𝗻𝗴：普段はオフにしておく。複雑な推論や数学的タスクの時だけオン。オンにするとトークン消費が跳ね上がるので、本当に必要な場面だけ

・𝗦𝘁𝘆𝗹𝗲𝘀（スタイル設定）：Claudeのホーム画面から「Concise」スタイルに切り替えられる。これだけで回答が短く簡潔になり、出力トークンが大幅に減る。多くの人がこの機能の存在すら知らない

・𝗟𝗼𝘄 𝗘𝗳𝗳𝗼𝗿𝘁：Claude Codeでは「Low」エフォートモードを選択可能。簡単なタスクならこれで十分で、処理速度も上がる

そしてClaude以外の選択肢も忘れないこと。ニュース検索、リサーチ、要約のような単純タスクには、KimiやDeepSeekなどの無料・安価なオープンソースモデルで十分対応できる。Claudeの枠は「Claudeでしかできないこと」に温存する。

■ 𝗦𝘁𝗲𝗽 𝟱：𝗧𝗼𝗼𝗹 𝗦𝗽𝗹𝗶𝘁𝘁𝗶𝗻𝗴（ツールごとの使用枠を戦略的に使い分ける）

ほとんどの人が気づいていない事実。Claudeの各ツールには、それぞれ独立した使用パラメータが存在します。

具体的には：

・Claude Code / Claude Chat → 同じプランの使用枠を共有

・Claude Design → 完全に別枠

この仕組みを知らないと何が起きるか。例えば、Claude Codeの中でUIデザインのモックアップを作らせる。これはCode/Chatの枠を消費する。でもClaude Designという別ツールには未使用の枠が丸々残っている。同じデザインタスクをClaude Designでやれば、Code/Chatの枠を一切消費せずに済む。

各ツールは、それぞれ設計された本来の用途に使うのが最もコスパが良い。

Milesのルール：

・コーディング → Claude Code

・デザイン → Claude Design

・対話・分析 → Claude Chat

・それぞれのツールが得意なことに使い、苦手なことを無理にやらせない

■ 𝗕𝗼𝗻𝘂𝘀 𝗧𝗶𝗽𝘀（すぐ使える追加テクニック集）

・追加クレジット購入：$20→$100のようなプランアップグレードを検討する前に、数ドルだけクレジットを追加購入する選択肢がある。月末にちょっと足りない時はこれで十分

・Claude Skills：繰り返しタスクを自動化するスキルを構築しておく。毎回同じ手順を説明する代わりに、スキルとして保存すれば1コマンドで実行できる

・使用量トラッキング：定期的に使用状況を確認する習慣をつける。Claude Codeなら /Usage コマンドで即座に確認可能。「あと何%使えるか」を把握していれば、使い方を調整できる

・Overviewセクション：最近追加された新機能で、使用状況の概要が一目でわかるダッシュボードが見られる

・制限に近づいたら行動を変える：残り20%を切ったら、Haikuに切り替える、Extended Thinkingをオフにする、チャットを短く保つ、など意識的にモードを切り替える

■ まとめ：この方法で3週間、制限ゼロを達成

Milesがこの5ステップを実践してから3週間、一度もトークン制限に引っかかっていないとのこと。$200/月のプランを変えずに、です。

ポイントを整理すると：

・Step 1：計画はHaikuで、実行はOpusで。フェーズを分離するだけで67%削減

・Step 2：チャットは短く保ち、Projectsで管理。3つの短いチャット＞ 1つの長いチャット

・Step 3：Memory.MDで記憶を外部化し、再説明コストをゼロにする

・Step 4：エスカレート方式で90%をOpus以外に回す。Styles・Effort設定も活用

・Step 5：ツールごとの使用枠の違いを把握し、適材適所で使い分ける

AIの利用コストが今後安くなる見込みは正直薄い。むしろモデルが高性能化するほど、トークン単価は上がる傾向にある。だからこそ、今のうちに「正しい使い方」を身につけておくことが、長期的な節約に直結します。

Milesも言っている通り、問題は「プランが安いこと」ではなく「使い方が間違っていること」。正しく使えば、今のプランのままで制限に引っかからない生活は十分に実現可能です。

この記事が少しでも参考になった方へ。

𝗖𝗹𝗮𝘂𝗱𝗲 𝗖𝗼𝗱𝗲 𝗦𝘁𝘂𝗱𝗶𝗼 @ 𝗝𝗮𝗽𝗮𝗻（@ClaudeCode_love）は、

Claude Codeガチ勢3人で運営しているアカウントです。

実務レベルのCLI活用・自動化を毎日発信しています。

現在は上場企業とAIエージェントを共同開発中。

普段の発信内容👇

・Claude CodeやClaudeを活用したリアルなプロダクト開発事例

・Claude Code活用／Vibe Coding／開発トレンドの整理

・海外のClaude Codeに関する最新情報

開発思想から設計、実装、改善まで、

「作って終わり」ではなく動くプロダクトを世に出すところまでを

海外の情報や１次情報をまとめています。

ご関心のある方は、ぜひフォローしてチェックしてみてください👀有益だと思います！

トークン消費量を 67% 削減：Claude Code のための「エスカレーション」戦略

Use YouMind to read viral articles deeply

最近のバイラル記事

AI エージェント導入における 7 つの現場的・組織的障壁

NotebookLM で 100 個のプロンプトを管理する「プロンプトライブラリ」の作り方

アイデアジェネレーター：リード・ホフマンが語るマーク・ピンカスと「ゲームの理論」

スクロールは「低ステータス」な行為である

ORACLE：Polymarket で取引を行う公式 AI エージェント

世界で一番おいしいトマトの食べ方