Claude Fable 5 のコストを抑えて賢く活用する方法

@milesdeutscher
英語2 日前 · 2026年7月02日
120K
178
29
18
319

TL;DR

Miles Deutscher 氏が紹介する 10-80-10 フレームワークを活用すれば、Claude Fable 5 を計画とレビューに限定し、実行タスクを安価なモデルに委ねることで、効率的に運用できます。

Fable 5 のトークンコストを 50% 以上削減する方法

Claude Fable 5 は、私がこれまで使った中で最高の AI モデルです。間違いありません。

問題は、とてつもなく高価なことです。

テストを始めて最初の数時間で、使用制限のほぼすべてを使い切ってしまいました。しかも、特別に無茶なことをしていたわけでもありません。

Fable は Opus 4.8 のちょうど 2 倍のコストがかかります。そして、非常に賢いがゆえに、考えすぎてループを繰り返し、これまでの Claude モデルにはない方法でトークンを消費してしまいます。

この新しいモデルを適切に使いこなす方法を学ぶことは、これまで以上に重要です。

このガイドでは、私が開発した、Fable のトークンコストを大幅に削減するための正確な 10-80-10 システムを紹介します。このアドバイスは、Anthropic のエンジニアから直接得たものです。

記事の最後には、私のフレームワーク全体をまとめたドキュメントを作成しました。これを Fable に直接読み込ませることができます。

このドキュメントは、すぐにトークン消費を削減してくれるでしょう。

最後までお付き合いいただき、このドキュメントを直接共有します。

Miles Deutscher - inline image

私のフレームワーク \ドキュメント\

I: 10-80-10 システムの解説

10-80-10 システムは、Fable を本当に必要な場面でのみ効率的に使用するためのシンプルなフレームワークです。

これは、Anthropic のエンジニア自身が使用しているのとまったく同じフレームワークです。

内訳は以下の通りです。

最初の 10%: 計画

AI プロジェクトに取り組む前に、Fable を使用して構造、アプローチ、成功基準、制約を定義します。

家を建てる場合を考えてみてください。最も重要なのは、設計図と計画を正しく立てることです。そうでなければ、建築業者は質の悪い計画を実行するだけです。

Fable 5 は優れた設計者です。そのように活用しましょう。

中間の 80%: 実行

ほとんどのトークンは、タスクを実際に完了するための、やり取り、反復、軽微な修正、単純作業の中で消費されます。

AI プロジェクトの実行レイヤーには、標準的な作業には Opus 4.8、軽いタスクには Haiku など、より安価なモデルを使用する必要があります。

Fable の設計の恩恵を受けながら、すべての実行トークンに Fable の料金を支払う必要はありません(そもそもそれは過剰です)。

最後の 10%: レビュー

実行が完了したら、Fable を再び呼び出します。元の設計に対して出力をレビューさせます。

結果は計画と一致していますか?ギャップはありますか?リリース前に修正が必要なものはありますか?

この最終チェックで、Fable の知性が安価なモデルでは見逃すものを発見します。そして、ゼロから生成するのではなく、完成した出力をレビューするため、タスク全体を自分で行う場合よりもはるかに少ないトークンしか使用しません。

Miles Deutscher - inline image

10-80-10 システム

これが 10-80-10 フレームワーク全体であり、トークンコストのデメリットなしに Fable のすべての利点を得ることができます。

Opus 4.8 のようなモデルは、実行レイヤーを処理するのに十分な能力があり、このシステムは、複数回のループや詳細な調査などで、すべてを「完璧」にしようとする Fable の傾向を回避します。

II: ループの解説

これについては詳細な記事を書く予定ですが、ここでは /loop について簡単に説明します。これは現在、Fable 5 を最も強力に活用する方法です。

Anthropic のエンジニアである Lance Martin ( @RLanceMartin ) 氏が、Mythos クラスのモデル向けのループ設計に関するガイドを公開しました。

この記事を読むことを強くお勧めしますが、以下に要約します。

https://x.com/RLanceMartin/status/2064397389189071163

従来のプロンプト方法 vs 新しいプロンプト方法

従来のプロンプト方法は次のようになっていました。

プロンプト → Claude が応答 → 確認 → 再プロンプト → 繰り返し

このモデルでは、あなた自身がループです。

すべての検証ステップ、修正、フォローアップを手動で確認します。

ループはこのプロセス全体を自動化し、あなたをボトルネックから解放します。

ループエンジニアリングを使用すると、Fable に事前に目標を与え、Fable がその目標に向けてサブエージェントを起動します。

ループを設計 → Fable が検証用サブエージェントを起動 → エージェントが目標達成のために自己プロンプト

Miles Deutscher - inline image

プロンプトエンジニアリング vs ループエンジニアリング

/goal と /loop の解説

これら 2 つのコマンドは、Claude Code 内でループエンジニアリングを実践的に実装したものです。

/goal は開始点です。

プロンプト構造

/goal [タスク] until [測定可能な最終状態] without [制約]

/loop はこれをさらに一歩進めます。

単一の実行ではなく、/loop は事前に設定された間隔でプロンプトを再実行します。

/loop [プロンプト] --interval 30m --expires 8h

Miles Deutscher - inline image

/goal vs /loop

この組み合わせは非常に強力です。

/goal を使用してタスクを一度定義し、/loop を使用して、作業に適したスケジュールで自動実行させます。

ループエンジニアリングをトークンコスト削減に実践的に活用する

ここで 10-80-10 システムが威力を発揮します。

10-80-10 フレームワークでは、Fable が最初の 10% の計画を担当し、ループを設計します。安価なモデルが 80% の実行を担当し、Fable はループが閉じたとき、または必要なときにのみ再び登場します。

実行レイヤーに GPT-5.5 を使用することもでき、トークン消費を 50% 以上削減できます。

III: 一般的なトークン節約のヒント

10-80-10 システムとループが大局的な効率性を扱います。以下は、違いを生む可能性のある、より小さな調整です。

  1. 努力レベルの選択

最大ではなく、中程度の努力から始めましょう。

中程度の Fable は、非常に高い Opus よりも優れています。品質に本当に問題が生じた場合にのみ、レベルを上げてください。すべてを最大にデフォルト設定することは、制限を消費する最も速い方法の 1 つです。

中には、低い努力レベルで Fable を使用して素晴らしい出力を得たと報告する人もいます。

  1. 古いスキルと指示を削除する

以前のモデル用に構築されたプロンプトは、Fable ではパフォーマンスが低下することがよくあります。

Fable 内では、より短く、よりクリーンな指示の方がパフォーマンスが良く、コストも低くなります(Fable はとにかく自分で解決します)。

  1. Fable にすべての理由を伝える

リクエストの背後にある意図を理解すると、Fable は最初から正しく処理できることが多くなります。

修正や反復の回数が減れば、消費されるトークンも大幅に減少します。

このモデルは完全に自律的な作業用に構築されていることに注意してください。物事の「理由」を伝えないと、次のステップを考え出すためにより多くの思考を必要とします。

  1. /usage

使用量を積極的に監視しましょう。 Claude Code で定期的に /usage を実行してください。7 月 7 日に Fable が従量課金制に移行した後は、これが必須になります。

Fable 5 のプロンプトガイド全体はこちらに書きました。ここで述べたヒントの多くは、トークン消費も削減します。

https://x.com/aiedge_/status/2065064961999847849

IV: 高くつく Fable のミス

これらは、特に指摘する価値のある 2 つのミスです。見落としがちで、対処しないと高くつく可能性があるからです。

ミス 1: 意図せずに Fable を実行してしまう。

Claude Code または Claude アプリを開くと、現在はデフォルトで Fable になっています。

Anthropic は現在、人々にこのモデルをテストするよう積極的に促しています。

簡単なアドバイス: セッションを開始する前に、毎回モデルセレクターを確認してください。通常のチャットで誤って Fable を実行していることに、何度か気づきました。

ミス 2: 支出上限がない

7 月 7 日、Fable は標準サブスクリプションから移行します。

プラン制限を超えて Fable を使い続けたい場合は、クレジットカードを追加してトークンごとに支払う必要があります。

落とし穴は、クレジットカードにハードリミットがないことです。

Fable は自律的な実行や長時間のセッションでトークンを急速に消費します。制限がないと、気づかないうちに多額の請求額が発生する可能性があります。

毎月の支出は、設定 → 使用量 → 制限の調整 で設定できます。

Miles Deutscher - inline image

毎月の支出を設定

まとめ

以上が、Fable のトークンコストを大幅に削減するための私のフレームワーク全体です。

この記事がお役に立てば幸いです。

役に立ったと思われた方は、ぜひ私 @milesdeutscher@aiedge_ をフォローしてください。毎週、この急速に進化する分野で先を行くための実用的な AI ガイドを投稿しています。

約束どおり、Fable に直接送信してトークン消費をすぐに削減できるドキュメントを作成しました。

Miles Deutscher - inline image

10-80-10 システムドキュメント \先行公開\

完全なドキュメントにアクセスするには:

  1. 無料の AI Edge ニュースレターに登録する
  2. 無料の Instagram コミュニティに参加して、ドキュメントを受け取る

こちらから始めてください。👇

https://www.aiedgehq.co/

Miles Deutscher - inline image

https://www.aiedgehq.co/

最後までお読みいただき、ありがとうございました。💙

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
クリエイターのために

あなたの Markdown をきれいな 𝕏 記事に

自分の長文を投稿するとき、画像・表・コードブロックを 𝕏 向けに整形するのは手間がかかります。YouMind は Markdown 全体を、そのまま投稿できるきれいな 𝕏 記事に変換します。

Markdown → 𝕏 を試す

解読すべきパターンをもっと

最近のバイラル記事

バイラル記事をもっと見る