Fable 5 のプロンプト術:開発チームが教える実践的ガイド

@cyrilXBT
英語2 日前 · 2026年7月02日
400K
397
48
12
1.3K

TL;DR

本ガイドでは、Fable 5 に関する Anthropic の公式戦略を解説します。高レイテンシな自律型タスクの処理、モデルのプロアクティブな制御、そして永続的なメモリシステムの実装に焦点を当てています。

Fable 5 が本日、2026 年 7 月 1 日より全世界で復活しました。

Opus 4.8 で使っていたのと同じプロンプトを開いて実行する前に、これを読んでください。Anthropic は Fable 5 専用の公式プロンプトガイドを公開しており、その中で最も重要な点は、ほとんどのチームが間違った方法でモデルをテストし、その能力を過小評価していることです。

Fable 5 は、これまで使ってきたツールのより賢いバージョンではありません。それは、異なるカテゴリーのツールであり、異なるカテゴリーのプロンプトを必要とします。最も良い結果を出しているチームは、より良い質問を書くチームではありません。彼らは、より難しい問題を与え、より長い実行を異なる方法で構成し、既存のワークフローが破綻する前に、Fable 5 のどのような行動変化がプロンプトの更新を必要とするかを理解しているチームです。

以下は、そのガイドが実際に述べていることの完全な解説であり、Anthropic が意図する方法で Fable 5 を使い始めるために必要なすべてが含まれています。

Fable 5 が実際に得意とすること

Anthropic の公式ガイドで最も明確に示されているのは次の点です。Fable 5 は、以前のモデルでは複雑すぎたり、実行時間が長すぎたり、曖昧すぎたりした問題に取り組みます。特に、人間が完了するのに数時間、数日、あるいは数週間かかるような、エンドツーエンドの作業に効果的です。

この一文は、見た目以上に多くのことを示しています。それは、このモデルの優位性が実際にどこにあるのかを教えており、それは単純な質問に対するより高速なワンショット回答にあるのではありません。それは、持続的で自律的な、複数段階の作業にあります。これまでのモデルでは、断片化したり、幻覚を起こしたり、あるいは途中で正しく完了しなくなったりしていました。

公式ガイドは明確に述べています。Fable 5 をより単純なワークロードでのみテストすると、その能力を過小評価する傾向があります。評価プロンプトが短く、明確に定義されたタスクであり、Opus 4.8 で既に問題なく完了できていたものであれば、わずかな改善しか見られず、Fable 5 はコストに見合わないと結論付けるでしょう。真に異なる結果を報告しているチームは、これを最も困難な未解決問題に適用しています。それは、これまで何時間もの人間による反復、複数回のやり取り、または実行段階での失敗を必要としていた問題です。

実際には、これは Fable 5 を評価する際に最初に問うべき質問は、「現在のプロンプトではどの程度の性能か?」ではないことを意味します。それは、「どのモデルも確実に完了できなかったため、自動化を諦めた作業は何か?」です。それらの放棄されたワークフローこそが、Fable 5 がまったく異なる製品のように見え始める領域です。

最大の行動変化:応答に時間がかかる

Opus 4.8 から Fable 5 に移行するチームを最初に驚かせるのは、応答レイテンシーです。Anthropic のガイドは、これを移行時の混乱の最も一般的な原因として直接挙げています。

高努力(high effort)では、単一の応答に数分かかることがあります。自律実行では、数時間かかることもあります。これはバグや非効率の兆候ではありません。モデルが正しく作業を行っている証拠です。Fable 5 は行動する前に計画し、自身の作業をチェックし、必要に応じてコンテキストを拡張し、問題が発生した場合にすぐに再度プロンプトを実行して修正を促すような、急いで出力を生成することはありません。

実用的な意味合いとして、API 経由で Fable 5 を実行している場合、タイムアウト設定をほぼ確実に更新する必要があります。Anthropic は、Opus 4.8 からの移行の一環として、タイムアウト戦略を再検討することを明示的に推奨しています。10 秒で応答を生成するモデルに適したタイムアウトは、Fable 5 が複雑なマルチステージタスクの計画に 3 分間を正しく費やしているワークフローでは破綻します。

努力(effort)パラメータは、Fable 5 が応答する前にどれだけ深く考えるかを制御します。High がデフォルトであり、ほとんどの要求の厳しい作業に適しています。xhigh は最大値であり、速度よりも初回の正確性が重要な場合に推奨されます。xhigh では、Fable 5 は応答する前に自身の作業を振り返り、検証します。Medium と Low は、完全な能力が不要でコストが重要なルーチン的なサブタスクに使用できます。

重要な原則:努力レベルは、より良い回答を得るために上げる品質ダイヤルではありません。それは、特定のタスクが実際に必要とするものに基づいて調整する、コストとレイテンシーのトレードオフです。コードベースの移行には xhigh が適しています。単純なフォーマットタスクには不要です。

プロンプトで努力を制御する方法

並列エージェントによる動的ワークフローを実行せずに、最大限の推論を必要とするタスクの場合、プロンプト内で直接努力を制御できます。

単一ターンの深い推論には、プロンプトに "ultrathink" を含めます。これにより、他のセッション設定を変更したり、ワークフローオーケストレーションをトリガーしたりすることなく、その特定の応答に対して xhigh の推論努力が指示されます。

セッションレベルの自動ワークフローには、Claude Code で /effort ultracode を設定します。これにより、セッション内のすべての実質的なタスクに対して、xhigh の推論と自動動的ワークフローオーケストレーションが組み合わされます。Anthropic のドキュメントで明確にされている重要な注意点として、ultracode は xhigh 努力をサポートするモデルを必要とします。これは現在、Fable 5、Opus 4.8、Opus 4.7 を意味します。Sonnet 4.6 以前のモデルはサポートしていません。

API 統合の場合は、リクエスト内で effort パラメータを直接使用します。Fable 5 と Mythos 5 では、生の思考連鎖(chain of thought)は決して返されません。thinking.display 設定は、思考ブロックに含まれる内容を制御します。"summarized" は読みやすい要約を返し、"omitted" がデフォルトで空の思考フィールドを返します。

進捗検証プロンプト

これは、Anthropic の公式ガイドで最も有用なプロンプトテクニックであり、Fable 5 の長時間の自律実行に固有のものです。

これが解決する問題:拡張されたマルチステップタスクにおいて、Fable 5 は、実際の実行結果に対して検証されていないステップを完了したと報告することがあります。これが「やった」問題であり、タスクが長く複雑になるほど発生しやすくなります。

Anthropic のテストでは、特に捏造された進捗報告を誘発するように設計されたタスクでも、特定の指示がこの問題をほぼ排除することがわかりました。長時間の自律タスクのプロンプトにこれを追加してください。

「進捗を報告する前に、各主張をこのセッションのツール結果に対して監査してください。証拠を提示できる作業のみを報告してください。まだ検証されていないものがあれば、明示的にその旨を述べてください。結果を忠実に報告してください。テストが失敗した場合は、その出力とともにその旨を述べてください。ステップがスキップされた場合は、その旨を述べてください。何かが完了し検証された場合は、曖昧にせず明確に述べてください。」

この指示は、Fable 5 が自身のステータスレポートを処理する方法を再構築します。自分が何が起こったと信じているかを要約する代わりに、報告する前に各主張を実際のツール実行結果と相互参照します。「監査(audit)」という言葉はここで特定の役割を果たしています。Anthropic は複数の表現をテストし、監査という言葉がよりソフトな同等の表現よりも信頼性の高い自己チェックを生み出すことを発見しました。

数分以上かかる、またはツール実行を含むワークフローの場合、この指示はタスクプロンプトだけでなく、システムプロンプトに属します。

積極性の問題とその制約方法

Fable 5 は Opus 4.8 よりも積極的です。顕著に積極的です。実際には、これは、明示的に依頼していなくても、アクションが役立つと推測した場合に、要求されていないアクションを実行することがあることを意味します。

Anthropic が公式ガイドで挙げている例:依頼されていないメールの下書きを作成したり、変更を加える前に防御的な git ブランチのバックアップを作成したりすること。これらの動作は、Fable 5 の観点からはエラーではありません。それらは、ユーザーがおそらく望むであろうことを推測して、モデルが真に役立とうとしているものです。

問題は、本番ワークフローにおける要求されていないアクション、特に外部システム、メール、git、ファイルに触れるアクションが、実際の問題を引き起こす可能性があることです。依頼されずにクライアントにメールを送信したり、リポジトリに予期しないブランチを作成したりするモデルは、明示的なガードレールなしでは無人で実行できるモデルではありません。

修正方法は簡単ですが、自動化された、または無人で実行されるワークフロー用のすべてのシステムプロンプトに含める必要があります。

「ユーザーが問題を説明している、質問をしている、または変更を要求するのではなく考えを述べている場合、成果物はあなたの評価です。調査結果を報告し、停止してください。依頼されるまで修正を適用しないでください。再起動、削除、設定編集など、システム状態を変更するコマンドを実行する前に、証拠が実際にその特定のアクションをサポートしていることを確認してください。」

この指示は、観察と行動の境界を明確に定義します。これは Fable 5 が推測するのではなく、明確に述べられる必要があるものです。この制約の最も重要な部分は、2 番目の文です。調査結果を報告し、停止する。Fable 5 は、評価が完全な成果物であり、即時の行動への前段階ではないことを知る必要があります。

メモリーシステムプロンプト

Fable 5 は、セッションをまたいで教訓を蓄積する永続的なメモリーシステムを備えると、特に強力になります。公式ガイドは、このための特定の構造を推奨しています。

各教訓は、上部に 1 行の要約がある独自の Markdown ファイルに保存されます。ファイルには、何が学ばれたか、何が修正されたか、どのアプローチが確認されたか、そしてそれらのそれぞれがなぜ重要であったかが記録されます。重要なのは、リポジトリやチャット履歴にまだ記録されていないものだけを記録することです。重複は蓄積されるのではなくマージされます。間違っていることが判明したメモは、放置されるのではなく削除されます。

長期プロジェクトの開始時にこれを確立するための実用的なプロンプト:

「[フォルダ] にメモリーシステムを維持してください。上部に 1 行の要約があるファイルごとに 1 つの教訓を保存してください。修正と確認されたアプローチの両方を、それらが重要であった理由を含めて記録してください。リポジトリやチャット履歴に既にある情報は保存しないでください。重複を作成するのではなく、既存のメモを更新してください。誤りが証明されたメモは削除してください。」

重要な作業セッションの終わりには、以下で締めくくります。

「これまでのセッションを振り返ってください。サブエージェントを使用して、コアとなるテーマと教訓を特定し、それらを [フォルダ] に保存してください。将来のセッションの開始時に [フォルダ] を参照してください。」

これにより、セッションの境界を越えて存続する知識ベースが作成されます。これは、Fable 5 が複数日にわたるタスクにわたって一貫性を維持する能力の背後にある実際のメカニズムです。これがないと、各セッションはゼロから始まります。これがあれば、モデルは各セッションに、何が学ばれ、どのアプローチが検証され、何を避けるべきかを既に認識した状態で入ります。

最終応答指示

長時間の自律実行は、Anthropic のガイドが直接対処する特定の障害モードを生み出します。拡張されたツール使用とマルチステージ実行の後、モデルは内部コンテキストのショートカットを蓄積し、すべてのステップを監視していなかった人には解析が難しい最終出力になります。

問題は次のように見えます。Fable 5 は複雑なマルチステージ移行を完了し、その後、すべてのエージェント出力をリアルタイムで追跡した場合にのみ意味をなす内部の略語、矢印チェーン、および省略形を使用して結果を要約します。単に移行が成功したかどうかと次に何をすべきかを知りたかったユーザーは、明確な回答ではなく、技術的なダンプを受け取ります。

修正方法は、長時間実行されるワークフロープロンプトに追加される最終応答制約です。

「このタスクの後の最終応答では、最初に結果を述べ、次に主要な詳細を述べてください。ユーザー向けの出力に、作業用の略語、内部ラベル、矢印チェーンを含めないでください。ユーザーは、結果、証拠、リスク(ある場合)、および次のステップを必要としています。」

この指示は、出力を劣化させることではありません。それは、モデルの内部処理プロセスと、エンドユーザーが実際に受け取る応答を分離することです。処理プロセスは徹底的であるべきです。最終応答はクリーンであるべきです。

サブエージェント委任パターン

Fable 5 は、複雑なタスクで自身のサブエージェントを生成し調整できますが、公式ガイドは、これを適切に行うためには明示的な許可と明確な引き継ぎ構造が必要であると述べています。

最良の結果を生み出す委任パターンには、3 つの指示が連携して機能します。まず、Fable 5 に、いつ委任が許可され、いつタスクを自身で処理すべきかを明示的に伝えます。次に、各サブエージェントに、曖昧な指示ではなく、特定の範囲と明示的な成功基準を与えます。第三に、サブエージェントが実行されている間、コーディネートエージェントが何をすべきかを指定します。Fable 5 は、サブエージェントからの報告を待つ代わりに、同じタスクの独立した部分で作業を続けることができます。

複雑な調査やコードベース作業のための実用的なパターン:

「独立したサブタスクをサブエージェントに委任し、それらが実行されている間も作業を続けてください。各サブエージェントは、特定の範囲と明示的な成功基準を受け取る必要があります。すべてのサブエージェントが報告した後にのみ、サブエージェントの結果を統合してください。いずれかのサブエージェントが失敗した場合、またはその範囲を完了できない場合、見つかったであろうものを推測するのではなく、統合結果でその旨を明確に報告してください。」

最も重要な行は最後の行です。Fable 5 は、欠落しているサブエージェントの結果を推測で補うべきではありません。サブエージェントが失敗した場合、その失敗は情報であり、最終的な統合結果はそれを正確に反映する必要があります。

セーフティ分類器とフォールバック

Fable 5 には、攻撃的なサイバーセキュリティ技術、生物学および生命科学コンテンツ、およびモデルの要約された思考の抽出を対象とするセーフティ分類器が含まれています。リクエストがこれらの分類器をトリガーすると、応答にはエラーではなく HTTP 200 として stop_reason "refusal" が含まれます。

API 統合の場合、これはエラー処理が HTTP ステータスとは別に stop_reason をチェックする必要があることを意味します。拒否は、特定の応答タイプを持つ成功した API 呼び出しであり、失敗ではありません。Anthropic は、拒否時に Opus 4.8 への自動フォールバックのための SDK ミドルウェアを提供しており、出力が生成されなかった拒否に関するプロンプトキャッシュコストはカバーされます。

ほとんどの開発者にとっての実際的な意味合い:Anthropic のテストによると、拒否は典型的な開発者クエリの 5 パーセント未満に影響しますが、機密性の高い領域に触れる無害な生物学やコードレビューのタスクで発生する可能性があります。特にユースケースがフラグ付きドメインのいずれかを含む場合は、本番環境にデプロイする前に、特定のワークフローで拒否動作をテストすることをお勧めします。

Mythos 5 は、生物学と化学の分類器を維持しながらサイバーセキュリティ分類器を削除し、Project Glasswing パートナーのみが利用できます。他のすべての人にとって、サイバーセキュリティ関連のタスクにおける Fable 5 の動作は Opus 4.8 にルーティングされ、Fable 価格ではなく Opus 価格で同じリクエストを処理します。

Fable 5 におけるビジョンプロンプティング

Fable 5 のビジョン機能は Opus 4.8 から大幅にアップグレードされており、公式ガイドはそれを効果的に使用するための具体的なガイダンスを提供しています。

主な変更点:Fable 5 は、密度の高い技術画像、Web アプリケーション、詳細なスクリーンショットを、多くの場合、同じタスクで Opus 4.8 よりも少ない出力トークンで、大幅に高い精度で解釈します。また、アップロードされた画像が反転、ぼやけ、またはその他のノイズがある場合、劣化した入力を直接解釈しようとするのではなく、bash ツールと crop ツールを積極的に使用するようにトレーニングされています。

実用的なプロンプティングの意味合いは、前処理なしで、ライブアプリケーションからの実際の生のスクリーンショットを Fable 5 に渡すことができることです。Opus 4.8 が有用な情報を抽出するためにクリーンで高コントラストの画像を必要としたのに対し、Fable 5 はより乱雑な入力を処理し、コンテンツの読み取りを試みる前にいつトリミングまたは再処理すべきかを認識します。

特にコーディングワークフローの場合、Fable 5 はビジョンを使用して自身の出力を評価できます。ガイドは、スクリーンショットを使用して、元のデザインや目標に対してコーディング作業をチェックするようにトレーニングされていると述べています。つまり、デザインモックアップと、それが構築したもののライブスクリーンショットを与え、違いを特定するように依頼できます。これにより、以前は人間のレビュー担当者が視覚的な出力を比較する必要があったループが閉じられます。

UI やフロントエンド作業のための実用的なプロンプトパターン:

「こちらがデザインターゲットと、現在の実装のスクリーンショットです。ビジョンを使用して違いを特定し、ギャップを埋めるために必要な変更を生成してください。調査結果を報告する前に、比較が不明瞭な領域をトリミングしてズームインしてください。」

トリミングとズームインの明示的な指示を含める価値があるのは、ノイズの多い入力を処理する bash ツールの動作を引き出すためです。これがないと、Fable 5 は前処理を行わずに、小さなまたはぼやけた領域を解釈しようとする可能性があります。

移行チェックリスト

既存の Opus 4.8 ワークフローを Fable 5 に移行する場合、Anthropic のガイドは、モデル名を交換するだけでは完全な移行ではないと明言しています。Fable 5 の統合を本番環境対応として扱う前に、以下の領域を見直す必要があります。

タイムアウト。 Opus 4.8 の応答速度に設定されたタイムアウトは、高努力の Fable 5 には短すぎる可能性があります。スタック内のすべてのタイムアウトを監査し、テストする前に延長してください。

拒否処理。 API 応答解析に stop_reason "refusal" 処理を追加してください。これは、特定の応答構造を持つ HTTP 200 であり、エラーではありません。セーフティ分類器をトリガーする可能性のあるドメインに対して、Opus 4.8 へのフォールバックを設定してください。

積極性の制約。 自動化された、または無人で実行されるコンテキストで実行されるすべてのシステムプロンプトに、要求されていないアクションに関する明示的な制約を追加してください。Fable 5 が Opus 4.8 が動作していたのと同じ境界を推測するとは想定しないでください。

進捗検証。 数分以上かかる、またはツール実行を含むワークフローの場合は、最初の本番実行の前に、システムプロンプトに監査指示を追加してください。

メモリー構造。 ワークフローが複数のセッションにわたって実行される場合は、最初の長時間実行の前に、教訓ファイル構造を設定し、セッション終了時の振り返りプロンプトを追加してください。

最終応答形式。 出力をエンドユーザーに直接提示する、またはクリーンで構造化されたテキストを期待するダウンストリームシステムに提示するワークフローには、結果優先の応答制約を追加してください。

テスト範囲。 移行が完了したと判断する前に、Opus 4.8 では本当に困難または不可能であった少なくとも 1 つのタスクでワークフローをテストしてください。ここで、Fable 5 が質的に異なることを行っているのか、それともより高いコストで同じ品質を生み出しているのかがわかります。

移行は、これら 6 つの各領域が対処され、最も困難なワークフローが、手動介入なしに、最初の試行で最初から最後までクリーンに実行されたときに完了します。

最後の基準、つまり困難な作業の初回試行完了は、Fable 5 への移行が価値があったかどうかの真のベンチマークです。最も複雑なワークフローが、以前は複数のセッションと数回の人間による修正を必要としていたものを、単一の自律実行で完了するようになった場合、モデルは本来の目的を果たしています。

Fable 5 を初めて使用するチームに対する公式ガイドの実用的な推奨事項は、既に解決済みの作業ではなく、これまで確実に完了できなかった作業から始めることです。

以前は複数のセッションとその間の重要な人間の介入を必要としたタスクを選んでください。Fable 5 に、完全なコンテキスト、完全な目標、およびこのガイドの制約(進捗検証指示、積極性制約、最終応答形式指示を含む)を与えてください。xhigh 努力で実行してください。それが生成するものを確認してください。

その経験と、Opus 4.8 で同じプロンプトを実行することとのギャップこそが、Fable 5 の実際の価値が明確になるところです。そこに意味のある違いが見られれば、モデルは設計されたとおりに機能しています。タスクが同じように感じられる場合、おそらく両方のモデルが同様に機能するカテゴリー(ほとんどのルーチン作業)でテストしており、より難しい問題に移行する必要があります。

Fable 5 は、すべてのユースケースにおいて Opus 4.8 の代替品ではありません。それは、持続的な自律性、複雑なタスクにおける初回の正確性、および長期コンテキストの一貫性が最も重要である作業のサブセットに特化したものです。

その他のすべてについては、Opus 4.8 の方が高速で、安価で、十分です。

Claude を使った構築の詳細については、@cyrilXBT をフォローしてください。

Turn one viral article into a full content workflow

Collect the source, decode the pattern, create assets, draft the story, and distribute from one AI workspace.

Explore YouMind
クリエイターのために

あなたの Markdown をきれいな 𝕏 記事に

自分の長文を投稿するとき、画像・表・コードブロックを 𝕏 向けに整形するのは手間がかかります。YouMind は Markdown 全体を、そのまま投稿できるきれいな 𝕏 記事に変換します。

Markdown → 𝕏 を試す

解読すべきパターンをもっと

最近のバイラル記事

バイラル記事をもっと見る