Claude Fable 5 成本優化：10-80-10 路由指南

Fable 5 是我用過最棒的 AI 模型。

但它也貴得離譜。

在我最初測試的幾個小時裡，我幾乎就用光了整個使用額度。

而且我甚至沒在做什麼瘋狂的事。

Fable 的價格是 Opus 4.8 的兩倍。

而且因為它太聰明了，它實際上會過度思考——不斷循環運算並消耗 Token，這是以前的 Claude 模型從未有過的情況。

大多數人使用它的方式完全錯誤。

以下是我建立的精確系統，成功將我的 Fable Token 成本降低了 50% 以上。

不需要新工具。輸出量不變。只是更聰明的路由。

每個人在第一天都會犯的錯誤

你打開 Claude Code。

Fable 現在是預設模型。

你開始聊天。

你請它修正一個錯字。你請它格式化一些 JSON。你請它重新命名一個變數。

Fable 思考了 12 秒，消耗了 8,000 個推理 Token，然後回傳答案。

成本：0.60 美元，只為了完成一個 Haiku 用 0.02 美元就能搞定的任務。

你付的是外科醫生的費用，卻只做閒聊的事。

Fable 是建築師。

不是室友。

一旦你內化這一點，一切都會改變。

10-80-10 系統（Anthropic 工程師自己使用的精確框架）

每個 Fable 專案都有三個階段。

大多數人在所有三個階段都使用 Fable。

聰明的做法是只在其中兩個階段使用 Fable。

前 10% — 規劃

這是 Fable 值得其價格標籤的地方。

在任何專案開始之前，使用 Fable 來定義：

→ 結構與方法 → 成功標準 → 限制條件與邊緣案例 → 可能出錯的地方

想像一下蓋房子。

最昂貴的錯誤是給建築工人一張糟糕的藍圖。

先把架構做對。

Fable 在這方面表現非凡。

中間 80% — 執行

這是大多數 Token 被消耗的地方。

來回溝通。迭代。實作循環。實際完成任務的苦工。

Fable 不需要參與這個階段。

切換到 Opus 4.8 來處理標準工作。使用 Haiku 處理輕量任務。使用 Codex 或 GPT-5.5 進行機械化執行。

你獲得了 Fable 品質的架構，卻不需要為每個執行 Token 支付 Fable 的價格。

最後 10% — 審查

讓 Fable 回來。

讓它根據原始計畫審查輸出：

→ 結果是否符合架構？

→ 是否有遺漏的差距或邊緣案例？

→ 在發布前是否需要修正任何東西？

因為 Fable 審查的是完成的輸出，而不是從頭開始生成，它使用的 Token 量遠低於它從頭到尾完成整個任務時所消耗的。

[INSERT IMAGE 2 — PROMPT BELOW]

CLAUDE.md 路由表（一個控制一切的檔案）

這是最重要的突破。

在你的 CLAUDE.md 中維護一個路由表。

讓 Fable 扮演編排者的角色，讀取這個表並自動將工作分派給正確的模型。

以下是我使用的精確路由表：

markdown

1## 模型路由表
2
3### Fable 5（僅限編排者）
4用於：規劃、架構設計、審查最終輸出
5切勿用於：機械性任務、大量生成、樣板程式碼
6努力程度：高（絕不使用極高——它是個 Token 熔爐且輸出更差）
7
8### Opus 4.8（深度推理執行者）
9用於：複雜除錯、多步驟推理、任何需要真正思考
10        但非架構設計的工作
11成本層級：標準
12
13### Sonnet 5（機械工作執行者）
14用於：程式碼生成、重構、標準功能開發
15成本層級：便宜
16
17### Codex / GPT-5.5（同儕執行者）
18用於：實作任務、UI/UX 驗證、
19        規格明確的執行工作
20注意：Fable 可以學會引導 Codex——教它一次即可
21成本層級：在 Codex 方案上通常免費
22
23### Haiku（大量執行者）
24用於：格式化、lint、簡單編輯、樣板程式碼、
25        重新命名重構、測試框架
26切勿從 Haiku 產生進一步的子 Agent
27成本層級：最便宜
28
29### Kimi / GLM-5.2（長上下文執行者）
30用於：讀取大型檔案、長期儲存庫分析，
31        這樣 Fable 就不會在此花費 Token
32成本層級：非常便宜
33
34### DeepSeek / Qwen（極便宜的基本工作）
35用於：樣板程式碼、測試撰寫、資料清理、
36        翻譯、初稿文件、大量生成
37成本層級：接近免費

Fable 從不直接處理便宜的工作。

它負責規劃，將任務委派給正確的層級，然後根據計畫檢查結果。

昂貴的大腦只花費 Token 來做決策。

就是這個檔案讓我的帳單下降了，同時產出卻增加了。

節省了我 70% Token 的精確 CLAUDE.md 設定

以下是我放入 CLAUDE.md 的完整編排章節：

markdown

1## 編排工作流程
2
3你（Fable）是編排者。負責規劃、分解、綜合。
4請勿自行執行機械性任務。
5
6### 委派規則：
7- 推理密集型階段 → 深度推理者（Opus 4.8）
8- 機械性工作 → 快速工作者（Sonnet/Haiku）
9- 程式碼庫分析 / 大型檔案 → Kimi（長上下文）
10- 樣板程式碼 / 大量工作 → DeepSeek 或 Qwen
11- 來自不同視角的同儕審查 → Codex
12
13### Codex 是同儕，不是審查者：
14將 Codex 視為來自不同視角的頂尖資深工程師。
15對於高風險決策：同時指派 Opus 和 Codex
16處理同一個問題，綜合兩者最佳結果，
17且不讓彼此看到對方的答案。
18
19### 上下文紀律：
20保持你自己的上下文精簡。
21切勿重新讀取你已處理過的檔案。
22在將工具輸出反饋到上下文之前，先進行摘要。
23要求模型回傳你可以據以行動的簡潔結論。
24
25### 努力程度：
26- 規劃與架構：高努力
27- 審查環節：中等努力
28- 預設情況下切勿使用極高/最高——成本更高，效果往往更差

現在像技術主管一樣提示 Fable：

markdown

1目標：[你想要什麼]
2上下文：[檔案、限制條件、你擔心的事]
3
4你是主管。
5將推理委派給深度推理者（Opus）。
6將苦工委派給快速工作者（Sonnet/Haiku）。
7使用 Codex 處理需要新視角的問題。
8
9先向我展示你的計畫，然後再執行。

就是這樣。

Fable 負責規劃。其他所有模型負責執行。帳單保持平穩。

安裝 Codex 外掛——倍增效果的關鍵步驟

這是大多數人會跳過的設定。

Codex 和 Fable 結合使用，效果比單獨使用 Fable 好 10 倍。

Fable 負責架構。Codex 以 GPT-5.5 的品質執行。你幾乎不會動到你的 Claude 額度。

設定時間不到 5 分鐘：

步驟 1：在你的機器上安裝 Codex CLI

bash

1npm install -g @openai/codex

步驟 2：在 Claude Code 內新增外掛

text

1/plugin marketplace add openai/codex-plugin-cc
2/plugin install codex@openai-codex
3/codex:setup

步驟 3：在 Claude Code 中建立兩個子 Agent

text

1/agents
2
3→ deep-reasoner
4  模型：Opus 4.8
5  指令：「用於推理密集型階段、架構設計、
6  複雜問題除錯。徹底思考，回傳一個
7  編排者可以據以行動的簡潔結論。」
8
9→ fast-worker
10  模型：Sonnet 5
11  指令：「用於機械性任務、樣板程式碼、測試、
12  格式化、簡單編輯。有效率地執行。」

步驟 4：請 Fable 為 Codex 撰寫一個 SKILL.md

text

1撰寫一個 SKILL.md，精確教導 Codex 如何：
2- 閱讀並執行實作計畫
3- 執行測試並將結果回報給你
4- 處理此專案中的特定檔案結構

讓 Codex 在機械性工作上不需要任何指導。

Fable 只需撰寫一次技能。

Codex 在每次未來執行時都會讀取它。

你的 Codex 輸出品質立刻提升 10 倍。

/loop 指令（目前使用 Fable 最強大的方式）

大多數人仍然使用舊的提示方式。

你提示 → Fable 回應 → 你審查 → 你再次提示 → 重複。

在這種模式下，你就是那個循環。

你手動驗證每一步、每一個修正、每一次後續追蹤。

Loop 消除了你這個瓶頸。

運作方式：

你事先給 Fable 一個目標。

它會啟動子 Agent 來朝這個目標努力。

這些 Agent 會自我提示，並在完成時回報。

兩個指令：

text

1/goal — 定義任務和最終狀態
2
3結構：
4/goal [任務] until [可衡量的最終狀態] without [限制條件]
5
6範例：
7/goal 重構認證模組 until 所有 47 個測試通過
8without 觸碰支付服務或資料庫結構

text

1/loop — 按排程自動執行提示
2
3結構：
4/loop [你的提示] --interval 30m --expires 8h
5
6範例：
7/loop 對所有 API 端點執行安全檢查
8--interval 24h --expires 7d

組合使用：

text

1/goal 重建儀表板元件 until Lighthouse
2分數在行動裝置上超過 90 without 破壞現有測試
3
4/loop 執行上述 /goal --interval 6h --expires 48h

Fable 設計循環。較便宜的模型在循環內執行那 80% 的工作。Fable 只在循環結束或遇到阻礙時才重新介入。

你醒來時，任務已經完成。

[INSERT IMAGE 5 — PROMPT BELOW]

現在就在 Fable 上運行的 7 個提示

這些是在將 Fable 用於其他任何事情之前，最能發揮其槓桿作用的事項。

不是隨興編碼。

不是發布功能。

而是磨練你已有的每一個系統。

1. 找出真正值得在 Fable 上運行的事

text

1你是 Fable 5，目前能力最強的可用模型。
2
3瀏覽我的專案、文件和記憶。
4
5列出前 5 個真正值得在你身上運行的任務。
6
7每個任務附上一行原因進行排名。
8
9先不要開始做這些工作。

2. 在開始建構任何東西之前，重新設計你的建構方式

text

1我希望你徹底審計並重新設計我的編碼工作流程。
2
3這是我目前的工作方式：[描述你的流程]
4
5我的目標是：[你想要發布什麼]
6
7審查、審計、磨練並改進我的系統。
8
9不要寫程式碼。在我們運行工廠之前，先重新設計工廠。

3. 規劃大型專案——但先不要開始建構

text

1我想要規劃：[描述專案]
2
3先不要開始建構。
4
5列出完整的計畫：階段、關鍵決策、風險、
6以及待解決的問題。
7
8標記任何可能導致專案失敗的因素。
9
10讓計畫足夠清晰，以便 Sonnet 或 Codex 能夠
11逐步執行，而不需要問我問題。

4. 在發布前找出所有問題

text

1我即將發布這個專案。
2
3先找出它所有的問題。
4
5閱讀整個程式碼庫。
6
7尋找真正的錯誤、有問題的邊緣案例，以及任何
8會在用戶面前出錯的地方。
9
10列出每個問題，附上：如何重現以及修正方法。
11
12標準要高。要毫不留情。

5. 從頭重建你的 CLAUDE.md

text

1閱讀我目前的 CLAUDE.md。
2
3它是為舊模型撰寫的，而且內容臃腫。
4
5更短、更清晰的指令在 Fable 上表現更好且成本更低。
6
7重寫它：
8- 移除 Fable 不再需要的指令
9- 精簡每個工作流程
10- 從我們的對話中加入模型路由表
11- 盡可能將每個章節控制在 5 行以內
12
13Fable 會自行處理其餘部分。

6. 從它對你的所有了解中獲得商業建議

text

1你是我的商業顧問。
2
3閱讀我的計畫文件、已連接的工具和記憶。
4
5撰寫一份一頁的業務評估，內容包括：
6- 未來 3 個月應專注的前 3 件事
7- 應該放棄什麼以及原因
8- 我可能忽略的一件事

7. 自動化安全掃描

text

1/loop 對我所有的 API 端點執行安全檢查。
2
3尋找：暴露的金鑰、缺少的認證、速率限制漏洞、
4注入向量，以及任何惡意用戶可能濫用的東西。
5
6僅回報具有嚴重性評級的實際問題。
7
8--interval 24h --expires 7d

努力程度——最容易被誤解的設定

大多數人預設使用最高或極高。

這是錯的。

以下是每個層級實際發生的情況：

→ 低：快速、便宜，對於簡單任務來說出奇地有能力。許多人回報在這裡得到了驚人的輸出。

→ 中：最佳平衡點。中等努力的 Fable 勝過極高努力的 Opus。預設使用這個。

→ 高：用於：困難的除錯、多檔案重構、架構決策。真正的推理能力。

→ 極高 / 最高： Token 熔爐。通常產出比「高」更差的結果。僅保留給你真正面對過的最困難問題。

規則：從「中」開始。只有在品質確實不足時才提升到「高」。切勿預設使用「最高」。

另一個扼殺預算的設定：

擴展思考——預設保持關閉。

只在問題確實需要時才開啟它。永久開啟它就像讓你的引擎在車道上空轉。

/handoff 技巧——解決上下文視窗膨脹問題

長時間的對話是無聲的殺手。

每次輪詢都會重新發送完整的對話歷史。

一個 200k Token 的對話會成為你帳單上最昂貴的項目。

解決方案：頻繁開啟新的對話。

但當你這麼做時，你不想失去上下文。

使用 /handoff 技能：

text

1給我一個提示，讓我可以使用它在新的對話中
2重新開始這個會話，而不會失去我們任何上下文。
3
4包含：
5- 我們決定了什麼
6- 我們建構了什麼
7- 下一步是什麼
8- 我必須記住的任何重要限制條件
9
10讓它少於 500 Token，這樣新的會話就能從精簡開始。

複製那個輸出。

開啟新的對話。

貼上它。

以極低的上下文成本，從你離開的地方精確繼續。

每 30–60 分鐘開啟一個新的會話 = 大量節省 Token。

要避免的 4 個昂貴錯誤

錯誤 1：Fable 成為預設模型。

當你打開 Claude Code 時，它會自動使用 Fable。

在每次會話前檢查模型選擇器。

這個習慣已經多次讓我在普通對話中意外使用 Fable，次數多到我不想承認。

錯誤 2：沒有支出上限。

在 7 月 7 日，Fable 將脫離標準訂閱方案。

立即新增信用卡並設定一個硬性的每月上限。

設定 → 使用量 → 調整限制。

Fable 在自主運行和長時間會話中消耗 Token 的速度非常快。

沒有硬性上限，一個晚上的 Agent 運行可能會在你醒來前累積一筆帳單。

已經有人因為一個提示被收取了 960 美元。

今晚就設定上限。

錯誤 3：要求它解釋其推理過程。

那一個請求可能會觸發分類器，你的工作會在被你認為仍在 Fable 上運行時，悄悄地由一個較弱的模型處理。

跳過「為什麼」的請求。判斷輸出品質，而不是過程。

錯誤 4：零碎地餵給它小提示。

Fable 可以在腦中容納數小時的上下文。

一次就把整個雜亂的東西給它。

完整的上下文。限制條件。你真正害怕的是什麼。

我曾用一個簡短的提示，將一個我害怕了好幾週的重構任務交給 Fable。它完成後回傳給我。

零碎地餵給它提示，浪費了它最擅長的一件事。

模型成本比較——了解你實際支付的費用

在你路由任何工作之前，先了解每個模型的價格：

模型輸入（$/M）輸出（$/M）最適合用於

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Fable 5 ~$15 ~$75 規劃、審查

Opus 4.8 ~$5 ~$25 深度推理

Sonnet 5 ~$3 ~$15 標準執行

Kimi K2.7 ~$0.95 ~$4.00 大量編碼、長上下文

GLM-5.2 ~$1.40 ~$4.40 儲存庫規模工作

DeepSeek v4 ~$0.28 ~$1.10 極便宜的基本工作

Haiku 4.5 ~$1 ~$5 清理、格式化

本地（Qwen/Llama） $0 $0 自動完成、樣板程式碼

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Fable 和 DeepSeek 之間的差距：輸入端 53 倍。輸出端 68 倍。

同一個 30 步驟的重構 Agent： → 全部使用 Fable：每次運行約 25 美元 → Fable 規劃 + Kimi 執行：每次運行約 1.40 美元 → 相同的已發布程式碼。相同的測試通過。

路由不是為了便宜。

而是為了精準。

完整系統——運行時的樣貌

在這個系統之前：

→ 所有工作都路由到 Fable

→ 每次發布功能時帳單飆升

→ 使用額度在會話中途耗盡

→ 你像個預算有限的旅行者一樣配給提示

在這個系統之後：

→ Fable 處理那真正需要的 10%

→ 便宜的模型處理那 80% 的執行

→ /loop 在夜間運行而不觸及你的額度

→ 你發布更多，花費更少，從不碰到速率限制

三行總結：

Fable 規劃。其他模型執行。Fable 審查。

在你改變任何其他事情之前，這一個規則就能將你的帳單降低 50% 以上。

其餘的都是最佳化。

今晚就執行這個

立即將這個丟給 Fable：

閱讀我目前的 CLAUDE.md 和我所有活躍的專案。

你的任務：為我的工作流程設定 10-80-10 路由系統。

建立：

包含完整模型路由表的更新版 CLAUDE.md
我目前活躍任務的清單，根據每個任務應由哪個模型處理來排名
三個 /goal 提示，我可以根據你在我的專案中看到的內容，今晚在較便宜的模型上運行

不要執行任何東西。只需規劃和路由。

Fable 負責規劃。

你醒來時會得到一個完整的路由系統。

還有一張不會讓你心臟病發作的帳單。

如果這篇文章幫你省了錢：

→ 轉發出去，讓其他開發者不再燒光預算

→ 追蹤 @sairahul1 獲取更多這類系統

→ 加入書籤——這些 CLAUDE.md 設定是有效的，今晚就貼上使用

訂閱 theaibuilders.co 獲取更多此類有趣文章

我撰寫關於 AI、產品建構，以及在你睡覺時也能運作的系統。

資源：

→ Entelligence token router：entelligence.ai/blogs/entelligence-token-router

→ 將帳單降低 80% 的三模型工作流程：entelligence.ai/blogs/our-three-model-coding-workflow-that-cut-our-ai-bill-80

→ Claude Code：claude.ai/code

→ Codex CLI：npmjs.com/package/@openai/codex

如何在使用 Claude Fable 5 時避免預算超支

10-80-10 系統（Anthropic 工程師自己使用的精確框架）

CLAUDE.md 路由表（一個控制一切的檔案）

節省了我 70% Token 的精確 CLAUDE.md 設定

安裝 Codex 外掛——倍增效果的關鍵步驟

/loop 指令（目前使用 Fable 最強大的方式）

現在就在 Fable 上運行的 7 個提示

努力程度——最容易被誤解的設定

/handoff 技巧——解決上下文視窗膨脹問題

要避免的 4 個昂貴錯誤

模型成本比較——了解你實際支付的費用

完整系統——運行時的樣貌

今晚就執行這個

如果這篇文章幫你省了錢：

資源：

使用 YouMind 創作爆款文章

近期爆款文章

最佳 AI 模型終極指南：Claude Fable 5 簡單易懂的解析

你的 AI Agents 無法互相溝通？只需兩行程式碼即可解決。

7 月 7 日前必試的 5 個 Fable 5 使用情境

為 Agent 編排設計可程式化的執行環境

Claude Fable 5 設定指南：如何以最低成本獲得最高品質（內含精確配置）

感謝一切：我從 Rakuten 離職的心路歷程

如何在使用 Claude Fable 5 時避免預算超支

10-80-10 系統 （Anthropic 工程師自己使用的精確框架）

CLAUDE.md 路由表 （一個控制一切的檔案）

節省了我 70% Token 的精確 CLAUDE.md 設定

安裝 Codex 外掛——倍增效果的關鍵步驟

/loop 指令 （目前使用 Fable 最強大的方式）

現在就在 Fable 上運行的 7 個提示

努力程度——最容易被誤解的設定

/handoff 技巧——解決上下文視窗膨脹問題

要避免的 4 個昂貴錯誤

模型成本比較——了解你實際支付的費用

完整系統——運行時的樣貌

今晚就執行這個

如果這篇文章幫你省了錢：

資源：

使用 YouMind 創作爆款文章

把你的 Markdown 變成乾淨的 𝕏 文章

近期爆款文章

最佳 AI 模型終極指南：Claude Fable 5 簡單易懂的解析

你的 AI Agents 無法互相溝通？只需兩行程式碼即可解決。

7 月 7 日前必試的 5 個 Fable 5 使用情境

為 Agent 編排設計可程式化的執行環境

Claude Fable 5 設定指南：如何以最低成本獲得最高品質（內含精確配置）

感謝一切：我從 Rakuten 離職的心路歷程

10-80-10 系統（Anthropic 工程師自己使用的精確框架）

CLAUDE.md 路由表（一個控制一切的檔案）

/loop 指令（目前使用 Fable 最強大的方式）