Fable 5 是我用過最棒的 AI 模型。
但它也貴得離譜。
在我最初測試的幾個小時裡,我幾乎就用光了整個使用額度。
而且我甚至沒在做什麼瘋狂的事。
Fable 的價格是 Opus 4.8 的兩倍。
而且因為它太聰明了,它實際上會過度思考——不斷循環運算並消耗 Token,這是以前的 Claude 模型從未有過的情況。
大多數人使用它的方式完全錯誤。
以下是我建立的精確系統,成功將我的 Fable Token 成本降低了 50% 以上。
不需要新工具。輸出量不變。只是更聰明的路由。
每個人在第一天都會犯的錯誤
你打開 Claude Code。
Fable 現在是預設模型。
你開始聊天。
你請它修正一個錯字。你請它格式化一些 JSON。你請它重新命名一個變數。
Fable 思考了 12 秒,消耗了 8,000 個推理 Token,然後回傳答案。
成本:0.60 美元,只為了完成一個 Haiku 用 0.02 美元就能搞定的任務。
你付的是外科醫生的費用,卻只做閒聊的事。
Fable 是建築師。
不是室友。
一旦你內化這一點,一切都會改變。

10-80-10 系統 (Anthropic 工程師自己使用的精確框架)
每個 Fable 專案都有三個階段。
大多數人在所有三個階段都使用 Fable。
聰明的做法是只在其中兩個階段使用 Fable。
前 10% — 規劃
這是 Fable 值得其價格標籤的地方。
在任何專案開始之前,使用 Fable 來定義:
→ 結構與方法 → 成功標準 → 限制條件與邊緣案例 → 可能出錯的地方
想像一下蓋房子。
最昂貴的錯誤是給建築工人一張糟糕的藍圖。
先把架構做對。
Fable 在這方面表現非凡。
中間 80% — 執行
這是大多數 Token 被消耗的地方。
來回溝通。迭代。實作循環。實際完成任務的苦工。
Fable 不需要參與這個階段。
切換到 Opus 4.8 來處理標準工作。使用 Haiku 處理輕量任務。使用 Codex 或 GPT-5.5 進行機械化執行。
你獲得了 Fable 品質的架構,卻不需要為每個執行 Token 支付 Fable 的價格。
最後 10% — 審查
讓 Fable 回來。
讓它根據原始計畫審查輸出:
→ 結果是否符合架構?
→ 是否有遺漏的差距或邊緣案例?
→ 在發布前是否需要修正任何東西?
因為 Fable 審查的是完成的輸出,而不是從頭開始生成,它使用的 Token 量遠低於它從頭到尾完成整個任務時所消耗的。
[INSERT IMAGE 2 — PROMPT BELOW]

CLAUDE.md 路由表 (一個控制一切的檔案)
這是最重要的突破。
在你的 CLAUDE.md 中維護一個路由表。
讓 Fable 扮演編排者的角色,讀取這個表並自動將工作分派給正確的模型。
以下是我使用的精確路由表:
1## 模型路由表23### Fable 5(僅限編排者)4用於:規劃、架構設計、審查最終輸出5切勿用於:機械性任務、大量生成、樣板程式碼6努力程度:高(絕不使用極高——它是個 Token 熔爐且輸出更差)78### Opus 4.8(深度推理執行者)9用於:複雜除錯、多步驟推理、任何需要真正思考10 但非架構設計的工作11成本層級:標準1213### Sonnet 5(機械工作執行者)14用於:程式碼生成、重構、標準功能開發15成本層級:便宜1617### Codex / GPT-5.5(同儕執行者)18用於:實作任務、UI/UX 驗證、19 規格明確的執行工作20注意:Fable 可以學會引導 Codex——教它一次即可21成本層級:在 Codex 方案上通常免費2223### Haiku(大量執行者)24用於:格式化、lint、簡單編輯、樣板程式碼、25 重新命名重構、測試框架26切勿從 Haiku 產生進一步的子 Agent27成本層級:最便宜2829### Kimi / GLM-5.2(長上下文執行者)30用於:讀取大型檔案、長期儲存庫分析,31 這樣 Fable 就不會在此花費 Token32成本層級:非常便宜3334### DeepSeek / Qwen(極便宜的基本工作)35用於:樣板程式碼、測試撰寫、資料清理、36 翻譯、初稿文件、大量生成37成本層級:接近免費
Fable 從不直接處理便宜的工作。
它負責規劃,將任務委派給正確的層級,然後根據計畫檢查結果。
昂貴的大腦只花費 Token 來做決策。
就是這個檔案讓我的帳單下降了,同時產出卻增加了。

節省了我 70% Token 的精確 CLAUDE.md 設定
以下是我放入 CLAUDE.md 的完整編排章節:
1## 編排工作流程23你(Fable)是編排者。負責規劃、分解、綜合。4請勿自行執行機械性任務。56### 委派規則:7- 推理密集型階段 → 深度推理者(Opus 4.8)8- 機械性工作 → 快速工作者(Sonnet/Haiku)9- 程式碼庫分析 / 大型檔案 → Kimi(長上下文)10- 樣板程式碼 / 大量工作 → DeepSeek 或 Qwen11- 來自不同視角的同儕審查 → Codex1213### Codex 是同儕,不是審查者:14將 Codex 視為來自不同視角的頂尖資深工程師。15對於高風險決策:同時指派 Opus 和 Codex16處理同一個問題,綜合兩者最佳結果,17且不讓彼此看到對方的答案。1819### 上下文紀律:20保持你自己的上下文精簡。21切勿重新讀取你已處理過的檔案。22在將工具輸出反饋到上下文之前,先進行摘要。23要求模型回傳你可以據以行動的簡潔結論。2425### 努力程度:26- 規劃與架構:高努力27- 審查環節:中等努力28- 預設情況下切勿使用極高/最高——成本更高,效果往往更差
現在像技術主管一樣提示 Fable:
1目標:[你想要什麼]2上下文:[檔案、限制條件、你擔心的事]34你是主管。5將推理委派給深度推理者(Opus)。6將苦工委派給快速工作者(Sonnet/Haiku)。7使用 Codex 處理需要新視角的問題。89先向我展示你的計畫,然後再執行。
就是這樣。
Fable 負責規劃。其他所有模型負責執行。帳單保持平穩。
安裝 Codex 外掛——倍增效果的關鍵步驟
這是大多數人會跳過的設定。
Codex 和 Fable 結合使用,效果比單獨使用 Fable 好 10 倍。
Fable 負責架構。Codex 以 GPT-5.5 的品質執行。你幾乎不會動到你的 Claude 額度。
設定時間不到 5 分鐘:
步驟 1:在你的機器上安裝 Codex CLI
1npm install -g @openai/codex
步驟 2:在 Claude Code 內新增外掛
1/plugin marketplace add openai/codex-plugin-cc2/plugin install codex@openai-codex3/codex:setup
步驟 3:在 Claude Code 中建立兩個子 Agent
1/agents23→ deep-reasoner4 模型:Opus 4.85 指令:「用於推理密集型階段、架構設計、6 複雜問題除錯。徹底思考,回傳一個7 編排者可以據以行動的簡潔結論。」89→ fast-worker10 模型:Sonnet 511 指令:「用於機械性任務、樣板程式碼、測試、12 格式化、簡單編輯。有效率地執行。」
步驟 4:請 Fable 為 Codex 撰寫一個 SKILL.md
1撰寫一個 SKILL.md,精確教導 Codex 如何:2- 閱讀並執行實作計畫3- 執行測試並將結果回報給你4- 處理此專案中的特定檔案結構
讓 Codex 在機械性工作上不需要任何指導。
Fable 只需撰寫一次技能。
Codex 在每次未來執行時都會讀取它。
你的 Codex 輸出品質立刻提升 10 倍。

/loop 指令 (目前使用 Fable 最強大的方式)
大多數人仍然使用舊的提示方式。
你提示 → Fable 回應 → 你審查 → 你再次提示 → 重複。
在這種模式下,你就是那個循環。
你手動驗證每一步、每一個修正、每一次後續追蹤。
Loop 消除了你這個瓶頸。
運作方式:
你事先給 Fable 一個目標。
它會啟動子 Agent 來朝這個目標努力。
這些 Agent 會自我提示,並在完成時回報。
兩個指令:
1/goal — 定義任務和最終狀態23結構:4/goal [任務] until [可衡量的最終狀態] without [限制條件]56範例:7/goal 重構認證模組 until 所有 47 個測試通過8without 觸碰支付服務或資料庫結構
1/loop — 按排程自動執行提示23結構:4/loop [你的提示] --interval 30m --expires 8h56範例:7/loop 對所有 API 端點執行安全檢查8--interval 24h --expires 7d
組合使用:
1/goal 重建儀表板元件 until Lighthouse2分數在行動裝置上超過 90 without 破壞現有測試34/loop 執行上述 /goal --interval 6h --expires 48h
Fable 設計循環。較便宜的模型在循環內執行那 80% 的工作。Fable 只在循環結束或遇到阻礙時才重新介入。
你醒來時,任務已經完成。
[INSERT IMAGE 5 — PROMPT BELOW]
現在就在 Fable 上運行的 7 個提示
這些是在將 Fable 用於其他任何事情之前,最能發揮其槓桿作用的事項。
不是隨興編碼。
不是發布功能。
而是磨練你已有的每一個系統。
1. 找出真正值得在 Fable 上運行的事
1你是 Fable 5,目前能力最強的可用模型。23瀏覽我的專案、文件和記憶。45列出前 5 個真正值得在你身上運行的任務。67每個任務附上一行原因進行排名。89先不要開始做這些工作。
2. 在開始建構任何東西之前,重新設計你的建構方式
1我希望你徹底審計並重新設計我的編碼工作流程。23這是我目前的工作方式:[描述你的流程]45我的目標是:[你想要發布什麼]67審查、審計、磨練並改進我的系統。89不要寫程式碼。在我們運行工廠之前,先重新設計工廠。
3. 規劃大型專案——但先不要開始建構
1我想要規劃:[描述專案]23先不要開始建構。45列出完整的計畫:階段、關鍵決策、風險、6以及待解決的問題。78標記任何可能導致專案失敗的因素。910讓計畫足夠清晰,以便 Sonnet 或 Codex 能夠11逐步執行,而不需要問我問題。
4. 在發布前找出所有問題
1我即將發布這個專案。23先找出它所有的問題。45閱讀整個程式碼庫。67尋找真正的錯誤、有問題的邊緣案例,以及任何8會在用戶面前出錯的地方。910列出每個問題,附上:如何重現以及修正方法。1112標準要高。要毫不留情。
5. 從頭重建你的 CLAUDE.md
1閱讀我目前的 CLAUDE.md。23它是為舊模型撰寫的,而且內容臃腫。45更短、更清晰的指令在 Fable 上表現更好且成本更低。67重寫它:8- 移除 Fable 不再需要的指令9- 精簡每個工作流程10- 從我們的對話中加入模型路由表11- 盡可能將每個章節控制在 5 行以內1213Fable 會自行處理其餘部分。
6. 從它對你的所有了解中獲得商業建議
1你是我的商業顧問。23閱讀我的計畫文件、已連接的工具和記憶。45撰寫一份一頁的業務評估,內容包括:6- 未來 3 個月應專注的前 3 件事7- 應該放棄什麼以及原因8- 我可能忽略的一件事
7. 自動化安全掃描
1/loop 對我所有的 API 端點執行安全檢查。23尋找:暴露的金鑰、缺少的認證、速率限制漏洞、4注入向量,以及任何惡意用戶可能濫用的東西。56僅回報具有嚴重性評級的實際問題。78--interval 24h --expires 7d

努力程度——最容易被誤解的設定
大多數人預設使用最高或極高。
這是錯的。
以下是每個層級實際發生的情況:
→ 低: 快速、便宜,對於簡單任務來說出奇地有能力。許多人回報在這裡得到了驚人的輸出。
→ 中: 最佳平衡點。中等努力的 Fable 勝過極高努力的 Opus。預設使用這個。
→ 高: 用於:困難的除錯、多檔案重構、架構決策。真正的推理能力。
→ 極高 / 最高: Token 熔爐。通常產出比「高」更差的結果。僅保留給你真正面對過的最困難問題。
規則:從「中」開始。只有在品質確實不足時才提升到「高」。切勿預設使用「最高」。
另一個扼殺預算的設定:
擴展思考——預設保持關閉。
只在問題確實需要時才開啟它。永久開啟它就像讓你的引擎在車道上空轉。
/handoff 技巧——解決上下文視窗膨脹問題
長時間的對話是無聲的殺手。
每次輪詢都會重新發送完整的對話歷史。
一個 200k Token 的對話會成為你帳單上最昂貴的項目。
解決方案:頻繁開啟新的對話。
但當你這麼做時,你不想失去上下文。
使用 /handoff 技能:
1給我一個提示,讓我可以使用它在新的對話中2重新開始這個會話,而不會失去我們任何上下文。34包含:5- 我們決定了什麼6- 我們建構了什麼7- 下一步是什麼8- 我必須記住的任何重要限制條件910讓它少於 500 Token,這樣新的會話就能從精簡開始。
複製那個輸出。
開啟新的對話。
貼上它。
以極低的上下文成本,從你離開的地方精確繼續。
每 30–60 分鐘開啟一個新的會話 = 大量節省 Token。

要避免的 4 個昂貴錯誤
錯誤 1:Fable 成為預設模型。
當你打開 Claude Code 時,它會自動使用 Fable。
在每次會話前檢查模型選擇器。
這個習慣已經多次讓我在普通對話中意外使用 Fable,次數多到我不想承認。
錯誤 2:沒有支出上限。
在 7 月 7 日,Fable 將脫離標準訂閱方案。
立即新增信用卡並設定一個硬性的每月上限。
設定 → 使用量 → 調整限制。
Fable 在自主運行和長時間會話中消耗 Token 的速度非常快。
沒有硬性上限,一個晚上的 Agent 運行可能會在你醒來前累積一筆帳單。
已經有人因為一個提示被收取了 960 美元。
今晚就設定上限。
錯誤 3:要求它解釋其推理過程。
那一個請求可能會觸發分類器,你的工作會在被你認為仍在 Fable 上運行時,悄悄地由一個較弱的模型處理。
跳過「為什麼」的請求。判斷輸出品質,而不是過程。
錯誤 4:零碎地餵給它小提示。
Fable 可以在腦中容納數小時的上下文。
一次就把整個雜亂的東西給它。
完整的上下文。限制條件。你真正害怕的是什麼。
我曾用一個簡短的提示,將一個我害怕了好幾週的重構任務交給 Fable。它完成後回傳給我。
零碎地餵給它提示,浪費了它最擅長的一件事。

模型成本比較——了解你實際支付的費用
在你路由任何工作之前,先了解每個模型的價格:
模型 輸入($/M) 輸出($/M) 最適合用於
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Fable 5 ~$15 ~$75 規劃、審查
Opus 4.8 ~$5 ~$25 深度推理
Sonnet 5 ~$3 ~$15 標準執行
Kimi K2.7 ~$0.95 ~$4.00 大量編碼、長上下文
GLM-5.2 ~$1.40 ~$4.40 儲存庫規模工作
DeepSeek v4 ~$0.28 ~$1.10 極便宜的基本工作
Haiku 4.5 ~$1 ~$5 清理、格式化
本地(Qwen/Llama) $0 $0 自動完成、樣板程式碼
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Fable 和 DeepSeek 之間的差距:輸入端 53 倍。輸出端 68 倍。
同一個 30 步驟的重構 Agent: → 全部使用 Fable:每次運行約 25 美元 → Fable 規劃 + Kimi 執行:每次運行約 1.40 美元 → 相同的已發布程式碼。相同的測試通過。
路由不是為了便宜。
而是為了精準。

完整系統——運行時的樣貌
在這個系統之前:
→ 所有工作都路由到 Fable
→ 每次發布功能時帳單飆升
→ 使用額度在會話中途耗盡
→ 你像個預算有限的旅行者一樣配給提示
在這個系統之後:
→ Fable 處理那真正需要的 10%
→ 便宜的模型處理那 80% 的執行
→ /loop 在夜間運行而不觸及你的額度
→ 你發布更多,花費更少,從不碰到速率限制
三行總結:
Fable 規劃。其他模型執行。Fable 審查。
在你改變任何其他事情之前,這一個規則就能將你的帳單降低 50% 以上。
其餘的都是最佳化。
今晚就執行這個
立即將這個丟給 Fable:
閱讀我目前的 CLAUDE.md 和我所有活躍的專案。
你的任務:為我的工作流程設定 10-80-10 路由系統。
建立:
- 包含完整模型路由表的更新版 CLAUDE.md
- 我目前活躍任務的清單,根據每個任務應由哪個模型處理來排名
- 三個 /goal 提示,我可以根據你在我的專案中看到的內容,今晚在較便宜的模型上運行
不要執行任何東西。只需規劃和路由。
Fable 負責規劃。
你醒來時會得到一個完整的路由系統。
還有一張不會讓你心臟病發作的帳單。
如果這篇文章幫你省了錢:
→ 轉發出去,讓其他開發者不再燒光預算
→ 追蹤 @sairahul1 獲取更多這類系統
→ 加入書籤——這些 CLAUDE.md 設定是有效的,今晚就貼上使用
訂閱 theaibuilders.co 獲取更多此類有趣文章
我撰寫關於 AI、產品建構,以及在你睡覺時也能運作的系統。
資源:
→ Entelligence token router:entelligence.ai/blogs/entelligence-token-router
→ 將帳單降低 80% 的三模型工作流程:entelligence.ai/blogs/our-three-model-coding-workflow-that-cut-our-ai-bill-80
→ Claude Code:claude.ai/code
→ Codex CLI:npmjs.com/package/@openai/codex





