如何在使用 Claude Fable 5 時避免預算超支

@sairahul1
英語1 天前 · 2026年7月03日
104K
108
14
16
306

TL;DR

本指南介紹了適用於 Claude Fable 5 的 10-80-10 系統,利用高階模型進行規劃與審核,同時將執行任務委派給 Opus 和 Haiku 等成本較低的模型。

Fable 5 是我用過最棒的 AI 模型。

但它也貴得離譜。

在我最初測試的幾個小時裡,我幾乎就用光了整個使用額度。

而且我甚至沒在做什麼瘋狂的事。

Fable 的價格是 Opus 4.8 的兩倍。

而且因為它太聰明了,它實際上會過度思考——不斷循環運算並消耗 Token,這是以前的 Claude 模型從未有過的情況。

大多數人使用它的方式完全錯誤。

以下是我建立的精確系統,成功將我的 Fable Token 成本降低了 50% 以上。

不需要新工具。輸出量不變。只是更聰明的路由。

每個人在第一天都會犯的錯誤

你打開 Claude Code。

Fable 現在是預設模型。

你開始聊天。

你請它修正一個錯字。你請它格式化一些 JSON。你請它重新命名一個變數。

Fable 思考了 12 秒,消耗了 8,000 個推理 Token,然後回傳答案。

成本:0.60 美元,只為了完成一個 Haiku 用 0.02 美元就能搞定的任務。

你付的是外科醫生的費用,卻只做閒聊的事。

Fable 是建築師。

不是室友。

一旦你內化這一點,一切都會改變。

Rahul - inline image

10-80-10 系統 (Anthropic 工程師自己使用的精確框架)

每個 Fable 專案都有三個階段。

大多數人在所有三個階段都使用 Fable。

聰明的做法是只在其中兩個階段使用 Fable。

前 10% — 規劃

這是 Fable 值得其價格標籤的地方。

在任何專案開始之前,使用 Fable 來定義:

→ 結構與方法 → 成功標準 → 限制條件與邊緣案例 → 可能出錯的地方

想像一下蓋房子。

最昂貴的錯誤是給建築工人一張糟糕的藍圖。

先把架構做對。

Fable 在這方面表現非凡。

中間 80% — 執行

這是大多數 Token 被消耗的地方。

來回溝通。迭代。實作循環。實際完成任務的苦工。

Fable 不需要參與這個階段。

切換到 Opus 4.8 來處理標準工作。使用 Haiku 處理輕量任務。使用 Codex 或 GPT-5.5 進行機械化執行。

你獲得了 Fable 品質的架構,卻不需要為每個執行 Token 支付 Fable 的價格。

最後 10% — 審查

讓 Fable 回來。

讓它根據原始計畫審查輸出:

→ 結果是否符合架構?

→ 是否有遺漏的差距或邊緣案例?

→ 在發布前是否需要修正任何東西?

因為 Fable 審查的是完成的輸出,而不是從頭開始生成,它使用的 Token 量遠低於它從頭到尾完成整個任務時所消耗的。

[INSERT IMAGE 2 — PROMPT BELOW]

Rahul - inline image

CLAUDE.md 路由表 (一個控制一切的檔案)

這是最重要的突破。

在你的 CLAUDE.md 中維護一個路由表。

讓 Fable 扮演編排者的角色,讀取這個表並自動將工作分派給正確的模型。

以下是我使用的精確路由表:

markdown
1## 模型路由表
2
3### Fable 5(僅限編排者)
4用於:規劃、架構設計、審查最終輸出
5切勿用於:機械性任務、大量生成、樣板程式碼
6努力程度:高(絕不使用極高——它是個 Token 熔爐且輸出更差)
7
8### Opus 4.8(深度推理執行者)
9用於:複雜除錯、多步驟推理、任何需要真正思考
10 但非架構設計的工作
11成本層級:標準
12
13### Sonnet 5(機械工作執行者)
14用於:程式碼生成、重構、標準功能開發
15成本層級:便宜
16
17### Codex / GPT-5.5(同儕執行者)
18用於:實作任務、UI/UX 驗證、
19 規格明確的執行工作
20注意:Fable 可以學會引導 Codex——教它一次即可
21成本層級:在 Codex 方案上通常免費
22
23### Haiku(大量執行者)
24用於:格式化、lint、簡單編輯、樣板程式碼、
25 重新命名重構、測試框架
26切勿從 Haiku 產生進一步的子 Agent
27成本層級:最便宜
28
29### Kimi / GLM-5.2(長上下文執行者)
30用於:讀取大型檔案、長期儲存庫分析,
31 這樣 Fable 就不會在此花費 Token
32成本層級:非常便宜
33
34### DeepSeek / Qwen(極便宜的基本工作)
35用於:樣板程式碼、測試撰寫、資料清理、
36 翻譯、初稿文件、大量生成
37成本層級:接近免費

Fable 從不直接處理便宜的工作。

它負責規劃,將任務委派給正確的層級,然後根據計畫檢查結果。

昂貴的大腦只花費 Token 來做決策。

就是這個檔案讓我的帳單下降了,同時產出卻增加了。

Rahul - inline image

節省了我 70% Token 的精確 CLAUDE.md 設定

以下是我放入 CLAUDE.md 的完整編排章節:

markdown
1## 編排工作流程
2
3你(Fable)是編排者。負責規劃、分解、綜合。
4請勿自行執行機械性任務。
5
6### 委派規則:
7- 推理密集型階段 → 深度推理者(Opus 4.8)
8- 機械性工作 → 快速工作者(Sonnet/Haiku)
9- 程式碼庫分析 / 大型檔案 → Kimi(長上下文)
10- 樣板程式碼 / 大量工作 → DeepSeek 或 Qwen
11- 來自不同視角的同儕審查 → Codex
12
13### Codex 是同儕,不是審查者:
14將 Codex 視為來自不同視角的頂尖資深工程師。
15對於高風險決策:同時指派 Opus 和 Codex
16處理同一個問題,綜合兩者最佳結果,
17且不讓彼此看到對方的答案。
18
19### 上下文紀律:
20保持你自己的上下文精簡。
21切勿重新讀取你已處理過的檔案。
22在將工具輸出反饋到上下文之前,先進行摘要。
23要求模型回傳你可以據以行動的簡潔結論。
24
25### 努力程度:
26- 規劃與架構:高努力
27- 審查環節:中等努力
28- 預設情況下切勿使用極高/最高——成本更高,效果往往更差

現在像技術主管一樣提示 Fable:

markdown
1目標:[你想要什麼]
2上下文:[檔案、限制條件、你擔心的事]
3
4你是主管。
5將推理委派給深度推理者(Opus)。
6將苦工委派給快速工作者(Sonnet/Haiku)。
7使用 Codex 處理需要新視角的問題。
8
9先向我展示你的計畫,然後再執行。

就是這樣。

Fable 負責規劃。其他所有模型負責執行。帳單保持平穩。

安裝 Codex 外掛——倍增效果的關鍵步驟

這是大多數人會跳過的設定。

Codex 和 Fable 結合使用,效果比單獨使用 Fable 好 10 倍。

Fable 負責架構。Codex 以 GPT-5.5 的品質執行。你幾乎不會動到你的 Claude 額度。

設定時間不到 5 分鐘:

步驟 1:在你的機器上安裝 Codex CLI

bash
1npm install -g @openai/codex

步驟 2:在 Claude Code 內新增外掛

text
1/plugin marketplace add openai/codex-plugin-cc
2/plugin install codex@openai-codex
3/codex:setup

步驟 3:在 Claude Code 中建立兩個子 Agent

text
1/agents
2
3→ deep-reasoner
4 模型:Opus 4.8
5 指令:「用於推理密集型階段、架構設計、
6 複雜問題除錯。徹底思考,回傳一個
7 編排者可以據以行動的簡潔結論。」
8
9→ fast-worker
10 模型:Sonnet 5
11 指令:「用於機械性任務、樣板程式碼、測試、
12 格式化、簡單編輯。有效率地執行。」

步驟 4:請 Fable 為 Codex 撰寫一個 SKILL.md

text
1撰寫一個 SKILL.md,精確教導 Codex 如何:
2- 閱讀並執行實作計畫
3- 執行測試並將結果回報給你
4- 處理此專案中的特定檔案結構

讓 Codex 在機械性工作上不需要任何指導。

Fable 只需撰寫一次技能。

Codex 在每次未來執行時都會讀取它。

你的 Codex 輸出品質立刻提升 10 倍。

Rahul - inline image

/loop 指令 (目前使用 Fable 最強大的方式)

大多數人仍然使用舊的提示方式。

你提示 → Fable 回應 → 你審查 → 你再次提示 → 重複。

在這種模式下,你就是那個循環。

你手動驗證每一步、每一個修正、每一次後續追蹤。

Loop 消除了你這個瓶頸。

運作方式:

你事先給 Fable 一個目標。

它會啟動子 Agent 來朝這個目標努力。

這些 Agent 會自我提示,並在完成時回報。

兩個指令:

text
1/goal — 定義任務和最終狀態
2
3結構:
4/goal [任務] until [可衡量的最終狀態] without [限制條件]
5
6範例:
7/goal 重構認證模組 until 所有 47 個測試通過
8without 觸碰支付服務或資料庫結構
text
1/loop — 按排程自動執行提示
2
3結構:
4/loop [你的提示] --interval 30m --expires 8h
5
6範例:
7/loop 對所有 API 端點執行安全檢查
8--interval 24h --expires 7d

組合使用:

text
1/goal 重建儀表板元件 until Lighthouse
2分數在行動裝置上超過 90 without 破壞現有測試
3
4/loop 執行上述 /goal --interval 6h --expires 48h

Fable 設計循環。較便宜的模型在循環內執行那 80% 的工作。Fable 只在循環結束或遇到阻礙時才重新介入。

你醒來時,任務已經完成。

[INSERT IMAGE 5 — PROMPT BELOW]

現在就在 Fable 上運行的 7 個提示

這些是在將 Fable 用於其他任何事情之前,最能發揮其槓桿作用的事項。

不是隨興編碼。

不是發布功能。

而是磨練你已有的每一個系統。

1. 找出真正值得在 Fable 上運行的事

text
1你是 Fable 5,目前能力最強的可用模型。
2
3瀏覽我的專案、文件和記憶。
4
5列出前 5 個真正值得在你身上運行的任務。
6
7每個任務附上一行原因進行排名。
8
9先不要開始做這些工作。

2. 在開始建構任何東西之前,重新設計你的建構方式

text
1我希望你徹底審計並重新設計我的編碼工作流程。
2
3這是我目前的工作方式:[描述你的流程]
4
5我的目標是:[你想要發布什麼]
6
7審查、審計、磨練並改進我的系統。
8
9不要寫程式碼。在我們運行工廠之前,先重新設計工廠。

3. 規劃大型專案——但先不要開始建構

text
1我想要規劃:[描述專案]
2
3先不要開始建構。
4
5列出完整的計畫:階段、關鍵決策、風險、
6以及待解決的問題。
7
8標記任何可能導致專案失敗的因素。
9
10讓計畫足夠清晰,以便 Sonnet 或 Codex 能夠
11逐步執行,而不需要問我問題。

4. 在發布前找出所有問題

text
1我即將發布這個專案。
2
3先找出它所有的問題。
4
5閱讀整個程式碼庫。
6
7尋找真正的錯誤、有問題的邊緣案例,以及任何
8會在用戶面前出錯的地方。
9
10列出每個問題,附上:如何重現以及修正方法。
11
12標準要高。要毫不留情。

5. 從頭重建你的 CLAUDE.md

text
1閱讀我目前的 CLAUDE.md。
2
3它是為舊模型撰寫的,而且內容臃腫。
4
5更短、更清晰的指令在 Fable 上表現更好且成本更低。
6
7重寫它:
8- 移除 Fable 不再需要的指令
9- 精簡每個工作流程
10- 從我們的對話中加入模型路由表
11- 盡可能將每個章節控制在 5 行以內
12
13Fable 會自行處理其餘部分。

6. 從它對你的所有了解中獲得商業建議

text
1你是我的商業顧問。
2
3閱讀我的計畫文件、已連接的工具和記憶。
4
5撰寫一份一頁的業務評估,內容包括:
6- 未來 3 個月應專注的前 3 件事
7- 應該放棄什麼以及原因
8- 我可能忽略的一件事

7. 自動化安全掃描

text
1/loop 對我所有的 API 端點執行安全檢查。
2
3尋找:暴露的金鑰、缺少的認證、速率限制漏洞、
4注入向量,以及任何惡意用戶可能濫用的東西。
5
6僅回報具有嚴重性評級的實際問題。
7
8--interval 24h --expires 7d
Rahul - inline image

努力程度——最容易被誤解的設定

大多數人預設使用最高或極高。

這是錯的。

以下是每個層級實際發生的情況:

低: 快速、便宜,對於簡單任務來說出奇地有能力。許多人回報在這裡得到了驚人的輸出。

中: 最佳平衡點。中等努力的 Fable 勝過極高努力的 Opus。預設使用這個。

高: 用於:困難的除錯、多檔案重構、架構決策。真正的推理能力。

極高 / 最高: Token 熔爐。通常產出比「高」更差的結果。僅保留給你真正面對過的最困難問題。

規則:從「中」開始。只有在品質確實不足時才提升到「高」。切勿預設使用「最高」。

另一個扼殺預算的設定:

擴展思考——預設保持關閉。

只在問題確實需要時才開啟它。永久開啟它就像讓你的引擎在車道上空轉。

/handoff 技巧——解決上下文視窗膨脹問題

長時間的對話是無聲的殺手。

每次輪詢都會重新發送完整的對話歷史。

一個 200k Token 的對話會成為你帳單上最昂貴的項目。

解決方案:頻繁開啟新的對話。

但當你這麼做時,你不想失去上下文。

使用 /handoff 技能:

text
1給我一個提示,讓我可以使用它在新的對話中
2重新開始這個會話,而不會失去我們任何上下文。
3
4包含:
5- 我們決定了什麼
6- 我們建構了什麼
7- 下一步是什麼
8- 我必須記住的任何重要限制條件
9
10讓它少於 500 Token,這樣新的會話就能從精簡開始。

複製那個輸出。

開啟新的對話。

貼上它。

以極低的上下文成本,從你離開的地方精確繼續。

每 30–60 分鐘開啟一個新的會話 = 大量節省 Token。

Rahul - inline image

要避免的 4 個昂貴錯誤

錯誤 1:Fable 成為預設模型。

當你打開 Claude Code 時,它會自動使用 Fable。

在每次會話前檢查模型選擇器。

這個習慣已經多次讓我在普通對話中意外使用 Fable,次數多到我不想承認。

錯誤 2:沒有支出上限。

在 7 月 7 日,Fable 將脫離標準訂閱方案。

立即新增信用卡並設定一個硬性的每月上限。

設定 → 使用量 → 調整限制。

Fable 在自主運行和長時間會話中消耗 Token 的速度非常快。

沒有硬性上限,一個晚上的 Agent 運行可能會在你醒來前累積一筆帳單。

已經有人因為一個提示被收取了 960 美元。

今晚就設定上限。

錯誤 3:要求它解釋其推理過程。

那一個請求可能會觸發分類器,你的工作會在被你認為仍在 Fable 上運行時,悄悄地由一個較弱的模型處理。

跳過「為什麼」的請求。判斷輸出品質,而不是過程。

錯誤 4:零碎地餵給它小提示。

Fable 可以在腦中容納數小時的上下文。

一次就把整個雜亂的東西給它。

完整的上下文。限制條件。你真正害怕的是什麼。

我曾用一個簡短的提示,將一個我害怕了好幾週的重構任務交給 Fable。它完成後回傳給我。

零碎地餵給它提示,浪費了它最擅長的一件事。

Rahul - inline image

模型成本比較——了解你實際支付的費用

在你路由任何工作之前,先了解每個模型的價格:

模型 輸入($/M) 輸出($/M) 最適合用於

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Fable 5 ~$15 ~$75 規劃、審查

Opus 4.8 ~$5 ~$25 深度推理

Sonnet 5 ~$3 ~$15 標準執行

Kimi K2.7 ~$0.95 ~$4.00 大量編碼、長上下文

GLM-5.2 ~$1.40 ~$4.40 儲存庫規模工作

DeepSeek v4 ~$0.28 ~$1.10 極便宜的基本工作

Haiku 4.5 ~$1 ~$5 清理、格式化

本地(Qwen/Llama) $0 $0 自動完成、樣板程式碼

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

Fable 和 DeepSeek 之間的差距:輸入端 53 倍。輸出端 68 倍。

同一個 30 步驟的重構 Agent: → 全部使用 Fable:每次運行約 25 美元 → Fable 規劃 + Kimi 執行:每次運行約 1.40 美元 → 相同的已發布程式碼。相同的測試通過。

路由不是為了便宜。

而是為了精準。

Rahul - inline image

完整系統——運行時的樣貌

在這個系統之前:

→ 所有工作都路由到 Fable

→ 每次發布功能時帳單飆升

→ 使用額度在會話中途耗盡

→ 你像個預算有限的旅行者一樣配給提示

在這個系統之後:

→ Fable 處理那真正需要的 10%

→ 便宜的模型處理那 80% 的執行

→ /loop 在夜間運行而不觸及你的額度

→ 你發布更多,花費更少,從不碰到速率限制

三行總結:

Fable 規劃。其他模型執行。Fable 審查。

在你改變任何其他事情之前,這一個規則就能將你的帳單降低 50% 以上。

其餘的都是最佳化。

今晚就執行這個

立即將這個丟給 Fable:

閱讀我目前的 CLAUDE.md 和我所有活躍的專案。

你的任務:為我的工作流程設定 10-80-10 路由系統。

建立:

  1. 包含完整模型路由表的更新版 CLAUDE.md
  2. 我目前活躍任務的清單,根據每個任務應由哪個模型處理來排名
  3. 三個 /goal 提示,我可以根據你在我的專案中看到的內容,今晚在較便宜的模型上運行

不要執行任何東西。只需規劃和路由。

Fable 負責規劃。

你醒來時會得到一個完整的路由系統。

還有一張不會讓你心臟病發作的帳單。

如果這篇文章幫你省了錢:

→ 轉發出去,讓其他開發者不再燒光預算

→ 追蹤 @sairahul1 獲取更多這類系統

→ 加入書籤——這些 CLAUDE.md 設定是有效的,今晚就貼上使用

訂閱 theaibuilders.co 獲取更多此類有趣文章

我撰寫關於 AI、產品建構,以及在你睡覺時也能運作的系統。

資源:

→ Entelligence token router:entelligence.ai/blogs/entelligence-token-router

→ 將帳單降低 80% 的三模型工作流程:entelligence.ai/blogs/our-three-model-coding-workflow-that-cut-our-ai-bill-80

→ Claude Code:claude.ai/code

→ Codex CLI:npmjs.com/package/@openai/codex

使用 YouMind 創作爆款文章

收集素材、拆解爆點、生成視覺資產、撰寫內容,並在一個 AI 工作空間裡完成分發。

了解 YouMind
寫給創作者

把你的 Markdown 變成乾淨的 𝕏 文章

圖片上傳、表格、程式碼區塊,往 𝕏 上手動重排太痛苦。YouMind 把整篇 Markdown 一鍵轉成乾淨、可直接發佈的 𝕏 文章草稿。

試試 Markdown 轉 𝕏

更多可拆解樣本

近期爆款文章

探索更多爆款文章