如何將你的 Fable 5 Token 成本降低 50% 以上
Claude Fable 5 是我用過最棒的 AI 模型。沒有之一。
問題是,它貴得離譜。
在測試它的頭幾個小時裡,我幾乎就用光了整個使用額度——而且我甚至沒做什麼特別誇張的事。
Fable 的價格正好是 Opus 4.8 的兩倍,而且因為它太聰明,它實際上會過度思考,執行循環並消耗 Token 的方式是之前的 Claude 模型都沒有的。
學習如何正確使用這個新模型比以往任何時候都更重要。
在這份指南中,我將介紹我開發出的精確 10-80-10 系統,用來大幅降低我的 Fable Token 成本,而這些建議直接來自 Anthropic 的工程師。
在文章的最後,我建立了一個文件,你可以直接丟進 Fable,裡面總結了我的整個框架。
這個文件將立即減少你的 Token 花費。
請看到最後,我會直接與你分享。

我的框架 文件
I:10-80-10 系統說明
10-80-10 系統是一個簡單的框架,讓你在真正需要的地方才有效率地使用 Fable。
這正是 Anthropic 工程師自己使用的框架。
以下是它的分解方式:
前 10%:規劃
在你開始任何 AI 專案之前,你應該使用 Fable 來定義結構、方法、成功標準和限制條件。
想像一下如果你要蓋一棟房子。最重要的部分其實是把建築設計和規劃做好。否則建築工人只會執行一個爛計畫。
Fable 5 是一位優秀的建築師;把它當作建築師來用。
中間 80%:執行
大多數 Token 都消耗在來回溝通、迭代、小修小補、以及實際完成任務的苦工上。
對於你 AI 專案的執行層面,你應該使用更便宜的模型,例如標準工作用 Opus 4.8,簡單任務用 Haiku。
你得到了 Fable 架構的好處,卻不需要為每一個執行的 Token 支付 Fable 的價格(而且這本來就是大材小用)。
最後 10%:審查
執行完成後,再把 Fable 找回來。讓它根據最初的架構來審查輸出結果。
結果是否符合計畫?有沒有遺漏?在發布之前是否需要修正什麼?
這最後一輪審查,就是 Fable 的智慧能抓出較便宜模型遺漏問題的地方,而且因為它是在審查一個完成的輸出,而不是從頭開始生成,所以它消耗的 Token 遠比它自己完成整個任務要少得多。

10-80-10 系統
這就是完整的 10-80-10 框架,讓你能獲得 Fable 的所有好處,而無需承擔 Token 成本的缺點。
像 Opus 4.8 這樣的模型在處理執行層面時同樣勝任,而且這個系統避免了 Fable 想要透過多次循環、深入研究等方式讓一切「完美」的傾向。
II:循環(Loops)說明
我會寫一篇深入的文章來談這個,但我想先簡單介紹一下 /loop,因為它是目前使用 Fable 5 最強大的方式。
Anthropic 的工程師 Lance Martin(@RLanceMartin)發布了一份關於為 Mythos 級模型設計循環的指南。
我強烈建議閱讀這篇文章,但我會在下面做個總結。
https://x.com/RLanceMartin/status/2064397389189071163
舊方法 vs. 新方法的提示技巧
舊的提示方法看起來像這樣:
你下提示 → Claude 回應 → 你審查 → 你重新下提示 → 重複
在這種模式下,你就是那個循環。
你手動驗證每一個驗證步驟、每一個修正、以及每一個後續動作。
循環(Loops)自動化了整個過程,並將你從瓶頸中解放出來。
透過循環工程,你事先給 Fable 一個目標,它就會啟動子 Agent 來朝著那個目標努力。
設計循環 → Fable 啟動驗證子 Agent → Agent 自我提示以完成目標

提示工程 vs. 循環工程
/goal 和 /loop 說明
這兩個指令是 Claude Code 中循環工程的實際應用。
/goal 是起點。
提示結構
/goal [任務] until [可衡量的最終狀態] without [限制條件]
/loop 則更進一步。
不是只執行一次,/loop 會以預定的時間間隔重新執行提示。
/loop [你的提示內容] --interval 30m --expires 8h

/goal 與 /loop 的比較
這個組合非常強大。
使用 /goal 來定義任務一次,然後使用 /loop 讓它根據對工作有意義的任何時間表自動執行。
實際運用循環工程來降低 Token 花費
這就是 10-80-10 系統發揮魔力的地方。
透過 10-80-10 框架,Fable 負責前 10% 的規劃,也就是設計循環;較便宜的模型負責 80% 的執行;而 Fable 只在循環結束時或需要時才重新介入。
你甚至可以在執行層使用 GPT-5.5,這可以將 Token 花費降低 50% 或更多。
III:一般 Token 節省技巧
10-80-10 系統和循環處理了宏觀的效率問題——以下是也能產生影響的一些小調整。
- 選擇努力程度
從中等努力程度開始,而不是最高。
中等努力程度的 Fable 表現勝過極高努力程度的 Opus。只有當你真正遇到品質問題時才調高。預設對所有事情都用最高努力程度是消耗你額度最快的方式之一。
有些人甚至回報說,在 Fable 上使用低努力程度也能得到驚人的輸出。
- 刪除舊的技能和指令
為早期模型建立的提示在 Fable 中表現往往較差。
在 Fable 中,更短、更乾淨的指令表現更好,成本也更低(Fable 反正會自己想辦法解決)。
- 告訴 Fable 每件事的「為什麼」
當 Fable 理解請求背後的意圖時,它更常在第一次就把事情做對。
更少的修正和迭代次數也意味著消耗更少的 Token。
請注意,這個模型是為完全自主工作而設計的,如果你不告訴它事情背後的「為什麼」,它就必須更努力思考來想出下一步。
- /usage
主動監控你的使用量。 定期在 Claude Code 中執行 /usage。一旦 Fable 在 7 月 7 日轉為按 Token 付費,這將變得至關重要。
我在這裡寫了一整份 Fable 5 提示技巧指南——裡面提到的許多技巧也能減少你的 Token 花費
https://x.com/aiedge_/status/2065064961999847849
IV:昂貴的 Fable 錯誤
這兩個錯誤值得特別提出來,因為它們很容易被忽略,而且如果你不處理,可能會很昂貴。
錯誤 1:不小心在你不想用的時候啟動了 Fable。
當你打開 Claude Code 或 Claude 應用程式時,它現在預設使用 Fable。
Anthropic 目前正在積極鼓勵人們測試這個模型。
簡單建議: 每次開始對話前檢查模型選擇器。我已經好幾次抓到自己在一般聊天中不小心啟動了 Fable。
錯誤 2:沒有設定花費上限
7 月 7 日,Fable 將脫離標準訂閱方案。
如果你想在方案限制之外繼續使用它,你需要添加一張信用卡並按 Token 付費。
陷阱在於你的信用卡沒有設定硬性上限。
Fable 在自主運行和長時間對話中消耗 Token 非常快。如果沒有限制,你可能在還沒意識到發生什麼事之前,就累積了一筆可觀的帳單。
你可以在 設定 → 使用量 → 調整限制 中設定你的每月花費

設定每月花費
結語
好了,就是這樣。
我整個用來大幅降低 Fable Token 成本的框架。
我希望你覺得這篇文章有幫助。
如果有的話,請務必追蹤我 @milesdeutscher 和 @aiedge_——我每週都會發布實用的 AI 指南,讓你在這個瘋狂的領域保持領先。
如同承諾,我建立了一個文件,你可以直接發送給 Fable 來儘快減少 Token 花費。

10-80-10 系統文件 搶先看
要取得完整文件:
- 免費註冊 AI Edge 電子報
- 加入我的免費 Instagram 社群,這樣我才能發送給你
從這裡開始。👇

感謝你讀到這裡。💙





