如何将你的 Fable 5 Token 成本降低 50% 以上
Claude Fable 5 是我用过的最好的 AI 模型。没有之一。
问题是,它贵得离谱。
在测试它的最初几个小时里,我几乎就用完了整个使用额度——而且我还没做什么疯狂的事。
Fable 的成本正好是 Opus 4.8 的两倍,而且因为它太聪明了,它实际上会过度思考,运行循环并消耗 Token,这是以往任何 Claude 模型都没有的。
学会如何正确使用这个新模型比以往任何时候都重要。
在本指南中,我将介绍我开发的精确的 10-80-10 系统,以显著降低我的 Fable Token 成本,而这些建议直接来自 Anthropic 的工程师们。
在文章的最后,我创建了一个文档,你可以直接放入 Fable 中,它总结了我的整个框架。
这个文档将立即减少你的 Token 消耗。
请坚持看到最后,我会直接与你分享。

我的框架 \文档\
一:10-80-10 系统详解
10-80-10 系统是一个简单的框架,用于仅在真正需要的地方高效地使用 Fable。
这正是 Anthropic 工程师们自己使用的框架。
具体分解如下:
最初的 10%:规划
在开始任何 AI 项目之前,你应该使用 Fable 来定义结构、方法、成功标准和约束条件。
想象一下你要盖房子。最重要的部分实际上是做好架构和规划。否则,施工方只会执行一个糟糕的计划。
Fable 5 是一位出色的架构师;请这样使用它。
中间的 80%:执行
大部分 Token 都消耗在来回沟通、迭代、小修小补以及实际完成任务的基础工作中。
对于 AI 项目的执行层,你应该使用更便宜的模型,例如标准工作用 Opus 4.8,轻量任务用 Haiku。
这样你既能获得 Fable 架构的好处,又无需为执行的每一个 Token 支付 Fable 的价格(这本身也是大材小用)。
最后的 10%:审查
执行完成后,再把 Fable 请回来。让它对照最初的架构审查输出结果。
结果是否符合计划?是否存在差距?在发布之前是否需要修复任何问题?
这最后的环节,正是 Fable 的智能捕捉到更便宜模型遗漏之处的地方,而且由于它是在审查一个完成的输出,而不是从头开始生成,它消耗的 Token 比它自己完成整个任务要少得多。

10-80-10 系统
这就是完整的 10-80-10 框架,它让你获得 Fable 的所有优势,同时避免了 Token 成本的缺点。
像 Opus 4.8 这样的模型在处理执行层方面同样有能力,而这个系统避免了 Fable 想要通过多次循环、深度研究等方式让一切变得"完美"的倾向。
二:循环详解
我会就此写一篇深入的文章,但我想简要介绍一下 /loop,因为它是目前使用 Fable 5 最强大的方式。
Anthropic 的工程师 Lance Martin ( @RLanceMartin ) 发布了一份关于为 Mythos 类模型设计循环的指南。
我强烈推荐阅读这篇文章,但我将在下面进行总结。
https://x.com/RLanceMartin/status/2064397389189071163
提示工程的老方法 vs 新方法
老的提示方法看起来像这样:
你提示 → Claude 响应 → 你审查 → 你再次提示 → 重复
在这种模式下,你就是循环。
你手动验证每一个验证步骤、每一次修正和每一次跟进。
循环自动化了整个流程,并将你从瓶颈中解放出来。
通过循环工程,你预先给 Fable 一个目标,然后它会启动子 Agent 来朝着这个目标工作。
设计循环 → Fable 启动验证子 Agent → Agent 自我提示以完成目标

提示工程 vs 循环工程
/goal 和 /loop 详解
这两个命令是 Claude Code 中循环工程的实际实现。
/goal 是起点。
提示结构
/goal [任务] 直到 [可衡量的最终状态] 且不 [约束条件]
/loop 则更进一步。
不是单次运行,/loop 会按预定的时间间隔重新运行提示。
/loop [你的提示] --interval 30m --expires 8h

/goal 对比 /loop
这个组合非常强大。
使用 /goal 一次性定义任务,使用 /loop 让它按照对工作有意义的任何计划自动运行。
实际运用循环工程来降低 Token 消耗
这就是 10-80-10 系统发挥魔力的地方。
使用 10-80-10 框架,Fable 通过架构循环来处理前期的 10% 规划;更便宜的模型处理 80% 的执行;而 Fable 仅在循环关闭或需要时才重新介入。
你甚至可以在执行层使用 GPT-5.5,这可以将 Token 消耗降低 50% 或更多。
三:通用的 Token 节省技巧
10-80-10 系统和循环处理了宏观效率问题——以下是一些也能产生影响的微调。
- 努力程度选择
从中等努力开始,而不是最高。
中等努力的 Fable 胜过超高努力的 Opus。只有在真正遇到质量问题时才提高。默认对所有事情都使用最高努力是消耗你额度的最快方式之一。
有些人甚至报告说,在低努力下使用 Fable 也能获得惊人的输出。
- 删除旧的技能和指令
为早期模型构建的提示在 Fable 中通常表现更差。
更短、更清晰的指令在 Fable 中表现更好且成本更低(Fable 反正会自己解决问题)。
- 告诉 Fable 每件事的"为什么"
当 Fable 理解请求背后的意图时,它更有可能第一次就做对。
更少的修正和迭代轮次也意味着消耗更少的 Token。
请注意,这个模型是为完全自主工作而构建的,如果你不告诉它事情背后的"为什么",它就必须更努力地思考来想出下一步。
- /usage
主动监控你的使用情况。 定期在 Claude Code 中运行 /usage。一旦 Fable 在 7 月 7 日转为按 Token 付费,这将变得至关重要。
我在这里写了一整份 Fable 5 提示指南——这里提到的许多技巧也会减少你的 Token 消耗
https://x.com/aiedge_/status/2065064961999847849
四:昂贵的 Fable 错误
这两个错误值得特别指出,因为它们很容易被忽略,如果不解决,代价会很高。
错误 1:无意中运行了 Fable。
当你打开 Claude Code 或 Claude 应用时,现在默认使用的是 Fable。
Anthropic 目前正在积极激励人们测试这个模型。
简单建议: 在每次会话前检查模型选择器。我已经发现自己在普通聊天中不小心运行了 Fable。
错误 2:没有消费上限
7 月 7 日,Fable 将退出标准订阅计划。
如果你想在计划限制之外继续使用它,你需要添加一张信用卡并按 Token 付费。
陷阱在于你的信用卡没有硬性上限。
Fable 在自主运行和长时间会话中消耗 Token 很快。没有限制,你可能会在意识到发生了什么之前就累积一大笔费用。
你可以在 设置 → 使用情况 → 调整限制 中设置你的月度支出

设置月度支出
结语
好了,以上就是全部内容。
我用于显著降低 Fable Token 成本的完整框架。
希望你觉得这篇文章有价值。
如果觉得有用,请务必关注我 @milesdeutscher 和 @aiedge_ —— 我每周都会发布实用的 AI 指南,帮助你在疯狂的 AI 领域保持领先。
正如承诺的那样,我创建了一个文档,你可以直接发送给 Fable,以尽快减少 Token 消耗。

10-80-10 系统文档 \预览\
要获取完整文档:
- 注册免费的 AI Edge 新闻通讯
- 加入我的免费 Instagram 社区,这样我就可以发给你
从这里开始。👇

感谢你读到这里。💙





