节省 50% 的 Claude Fable 5 成本：10-80-10 框架

如何将你的 Fable 5 Token 成本降低 50% 以上

Claude Fable 5 是我用过的最好的 AI 模型。没有之一。

问题是，它贵得离谱。

在测试它的最初几个小时里，我几乎就用完了整个使用额度——而且我还没做什么疯狂的事。

Fable 的成本正好是 Opus 4.8 的两倍，而且因为它太聪明了，它实际上会过度思考，运行循环并消耗 Token，这是以往任何 Claude 模型都没有的。

学会如何正确使用这个新模型比以往任何时候都重要。

在本指南中，我将介绍我开发的精确的 10-80-10 系统，以显著降低我的 Fable Token 成本，而这些建议直接来自 Anthropic 的工程师们。

在文章的最后，我创建了一个文档，你可以直接放入 Fable 中，它总结了我的整个框架。

这个文档将立即减少你的 Token 消耗。

请坚持看到最后，我会直接与你分享。

我的框架 \文档\

一：10-80-10 系统详解

10-80-10 系统是一个简单的框架，用于仅在真正需要的地方高效地使用 Fable。

这正是 Anthropic 工程师们自己使用的框架。

具体分解如下：

最初的 10%：规划

在开始任何 AI 项目之前，你应该使用 Fable 来定义结构、方法、成功标准和约束条件。

想象一下你要盖房子。最重要的部分实际上是做好架构和规划。否则，施工方只会执行一个糟糕的计划。

Fable 5 是一位出色的架构师；请这样使用它。

中间的 80%：执行

大部分 Token 都消耗在来回沟通、迭代、小修小补以及实际完成任务的基础工作中。

对于 AI 项目的执行层，你应该使用更便宜的模型，例如标准工作用 Opus 4.8，轻量任务用 Haiku。

这样你既能获得 Fable 架构的好处，又无需为执行的每一个 Token 支付 Fable 的价格（这本身也是大材小用）。

最后的 10%：审查

执行完成后，再把 Fable 请回来。让它对照最初的架构审查输出结果。

结果是否符合计划？是否存在差距？在发布之前是否需要修复任何问题？

这最后的环节，正是 Fable 的智能捕捉到更便宜模型遗漏之处的地方，而且由于它是在审查一个完成的输出，而不是从头开始生成，它消耗的 Token 比它自己完成整个任务要少得多。

10-80-10 系统

这就是完整的 10-80-10 框架，它让你获得 Fable 的所有优势，同时避免了 Token 成本的缺点。

像 Opus 4.8 这样的模型在处理执行层方面同样有能力，而这个系统避免了 Fable 想要通过多次循环、深度研究等方式让一切变得"完美"的倾向。

二：循环详解

我会就此写一篇深入的文章，但我想简要介绍一下 /loop，因为它是目前使用 Fable 5 最强大的方式。

Anthropic 的工程师 Lance Martin ( @RLanceMartin ) 发布了一份关于为 Mythos 类模型设计循环的指南。

我强烈推荐阅读这篇文章，但我将在下面进行总结。

https://x.com/RLanceMartin/status/2064397389189071163

提示工程的老方法 vs 新方法

老的提示方法看起来像这样：

你提示 → Claude 响应 → 你审查 → 你再次提示 → 重复

在这种模式下，你就是循环。

你手动验证每一个验证步骤、每一次修正和每一次跟进。

循环自动化了整个流程，并将你从瓶颈中解放出来。

通过循环工程，你预先给 Fable 一个目标，然后它会启动子 Agent 来朝着这个目标工作。

设计循环 → Fable 启动验证子 Agent → Agent 自我提示以完成目标

提示工程 vs 循环工程

/goal 和 /loop 详解

这两个命令是 Claude Code 中循环工程的实际实现。

/goal 是起点。

提示结构

/goal [任务] 直到 [可衡量的最终状态] 且不 [约束条件]

/loop 则更进一步。

不是单次运行，/loop 会按预定的时间间隔重新运行提示。

/loop [你的提示] --interval 30m --expires 8h

/goal 对比 /loop

这个组合非常强大。

使用 /goal 一次性定义任务，使用 /loop 让它按照对工作有意义的任何计划自动运行。

实际运用循环工程来降低 Token 消耗

这就是 10-80-10 系统发挥魔力的地方。

使用 10-80-10 框架，Fable 通过架构循环来处理前期的 10% 规划；更便宜的模型处理 80% 的执行；而 Fable 仅在循环关闭或需要时才重新介入。

你甚至可以在执行层使用 GPT-5.5，这可以将 Token 消耗降低 50% 或更多。

三：通用的 Token 节省技巧

10-80-10 系统和循环处理了宏观效率问题——以下是一些也能产生影响的微调。

努力程度选择

从中等努力开始，而不是最高。

中等努力的 Fable 胜过超高努力的 Opus。只有在真正遇到质量问题时才提高。默认对所有事情都使用最高努力是消耗你额度的最快方式之一。

有些人甚至报告说，在低努力下使用 Fable 也能获得惊人的输出。

删除旧的技能和指令

为早期模型构建的提示在 Fable 中通常表现更差。

更短、更清晰的指令在 Fable 中表现更好且成本更低（Fable 反正会自己解决问题）。

告诉 Fable 每件事的"为什么"

当 Fable 理解请求背后的意图时，它更有可能第一次就做对。

更少的修正和迭代轮次也意味着消耗更少的 Token。

请注意，这个模型是为完全自主工作而构建的，如果你不告诉它事情背后的"为什么"，它就必须更努力地思考来想出下一步。

/usage

主动监控你的使用情况。 定期在 Claude Code 中运行 /usage。一旦 Fable 在 7 月 7 日转为按 Token 付费，这将变得至关重要。

我在这里写了一整份 Fable 5 提示指南——这里提到的许多技巧也会减少你的 Token 消耗

https://x.com/aiedge_/status/2065064961999847849

四：昂贵的 Fable 错误

这两个错误值得特别指出，因为它们很容易被忽略，如果不解决，代价会很高。

错误 1：无意中运行了 Fable。

当你打开 Claude Code 或 Claude 应用时，现在默认使用的是 Fable。

Anthropic 目前正在积极激励人们测试这个模型。

简单建议： 在每次会话前检查模型选择器。我已经发现自己在普通聊天中不小心运行了 Fable。

错误 2：没有消费上限

7 月 7 日，Fable 将退出标准订阅计划。

如果你想在计划限制之外继续使用它，你需要添加一张信用卡并按 Token 付费。

陷阱在于你的信用卡没有硬性上限。

Fable 在自主运行和长时间会话中消耗 Token 很快。没有限制，你可能会在意识到发生了什么之前就累积一大笔费用。

你可以在设置 → 使用情况 → 调整限制中设置你的月度支出

设置月度支出

结语

好了，以上就是全部内容。

我用于显著降低 Fable Token 成本的完整框架。

希望你觉得这篇文章有价值。

如果觉得有用，请务必关注我 @milesdeutscher 和 @aiedge_ —— 我每周都会发布实用的 AI 指南，帮助你在疯狂的 AI 领域保持领先。

正如承诺的那样，我创建了一个文档，你可以直接发送给 Fable，以尽快减少 Token 消耗。

10-80-10 系统文档 \预览\

要获取完整文档：

注册免费的 AI Edge 新闻通讯
加入我的免费 Instagram 社区，这样我就可以发给你

从这里开始。👇

https://www.aiedgehq.co/

https://www.aiedgehq.co/

感谢你读到这里。💙

如何使用 Claude Fable 5 而不至于破产

如何将你的 Fable 5 Token 成本降低 50% 以上

一：10-80-10 系统详解

二：循环详解

三：通用的 Token 节省技巧

四：昂贵的 Fable 错误

结语

使用 YouMind 创作爆款文章

近期爆款文章

最佳 AI 模型终极指南：Claude Fable 5 简明解析

“随时来问我”并非真正的指导：专业陪伴指南

7 月 7 日前必须尝试的 5 个 Fable 5 使用场景

Fable 实战指南：发掘你的未知领域

如何利用 Fable 5 构建“第二大脑”

Fable 5：Loop Engineering 初学者指南

如何使用 Claude Fable 5 而不至于破产

如何将你的 Fable 5 Token 成本降低 50% 以上

一：10-80-10 系统详解

二：循环详解

三：通用的 Token 节省技巧

四：昂贵的 Fable 错误

结语

使用 YouMind 创作爆款文章

把你的 Markdown 变成干净的 𝕏 文章

近期爆款文章

最佳 AI 模型终极指南：Claude Fable 5 简明解析

“随时来问我”并非真正的指导：专业陪伴指南

7 月 7 日前必须尝试的 5 个 Fable 5 使用场景

Fable 实战指南：发掘你的未知领域

如何利用 Fable 5 构建“第二大脑”

Fable 5：Loop Engineering 初学者指南