如何使用 Claude Fable 5 而不至于破产

@milesdeutscher
英语2天前 · 2026年7月02日
120K
178
29
18
319

TL;DR

Miles Deutscher 介绍了用于优化 Claude Fable 5 使用体验的 10-80-10 框架,即利用它进行规划和审查,同时将执行任务委托给成本更低的模型。

如何将你的 Fable 5 Token 成本降低 50% 以上

Claude Fable 5 是我用过的最好的 AI 模型。没有之一。

问题是,它贵得离谱。

在测试它的最初几个小时里,我几乎就用完了整个使用额度——而且我还没做什么疯狂的事。

Fable 的成本正好是 Opus 4.8 的两倍,而且因为它太聪明了,它实际上会过度思考,运行循环并消耗 Token,这是以往任何 Claude 模型都没有的。

学会如何正确使用这个新模型比以往任何时候都重要。

在本指南中,我将介绍我开发的精确的 10-80-10 系统,以显著降低我的 Fable Token 成本,而这些建议直接来自 Anthropic 的工程师们。

在文章的最后,我创建了一个文档,你可以直接放入 Fable 中,它总结了我的整个框架。

这个文档将立即减少你的 Token 消耗。

请坚持看到最后,我会直接与你分享。

Miles Deutscher - inline image

我的框架 \文档\

一:10-80-10 系统详解

10-80-10 系统是一个简单的框架,用于仅在真正需要的地方高效地使用 Fable。

这正是 Anthropic 工程师们自己使用的框架。

具体分解如下:

最初的 10%:规划

在开始任何 AI 项目之前,你应该使用 Fable 来定义结构、方法、成功标准和约束条件。

想象一下你要盖房子。最重要的部分实际上是做好架构和规划。否则,施工方只会执行一个糟糕的计划。

Fable 5 是一位出色的架构师;请这样使用它。

中间的 80%:执行

大部分 Token 都消耗在来回沟通、迭代、小修小补以及实际完成任务的基础工作中。

对于 AI 项目的执行层,你应该使用更便宜的模型,例如标准工作用 Opus 4.8,轻量任务用 Haiku。

这样你既能获得 Fable 架构的好处,又无需为执行的每一个 Token 支付 Fable 的价格(这本身也是大材小用)。

最后的 10%:审查

执行完成后,再把 Fable 请回来。让它对照最初的架构审查输出结果。

结果是否符合计划?是否存在差距?在发布之前是否需要修复任何问题?

这最后的环节,正是 Fable 的智能捕捉到更便宜模型遗漏之处的地方,而且由于它是在审查一个完成的输出,而不是从头开始生成,它消耗的 Token 比它自己完成整个任务要少得多。

Miles Deutscher - inline image

10-80-10 系统

这就是完整的 10-80-10 框架,它让你获得 Fable 的所有优势,同时避免了 Token 成本的缺点。

像 Opus 4.8 这样的模型在处理执行层方面同样有能力,而这个系统避免了 Fable 想要通过多次循环、深度研究等方式让一切变得"完美"的倾向。

二:循环详解

我会就此写一篇深入的文章,但我想简要介绍一下 /loop,因为它是目前使用 Fable 5 最强大的方式。

Anthropic 的工程师 Lance Martin ( @RLanceMartin ) 发布了一份关于为 Mythos 类模型设计循环的指南。

我强烈推荐阅读这篇文章,但我将在下面进行总结。

https://x.com/RLanceMartin/status/2064397389189071163

提示工程的老方法 vs 新方法

老的提示方法看起来像这样:

你提示 → Claude 响应 → 你审查 → 你再次提示 → 重复

在这种模式下,你就是循环。

你手动验证每一个验证步骤、每一次修正和每一次跟进。

循环自动化了整个流程,并将你从瓶颈中解放出来。

通过循环工程,你预先给 Fable 一个目标,然后它会启动子 Agent 来朝着这个目标工作。

设计循环 → Fable 启动验证子 Agent → Agent 自我提示以完成目标

Miles Deutscher - inline image

提示工程 vs 循环工程

/goal 和 /loop 详解

这两个命令是 Claude Code 中循环工程的实际实现。

/goal 是起点。

提示结构

/goal [任务] 直到 [可衡量的最终状态] 且不 [约束条件]

/loop 则更进一步。

不是单次运行,/loop 会按预定的时间间隔重新运行提示。

/loop [你的提示] --interval 30m --expires 8h

Miles Deutscher - inline image

/goal 对比 /loop

这个组合非常强大。

使用 /goal 一次性定义任务,使用 /loop 让它按照对工作有意义的任何计划自动运行。

实际运用循环工程来降低 Token 消耗

这就是 10-80-10 系统发挥魔力的地方。

使用 10-80-10 框架,Fable 通过架构循环来处理前期的 10% 规划;更便宜的模型处理 80% 的执行;而 Fable 仅在循环关闭或需要时才重新介入。

你甚至可以在执行层使用 GPT-5.5,这可以将 Token 消耗降低 50% 或更多。

三:通用的 Token 节省技巧

10-80-10 系统和循环处理了宏观效率问题——以下是一些也能产生影响的微调。

  1. 努力程度选择

从中等努力开始,而不是最高。

中等努力的 Fable 胜过超高努力的 Opus。只有在真正遇到质量问题时才提高。默认对所有事情都使用最高努力是消耗你额度的最快方式之一。

有些人甚至报告说,在低努力下使用 Fable 也能获得惊人的输出。

  1. 删除旧的技能和指令

为早期模型构建的提示在 Fable 中通常表现更差。

更短、更清晰的指令在 Fable 中表现更好且成本更低(Fable 反正会自己解决问题)。

  1. 告诉 Fable 每件事的"为什么"

当 Fable 理解请求背后的意图时,它更有可能第一次就做对。

更少的修正和迭代轮次也意味着消耗更少的 Token。

请注意,这个模型是为完全自主工作而构建的,如果你不告诉它事情背后的"为什么",它就必须更努力地思考来想出下一步。

  1. /usage

主动监控你的使用情况。 定期在 Claude Code 中运行 /usage。一旦 Fable 在 7 月 7 日转为按 Token 付费,这将变得至关重要。

我在这里写了一整份 Fable 5 提示指南——这里提到的许多技巧也会减少你的 Token 消耗

https://x.com/aiedge_/status/2065064961999847849

四:昂贵的 Fable 错误

这两个错误值得特别指出,因为它们很容易被忽略,如果不解决,代价会很高。

错误 1:无意中运行了 Fable。

当你打开 Claude Code 或 Claude 应用时,现在默认使用的是 Fable。

Anthropic 目前正在积极激励人们测试这个模型。

简单建议: 在每次会话前检查模型选择器。我已经发现自己在普通聊天中不小心运行了 Fable。

错误 2:没有消费上限

7 月 7 日,Fable 将退出标准订阅计划。

如果你想在计划限制之外继续使用它,你需要添加一张信用卡并按 Token 付费。

陷阱在于你的信用卡没有硬性上限。

Fable 在自主运行和长时间会话中消耗 Token 很快。没有限制,你可能会在意识到发生了什么之前就累积一大笔费用。

你可以在 设置 → 使用情况 → 调整限制 中设置你的月度支出

Miles Deutscher - inline image

设置月度支出

结语

好了,以上就是全部内容。

我用于显著降低 Fable Token 成本的完整框架。

希望你觉得这篇文章有价值。

如果觉得有用,请务必关注我 @milesdeutscher@aiedge_ —— 我每周都会发布实用的 AI 指南,帮助你在疯狂的 AI 领域保持领先。

正如承诺的那样,我创建了一个文档,你可以直接发送给 Fable,以尽快减少 Token 消耗。

Miles Deutscher - inline image

10-80-10 系统文档 \预览\

要获取完整文档:

  1. 注册免费的 AI Edge 新闻通讯
  2. 加入我的免费 Instagram 社区,这样我就可以发给你

从这里开始。👇

https://www.aiedgehq.co/

Miles Deutscher - inline image

https://www.aiedgehq.co/

感谢你读到这里。💙

使用 YouMind 创作爆款文章

收集素材、拆解爆点、生成视觉资产、撰写内容,并在一个 AI 工作空间里完成分发。

了解 YouMind
写给创作者

把你的 Markdown 变成干净的 𝕏 文章

图片上传、表格、代码块,往 𝕏 上手动重排太痛苦。YouMind 把整篇 Markdown 一键转成干净、可直接发布的 𝕏 文章草稿。

试试 Markdown 转 𝕏

更多可拆解样本

近期爆款文章

探索更多爆款文章