Fable 5 的免费期到 7 月 7 日结束。
今天是 2026 年 7 月 3 日。也就是说,"因为免费所以用 Fable" 的时间还剩几天,从 7 月 8 日起,它将转为按使用量计费的积分制。
那么,从 7 月 8 日开始我们该怎么办?
所有套餐(包括免费版)均可使用 Sonnet 5。
截至 8 月 31 日的优惠价为:每 100 万输入 token 2 美元,每 100 万输出 token 10 美元。之后,输入价格为 3 美元,输出价格为 15 美元。Fable 5 的输入价格为 10 美元,输出价格为 50 美元。
即使在常规价格下,差距也约为 3.3 倍。与 Sonnet 5 的优惠价相比,差距为 5 倍。
此外,Sonnet 5 拥有 100 万 token 的上下文窗口和 12.8 万 token 的输出。读取长文档和代码的能力与 Fable 5 相同。
如果是这样,唯一缺少的真的只是"性能"吗?
我的结论略有不同。Fable 5 强大的秘诀不仅仅是智能。而是行为。
长时间思考。先定义成功条件。质疑。验证。做笔记。最后,诚实地报告哪些完成了,哪些没有。
这些行为中的很大一部分可以嵌入到 CLAUDE.md 和环境设置中。
CLAUDE.md 是一个配置备忘录,Claude Code 会持续读取它,告诉它"在这个项目中该如何行动"。它不是你在每次对话中粘贴的提示词。它是放置在环境本身中的指令。
那些每次都粘贴提示词的人的技术也很强大。让它创建胜利条件、比较草稿、分解任务并完成。这种模式非常有效。
但是,每次都必须粘贴的东西,你总会忘记。它们越长,就越繁琐。当会话切换时,它们就会消失。
这就是为什么这次,我们要让它永久化。
借用海外流行的一句话:
提示词是暂时的。结构是永久的。
在本文中,我将提供 CLAUDE.md 设置,以可复制粘贴的格式让 Sonnet 5 更接近 Fable 5。
而且,这些设置并非我凭空想出来的。
我使用了 Claude Code 的无头模式——具体来说,是通过终端使用 claude -p 提问——分别采访了 Sonnet 5 和 Fable 5 本身。
询问初级模型 Sonnet 5 关于它自己的弱点。
询问高级模型 Fable 5 如何训练初级模型。
这次双重采访带来了一些非常有趣的答案。
Fable 5 的真正身份是"持久的行为"
当你使用 Fable 5 时,它确实很聪明。
但如果你仔细观察它的输出,它的优势不仅仅是知识量。它处理工作的方式是不同的。
它不会立即开始构建。它首先定义成功条件。
它不会马上相信自己的想法。它首先寻找可能失败的地方。
它不会只说"成功了"。它会展示它用来验证的内容。
它不会用假装理解来填补知识空白。
即使在长时间的任务中,它也会努力将最初的约束条件保持到最后。
如果用人类的工作来类比,这很容易理解。
Fable 5 看起来像一位能力很强的高级员工。即使接到模糊的请求,在匆忙行动之前,它会回来问:"首先,成功是什么样的?" 如果计划失败,它会放弃计划并重新开始。
Sonnet 5 是一位能力很强的初级员工。速度快。服从性强。忠实于指令。然而,如果没有结构,它可能会回答得过于流畅。
在这种情况下,我们只需要把高级员工的工作习惯教给初级员工。
放置这些习惯的地方就是 CLAUDE.md。
通过采访 Sonnet 5 "本身" 发现的明确弱点
首先,我问了 Sonnet 5 本身。
"我应该在我的 CLAUDE.md 中写什么才能产生 Fable 5 级别的结果?"
它返回的自我分析相当诚实。
Sonnet 5 这样评价自己:
"我倾向于流畅地回答,不确定性常常隐藏在我的写作风格中。"
这一点很重要。
当 AI 的写作水平很高时,它的回答可能很危险。如果写得清晰,人类往往会相信它。但实际上,它可能包含"也许"、"未经证实"或"这部分可疑"的内容。
因此,首先要包含的设置是:
**让它明确说明不确定部分的置信度。
不要让它隐藏在模糊的副词后面。
如果置信度低,让它先确认再继续。**
这样做的原因很简单。它无法再将焦虑隐藏在写作风格中。
接下来,Sonnet 5 承认它倾向于"先实施,后调整"。为了阻止这种情况,让它先写成功条件。
在编写代码或文本之前,让它输出前提、可验证的成功条件和失败模式。不是"有效"或"感觉良好",而是以可以判断为测试、输出、屏幕或特定文本条件的形式。
这里重要的是让成功条件成为一种"判断",而不是一种"感觉"。
"写一篇好文章"太弱了。
"开头提到 7 月 7 日的截止日期。包含价格差异。放置 6 个或更多 CLAUDE.md 的可复制粘贴设置。不要隐藏 Fable 无法填补的差距。"
如果你写这么多,你可以在最后进行比较。
Sonnet 5 总结道:
"Fable 5 可以自己深入思考。如果给我结构,我会快速准确地行动。用 CLAUDE.md 来弥合这种差异是核心。"
本文的核心正是这一点。
采访 Fable 5 的结果
接下来,我向 Fable 5 本身询问了相同的主题。
第一个回答很棒。
"模型的自我报告不是可靠的数据。"
没错。仅仅因为我问了模型,这并不能成为基准。来自内部的自我评估是有偏见的。
所以,在本文中,我不会把"它们说的话"当作绝对真理。我会把它们当作创建使用模式的提示。
话虽如此,Fable 5 定义的差异非常尖锐。
它说差异在于"当没有结构,或者给定的结构错误时会发生什么。"
如果规格明确、测试存在、流程已设置,那么差异很小。
差异出现在规格本身错误时。当计划失败时。当在长时间任务中需要将最初的约束条件保持到最后时。当需要自我克制以不添加未要求的改进时。
而 Fable 5 也承认了自己的弱点。
单位成本高。即使是简单任务也会过度思考。在批量处理的速度比拼中会输。
换句话说,"所有事情都用 Fable" 在经济上是错误的管理。
那么,Fable 5 为其初级模型 Sonnet 编写的 `CLAUDE.md` 是什么样的?
整理与 Sonnet 方面重叠的要点,以下是需要牢记的 7 个技巧。
让 Sonnet 5 变成 Fable 的 `CLAUDE.md` 的 7 个技巧
第一个是成功条件。两个模型都独立提到了这一点。
1[机械地判断完成]2在开始之前用一句话定义"完成"。3示例:此测试通过。此命令返回退出码 0。此标题在正文中。4如果无法写出,请询问在继续之前需要决定什么。
第二个是多重解释。两者也都同意这一点。
1[不要自行选择多重解释]2如果一条指令有两种或更多种解释,不要默默地选择一种。3列出候选解释并附上建议进行确认。4但是,如果无论哪种解释输出都相同,则可以继续。
第三个是范围。
1[禁止附带改进]2不要实施未要求的更改。3禁止"顺手修复"或"做了更好的设计"。4如果发现相邻的可改进区域,将其列为建议而不是实施。
第四个是验证报告。
1[报告"已验证"而非"有效"]2完成报告必须包括执行的验证命令、返回值、测试结果和截图确认等证据。3不要为未执行的内容写"应该有效"。4清楚地说明任何跳过验证的原因。
第五个是如何在同一个失败中坚持下去。坚持很重要,但在错误的方向上坚持会浪费时间。
1[同一错误最多重试 2 次]2如果针对同一错误的修复失败两次,不要尝试第三种变体。3简要报告当前状态、已尝试的内容和剩余的假设,然后改变方向。
第六个是反对者的角色。
1[在完成前进行首次阅读审查]2在完成报告之前,像第一次阅读一样审查你的更改。3找出一个可能被破坏的相邻功能。4写出一个持怀疑态度的高级员工会提出的反对意见,并回答该反对意见。
第七个是置信度和诚实的进度。这反映了 Sonnet 5 的自我分析。
1[用 3 点报告置信度和进度]2对不确定的部分附加置信度级别(高、中、低)。3如果置信度为中或低,询问是否应该在继续之前确认。4在长时间任务中,在每个里程碑只报告以下三点:5已完成的内容。下一步要做什么。你担心什么。6禁止仅包含"进展顺利"的报告。
这 7 个技巧不是增加能力的设置。
它们是预先阻止差距出现之故障模式的设置。
不要掉进规格的坑里。不要自行决定模糊之处。不要扩大范围。不要未经验证就声称完成。不要继续一个已失效的计划。
简而言之,我们正在将 Fable 5 自然执行的行为外部附加到 Sonnet 5 的环境中。
我们在比较中看到了什么
有趣的是,即使分别询问,Sonnet 5 和 Fable 5 的回答也高度吻合。
首先,不要自行选择多重解释。
两者都这么说。当给出模糊的指令时,AI 倾向于选择一个看似合理的解释并继续前进。从人类的角度来看,你会想:"我希望你确认一下。"
接下来,将验证外部化。
不要让它说"有效",而是让它输出它执行了什么、什么通过了以及它看到了什么。即使在官方最佳实践中,给 Claude 一种验证自己工作的方法也被认为是最重要的。
提供能产生通过或失败结果的检查,例如测试、构建或截图比较。这形成了一个闭环。
此外,将验证者的角色分离出来也很重要。
如果创作者给自己打分,他们会变得宽松。让一个在新上下文中的验证子代理根据计划检查差异。这就像在人类工作中,将审阅者与作者分开。
最后,无法弥合的差距也吻合了。
长期上下文保持。
在涉及数十次工具调用和数小时的工作中,将开始时决定的约束条件保持到最后的能力。这不能完全由 CLAUDE.md 来填补。
如果我隐瞒这一点,这篇文章就变成了谎言。
环境方面的收尾工作
仅仅编写 CLAUDE.md 是不够的。
Sonnet 5 有一个 effort 设置,用于指定思考深度。在官方对应表中,Sonnet 5 的"medium"相当于 Sonnet 4.6 的"high",Sonnet 5 的"high"相当于 Sonnet 4.6 的"max"。
如果你看到推理深度较浅,可以增加 effort 而不是调整提示词。这是官方建议。
如果你希望 Claude Code 始终深入思考,请在 settings.json 中添加以下内容:
"effortLevel": "high"
这将从一开始就将 Sonnet 5 推向"持久"的一面。
但是,CLAUDE.md 不应只是冗长。
理想情况下,它应该少于 60 行。最多 200 到 300 行。对于每一行,问自己:"如果我删除这一行,Claude 会犯错吗?" 如果答案是否定的,就删除它。
不要写可以从代码中推断出来的内容。不要写标准实践。把 linter 能处理的事情留给 linter。
你应该写的是不可预测的命令、独特的实践、如何运行测试、陷阱和架构决策。
将重要的指令放在开头。使用"必须"或"禁止"等强词,而不是"建议"。
CLAUDE.md 不是给 AI 的请求信。它是团队的工作规则。
仍然应该使用 Fable 5 的情况
读到这里,你可能会想:"那我就不需要 Fable 5 了吗?"
不。
Fable 5 是必要的。但是,你应该缩小它的使用范围。
可以弥合的差距在于那些可以通过机械方式判断正确答案的工作。
可以通过测试判断的实施修复。批量分类、提取和总结。无论如何都会有人类审查的小改动。拥有良好 CLAUDE.md 的 Sonnet 5 在这些任务中可以很好地竞争。
无法弥合的差距主要有三个:
1. 无法编写检查器的工作。
这个设计可以吗?这个迁移计划有漏洞吗?首先应该构建什么?如果编写验收标准本身就是工作的核心,你就无法先运行验证循环。
2. 规则应用的判断。
即使你写了"保持简单",模型也会决定什么是简单。即使你写了"未经许可不要抽象化",抽象的起点也会随情况变化。
3. 长期上下文保持。
这是原始能力的差异。虽然提示词可以改善它,但它不会完全消失。
Fable 5 本身提供的判断标准是最实用的。
如果你可以先编写验收测试,请使用 Sonnet。如果编写验收测试本身很困难,请使用 Fable。如果不确定,从 Sonnet 开始,仅在导致连续两次返工的任务时切换到 Fable。
我认为这没问题。
你不需要从一开始就把所有事情都交给 Fable。反之,说所有事情都可以由 Sonnet 处理也是草率的。
从更便宜的 Sonnet 开始。用结构减少失败。两次挫折后切换到 Fable。
这是 7 月 8 日之后差异化使用的现实方法。
今天要做什么
首先,将本文中的 7 个技巧粘贴到你项目的 CLAUDE.md 中。
接下来,在 settings.json 中将 effortLevel 设置为 high。
然后,对于你的下一个任务,确保让它输出"成功条件"、"多重解释"和"验证报告"。
对于长时间任务,将实施角色和验证角色分开。不要让创作者给自己打分;在另一个上下文中向 Claude 展示。
并且仅在返工持续两次的任务时切换到 Fable 5。
即使 Fable 5 的免费期结束,结束的也只是免费品尝期。
你真正应该保留的是 Fable 5 的行为。
将 Sonnet 5 变成 Fable 5。
第一步不是每次都粘贴长长的魔法提示词。
而是将工作模板放入 CLAUDE.md。
但是,读到这里,你一定在想:
"我理解这些设置。但我不知道要构建什么,也不知道如何用这个升级后的 AI 赚钱。"
恰恰相反。变得更便宜、更智能的 AI 应该首先用于大规模生产吸引客户和内容。如果你能将 Fable 级别的持久性融入 Sonnet,你就可以低成本地运行每日帖子、文章、漏斗、产品创意和改进循环。
具体细节总结在我的置顶帖中。对于那些认真想要"便宜且聪明地使用 AI 来连接客户吸引和变现"的人,请点击这里 ↓





