通过 7 个 CLAUDE.md 设置优化 Claude Sonnet，实现 Fable 级性能

Fable 5 的免费期到 7 月 7 日结束。

今天是 2026 年 7 月 3 日。也就是说，"因为免费所以用 Fable" 的时间还剩几天，从 7 月 8 日起，它将转为按使用量计费的积分制。

那么，从 7 月 8 日开始我们该怎么办？

所有套餐（包括免费版）均可使用 Sonnet 5。

截至 8 月 31 日的优惠价为：每 100 万输入 token 2 美元，每 100 万输出 token 10 美元。之后，输入价格为 3 美元，输出价格为 15 美元。Fable 5 的输入价格为 10 美元，输出价格为 50 美元。

即使在常规价格下，差距也约为 3.3 倍。与 Sonnet 5 的优惠价相比，差距为 5 倍。

此外，Sonnet 5 拥有 100 万 token 的上下文窗口和 12.8 万 token 的输出。读取长文档和代码的能力与 Fable 5 相同。

如果是这样，唯一缺少的真的只是"性能"吗？

我的结论略有不同。Fable 5 强大的秘诀不仅仅是智能。而是行为。

长时间思考。先定义成功条件。质疑。验证。做笔记。最后，诚实地报告哪些完成了，哪些没有。

这些行为中的很大一部分可以嵌入到 CLAUDE.md 和环境设置中。

CLAUDE.md 是一个配置备忘录，Claude Code 会持续读取它，告诉它"在这个项目中该如何行动"。它不是你在每次对话中粘贴的提示词。它是放置在环境本身中的指令。

那些每次都粘贴提示词的人的技术也很强大。让它创建胜利条件、比较草稿、分解任务并完成。这种模式非常有效。

但是，每次都必须粘贴的东西，你总会忘记。它们越长，就越繁琐。当会话切换时，它们就会消失。

这就是为什么这次，我们要让它永久化。

借用海外流行的一句话：

提示词是暂时的。结构是永久的。

在本文中，我将提供 CLAUDE.md 设置，以可复制粘贴的格式让 Sonnet 5 更接近 Fable 5。

而且，这些设置并非我凭空想出来的。

我使用了 Claude Code 的无头模式——具体来说，是通过终端使用 claude -p 提问——分别采访了 Sonnet 5 和 Fable 5 本身。

询问初级模型 Sonnet 5 关于它自己的弱点。

询问高级模型 Fable 5 如何训练初级模型。

这次双重采访带来了一些非常有趣的答案。

Fable 5 的真正身份是"持久的行为"

当你使用 Fable 5 时，它确实很聪明。

但如果你仔细观察它的输出，它的优势不仅仅是知识量。它处理工作的方式是不同的。

它不会立即开始构建。它首先定义成功条件。

它不会马上相信自己的想法。它首先寻找可能失败的地方。

它不会只说"成功了"。它会展示它用来验证的内容。

它不会用假装理解来填补知识空白。

即使在长时间的任务中，它也会努力将最初的约束条件保持到最后。

如果用人类的工作来类比，这很容易理解。

Fable 5 看起来像一位能力很强的高级员工。即使接到模糊的请求，在匆忙行动之前，它会回来问："首先，成功是什么样的？" 如果计划失败，它会放弃计划并重新开始。

Sonnet 5 是一位能力很强的初级员工。速度快。服从性强。忠实于指令。然而，如果没有结构，它可能会回答得过于流畅。

在这种情况下，我们只需要把高级员工的工作习惯教给初级员工。

放置这些习惯的地方就是 CLAUDE.md。

通过采访 Sonnet 5 "本身" 发现的明确弱点

首先，我问了 Sonnet 5 本身。

"我应该在我的 CLAUDE.md 中写什么才能产生 Fable 5 级别的结果？"

它返回的自我分析相当诚实。

Sonnet 5 这样评价自己：

"我倾向于流畅地回答，不确定性常常隐藏在我的写作风格中。"

这一点很重要。

当 AI 的写作水平很高时，它的回答可能很危险。如果写得清晰，人类往往会相信它。但实际上，它可能包含"也许"、"未经证实"或"这部分可疑"的内容。

因此，首先要包含的设置是：

**让它明确说明不确定部分的置信度。

不要让它隐藏在模糊的副词后面。

如果置信度低，让它先确认再继续。**

这样做的原因很简单。它无法再将焦虑隐藏在写作风格中。

接下来，Sonnet 5 承认它倾向于"先实施，后调整"。为了阻止这种情况，让它先写成功条件。

在编写代码或文本之前，让它输出前提、可验证的成功条件和失败模式。不是"有效"或"感觉良好"，而是以可以判断为测试、输出、屏幕或特定文本条件的形式。

这里重要的是让成功条件成为一种"判断"，而不是一种"感觉"。

"写一篇好文章"太弱了。

"开头提到 7 月 7 日的截止日期。包含价格差异。放置 6 个或更多 CLAUDE.md 的可复制粘贴设置。不要隐藏 Fable 无法填补的差距。"

如果你写这么多，你可以在最后进行比较。

Sonnet 5 总结道：

"Fable 5 可以自己深入思考。如果给我结构，我会快速准确地行动。用 CLAUDE.md 来弥合这种差异是核心。"

本文的核心正是这一点。

采访 Fable 5 的结果

接下来，我向 Fable 5 本身询问了相同的主题。

第一个回答很棒。

"模型的自我报告不是可靠的数据。"

没错。仅仅因为我问了模型，这并不能成为基准。来自内部的自我评估是有偏见的。

所以，在本文中，我不会把"它们说的话"当作绝对真理。我会把它们当作创建使用模式的提示。

话虽如此，Fable 5 定义的差异非常尖锐。

它说差异在于"当没有结构，或者给定的结构错误时会发生什么。"

如果规格明确、测试存在、流程已设置，那么差异很小。

差异出现在规格本身错误时。当计划失败时。当在长时间任务中需要将最初的约束条件保持到最后时。当需要自我克制以不添加未要求的改进时。

而 Fable 5 也承认了自己的弱点。

单位成本高。即使是简单任务也会过度思考。在批量处理的速度比拼中会输。

换句话说，"所有事情都用 Fable" 在经济上是错误的管理。

那么，Fable 5 为其初级模型 Sonnet 编写的 `CLAUDE.md` 是什么样的？

整理与 Sonnet 方面重叠的要点，以下是需要牢记的 7 个技巧。

让 Sonnet 5 变成 Fable 的 `CLAUDE.md` 的 7 个技巧

第一个是成功条件。两个模型都独立提到了这一点。

text

1[机械地判断完成]
2在开始之前用一句话定义"完成"。
3示例：此测试通过。此命令返回退出码 0。此标题在正文中。
4如果无法写出，请询问在继续之前需要决定什么。

第二个是多重解释。两者也都同意这一点。

text

1[不要自行选择多重解释]
2如果一条指令有两种或更多种解释，不要默默地选择一种。
3列出候选解释并附上建议进行确认。
4但是，如果无论哪种解释输出都相同，则可以继续。

第三个是范围。

text

1[禁止附带改进]
2不要实施未要求的更改。
3禁止"顺手修复"或"做了更好的设计"。
4如果发现相邻的可改进区域，将其列为建议而不是实施。

第四个是验证报告。

text

1[报告"已验证"而非"有效"]
2完成报告必须包括执行的验证命令、返回值、测试结果和截图确认等证据。
3不要为未执行的内容写"应该有效"。
4清楚地说明任何跳过验证的原因。

第五个是如何在同一个失败中坚持下去。坚持很重要，但在错误的方向上坚持会浪费时间。

text

1[同一错误最多重试 2 次]
2如果针对同一错误的修复失败两次，不要尝试第三种变体。
3简要报告当前状态、已尝试的内容和剩余的假设，然后改变方向。

第六个是反对者的角色。

text

1[在完成前进行首次阅读审查]
2在完成报告之前，像第一次阅读一样审查你的更改。
3找出一个可能被破坏的相邻功能。
4写出一个持怀疑态度的高级员工会提出的反对意见，并回答该反对意见。

第七个是置信度和诚实的进度。这反映了 Sonnet 5 的自我分析。

text

1[用 3 点报告置信度和进度]
2对不确定的部分附加置信度级别（高、中、低）。
3如果置信度为中或低，询问是否应该在继续之前确认。
4在长时间任务中，在每个里程碑只报告以下三点：
5已完成的内容。下一步要做什么。你担心什么。
6禁止仅包含"进展顺利"的报告。

这 7 个技巧不是增加能力的设置。

它们是预先阻止差距出现之故障模式的设置。

不要掉进规格的坑里。不要自行决定模糊之处。不要扩大范围。不要未经验证就声称完成。不要继续一个已失效的计划。

简而言之，我们正在将 Fable 5 自然执行的行为外部附加到 Sonnet 5 的环境中。

我们在比较中看到了什么

有趣的是，即使分别询问，Sonnet 5 和 Fable 5 的回答也高度吻合。

首先，不要自行选择多重解释。

两者都这么说。当给出模糊的指令时，AI 倾向于选择一个看似合理的解释并继续前进。从人类的角度来看，你会想："我希望你确认一下。"

接下来，将验证外部化。

不要让它说"有效"，而是让它输出它执行了什么、什么通过了以及它看到了什么。即使在官方最佳实践中，给 Claude 一种验证自己工作的方法也被认为是最重要的。

提供能产生通过或失败结果的检查，例如测试、构建或截图比较。这形成了一个闭环。

此外，将验证者的角色分离出来也很重要。

如果创作者给自己打分，他们会变得宽松。让一个在新上下文中的验证子代理根据计划检查差异。这就像在人类工作中，将审阅者与作者分开。

最后，无法弥合的差距也吻合了。

长期上下文保持。

在涉及数十次工具调用和数小时的工作中，将开始时决定的约束条件保持到最后的能力。这不能完全由 CLAUDE.md 来填补。

如果我隐瞒这一点，这篇文章就变成了谎言。

环境方面的收尾工作

仅仅编写 CLAUDE.md 是不够的。

Sonnet 5 有一个 effort 设置，用于指定思考深度。在官方对应表中，Sonnet 5 的"medium"相当于 Sonnet 4.6 的"high"，Sonnet 5 的"high"相当于 Sonnet 4.6 的"max"。

如果你看到推理深度较浅，可以增加 effort 而不是调整提示词。这是官方建议。

如果你希望 Claude Code 始终深入思考，请在 settings.json 中添加以下内容：

"effortLevel": "high"

这将从一开始就将 Sonnet 5 推向"持久"的一面。

但是，CLAUDE.md 不应只是冗长。

理想情况下，它应该少于 60 行。最多 200 到 300 行。对于每一行，问自己："如果我删除这一行，Claude 会犯错吗？" 如果答案是否定的，就删除它。

不要写可以从代码中推断出来的内容。不要写标准实践。把 linter 能处理的事情留给 linter。

你应该写的是不可预测的命令、独特的实践、如何运行测试、陷阱和架构决策。

将重要的指令放在开头。使用"必须"或"禁止"等强词，而不是"建议"。

CLAUDE.md 不是给 AI 的请求信。它是团队的工作规则。

仍然应该使用 Fable 5 的情况

读到这里，你可能会想："那我就不需要 Fable 5 了吗？"

不。

Fable 5 是必要的。但是，你应该缩小它的使用范围。

可以弥合的差距在于那些可以通过机械方式判断正确答案的工作。

可以通过测试判断的实施修复。批量分类、提取和总结。无论如何都会有人类审查的小改动。拥有良好 CLAUDE.md 的 Sonnet 5 在这些任务中可以很好地竞争。

无法弥合的差距主要有三个：

1. 无法编写检查器的工作。

这个设计可以吗？这个迁移计划有漏洞吗？首先应该构建什么？如果编写验收标准本身就是工作的核心，你就无法先运行验证循环。

2. 规则应用的判断。

即使你写了"保持简单"，模型也会决定什么是简单。即使你写了"未经许可不要抽象化"，抽象的起点也会随情况变化。

3. 长期上下文保持。

这是原始能力的差异。虽然提示词可以改善它，但它不会完全消失。

Fable 5 本身提供的判断标准是最实用的。

如果你可以先编写验收测试，请使用 Sonnet。如果编写验收测试本身很困难，请使用 Fable。如果不确定，从 Sonnet 开始，仅在导致连续两次返工的任务时切换到 Fable。

我认为这没问题。

你不需要从一开始就把所有事情都交给 Fable。反之，说所有事情都可以由 Sonnet 处理也是草率的。

从更便宜的 Sonnet 开始。用结构减少失败。两次挫折后切换到 Fable。

这是 7 月 8 日之后差异化使用的现实方法。

今天要做什么

首先，将本文中的 7 个技巧粘贴到你项目的 CLAUDE.md 中。

接下来，在 settings.json 中将 effortLevel 设置为 high。

然后，对于你的下一个任务，确保让它输出"成功条件"、"多重解释"和"验证报告"。

对于长时间任务，将实施角色和验证角色分开。不要让创作者给自己打分；在另一个上下文中向 Claude 展示。

并且仅在返工持续两次的任务时切换到 Fable 5。

即使 Fable 5 的免费期结束，结束的也只是免费品尝期。

你真正应该保留的是 Fable 5 的行为。

将 Sonnet 5 变成 Fable 5。

第一步不是每次都粘贴长长的魔法提示词。

而是将工作模板放入 CLAUDE.md。

但是，读到这里，你一定在想：

"我理解这些设置。但我不知道要构建什么，也不知道如何用这个升级后的 AI 赚钱。"

恰恰相反。变得更便宜、更智能的 AI 应该首先用于大规模生产吸引客户和内容。如果你能将 Fable 级别的持久性融入 Sonnet，你就可以低成本地运行每日帖子、文章、漏斗、产品创意和改进循环。

具体细节总结在我的置顶帖中。对于那些认真想要"便宜且聪明地使用 AI 来连接客户吸引和变现"的人，请点击这里 ↓

https://x.com/armadillo_ai/status/2069240810902868139

https://x.com/armadillo_ai/status/2068301855080448234

如何将 Sonnet 3.5 升级为 Fable 3.5：来自 Claude 访谈的 7 个神级设置

Fable 5 的真正身份是"持久的行为"

通过采访 Sonnet 5 "本身" 发现的明确弱点

采访 Fable 5 的结果

让 Sonnet 5 变成 Fable 的 `CLAUDE.md` 的 7 个技巧

我们在比较中看到了什么

环境方面的收尾工作

仍然应该使用 Fable 5 的情况

今天要做什么

使用 YouMind 创作爆款文章

近期爆款文章

最佳 AI 模型终极指南：Claude Fable 5 简明解析

大多数人都在错误地使用 Claude

如何利用 Fable 5 构建“第二大脑”

为 Agent 编排设计可编程运行时

感谢一切：我从 Rakuten 的离职感言

你的 AI Agents 无法互相交流？只需两行代码即可解决。

如何将 Sonnet 3.5 升级为 Fable 3.5：来自 Claude 访谈的 7 个神级设置

Fable 5 的真正身份是"持久的行为"

通过采访 Sonnet 5 "本身" 发现的明确弱点

采访 Fable 5 的结果

让 Sonnet 5 变成 Fable 的 `CLAUDE.md` 的 7 个技巧

我们在比较中看到了什么

环境方面的收尾工作

仍然应该使用 Fable 5 的情况

今天要做什么

使用 YouMind 创作爆款文章

把你的 Markdown 变成干净的 𝕏 文章

近期爆款文章

最佳 AI 模型终极指南：Claude Fable 5 简明解析

大多数人都在错误地使用 Claude

如何利用 Fable 5 构建“第二大脑”

为 Agent 编排设计可编程运行时

感谢一切：我从 Rakuten 的离职感言

你的 AI Agents 无法互相交流？只需两行代码即可解决。