如何将 Sonnet 3.5 升级为 Fable 3.5:来自 Claude 访谈的 7 个神级设置

@armadillo_ai
日语2天前 · 2026年7月03日
118K
700
46
6
1.6K

TL;DR

本文提供了使用 CLAUDE.md 将先进的 Fable 行为注入更具性价比的 Claude Sonnet 模型中的指南,并分享了 7 个用于提升 AI 任务管理能力的配置技巧。

Fable 5 的免费期到 7 月 7 日结束。

今天是 2026 年 7 月 3 日。也就是说,"因为免费所以用 Fable" 的时间还剩几天,从 7 月 8 日起,它将转为按使用量计费的积分制。

那么,从 7 月 8 日开始我们该怎么办?

所有套餐(包括免费版)均可使用 Sonnet 5。

截至 8 月 31 日的优惠价为:每 100 万输入 token 2 美元,每 100 万输出 token 10 美元。之后,输入价格为 3 美元,输出价格为 15 美元。Fable 5 的输入价格为 10 美元,输出价格为 50 美元。

即使在常规价格下,差距也约为 3.3 倍。与 Sonnet 5 的优惠价相比,差距为 5 倍。

此外,Sonnet 5 拥有 100 万 token 的上下文窗口和 12.8 万 token 的输出。读取长文档和代码的能力与 Fable 5 相同。

如果是这样,唯一缺少的真的只是"性能"吗?

我的结论略有不同。Fable 5 强大的秘诀不仅仅是智能。而是行为。

长时间思考。先定义成功条件。质疑。验证。做笔记。最后,诚实地报告哪些完成了,哪些没有。

这些行为中的很大一部分可以嵌入到 CLAUDE.md 和环境设置中。

CLAUDE.md 是一个配置备忘录,Claude Code 会持续读取它,告诉它"在这个项目中该如何行动"。它不是你在每次对话中粘贴的提示词。它是放置在环境本身中的指令。

那些每次都粘贴提示词的人的技术也很强大。让它创建胜利条件、比较草稿、分解任务并完成。这种模式非常有效。

但是,每次都必须粘贴的东西,你总会忘记。它们越长,就越繁琐。当会话切换时,它们就会消失。

这就是为什么这次,我们要让它永久化。

借用海外流行的一句话:

提示词是暂时的。结构是永久的。

在本文中,我将提供 CLAUDE.md 设置,以可复制粘贴的格式让 Sonnet 5 更接近 Fable 5。

而且,这些设置并非我凭空想出来的。

我使用了 Claude Code 的无头模式——具体来说,是通过终端使用 claude -p 提问——分别采访了 Sonnet 5 和 Fable 5 本身。

询问初级模型 Sonnet 5 关于它自己的弱点。

询问高级模型 Fable 5 如何训练初级模型。

这次双重采访带来了一些非常有趣的答案。

Fable 5 的真正身份是"持久的行为"

当你使用 Fable 5 时,它确实很聪明。

但如果你仔细观察它的输出,它的优势不仅仅是知识量。它处理工作的方式是不同的。

它不会立即开始构建。它首先定义成功条件。

它不会马上相信自己的想法。它首先寻找可能失败的地方。

它不会只说"成功了"。它会展示它用来验证的内容。

它不会用假装理解来填补知识空白。

即使在长时间的任务中,它也会努力将最初的约束条件保持到最后。

如果用人类的工作来类比,这很容易理解。

Fable 5 看起来像一位能力很强的高级员工。即使接到模糊的请求,在匆忙行动之前,它会回来问:"首先,成功是什么样的?" 如果计划失败,它会放弃计划并重新开始。

Sonnet 5 是一位能力很强的初级员工。速度快。服从性强。忠实于指令。然而,如果没有结构,它可能会回答得过于流畅。

在这种情况下,我们只需要把高级员工的工作习惯教给初级员工。

放置这些习惯的地方就是 CLAUDE.md

通过采访 Sonnet 5 "本身" 发现的明确弱点

首先,我问了 Sonnet 5 本身。

"我应该在我的 CLAUDE.md 中写什么才能产生 Fable 5 级别的结果?"

它返回的自我分析相当诚实。

Sonnet 5 这样评价自己:

"我倾向于流畅地回答,不确定性常常隐藏在我的写作风格中。"

这一点很重要。

当 AI 的写作水平很高时,它的回答可能很危险。如果写得清晰,人类往往会相信它。但实际上,它可能包含"也许"、"未经证实"或"这部分可疑"的内容。

因此,首先要包含的设置是:

**让它明确说明不确定部分的置信度。

不要让它隐藏在模糊的副词后面。

如果置信度低,让它先确认再继续。**

这样做的原因很简单。它无法再将焦虑隐藏在写作风格中。

接下来,Sonnet 5 承认它倾向于"先实施,后调整"。为了阻止这种情况,让它先写成功条件。

在编写代码或文本之前,让它输出前提、可验证的成功条件和失败模式。不是"有效"或"感觉良好",而是以可以判断为测试、输出、屏幕或特定文本条件的形式。

这里重要的是让成功条件成为一种"判断",而不是一种"感觉"。

"写一篇好文章"太弱了。

"开头提到 7 月 7 日的截止日期。包含价格差异。放置 6 个或更多 CLAUDE.md 的可复制粘贴设置。不要隐藏 Fable 无法填补的差距。"

如果你写这么多,你可以在最后进行比较。

Sonnet 5 总结道:

"Fable 5 可以自己深入思考。如果给我结构,我会快速准确地行动。用 CLAUDE.md 来弥合这种差异是核心。"

本文的核心正是这一点。

采访 Fable 5 的结果

接下来,我向 Fable 5 本身询问了相同的主题。

第一个回答很棒。

"模型的自我报告不是可靠的数据。"

没错。仅仅因为我问了模型,这并不能成为基准。来自内部的自我评估是有偏见的。

所以,在本文中,我不会把"它们说的话"当作绝对真理。我会把它们当作创建使用模式的提示。

话虽如此,Fable 5 定义的差异非常尖锐。

它说差异在于"当没有结构,或者给定的结构错误时会发生什么。"

如果规格明确、测试存在、流程已设置,那么差异很小。

差异出现在规格本身错误时。当计划失败时。当在长时间任务中需要将最初的约束条件保持到最后时。当需要自我克制以不添加未要求的改进时。

而 Fable 5 也承认了自己的弱点。

单位成本高。即使是简单任务也会过度思考。在批量处理的速度比拼中会输。

换句话说,"所有事情都用 Fable" 在经济上是错误的管理。

那么,Fable 5 为其初级模型 Sonnet 编写的 `CLAUDE.md` 是什么样的?

整理与 Sonnet 方面重叠的要点,以下是需要牢记的 7 个技巧。

让 Sonnet 5 变成 Fable 的 `CLAUDE.md` 的 7 个技巧

第一个是成功条件。两个模型都独立提到了这一点。

text
1[机械地判断完成]
2在开始之前用一句话定义"完成"。
3示例:此测试通过。此命令返回退出码 0。此标题在正文中。
4如果无法写出,请询问在继续之前需要决定什么。

第二个是多重解释。两者也都同意这一点。

text
1[不要自行选择多重解释]
2如果一条指令有两种或更多种解释,不要默默地选择一种。
3列出候选解释并附上建议进行确认。
4但是,如果无论哪种解释输出都相同,则可以继续。

第三个是范围。

text
1[禁止附带改进]
2不要实施未要求的更改。
3禁止"顺手修复"或"做了更好的设计"。
4如果发现相邻的可改进区域,将其列为建议而不是实施。

第四个是验证报告。

text
1[报告"已验证"而非"有效"]
2完成报告必须包括执行的验证命令、返回值、测试结果和截图确认等证据。
3不要为未执行的内容写"应该有效"。
4清楚地说明任何跳过验证的原因。

第五个是如何在同一个失败中坚持下去。坚持很重要,但在错误的方向上坚持会浪费时间。

text
1[同一错误最多重试 2 次]
2如果针对同一错误的修复失败两次,不要尝试第三种变体。
3简要报告当前状态、已尝试的内容和剩余的假设,然后改变方向。

第六个是反对者的角色。

text
1[在完成前进行首次阅读审查]
2在完成报告之前,像第一次阅读一样审查你的更改。
3找出一个可能被破坏的相邻功能。
4写出一个持怀疑态度的高级员工会提出的反对意见,并回答该反对意见。

第七个是置信度和诚实的进度。这反映了 Sonnet 5 的自我分析。

text
1[用 3 点报告置信度和进度]
2对不确定的部分附加置信度级别(高、中、低)。
3如果置信度为中或低,询问是否应该在继续之前确认。
4在长时间任务中,在每个里程碑只报告以下三点:
5已完成的内容。下一步要做什么。你担心什么。
6禁止仅包含"进展顺利"的报告。

这 7 个技巧不是增加能力的设置。

它们是预先阻止差距出现之故障模式的设置。

不要掉进规格的坑里。不要自行决定模糊之处。不要扩大范围。不要未经验证就声称完成。不要继续一个已失效的计划。

简而言之,我们正在将 Fable 5 自然执行的行为外部附加到 Sonnet 5 的环境中。

我们在比较中看到了什么

有趣的是,即使分别询问,Sonnet 5 和 Fable 5 的回答也高度吻合。

首先,不要自行选择多重解释。

两者都这么说。当给出模糊的指令时,AI 倾向于选择一个看似合理的解释并继续前进。从人类的角度来看,你会想:"我希望你确认一下。"

接下来,将验证外部化。

不要让它说"有效",而是让它输出它执行了什么、什么通过了以及它看到了什么。即使在官方最佳实践中,给 Claude 一种验证自己工作的方法也被认为是最重要的。

提供能产生通过或失败结果的检查,例如测试、构建或截图比较。这形成了一个闭环。

此外,将验证者的角色分离出来也很重要。

如果创作者给自己打分,他们会变得宽松。让一个在新上下文中的验证子代理根据计划检查差异。这就像在人类工作中,将审阅者与作者分开。

最后,无法弥合的差距也吻合了。

长期上下文保持。

在涉及数十次工具调用和数小时的工作中,将开始时决定的约束条件保持到最后的能力。这不能完全由 CLAUDE.md 来填补。

如果我隐瞒这一点,这篇文章就变成了谎言。

环境方面的收尾工作

仅仅编写 CLAUDE.md 是不够的。

Sonnet 5 有一个 effort 设置,用于指定思考深度。在官方对应表中,Sonnet 5 的"medium"相当于 Sonnet 4.6 的"high",Sonnet 5 的"high"相当于 Sonnet 4.6 的"max"。

如果你看到推理深度较浅,可以增加 effort 而不是调整提示词。这是官方建议。

如果你希望 Claude Code 始终深入思考,请在 settings.json 中添加以下内容:

"effortLevel": "high"

这将从一开始就将 Sonnet 5 推向"持久"的一面。

但是,CLAUDE.md 不应只是冗长。

理想情况下,它应该少于 60 行。最多 200 到 300 行。对于每一行,问自己:"如果我删除这一行,Claude 会犯错吗?" 如果答案是否定的,就删除它。

不要写可以从代码中推断出来的内容。不要写标准实践。把 linter 能处理的事情留给 linter。

你应该写的是不可预测的命令、独特的实践、如何运行测试、陷阱和架构决策。

将重要的指令放在开头。使用"必须"或"禁止"等强词,而不是"建议"。

CLAUDE.md 不是给 AI 的请求信。它是团队的工作规则。

仍然应该使用 Fable 5 的情况

读到这里,你可能会想:"那我就不需要 Fable 5 了吗?"

不。

Fable 5 是必要的。但是,你应该缩小它的使用范围。

可以弥合的差距在于那些可以通过机械方式判断正确答案的工作。

可以通过测试判断的实施修复。批量分类、提取和总结。无论如何都会有人类审查的小改动。拥有良好 CLAUDE.md 的 Sonnet 5 在这些任务中可以很好地竞争。

无法弥合的差距主要有三个:

1. 无法编写检查器的工作。

这个设计可以吗?这个迁移计划有漏洞吗?首先应该构建什么?如果编写验收标准本身就是工作的核心,你就无法先运行验证循环。

2. 规则应用的判断。

即使你写了"保持简单",模型也会决定什么是简单。即使你写了"未经许可不要抽象化",抽象的起点也会随情况变化。

3. 长期上下文保持。

这是原始能力的差异。虽然提示词可以改善它,但它不会完全消失。

Fable 5 本身提供的判断标准是最实用的。

如果你可以先编写验收测试,请使用 Sonnet。如果编写验收测试本身很困难,请使用 Fable。如果不确定,从 Sonnet 开始,仅在导致连续两次返工的任务时切换到 Fable。

我认为这没问题。

你不需要从一开始就把所有事情都交给 Fable。反之,说所有事情都可以由 Sonnet 处理也是草率的。

从更便宜的 Sonnet 开始。用结构减少失败。两次挫折后切换到 Fable。

这是 7 月 8 日之后差异化使用的现实方法。

今天要做什么

首先,将本文中的 7 个技巧粘贴到你项目的 CLAUDE.md 中。

接下来,在 settings.json 中将 effortLevel 设置为 high

然后,对于你的下一个任务,确保让它输出"成功条件"、"多重解释"和"验证报告"。

对于长时间任务,将实施角色和验证角色分开。不要让创作者给自己打分;在另一个上下文中向 Claude 展示。

并且仅在返工持续两次的任务时切换到 Fable 5。

即使 Fable 5 的免费期结束,结束的也只是免费品尝期。

你真正应该保留的是 Fable 5 的行为。

将 Sonnet 5 变成 Fable 5。

第一步不是每次都粘贴长长的魔法提示词。

而是将工作模板放入 CLAUDE.md

但是,读到这里,你一定在想:

"我理解这些设置。但我不知道要构建什么,也不知道如何用这个升级后的 AI 赚钱。"

恰恰相反。变得更便宜、更智能的 AI 应该首先用于大规模生产吸引客户和内容。如果你能将 Fable 级别的持久性融入 Sonnet,你就可以低成本地运行每日帖子、文章、漏斗、产品创意和改进循环。

具体细节总结在我的置顶帖中。对于那些认真想要"便宜且聪明地使用 AI 来连接客户吸引和变现"的人,请点击这里 ↓

https://x.com/armadillo_ai/status/2069240810902868139

https://x.com/armadillo_ai/status/2068301855080448234

使用 YouMind 创作爆款文章

收集素材、拆解爆点、生成视觉资产、撰写内容,并在一个 AI 工作空间里完成分发。

了解 YouMind
写给创作者

把你的 Markdown 变成干净的 𝕏 文章

图片上传、表格、代码块,往 𝕏 上手动重排太痛苦。YouMind 把整篇 Markdown 一键转成干净、可直接发布的 𝕏 文章草稿。

试试 Markdown 转 𝕏

更多可拆解样本

近期爆款文章

探索更多爆款文章