CIA 红队测试法:4 个帮你扼杀糟糕想法的提示词,避免项目夭折

@heynavtoor
英语1天前 · 2026年6月30日
192K
339
53
8
995

TL;DR

本指南介绍了 CIA 的 AI 红队测试方法论,并提供了 4 个具体的提示词,帮助你在项目启动前识别出致命缺陷。

以下是您提供的英文内容的简体中文翻译,已严格遵循您的所有指南,特别是关于术语、格式、代码块处理和CJK排版的规则。


其他的 AI 文章都教你用 Claude 来完善你的想法。而这篇文章教你用 Claude 来有意地扼杀你的想法。

收藏一下吧 :)

Nav Toor - inline image

你现在有一个想法。

也许是一个创业项目。也许是一条推文。也许是一次发布、一次推销、一门课程、一封辞职邮件、一个产品、一个新功能,或者是一个押注在某个大事上的 6 个月计划。

你认为这个想法很好。你希望它很好。但实际上,你并没有真正测试过它。

于是你做了大多数人会做的事。你问了一个朋友。朋友说了些好话。你又去问 Claude。Claude 也说了好话,因为 Claude 被训练得乐于助人且彬彬有礼。然后你发布了这个想法。之后便开始等待。

接着,现实降临了。而现实并不礼貌。

客户不买单。推文石沉大海。产品发布失败。无人问津。6 个月过去了,你却不知道问题出在哪里。

这几乎是历史上所有失败想法的写照。不是因为想法本身没有希望,而是因为没有人能在现实出手之前,下足够功夫去扼杀它。

9/11 事件之后,CIA 意识到他们自己也面临着同样的问题,只不过代价是最高昂的——生命。他们没能充分对自己的假设进行压力测试。于是,CIA 组建了一个团队,其唯一任务就是攻击他们自己的思维。他们称之为“红队”(Red Cell)。

CIA 至今仍在公开发布他们使用的具体方法。这份文件叫做《间谍技艺入门》(Tradecraft Primer)。它是免费的,就在 cia.gov 网站上。但几乎没人读过它。

今天,你将利用 Claude,在 30 分钟内,将文件里最强大的 4 种技术应用到你的想法上。

读完这篇文章时,你的下一个想法要么已经死掉,要么已经坚不可摧。无论哪种结果,都能为你节省 6 个月的生命。

第一阶段:午夜时分,特尼特开始行动

那是 2001 年 9 月 12 日,刚过午夜。

CIA 局长乔治·特尼特坐在位于弗吉尼亚州兰利的 CIA 总部七楼的办公室里。就在前一天,两架飞机撞毁了世贸中心,一架撞上了五角大楼,另一架坠毁在宾夕法尼亚州的一片田地里。

CIA 失算了。现代美国历史上最严重的间谍失败发生在他的任期内。

特尼特召来了两个人:他的幕僚长约翰·莫塞曼和情报局副局长杰米·米西克。他给了他们一个指示。

“告诉我别人不知道的事,让高级官员感到不自在。”

这句话是现代决策中最重要的一句话之一,而且它是真实存在的。《外交政策》杂志在 2015 年首次深入报道 CIA 红队时证实了这一点。

第二天早上,米西克和两名高级分析师创建了“红队”。他们的唯一任务就是攻击 CIA 自己的思维方式。扮演魔鬼的角色。找出其他人可能遗漏的东西。让屋子里那些聪明人对他们坚信不疑的事情深感不安。

这个策略奏效了。CIA 公开表示,在随后的二十年里,红队帮助阻止了多起重大恐怖袭击。

几年后,美国陆军也做了同样的事。2004 年,他们在堪萨斯州莱文沃思堡开设了一所学校,正式名称为“外国军事与文化研究大学”。士兵们给它起了个绰号:“红队大学”。

随后,这种方法传播开来。五角大楼在《联合条令注释 1-16》中将其规范化。国防部发布了正式指令。世界上每一个主要情报机构都效仿了它。甚至 2011 年击毙奥萨马·本·拉登的行动,在获得批准前也由三个独立的红队进行了压力测试。

2009 年,CIA 解密并公布了这份行动手册。《间谍技艺入门》共 40 页,列出了每一种技术:关键假设检查、魔鬼代言人、竞争假说分析、红队分析。

下面的 4 个提示就是把上述技术转化成你可以在 30 分钟内通过 Claude 运行的提示词。

Nav Toor - inline image

第二阶段:为什么你的大脑会对自己的想法撒谎

令人痛苦的部分来了。

你明明知道应该对自己的想法进行压力测试。你听过“唱唱反调”这种说法不下百遍。你可能还告诉自己你确实这么做了。

但你没有。

CIA 的《间谍技艺入门》开篇就讲了认知偏见。这些不是小缺陷;它们是聪明、训练有素的分析师仍然会犯错的原因。它们也是你犯错的原因。

有 5 种偏见你需要了解。

确认偏误。 你会注意到支持你想法的证据,而忽略与之矛盾的证据。你读了 10 篇关于你市场的文章,却只记住了那 3 篇支持你论点的。

锚定效应。 你听到的第一个数字会主导所有后续判断。如果有人告诉你,你的想法可能价值一百万,那么之后每一个估值都会围绕这个锚点打转,哪怕它错得离谱。

过度自信。 你的自信程度超出了证据所能支撑的范围。当人们说自己有 90% 的把握时,他们实际正确的概率只有大约 70%。

群体思维。 当你周围的人都同意时,表达不同意见会让人觉得有社交风险。团队达成共识不是因为想法正确,而是因为提出反对的成本太高。

可得性启发。 最近发生的、生动的事件会主导你的思考。一个病毒式传播的成功故事会让你高估自己的成功几率。而那上千个悄无声息的失败案例则被你完全忽略。

现在再加上第二个问题:谄媚(Sycophancy)。

当你让朋友批评你的想法时,他们会软化语气。他们喜欢你。默认情况下,Claude 也会做同样的事。Claude 被训练得乐于助人且温暖。如果你说:“这是我的创业想法,你觉得怎么样?”Claude 大多只会告诉你好的部分。

这正是现在几乎所有人在使用 AI 时都会犯的错误:他们把 Claude 当成一个只会说“是”的机器。感觉良好,然后发布产品,接着浪费 6 个月。

CIA 想明白的是,获得真相的唯一方法就是分配一个角色。让某个人或某个东西成为攻击者。不是“给我两面分析”,也不是“要诚实”,而是让 Claude 变成一个特定的、充满敌意的力量,其唯一任务就是找到你想法的裂缝。

下面这 4 个提示词做的正是这件事。每一条都对应一个真实的 CIA 技术,并将其转化给了 Claude。每一条都针对一个不同的盲点。综合起来,它们是在不雇佣真实红队的情况下,你能得到的最接近真实红队的方法。

全部运行这 4 条提示。不是 3 条。是全部 4 条。每一条都会发现其他提示所遗漏的东西。

Nav Toor - inline image

第三阶段:能摧毁你想法的 4 个提示

在运行这些提示之前,先用通俗的语言把你的想法粘贴到 Claude 中。一个段落就够了:它是什么?为谁而做?目标是什么?6 个月后的成功是什么样子?

然后按顺序运行以下 4 个提示。不要跳过任何一个。

提示 1:关键假设检查

text
1你现在是一名 CIA 红队分析师。不要评估我的想法
2好不好。你唯一的任务是审查这个想法所依赖的假设。
31. 列出我的计划所依赖的每一个假设。不仅仅是那些
4显而易见的,还要包括那些我可能没注意到的隐藏假设。
5至少列出 10 个。
62. 将每个假设分为三个等级:
7- 承重假设:如果出错,整个计划将失败。
8- 重要假设:如果出错,计划会受损但还能存活。
9- 次要假设:如果出错,对结果影响不大。
103. 对于每一个承重假设,回答:有哪些具体证据
11可以证明它是错误的?如果我无法指出这些证据,
12那我就是在靠信念行事,而不是靠分析。

这个提示的作用: 这是 CIA《间谍技艺入门》中的第一种技术。CIA 称之为“关键假设检查”。他们自己的描述是:“检查关键假设,要求分析人员考虑他们的分析在多大程度上依赖于某些前提的有效性,而这些前提他们通常不会质疑或认为存在疑问。”

这是基础。你无法攻击一个你不了解的计划。大多数想法的失败,不是因为它们本身错了,而是因为它们建立在一个从未被揭露的隐藏假设之上。

你需要关注的重点: 承重假设。如果你的计划依赖于 3 个承重假设,而你又无法为其中任何一个指出证据,那么你不是在建设,而是在碰运气。

提示 2:事前验尸

text
1现在是今天算起的 18 个月后。我分享给你的这个想法遭到了
2灾难性的失败。不是“做得还行”,而是失败了,彻底完蛋了,
3令人难堪。
4你正在写一份诚实的复盘报告。按时间顺序,一步步告诉我
5到底是哪些地方出了问题。
6请涵盖以下阶段:
7- 第 1-3 个月:我们忽略的早期警示信号
8- 第 4-9 个月:让情况恶化的决策
9- 第 10-15 个月:无法回头的转折点
10- 第 16-18 个月:崩溃以及造成的损失
11请具体描述。说明确切的错误。不要含糊其辞。
12最后用一句话结尾:“根本原因是___。”

这个提示的作用: “事前验尸”分析由认知心理学家加里·克莱因(Gary Klein)提出,并于 2007 年发表在《哈佛商业评论》上。现在,它已成为 CIA 红队和陆军红队的标准做法。

克莱因发现了一个奇怪的现象:当你问人们“这个计划可能会出什么问题?”时,他们给出的答案往往薄弱而模糊。但当你告诉他们“假设它已经失败了,现在来解释原因”时,他们给出的答案会变得尖锐、具体且极其诚实。从“未来时”转变为“过去时”,解锁了大脑的模式匹配能力。克莱因引用的研究表明,这个练习可以将风险识别能力提高多达 30%。

你需要关注的重点: 末尾那句“根本原因”的描述。如果 Claude 指出的根本原因是你能够预防的,那么你就有了路线图。如果 Claude 指出的根本原因是你无法预防的,那你可能得重新审视这个想法了。

Nav Toor - inline image

提示 3:敌方竞争对手

text
1你现在是一名竞争对手,拥有 1 亿美元的融资、世界一流的
2人才,并且有种强烈的个人动机想要摧毁我刚刚分享的这个想法。
3你有 90 天时间,预算无上限,而且你恨我。
4请制定一个为期 90 天的攻击计划,让我的想法变得无关紧要。
5请涵盖:
6- 第 1-30 天:你如何研究、复制和重新定位
7- 第 31-60 天:你如何推出一个更好的版本
8- 第 61-90 天:你如何让我失去客户、关注度或人才
9- 我有哪些你可能还没看到的独特弱点?
10请具体说明。给出战术,而不是模糊的策略。
11最后用一句话结尾:“让我能赢的弱点是___。”

这个提示的作用: 这来自于 CIA《间谍技艺入门》中的“红队分析”技术,并应用到了商业领域。五角大楼在兵棋推演中也使用同样的方法。诀窍在于,这个对手必须是完全成型的。不是“一个竞争对手”,而是一个具体的、有动机的、资金充足的、有明确期限且对你怀恨在心的敌人。

这个方法之所以有效,是因为模糊的威胁只会产生模糊的答案,而具体的敌人则会催生具体的行动。这就像有具体编号的单位的兵棋推演,要优于使用抽象力量的兵棋推演。

你需要关注的重点: “让我能赢的弱点”这句话。这是你最大的软肋。如果你的竞争对手想要获胜,路径依赖于某个你可以在 30 天内修复的东西,那么现在就修复它。如果他们的路径依赖于你无法修复的东西,那么你需要建立护城河。

提示 4:一星差评

text
1你现在是一名尝试过我的想法并感到厌恶的顾客。你花了
2真金白银,投入了实际时间,感觉自己被欺骗了。
3请写一个在 Twitter 上病毒式传播并获得 10,000 个赞的
4一星差评。具体说明是什么让你失望。要有趣,要犀利。
5用那种既生气又能说会道的口吻。
6然后写 3 条后续推文,内容是其他用户引用你的评论并
7补充他们自己的抱怨。
8最后用一句话结尾:“唯一让我感觉受骗的事是___。”

这个提示的作用: 这是整个方法中最被低估的压力测试。它迫使 Claude 跳出抽象的批判,进入那个最终会在现实世界中遇到你想法的人的真实情感口吻。

在红队理论中,这有时被称为“需求侧批判”。它能捕捉到其他三个提示常常遗漏的那类失败。不是“这个想法在逻辑上是否成立”,而是“这个想法在情感上是否诚实?”它是否兑现了它的承诺?或者,在你说的话和你能给的东西之间是否存在一个微小的差距——那种足以引发愤怒的差距。

你需要关注的重点: “感觉受骗”这句话。如果 Claude 构想的顾客因为你计划实施的某个方面而感到受骗,那么你面临的是一个足以毁掉品牌的问题。要么修正你的承诺,要么修正你的交付,但不要带着问题一起发布。

请严格按照这个顺序运行这四个提示。首先检查假设,以找到你的计划依赖什么;其次进行事前验尸,以模拟失败;再次分析竞争对手,以暴露战略弱点;最后模拟客户,以测试情感真实性。每一步都建立在前一步的基础上。

Nav Toor - inline image

第四阶段:运行完所有四个提示后会发生什么

当你运行完这四个提示后,会发生两件事之一,而这两件事都非常有价值。

结果 A:你的想法被扼杀了。

关键假设检查发现了 3 个你无法验证的承重假设。事前验尸找到了一个你无法修复的根本原因。竞争对手发现了一个足以让他们获胜的弱点。客户则在你的承诺中发现了“背叛”感。模式很清晰:这个想法从根本上来说是有缺陷的。

这感觉很糟糕。但这也是可能发生的最好的事情。

你刚刚为自己节省了 6 个月的生命。你没有花掉那笔钱,没有编写那堆代码,没有发出那封发布邮件,也不必在 6 个月后的全体员工大会上尴尬地承认这件事没有成功。

五角大楼对此有一句名言:“在作战室里尴尬,总好过在战场上被埋葬。” 红队在发布前扼杀你的想法,不是红队的失败,而是红队的成功。

结果 B:你的想法幸存了下来。

批评是真实的,但是可以修复的。所有的承重假设背后都有证据支持。事前验尸找到的根本原因有明确的预防措施。竞争对手的进攻路径有你可以建立的护城河来阻挡。客户的“受骗”感可以通过改变某个具体的承诺来解决。

这比仅仅“感觉良好”要好得多。这是对你自己的想法有了清晰的校准。你确切地知道弱点在哪里,知道该防御什么,该忽略什么。你不再凭直觉工作,而是手拿地图在前进。

这就是现实世界中“防弹”的真正含义。不是“我相信我的想法”,而是“我已经对我的想法进行了针对 4 个不同攻击者的压力测试,这是发布前需要修复的 3 个具体问题。”

Nav Toor - inline image

在做出这 7 个决定前,你应该先进行红队测试

这种方法不仅仅适用于创业者。以下是使用它的最佳时机。

1. 在辞职前。 对你的离职计划运行全部 4 个提示。光是事前验尸这一个提示就能揭示出 3 个你未曾考虑过的失败模式。

2. 在发布产品前。 竞争对手这个提示会找出你的定位缺陷。一星差评这个提示会暴露你承诺与交付之间的差距。

3. 在进行重大投资前。 你所拥有的所有关于这件事会成功的证据,可能都存在另一种解释。先运行关键假设检查。

4. 在签订合同前。 关键假设检查能揭示那些你以为是标准条款但实际上并非如此的条款。事前验尸则会设想关系破裂并追溯原因。

5. 在招聘关键人物前。 竞争对手提示会构建出此人为何不适合的理由。一星差评提示则能测试该候选人的过往记录是否真的能预测在新的职位上取得成功。

6. 在发布可能引爆的推文/帖子前。 关键假设检查能发现你论据中的薄弱环节。事前验尸会展示它如何被社区标注。一星差评则展示了那个会缠着你的“回复怪咖”的引用推文。

7. 在你做出任何难以逆转的决定前。 如果判断错误的代价很高而且决定很难撤销,那么花 30 分钟进行红队测试就是你所能买到的最好的保险。

CIA 为军备控制条约创建了这套方法。五角大楼将其扩展用于战争计划。它可以毫不费力地应用到一条推文、一份工作、一次发布、一个人生决定上。

任何时候,只要你打算押注在自己身上,先运行这 4 个提示。要更聪明地押注,而不是更用力地押注。

令人不安的真相

在未来的 18 个月里,那些使用 AI 是为了感觉良好的人,和那些使用 AI 是为了清晰思考的人之间的差距将变得极其残酷。

追求感觉良好的人群会以更快的速度、更低的摩擦发布更多想法。但同时,他们也会遭遇更多的失败,损失更多的金钱,消耗更多的信誉。他们将在二三十岁的年纪里,在一个又一个项目间循环,而这些项目之所以死亡,仅仅是因为它们从未接受过一个敌对的批评者。

而追求清晰思考的人群,从外部看来会显得更慢。他们会在每次发布前花 30 分钟进行红队测试。他们会扼杀掉他们考虑过的每 5 个想法中的 4 个。他们的发布次数会更少。

然而,他们发布的唯一那一个想法会取得成功。而他们扼杀的另外 4 个,本来会毁掉他们。

大多数读到这篇文章的人会把它加入书签,但永远也不会去运行这些提示。不是因为方法不管用,而是因为攻击自己的想法在心理上是痛苦的。你在那个计划上花了数周时间。你已经投入了情感。让 Claude 摧毁它,感觉就像让别人侮辱你的孩子一样。

而这恰恰是你需要这样做的原因。

CIA 创建红队,不是因为他们乐于接受挑战。他们创建红队,是因为不接受挑战的代价,是在一个九月的早晨失去 3000 条生命。你的决策的后果没那么严重,但原则是一样的。

当你有了下一个想法时,用这 4 个提示对它进行测试。不是 3 个,是全部 4 个。看看什么样的想法能幸存下来。

那才是值得你付出未来 6 个月的唯一想法。

资料来源

  • CIA《间谍技艺入门:提高情报分析的结构化分析技术》(2009 年)——本文所依据的实际解密文件
  • 理查兹·霍耶,《情报分析心理学》(1999 年)——关于情报分析中认知偏见的基础性文献
  • 《外交政策》杂志:《走进 CIA 红队内部》(2015 年)——特尼特引言及红队历史的来源
  • 《联合条令注释 1-16:指挥红队》——五角大楼官方的红队理论
  • 加里·克莱因,“执行项目事前验尸”,《哈佛商业评论》(2007 年)
  • 米卡·曾科,《红队:通过像敌人一样思考来取得成功》(2015 年)
  • 布莱斯·霍夫曼,《红队测试:你的企业如何通过挑战一切来战胜竞争对手》(2017 年)

希望对你有用。

Nav ❤️

使用 YouMind 创作爆款文章

收集素材、拆解爆点、生成视觉资产、撰写内容,并在一个 AI 工作空间里完成分发。

了解 YouMind

更多可拆解样本

近期爆款文章

探索更多爆款文章