如何掌握上下文工程并构建真正懂你的 AI 系统(完整课程)

如何掌握上下文工程并构建真正懂你的 AI 系统(完整课程)

@eng_khairallah1
英语4天前 · 2026年5月10日

AI 功能

734K
692
116
32
2.2K

TL;DR

这份为期六周的综合指南阐述了为何上下文工程优于提示词工程,重点介绍了如何通过信息架构、持久化记忆和工具集成来构建生产级的 AI 系统。

大多数人认为,从 AI 获得更好结果的秘诀是写出更好的提示词。

收藏并保存这个 :)

他们花大量时间精心雕琢完美的句子。他们加上“扮演资深专家”。他们加入“一步步思考”。他们调整一个词,运行一次,再调整另一个词,再运行一次。

但结果几乎没什么变化。

原因如下。

提示词工程是语法。上下文工程是基础设施。而基础设施每次都胜过语法。

那些真正构建有效 AI 系统的人——那些能记住你的偏好、访问你的数据、始终如一地遵循你的规则、日复一日产出可靠结果的系统——他们并不是在写更好的提示词。

他们是在设计更好的上下文。

上下文工程,是设计、构建和管理 AI 模型在生成回复时所能访问到的精确信息的实践。它是提示词周围的一切:它可以读取的文件、它从之前会话中携带的记忆、它可以使用的工具、塑造其行为的约束、校准其输出的示例。

一个措辞完美的提示词,放在设计糟糕的上下文中,每次都会产生平庸的结果。

一个基本的提示词,放在设计完美的上下文中,每次都会产生卓越的结果。

这就是大多数人完全错过的转变。

这篇文章就是完整的课程。为期六周。从理解上下文工程到底是什么,到构建生产级的 AI 系统,其表现将超越你从聊天窗口中获得的一切。

第一周:理解为什么仅靠提示词永远不够

仅靠提示词思维的问题

当你在 Claude 中输入一条消息时,模型看到的不仅仅是你的消息。它看到的是上下文窗口中的一切:系统提示词、任何上传的文档、对话历史、工具定义以及你最新的消息——所有这些,一起被处理。

你的提示词只是一个原料。上下文才是整个厨房。

大多数人痴迷于原料,却完全忽略了厨房。他们写出漂亮的提示词,然后粘贴到一个空白的、零上下文的对话中。然后他们奇怪为什么输出如此泛泛。

输出泛泛,是因为模型没有任何可以个性化的信息。它不了解你的工作、你的受众、你的标准、你之前的决定或你的目标。它是在盲目工作。而一个盲目的模型,会默认生成它所能产生的最平均、最泛泛、最安全的回复。

上下文工程通过给模型装上“眼睛”来解决这个问题。

上下文的三个层次

每一次 AI 交互都有三个上下文层次,而大多数人只使用了一个。

第一层是即时上下文。这就是你的提示词:你问的问题、你给的指令、你要求的格式。99% 的人止步于此。

第二层是会话上下文。这是模型在单次对话中知道的一切:上传的文件、对话历史、系统指令。大多数人部分地使用这一层,但并没有有意识地设计它。

第三层是持久上下文。这是跨会话传递的知识:记忆系统、上下文文件、知识库、保存的偏好。几乎没有人正确使用这一层,而这里正是最大的杠杆所在。

本周要做的事

  • 审查你最近十次 AI 交互,识别你使用了哪些上下文层次
  • 阅读 Anthropic 关于系统提示词、上下文窗口和记忆的文档
  • 创建你的第一个上下文文档:一个描述你是谁、你做什么、你的受众、你的标准和你的偏好的文件
  • 在有无上下文文档的情况下测试同一个提示词,并比较结果
  • 开始建立你的个人上下文库,为不同类型的工作保存可复用的上下文

第二周:设计你的上下文架构

停止把每次会话都当成第一次

AI 辅助工作中最大的生产力漏洞,就是每次会话都要重新解释你自己。

每次你打开一个新对话,输入“我是一名营销顾问,为 B2B 领域的 SaaS 初创公司工作,我的受众是创始人和 CMO,我采用直接对话的语气写作……”你都在浪费两分钟,而且因为每次措辞略有不同,得到的结果也略有差异。

上下文架构能永久解决这个问题。

你一次性构建好它。随着时间的推移不断完善它。然后每次会话开始时,模型已经知道它需要知道的一切。

每个专业人士需要的四个文件

你的身份文件。你是谁,你做什么,你的专长,你的背景,你的沟通风格。这是你 AI 的“入职文档”。

你的受众文件。你为谁创作。他们的人口统计、心理特征、知识水平、痛点、目标以及他们使用的语言。这确保每个输出都是有针对性的,而非泛泛而谈。

你的标准文件。什么是“好”的样子。你的质量标准、格式偏好、语气指南、反模式、优秀作品和糟糕作品的示例。这是你的质量控制体系。

你的项目文件。你当前正在做什么。当前目标、活跃项目、近期决策、未决问题、截止日期。这是动态层,每周或每月都会变化。

在每次会话开始时加载这四个文件,模型就会从一个通用的助手,转变为一个已经了解你世界的、具有上下文意识的协作者。

本周要做的事

  • 编写全部四个上下文文件:身份、受众、标准、项目
  • 保持每个文件在 2000 词以内,以便轻松放入上下文窗口
  • 用三种不同类型的工作测试这四个文件的设置:写作、分析和头脑风暴
  • 将输出质量与你之前没有上下文文件的会话进行比较
  • 根据输出仍不理想的地方,完善每个文件

第三周:掌握动态上下文加载

并非每个任务都需要相同的上下文

将你的整个知识库加载到每个对话中,既浪费 token,实际上还会降低性能。当上下文窗口充斥着无关信息时,模型的注意力会被稀释。它试图使用所有信息,结果却什么都没用好。

动态上下文加载意味着,只为手头的特定任务提供模型恰好需要的信息。不是你所有知道的东西,只是当下重要的东西。

想想人类专家是如何工作的。外科医生不会在每次手术前复习所有医学教科书。他们会查看特定的病人档案、特定的手术记录和特定的影像结果。他们加载相关的上下文,而不是所有上下文。

你的 AI 系统也应该以同样的方式工作。

如何设计上下文加载规则

对于每种重复出现的工作类型,定义加载哪些上下文文件。

写作任务加载你的身份文件、受众文件和标准文件,再加上该格式下你表现最佳的内容示例。

分析任务加载你的身份文件和项目文件,再加上原始数据和任何关于同一主题的先前分析。

研究任务加载你的项目文件,再加上你的研究方法论文档和任何你希望模型在此基础上构建的现有研究。

战略任务加载所有四个文件,再加上你的竞争格局文档和相关的行业数据。

通过预先定义这些加载规则,每次会话都以加载了精确正确的上下文开始。不再需要猜测。不再过度加载。也不再加载不足。

本周要做的事

  • 列出你最常进行的五种 AI 辅助工作类型
  • 为每种类型,精确定义应该加载哪些上下文文件
  • 创建一个简单的文档,将每种工作类型映射到其上下文加载规则
  • 测试每种配置,并验证输出是否比加载所有内容有所改进
  • 养成在任何会话开始前有意识地选择上下文的习惯

第四周:构建跨会话持久化的记忆系统

记忆问题不是 Bug。它是你尚未使用的功能。

每次与 Claude 的对话都是全新的开始。模型不记得你昨天、上周或上个月讨论过什么。

大多数人将此视为一个限制。而最聪明的人将其视为一个设计机会。

当你构建一个记忆系统时,你精确地控制着模型记住什么。你策划上下文。你移除过时的信息。你添加新的学习成果。你有意地塑造模型的知识库,而不是让它随机积累。

一个人类员工会记住所有事情,包括他们的坏习惯、过时的假设和错误的解读。而一个拥有设计良好的记忆系统的 AI,只记住你想让它记住的东西,并且会根据你最新的想法进行更新。

AI 记忆的三种方法

手动记忆文档。最简单的方法。你维护一个持续更新的文档,记录关键决策、学习成果、偏好和项目历史。在每次会话开始时,你将相关部分粘贴到对话中。这适用于个人和小规模工作。

结构化知识库。中级方法。你构建一个由文件夹结构中的 Markdown 文件组成的组织化系统。Obsidian 是理想的选择。你按项目、主题或领域对信息进行分类。当需要特定上下文时,你加载特定的文件。Claude Code 可以直接从你的文件系统中读取这些文件。

向量数据库和 RAG。高级方法。你将文档嵌入到向量数据库中,并构建一个检索系统,该系统能自动为任何给定查询找到并加载最相关的上下文。这可以扩展到数千个文档,也是生产级 AI 系统所使用的方法。

从手动记忆文档开始。当你有超过 20 个上下文文档时,升级到结构化知识库。当你的知识库超出手动管理能力时,再转向向量数据库。

本周要做的事

  • 创建你的第一个记忆文档:一个持续记录你 AI 辅助工作中的关键决策、学习成果和偏好的日志
  • 设置一个 Obsidian 仓库或一个简单的文件夹结构,按项目和主题组织
  • 在同一个项目的连续三次会话开始时,练习加载记忆上下文
  • 注意当模型能访问你累积的上下文时,输出质量的变化
  • 建立每周更新记忆文档、添加新学习成果的习惯

第五周:通过 MCP 将上下文连接到工具

没有工具的上下文,就像没有双手的知识

你可以给 AI 模型提供关于你业务的完美上下文。它可以了解你的受众、你的标准、你的项目以及你全部的决策历史。

但如果它无法访问你的数据、查询你的数据库、搜索网络、阅读你的邮件或与你的工具交互,它仍然只是一个信息非常丰富的文本生成器。

MCP,即模型上下文协议,正是赋予你上下文丰富的 AI 模型根据所知信息采取行动的能力。

当你将深度上下文与 MCP 工具访问相结合时,模型不再只是一个顾问,而开始成为一个操作者。它不仅知道你的周报应该包含什么内容,它还会拉取数据、运行数字、格式化报告并将其保存到你的硬盘。

上下文-MCP 集成模式

能产生最佳结果的模式是:上下文优先,工具其次。

你的系统提示词建立上下文:模型是谁,它知道什么,它遵循什么标准,它当前的优先事项是什么。

你的 MCP 服务器提供能力:网络搜索、文件访问、数据库查询、API 集成、邮件访问、日历访问。

你的任务提示词将它们结合在一起:“根据你对 Q2 目标和竞争格局的了解,拉取最新的市场数据,与我们的内部指标进行比较,并生成一份每周战略简报。”

上下文告诉模型“为什么”和“是什么”。工具告诉模型“怎么做”。任务告诉模型“何时”和“何地”。

本周要做的事

  • 确定你的 AI 工作流需要访问哪些外部工具和数据源
  • 设置你的第一个 MCP 服务器,从网络搜索或文件访问开始
  • 构建一个完整的工作流,将你的上下文文件与 MCP 工具访问结合起来
  • 端到端测试该工作流,并确定上下文和工具在哪些方面需要更好的集成
  • 记录该工作流,以便你可以复制和完善它

第六周:构建生产系统并规模化

从个人生产力到专业基础设施

你在过去五周里构建的一切,都是一个个人上下文工程系统。它让你个人在使用 AI 时更快、更一致、更高效。

下一个层次是为他人构建上下文工程化的系统。

企业需要能理解其特定领域、遵循其特定规则、访问其特定数据、并产出符合其特定标准输出的 AI 系统。这就是被打包成产品或服务的上下文工程。

能够走进一家公司,审计其 AI 工作流,设计上下文架构,实施记忆系统,连接 MCP 工具,并交付一个生产级 AI 系统的人,正是目前企业愿意为每个项目支付 5000 到 25000 美元的人。

对这种技能的需求增长速度超过了供应。而且这种需求将持续增长多年,因为上下文工程不是一种趋势。它是让每个 AI 应用运行得更好的基础基础设施层。

本周要做的事

  • 将你的上下文工程系统打包成一个可复用的框架
  • 记录你的四文件上下文架构、加载规则、记忆系统和 MCP 集成
  • 为你自己工作之外的一个真实用例,构建一个完整的上下文工程化系统
  • 公开分享你的框架,并开始将自己定位为构建 AI 系统的人,而不是写提示词的人
  • 确定三个可能从上下文工程中受益的企业,并开始对话

改变一切的转变

大多数人会继续写更好的提示词。

他们会继续寻找神奇的词语。他们会继续调整句子。他们会继续获得渐进式的改进,同时奇怪为什么其他人正在获得变革性的结果。

区别不在于提示词。

区别在于提示词周围的上下文。

设计上下文。构建架构。建立记忆。连接工具。组织信息。塑造环境。

做到这些,你写的每一个提示词都会产生仅靠提示词思维的人无论多么完美地措辞都无法复制的成果。

提示词工程是 2024 年的技能。

上下文工程是 2026 年及以后的技能。

如果你觉得这有用,请关注我 @eng_khairallah1 获取更多类似的 AI 内容。我每周都会发布解析、课程和工具。

希望对你有用,Khairallah ❤️

更多可拆解样本

近期爆款文章

探索更多爆款文章

为创作者而生。

从全球 𝕏 爆款文章里发现选题,拆解它为什么能爆,再把可复用的内容结构变成你的下一篇创作灵感。