第三部分｜上下文与记忆：让企业知识库助手在时间维度上可靠

一灰灰blog约 411 字大约 1 分钟

本部分目标：
解释一个几乎所有真实 LLM 系统都会遇到的问题：为什么对话一变长，系统就开始失控？
引入并系统化「Context Engineering（上下文工程）」这一核心思想
让企业知识库助手从“单轮可用”，升级为“多轮可信”

在第二部分中，我们通过 Prompt 工程为模型建立了单次生成层面的约束—— 比如明确系统角色、限定回答范围、规范输出格式等。这些方法在单轮对话中往往能取得不错的效果：用户问一个问题，系统基于设定的规则和知识库给出答案，看起来既准确又可靠。

但如果你真正将企业知识库助手投入实际使用，很快就会收到用户这样的反馈：“一开始回答得挺准的，多聊几句就越来越离谱了。”

这并非 Prompt 突然失效，也不是模型能力下降，而是当对话从 “单轮” 进入 “多轮”，系统面临了一个全新的挑战维度 —— 时间。

在持续交互中，历史信息的累积会逐渐改变模型的输入环境，进而打破最初设定的约束边界。

接下来，我们将从上下文窗口的本质出发，逐步拆解多轮对话失控的根源，最终落地一套可工程化的上下文管理方案。