第 17 章：可控 Agent，而不是“放飞自我”

一灰灰blog约 1258 字大约 4 分钟

在 Agent 技术的热潮中，有一种危险的倾向：追求 “让 Agent 自主完成一切”，甚至赋予它 “近乎人类的自主权”。

但在企业场景中，这种 “放飞自我” 的 Agent 几乎一定会出问题 —— 合规性、成本、安全性都无法保障。

设计企业级 Agent 时，必须先回答一个问题：

Agent 的“自由度”，应该到哪里为止？

如果不加控制，后果可能包括：

企业场景对 “可控性” 的要求远高于 “智能性” —— 一个偶尔犯错但行为可预测的系统，远好于一个聪明但可能失控的系统。

在企业知识库助手中，常见的约束包括：

有限的工具集合：只开放与任务相关的函数（比如处理报销时，只给search_document submit_reimbursement等工具，不开放delete_data modify_user等高危工具）；
明确的终止条件：提前定义 “任务完成” 的标准（比如 “报销申请提交成功并返回单号”），达到条件后强制终止循环；
最大步数限制：设置最多执行步骤（比如最多 8 步），避免无限循环（比如遇到错误时反复重试）；
可观测的中间状态：记录每一步的思考、行动、结果（如 “第 3 步调用了 XX 函数，返回结果是 XX”），便于管理员追溯和干预；
用户确认节点：关键操作（如提交金额超过 10000 美元的报销）前，必须让用户确认，避免 Agent 擅自决策。

理解 Agent 的关键，是摒弃对 “类人智能” 的幻想，回归工程本质：

只有这样，Agent 才能真正成为企业知识库助手的 “能力放大器”，而不是 “风险来源”。

第五部分总结：系统终于开始“做事”了

通过 Function Calling 与 Agent 的引入，企业知识库助手完成了一次关键进化：

但能力的提升也带来了新的挑战：

这自然引出了最后一个问题：

当系统变得越来越复杂，我们如何评估、调试、演进它？

这将是最后一部分要讨论的主题：评估、监控与工程化落地。