《构建有效的AI代理》学习笔记

news2025/4/4 21:57:51

原文链接:https://www.anthropic.com/engineering/building-effective-agents

核心结论
• 成功的AI代理系统往往基于简单、可组合的模式，而非复杂框架。
• 需在性能、成本与延迟之间权衡，仅在必要时增加复杂度。
核心原则
• 从简单的提示开始，通过综合评估对其进行优化，并且仅在更简单的解决方案不足时才添加多步骤代理系统。
• 在实施代理时，我们尽量遵循三个核心原则：

原则	实施要点
简洁性	保持智能体架构简洁，避免过度复杂的功能堆砌
透明性	显式展示智能体的规划步骤与决策路径（如思维链可视化）
接口优化	通过完善的工具文档与系统性测试，精心打磨智能体-计算机接口（ACI）

代理（Agents） vs 工作流（Workflows）

类别	定义	适用场景
工作流（Workflow）	通过预定义代码路径编排LLM和工具的系统。	任务路径可预测，需一致性（如客服分类、翻译流程）。
代理（Agent）	LLM能够动态主导自身执行过程与工具使用，始终保持对任务完成方式的控制权的系统。	需灵活性和模型驱动决策（如复杂编码、多步骤信息检索）。

基本原则
- 优先简单方案：LLM应用开发应从最简单的方案入手（如单次LLM调用+上下文优化），仅在必要时引入代理系统。
- 权衡成本与性能：代理系统以更高的延迟和成本换取任务性能提升，需评估是否值得牺牲效率。
适用场景
- 复杂灵活任务：当任务需要动态决策、多步骤推理或大规模灵活处理时（如动态工具调用、复杂问题拆解）。
- 非结构化需求：任务边界模糊，需模型自主判断下一步行动（如开放式对话、探索性数据分析）。
避免场景
- 明确结构化任务：若任务流程固定且定义清晰（如模板化回复、规则化数据处理），直接使用确定性工作流（workflow）更高效。

框架价值
- 加速开发：简化代理系统实现（如工具调用、链式逻辑），例如 LangGraph、Amazon Bedrock 等。
- 可视化支持：部分框架（如 Rivet、Vellum）提供GUI降低开发门槛。
潜在风险
- 抽象层问题：框架可能隐藏底层逻辑（如实际提示词、响应解析），增加调试难度。
- 过度复杂化：易诱使开发者引入不必要的复杂性，违背“简单优先”原则。
使用建议
- 优先直接调用API：多数模式可通过少量原生代码实现（如 Python 直接调用 OpenAI API）。
- 理解底层逻辑：若用框架，需透彻掌握其内部机制，避免因“黑箱”操作导致错误。

针对性定制
- 根据具体场景选择增强能力组合（例如：客服场景侧重检索+记忆，数据分析场景侧重工具调用）。
- 避免“过度增强”，防止冗余功能增加复杂性和延迟。
接口友好性
- 为LLM提供标准化、易理解的增强能力接口（如统一工具调用格式、结构化记忆存储）。
- 文档清晰化，确保模型能准确识别何时及如何使用增强功能（如通过示例提示词引导）。

3.技术实现路径

协议化集成：
采用类似Model Context Protocol的标准化协议，通过轻量客户端接入第三方工具生态（如数据库、API服务）。
- 优势：降低开发成本，兼容扩展性；
- 示例：开发者只需实现协议接口，即可复用现有工具链（如搜索引擎、代码解释器）。

提示链（Prompt Chaining）
• 流程：任务分解为固定顺序的LLM调用，中间加入程序化检查（如“门控”步骤）。
• 适用：可明确拆分的任务（如生成营销文案→翻译→润色）。
• 示例：文档大纲生成→内容填充。
路由（Routing）
• 流程：输入分类后分派到专用子流程。
• 适用：任务类别差异大（如客服问题分派：常规问题→Haiku模型，复杂问题→Sonnet模型）。
• 优化点：分类准确性是关键（LLM或传统算法均可）。
并行化（Parallelization）
• 变体：
◦ 分段：独立子任务并行处理（如内容生成与安全审查并行）。
◦ 投票：多次生成后聚合结果（如代码漏洞审查需多模型独立评估）。
• 适用：需速度或高置信度结果的任务。
协调器-工作者（Orchestrator-Workers）
• 流程：协调器动态拆分任务，分派给工作者LLM，合成结果。
• 适用：任务拆解不可预测（如跨文件代码修改、多源信息分析）。
• 示例：编码代理需修改多个文件，协调器决定修改顺序。
评估器-优化器（Evaluator-Optimizer）
• 流程：生成器LLM输出结果→评估器LLM提供反馈→迭代优化。
• 适用：需明确评估标准的任务（如文学翻译、复杂搜索的多轮优化）。
• 条件：人工反馈可提升模型表现时效果最佳。

Agent = LLM（大模型） + 记忆 + 感知&反思 + 规划 + 工具使用

代理流程
• 启动：用户指令或交互对话。
• 执行：自主规划→使用工具→环境反馈→可能暂停等待人工输入。
• 终止：任务完成或达到停止条件（如最大迭代次数）。
关键挑战
• 错误累积：需沙盒测试和防护机制。
• 工具可靠性：工具定义需清晰（如避免相对路径导致错误）。
应用场景
• 客户支持：集成工具调用（调取订单数据、知识库）、支持对话流。
• 编码代理：通过自动化测试验证解决方案（如SWE-bench任务）。