AI Agent火爆到什么程度?
OpenAI创始人奥特曼预测,未来各行各业,每一个人都可以拥有一个AI Agent;比尔·盖茨在2023年层预言:AI Agent将彻底改变人机交互方式,并颠覆整个软件行业;吴恩达教授在AI Ascent 2024演讲中高赞:AI Agent是一个令人兴奋的趋势,所有从事AI开发的人都应该关注。而国内的各科技巨头也纷纷布局AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。
👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享**(安全链接,放心点击)**👈
针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料
分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓
👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈
Agent 是未来最重要的智能化工具。对于程序员来说,是时候将目光转向大模型的应用开发了,率先抢占AI的下一个风口AI Agent。
有这样一本秘籍在手,程序员们这下放心了吧,让我们先来揭开 Agent 的神秘面纱。
AI Agent 面面观
先对 Agent 下一个定义:Agent 是一个具有一定程度自主性的人工智能系统。更进一步说,Agent 是一个能够感知环境、做出决策并采取行动的系统。Agent 具有四大特性:
· 自主性: Agent 能够根据自身的知识和经验,独立做出决策和采取行动。
· 适应性: Agent 能够学习和适应环境,不断提高自己的能力。
· 交互性: Agent 能够与人类进行交互,提供信息和服务。
· 功能性: Agent 可以在特定领域内执行特定的任务。
要从技术上实现上述特性,Agent 通常需要包含四大核心组件。感知器用来收集环境信息;知识库存储和管理有关环境和自身状态的信息;决策引擎分析感知的信息,做出决策;执行器在环境中采取行动。
那么,我们在开发 Agent 时要遵循哪些原则才能收效最佳呢?本书作者引据儒家经典的“博学之,审问之,慎思之,明辨之,笃行之”。 在经过引申之后,为我们阐述了 Agent 方法论。
对于构建 Agent 来说,目前业界已经具备技术基础,包括大模型和 AIGC 模型、人工智能应用开发框架和工具、软件平台、丰富的数据等。只要结合具体的业务场景,将现有技术进行整合,就能开发出满足需求的 Agent。本书按照“基础知识——技术工具——项目实战”三部分来组织内容,帮助读者从理论学习推进到动手实际操作。
书籍目录:
第1章 何为Agent,为何Agent 1
- 1.1 大开脑洞的演讲:Life 3.0 2
- 1.2 那么,究竟何为Agent 5
- 1.3 Agent的大脑:大模型的通用推理能力 9
- 1.4 Agent的感知力:语言交互和多模态 23
- 1.5 Agent的行动力:语言输出和工具使用 25
- 1.6 Agent对各行业的效能提升 28
- 1.7 Agent带来新的商业模式和变革 32
- 1.8 小结 39
第2章 基于大模型的Agent技术框架 41
- 2.1 Agent的四大要素 41
- 2.2 Agent的规划和决策能力 44
- 2.3 Agent的各种记忆机制 45
- 2.4 Agent的核心技能:调用工具 46
- 2.5 Agent的推理引擎:ReAct框架 49
- 2.6 其他Agent认知框架 66
- 2.7 小结 68
第3章 OpenAI API、LangChain和LlamaIndex 70
- 3.1 何为OpenAI API 71
- 3.2 何为LangChain 91
- 3.3 何为LlamaIndex 105
- 3.4 小结 113
第4章 Agent 1:自动化办公的实现——使用Assistants API和DALL·E 3模型创作PPT 115
- 4.1 OpenAI公司的Assistants是什么 117
- 4.2 不写代码,在Playground中玩Assistants 118
- 4.3 Assistants API的简单示例 123
- 4.4 创建一个简短的虚构PPT 141
- 4.5 小结 160
第5章 Agent 2:多功能选择的引擎——通过Functions Calling调用函数 161
- 5.1 OpenAI中的Functions 163
- 5.2 在OpenAI Playground中定义Function 168
- 5.3 用Assistants API来实现Functions Calling 173
- 5.4 用ChatCompletion API来实现Tool Calls 196
- 5.5 小结 205
第6章 Agent 3:推理与行动的协同——使用LangChain中的ReAct框架实现自动定价 207
- 6.1 复习一下ReAct推理框架 208
- 6.2 LangChain中ReAct Agent 的实现 210
- 6.3 LangChain中的工具和工具包 212
- 6.4 通过create_react_agent创建鲜花定价Agent 215
- 6.5 深挖AgentExecutor的运行机制 221
- 6.6 小结 249
第7章 Agent 4:计划和执行的解耦——使用LangChain中的Plan-and-Execute智能调度库存 251
- 7.1 Plan-and-Solve策略的提出 252
- 7.2 LangChain中的Plan-and-Execute Agent 257
- 7.3 用Plan-and-Execute Agent实现物流管理 258
- 7.4 从单Agent到多Agent 273
- 7.5 小结 273
第8章 Agent 5:知识的提取与整合——使用Llama Index实现检索增强生成Agent 275
- 8.1 何为检索增强生成 276
- 8.2 RAG和Agent 282
- 8.3 用LlamaIndex的ReAct Agent来实现花语秘境财报检索 284
- 8.4 小结 289
第9章 Agent 6:GitHub的网红聚落——AutoGPT、BabyAGI、CAMEL和Generative Agents 292
- 9.1 AutoGPT 293
- 9.2 BabyAGI 298
- 9.3 CAMEL 317
- 9.4 小结 333
第10章 Agent 7:多Agent系统框架——AutoGen和MetaGPT 335
- 10.1 AutoGen 336
- 10.2 MetaGPT 343
- 10.3 小结 353
第11章 下一代Agent的诞生地:科研论文中的新思路 355
- 11.1 两篇高质量的Agent综述 355
- 11.2 论文选读:Agent自主学习、多Agent合作、Agent可信度的评估、边缘系统部署以及具身智能落地 358
- 11.3 小结 359
- 参考文献 361
- 后记 创新与变革的交汇点 362
👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享**(安全链接,放心点击)**👈
针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料
分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓
👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈