AI Agent是何方神圣?
让比尔·盖茨在2023年预言:未来五年内有望正式迎来它,彻底改变人类的生产力与生活方式。
让吴恩达教授在AI Ascent 2024演讲中高赞:今年得益于它的工作流的帮助, 人工智能的能力范围将持续拓展,所有从事人工智能的人都应该关注这个令人兴奋的新兴趋势。
它就是卷爆大模型,引发微软、OpenAI 、谷歌、Meta打擂台赛,“代表了AI的一种未来”的AI Agent。
可能还有很多小伙伴对这个概念很陌生,今天通过新书《动手做AI Agent》为大家科普一下它的来龙去脉。
下载当前版本: 完整PDF书籍链接获取,可以V扫描下方二维码免费领取👇👇👇
什么是AI Agent?
Agent也可以译为“代理”。“代理”这个词在AI出现之前就有了,哲学家们研究过它。像亚里士多德和大卫·休谟这样的大思想家都讨论过代理的概念,他们认为只要能自己做决定,不管是人、动物还是别的东西,都能称作代理。到了20世纪80年代,AI的研究者也开始关注这个概念了。
目前,我们倾向于把所有能够感知环境、做出决策并采取行动的实体或系统视为人工智能领域的代理。而AI Agent,即人工智能代理,被定义为一个能够自主执行任务、做出决策并与环境交互的系统。
-
感知环境,指Agent能够接收来自环境的信息。例如,一个自动驾驶Agent可以感知周围的交通情况、道路状况等信息。
-
做出决策,指Agent根据感知的信息制订下一步的行动计划。例如,自动驾驶 Agent 根据感知的信息决定是否加速、减速、转弯等。
-
采取行动,指Agent根据决策执行相应的行动。例如,自动驾驶 Agent 根据决策控制汽车的加速器、刹车、方向盘等。
在众多 Agent 框架中如何选择适合自己需求的框架做AI Agent?
挑个适合自己的AI代理框架得考虑老多事儿,不过看看相关书籍能给咱们指点迷津。最近,黄佳出的新书 《大模型应用与开发:动手做AI Agent》 就能帮上大忙。
这本书会带你深入探索AI Agent的世界,从技术框架到开发工具,从实战项目到最新动态,手把手教你做出7个超给力的AI Agent。书的最后,还会聊聊AI Agent的未来会是啥样。
不管是对AI Agent感兴趣的朋友,还是想在这块儿大展拳脚的研究人员、开发人员、企业高管,或者是大学里的老师和学生,都适合读这本书。你会跟着咖哥和小雪一起开启一段超有趣的AI Agent开发之旅,近距离感受GPT-4模型、OpenAI API、各种助手、LangChain、LlamaIndex和MetaGPT这些前沿技术的魅力,看看AI Agent在自动办公、智能调度、知识整合和增强生成等领域的酷炫表现,一起打开人工智能时代的大门,找到那颗最耀眼的AI Agent之星!
书籍目录:
第1章 何为Agent,为何Agent 1
1.1 大开脑洞的演讲:Life 3.0
1.2 那么,究竟何为Agent
1.3 Agent的大脑:大模型的通用推理能力
1.4 Agent的感知力:语言交互和多模态
1.5 Agent的行动力:语言输出和工具使用
1.6 Agent对各行业的效能提升
1.7 Agent带来新的商业模式和变革
1.8 小结
第2章 基于大模型的Agent技术框架
2.1 Agent的四大要素
2.2 Agent的规划和决策能力
2.3 Agent的各种记忆机制
2.4 Agent的核心技能:调用工具
2.5 Agent的推理引擎:ReAct框架
2.6 其他Agent认知框架
2.7 小结
第3章 OpenAI API、LangChain和LlamaIndex
3.1 何为OpenAI API
3.2 何为LangChain
3.3 何为LlamaIndex
3.4 小结
第4章 Agent 1:自动化办公的实现——使用Assistants API和DALL·E 3模型创作PPT
4.1 OpenAI公司的Assistants是什么
4.2 不写代码,在Playground中玩Assistants
4.3 Assistants API的简单示例
4.4 创建一个简短的虚构PPT
4.5 小结
第5章 Agent 2:多功能选择的引擎——通过Functions Calling调用函数
5.1 OpenAI中的Functions
5.2 在OpenAI Playground中定义Function
5.3 用Assistants API来实现Functions Calling
5.4 用ChatCompletion API来实现Tool Calls
5.5 小结
第6章 Agent 3:推理与行动的协同——使用LangChain中的ReAct框架实现自动定价
6.1 复习一下ReAct推理框架
6.2 LangChain中ReAct Agent 的实现
6.3 LangChain中的工具和工具包
6.4 通过create_react_agent创建鲜花定价Agent
6.5 深挖AgentExecutor的运行机制
6.6 小结
第7章 Agent 4:计划和执行的解耦——使用LangChain中的Plan-and-Execute智能调度库存
7.1 Plan-and-Solve策略的提出
7.2 LangChain中的Plan-and-Execute Agent
7.3 用Plan-and-Execute Agent实现物流管理
7.4 从单Agent到多Agent
7.5 小结
第8章 Agent 5:知识的提取与整合——使用Llama Index实现检索增强生成Agent
8.1 何为检索增强生成
8.2 RAG和Agent
8.3 用LlamaIndex的ReAct Agent来实现花语秘境财报检索
8.4 小结
第9章 Agent 6:GitHub的网红聚落——AutoGPT、BabyAGI、CAMEL和Generative Agents
9.1 AutoGPT
9.2 BabyAGI
9.3 CAMEL
9.4 小结
第10章 Agent 7:多Agent系统框架——AutoGen和MetaGPT
10.1 AutoGen
10.2 MetaGPT
10.3 小结
下载当前版本: 完整PDF书籍链接获取,可以V扫描下方二维码免费领取👇👇👇