langchian入门四:LLM+Agents代理=贾维斯?让大模型拥有三头六臂

news2024/9/21 12:33:16

什么是Agent

在日常生活中,不难发现,chatgpt通过文本输入进行处理后返回的也是文本内容,就像是一个只有头的人,能听能思考能说话,但是无法行动.而Agent是一种能够自主决策、采取行动以达到某种目标的实体。被解释为"智能体"或者"代理".

代理的核心思想是通过大模型来选择要采取的一系列行动.在常规结构下,一系列行动都是硬编码,是已规定好的行为路线,而在代理中,是用大模型作为推理引擎来确定并采取行动的.通俗的讲就是给大模型配备工具,让大模型自己去判断在当前场景需要使用什么工具.

代理的效果与模型的智慧程度有关,大模型的训练集越大,代理的效果越好,差的模型进行代理会陷入某一个自问自答而死循环,好的模型会进行自我验证,验证这个答案是否与最初的问题相关,不相关进行修正.

举个例子:

链式结构下,我会拿着螺丝刀去拧螺丝,拿着钥匙开锁,拿着斧头砍木头.我不会选择工具,而是按照规划的路线行动.

代理情况下,我有螺丝刀,钥匙,斧头等工具,我遇到了一颗螺丝,我会用螺丝刀去拧螺丝. 遇到了一把锁,我会用钥匙去开锁,遇到了木头,我会用斧头去砍木头.在不同的场景或者问题下会进行推理选择.

总而言之:Agent= LLM(思考决策)+ memory(记忆)+ tools(执行)

langchain中代理的关键组成

  • Agent代理
  • llm大模型
  • Tool工具
  • prompt提示词
  • Toolkit工具包
  • AgentExecutor代理执行器

这里使用的是openai的大模型,想要白嫖阿里云的通义千问大模型,还不会prompt提示词以及记忆组件memory的请移步传送门

传送门:

  • langchain入门一:python+langchain+通义千问,白嫖qwen大模型实现自己的聊天机器人 - 掘金 (juejin.cn)
  • langchian入门二:prompts提示词的使用,你的LLM说话怎么这么⑥! - 掘金 (juejin.cn)
  • langchain入门三:memory-记忆组件,让大语言模型拥有记忆,燕咂,我刚刚说了啥? - 掘金 (juejin.cn)

代理的类型

  • Zero-shot ReAct:利用工具的描述来决定使用哪个工具,可以有多个工具,每个工具都要提供描述信息。选择单纯依靠描述信息
  • Structured Input ReAct:通过工具的参数schema创建结构化的动作输入
  • Open AI Functions:与openai function call机制配合工作
  • Conversational:为对话场景设计,使用具有对话性提示词,利用ReAct框架选择工具,并利用记忆功能来保存对话历史
  • Self ask with seach:利用工具查找事实性答案

Tool

代理调用的功能,相当于手的部分,与外部世界交互 ,LangChain 提供了一系列工具,比如 Search 工具,AWS 工具,Wikipedia 工具等。这些工具都是 BaseTool 的子类。通过调用 run 函数,执行工具的功能。

如何创建工具

  1. 加载langchain内置的工具
python
复制代码
from langchain.tools import load_tools
tools = load_tools(["serpapi"],llm=llm)#谷歌的搜索引擎
  1. 通过tool装饰器,自定义工具,在函数中需要描述这个工具
python
复制代码
from langchain.agents import tool
@tool
def serpapi_search(query:str)->str:
    '''使用serpapi搜索引擎获取搜索结果'''
    from serpapi import GoogleSearch
    params = {
        "q": query,
        "api_key": "serpapi-api-key"
    }
    search = GoogleSearch(params)
    results = search.get_dict()
    return results['organic_results'][0]['snippet']
 tools = [serpapi_search]

Tollkit

工具包,一组工具的集合,tools = [serpapi_search]tools = load_tools(["serpapi"],llm=llm)都是工具包.

AgentExecutor

代理执行器是代理执行时,由它来选择并执行其他选择的动作。

  1. 处理代理选择不存在的工具的情况
  2. 处理工具发生错误的情况
  3. 处理代理生成无法解析为工具调用的输出的情况
  4. 在所有级别上记录和可观察性(代理决策,工具调用)

思考的过程

  • Action:就是根据用户的输入,选用哪个Tool,然后行动
  • Action Input:根据需要使用的Tool,从用户的输入里提取相关的内容,可以输入到Tool里面
  • Observation:就是观察通过使用 Tool 得到的一个输出结果。稳定版本之前有展示,稳定版本之后就没有了,但是步骤仍然存在
  • Thought:就是再看一眼用户的输入,判断一下该怎么做,同样是稳定版本之前有展示,稳定版本之后就没有了,仍然存在
  • Final Answer:就是 Thought 在看到 Obersavation 之后,给出的最终输出,

创建一个代理

这里来创建一个react代理,给他配备一个谷歌的搜索引擎,让他能去搜索网络上的内容,但是他对中文不友好,用Translator翻译翻译.还配备了一个运算工具,看看他是否在不同情景下能推理并且选择工具

python
复制代码
# 代理模块,用于调用openai的模型进行对话并执行操作
import os
from dotenv import find_dotenv, load_dotenv
load_dotenv(find_dotenv())
os.environ["OPENAI_API_BASE"] 
os.environ["OPENAI_API_KEY"] 
os.environ["SERPAPI_API_KEY"]
from langchain_openai import ChatOpenAI
#引入集成的工具,包含langchain中内置的各种工具。官方文档中查找
from langchain.agents import create_react_agent,AgentExecutor,tool
#引入hub模块,用于调用hub中的模型
from langchain import hub
#引入工具加载器,用于加载工具
from langchain.tools import load_tools
#引入翻译工具
from translate import Translator
#实例化一个大模型
llm=ChatOpenAI(temperature=0, model="gpt-3.5-turbo")
#从hub中拉取模型
prompt = hub.pull("hwchase17/react")

#创建工具

#搜索引擎
@tool
def serpapi_search(query:str)->str:
    '''使用serpapi搜索引擎获取搜索结果'''#工具描述
    from serpapi import GoogleSearch
    params = {
        "q": query,
        "api_key": os.getenv("SERPAPI_API_KEY")
    }
    search = GoogleSearch(params)
    results = search.get_dict()
    return results['organic_results'][0]['snippet']

#运算工具
@tool
def calculate(expression:str)->str:
    '''计算表达式'''
    return str(eval(expression))


# tools = load_tools(["serpapi"],llm=llm)#加载内置工具
tools=[serpapi_search,calculate]#工具包
#创建agent
agent=create_react_agent(
    llm,
    tools,
    prompt,
)
#代理执行器
agent_executor=AgentExecutor(agent=agent,
                              tools=tools,#工具包
                              verbose=True,#执行的详细过程
                              )
                              
def agent_invoke(huamn_input:str):
    text=agent_executor.invoke({"input":huamn_input})
    res=Translator(from_lang="en",to_lang="zh").translate(text['output'])
    return res

if __name__ == "__main__":
    text=input()
    print(agent_invoke(text))

.env文件内容为:

python
复制代码
# 代理地址
OPENAI_API_BASE = ""
# 代理密钥
OPENAI_API_KEY = ""
#谷歌引擎
SERPAPI_API_KEY=""

搜索一下最近发生的事儿,看看结果:

搜索一下时事 image.png 再来一个 image.png 来个简单的计算题 image.png 根据问题情景,大模型能够进行推理选择工具,关于时事的它能够选择搜索工具进行搜索,关于计算的问题,它能够选择运算工具进行回答,也回答正确了.并且我在问题中没有提示他该选择什么工具.

总结

代理就是让大模型具备了行动的能力,大模型不仅仅局限于进行文本回答,在回答的同时还能进行一系列行动.openai的chatgpt把agent推向了一个新的高度,使得agent更接近于一个’智能体’.通过各种工具将大模型武装起来,或许这个工具,不仅仅是软件也可以是硬件,将大模型与嵌入式结合或许能做成一个能思考能行动的智能机器人,或许在不久的将来,私人AI助理-贾维斯就可以变成现实.

最后

为了帮助大家更好的学习人工智能,这里给大家准备了一份人工智能入门/进阶学习资料,里面的内容都是适合学习的笔记和资料,不懂编程也能听懂、看懂,所有资料朋友们如果有需要全套人工智能入门+进阶学习资源包,可以在评论区或扫.码领取哦)~

在线教程

  • 麻省理工学院人工智能视频教程 – 麻省理工人工智能课程
  • 人工智能入门 – 人工智能基础学习。Peter Norvig举办的课程
  • EdX 人工智能 – 此课程讲授人工智能计算机系统设计的基本概念和技术。
  • 人工智能中的计划 – 计划是人工智能系统的基础部分之一。在这个课程中,你将会学习到让机器人执行一系列动作所需要的基本算法。
  • 机器人人工智能 – 这个课程将会教授你实现人工智能的基本方法,包括:概率推算,计划和搜索,本地化,跟踪和控制,全部都是围绕有关机器人设计。
  • 机器学习 – 有指导和无指导情况下的基本机器学习算法
  • 机器学习中的神经网络 – 智能神经网络上的算法和实践经验
  • 斯坦福统计学习

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

请添加图片描述

人工智能书籍

  • OpenCV(中文版).(布拉德斯基等)
  • OpenCV+3计算机视觉++Python语言实现+第二版
  • OpenCV3编程入门 毛星云编著
  • 数字图像处理_第三版
  • 人工智能:一种现代的方法
  • 深度学习面试宝典
  • 深度学习之PyTorch物体检测实战
  • 吴恩达DeepLearning.ai中文版笔记
  • 计算机视觉中的多视图几何
  • PyTorch-官方推荐教程-英文版
  • 《神经网络与深度学习》(邱锡鹏-20191121)

  • 在这里插入图片描述
    😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

第一阶段:零基础入门(3-6个月)

新手应首先通过少而精的学习,看到全景图,建立大局观。 通过完成小实验,建立信心,才能避免“从入门到放弃”的尴尬。因此,第一阶段只推荐4本最必要的书(而且这些书到了第二、三阶段也能继续用),入门以后,在后续学习中再“哪里不会补哪里”即可。

第二阶段:基础进阶(3-6个月)

熟读《机器学习算法的数学解析与Python实现》并动手实践后,你已经对机器学习有了基本的了解,不再是小白了。这时可以开始触类旁通,学习热门技术,加强实践水平。在深入学习的同时,也可以探索自己感兴趣的方向,为求职面试打好基础。

第三阶段:工作应用

这一阶段你已经不再需要引导,只需要一些推荐书目。如果你从入门时就确认了未来的工作方向,可以在第二阶段就提前阅读相关入门书籍(对应“商业落地五大方向”中的前两本),然后再“哪里不会补哪里”。

在这里插入图片描述
😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1543602.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java全栈课程之Linux———基本属性

一、看懂文件属性 Linux系统是一种典型的多用户系统,不同的用户处于不同的地位,拥有不同的权限。为了保护系统的安全性,Linux系统对不同的用户访问同一文件(包括目录文件)的权限做了不同的规定。 在Linux中我们可以使…

Mysql数据库——数据备份与恢复

目录 一、数据备份的重要性 二、数据库备份的分类 1.从物理与逻辑的角度分类 2.从数据库的备份策略角度,备份可分为 2.1完全备份 2.2差异备份 2.3增量备份 2.4总结 三、常见的备份方法 四、Mysql数据库完全备份 1.完全备份定义 2.优缺点 3.数据库完全备…

代码随想录算法训练营第25天|LeetCode106.中序和后序遍历构造二叉树、LeetCode105.中序和先序遍历构造二叉树

代码随想录算法训练营第25天|LeetCode106.中序和后序遍历构造二叉树、LeetCode105.中序和先序遍历构造二叉树 1、LeetCode106.中序和后序遍历构造二叉树 106. 从中序与后序遍历序列构造二叉树 - 力扣(LeetCode) 知道理论怎么求,但是太久没写…

Adaptive Partitioning

qnx开源代码 GitHub - vocho/openqnx: mirror of git://git.code.sf.net/p/monartis/openqnx http://www.qnx.com/developers/docs/7.0.0/#com.qnx.doc.adaptivepartitioning.userguide/topic/about_howtouseguide_.html ap是对进程和线程集合分配最小的系统资源,目…

基于nodejs+vue宿舍管理系统python-flask-django-php

随着信息时代的来临,过去的传统管理方式缺点逐渐暴露,对过去的传统管理方式的缺点进行分析,采取计算机方式构建宿舍管理系统。本文通过课题背景、课题目的及意义相关技术,提出了一种楼宇信息、宿舍信息、宿舍安排、缺勤信息等于一…

OceanBase中NOT EXISTS是否需要被改写

作者简介 张瑞远,曾经从事银行、证券数仓设计、开发、优化类工作,现主要从事电信级IT系统及数据库的规划设计、架构设计、运维实施、运维服务、故障处理、性能优化等工作。 持有Orale OCM,MySQL OCP及国产代表数据库认证。 获得的专业技能与认证包括 Oce…

直播预告丨困气排气解决新方案--毅速金属3D打印随形透气钢

您是否也遇到过这些问题 模具困气造成产品出现注塑瑕疵,但复杂的产品形状导致无法开排气槽 常规透气钢需要拆镶件导致工件强度下降 某些工件部分不接受分模线区域无法拆镶件无法使用常规透气钢 面对越来越复杂的产品和结构,越来越多需要透气、保压、…

全网最新网络安全自学路线,最详细没有之一!!!

在各大平台搜的网安学习路线都太粗略了。。。。看不下去了! 我把自己整理的系统学习路线,拿出来跟大家分享了! 建议的学习顺序: 一、网络安全学习普法(心里有个数,要进去坐几年!) 1…

Spring 面试——restcontroller/requestmapping

RestController Controller ResponseBody Controller:包含Component,把当前类声明成为一个 bean ResponseBody:表示方法返回的结果直接作为 HTTP 响应的内容,不是返回视图 3.RequestMapping注解的基本用法_哔哩哔哩_bilibili

Linux文件系列:磁盘,文件系统,软硬链接

Linux文件系列:磁盘,文件系统,软硬链接 一.磁盘相关知识1.磁盘机械构成2.磁盘物理存储3.磁盘逻辑存储1.LBA地址2.磁盘的分区和分组 二.文件系统和inode1.inode结构体2.文件系统1.Super Block(超级块)2.Group Descriptor Table(块组描述表GDT)3.inode Table4.Data Blocks5.Block…

如何本地部署Imagewheel并实现无公网IP远程连接打造个人云图床

文章目录 1.前言2. Imagewheel网站搭建2.1. Imagewheel下载和安装2.2. Imagewheel网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar临时数据隧道3.2.Cpolar稳定隧道(云端设置)3.3.Cpolar稳定隧道(本地设置) 4.公网访问测…

域名SSL证书怎么获取?

获取域名证书的步骤如下: 选择认证机构:域名证书必须从受信任的认证机构(CA)中申请,如JoySSL、GeoTrust、、Thawte等。收集信息:在申请域名证书之前,需要准备一些证明信息,如域名认证等。创建CSR&#xff…

【ARXIV2402】MambaIR

这个工作首次将 Mamba 引入到图像修复任务,关于为什么 Mamba 可以用于图像修复,作者有非常详细的解释:一路向北:性能超越SwinIR!MambaIR: 基于Mamba的图像复原基准模型 作者认为Mamba可以理解为RNN和CNN的结合&#xf…

实战 | 微调训练TrOCR识别弯曲文本

导 读 本文主要介绍如何通过微调训练TrOCR实现弯曲文本识别。 背景介绍 TrOCR(基于 Transformer 的光学字符识别)模型是性能最佳的 OCR 模型之一。在我们之前的文章中,我们分析了它们在单行打印和手写文本上的表现。 TrOCR—基于Transforme…

基于ARM 的Linux系统的交叉编译

返回:OpenCV系列文章目录(持续更新中......) 上一篇:在 MacOS 中安装 下一篇:MultiArch与Ubuntu/Debian 的交叉编译 警告 本教程可以包含过时的信息。 此步骤已在 Ubuntu Linux 12.04 上进行了测试,但应…

跳蚱蜢(蓝桥杯)

文章目录 跳蚱蜢题目描述答案:20bfs 跳蚱蜢 题目描述 本题为填空题,只需要算出结果后,在代码中使用输出语句将所填结果输出即可。 如下图所示: 有 9 只盘子,排成 1 个圆圈。 其中 8 只盘子内装着 8 只蚱蜢&#xff…

JVM 基础知识

JAVA code加载执行顺序: *.java --->*.class->类装载子系统、字节码执行引擎 JVM虚拟机组成: 堆、方法区(元空间)、栈(线程)、本地方法栈、程序计数器 栈帧组成: 栈帧:局部…

管理类联考–复试–管理类知识–计划

决策是管理的核心,决策是计划的前提,计划是管理的首要职能,战略是一种计划。 #mermaid-svg-kwa82umCx6PXrp8x {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-kwa82umCx6PXrp8x .e…

Linux操作系统及进程(三)进程优先级及特性

目录 一、优先级概念 二、查看系统进程 三、进程切换 一、优先级概念 1.cpu资源分配的先后顺序,就是指进程的优先权(priority)。 2.优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用,可以改善系统性能。…

在面对API的安全风险,WAAP全站防护能做到哪些?

随着数字化转型的加速,API(应用程序接口)已经成为企业间和企业内部系统交互的核心组件。在应用程序开发过程中,API能够在不引起用户注意的情况下,无缝、流畅地完成各种任务。例如从一个应用程序中提取所需数据并传递给…