逐步掌握最佳Ai Agents框架-AutoGen 九 RAG应用

news2025/1/19 3:27:01

在最近的几篇文章里,我们使用AutoGen实现了一些Demo。这篇文章,我们将使用AutoGen来完成RAG应用开发。

RAG应用

RAG全称"Retrieval-Augmented Generation",即检索增强生成,它是自然语言处理中的一项技术。这种模型结合了检索式(retrieval-based)和生成式(generative)两种组件,以生成更准确、更相关的回答。

在之前我们的基于文档的聊天机器人的例子,就是RAG的一种应用。在本系列的逐步掌握最佳Ai Agents框架-AutoGen 五 与LangChain手拉手 - 掘金 (juejin.cn),我们将文档读取、向量化和存储工作交给了LangChain, AutoGen以agent with function calls 的方式调用LangChain封装好的函数。AutoGen在最近版本里,新增了RetriveChat,可以减少对LangChain的依赖。那么,我们一起来看下AutoGen如何独立完成RAG应用开发。

RetrievalAgent

让我们来看下,官方文档对Retrieval-Augmented Generation (RAG) Applications with AutoGen | AutoGen (microsoft.github.io)的介绍。

image.png

从上图可以看出,AutoGen提供了Retrieval-augmented User Proxy 和Retrieval-augmented Assistant两个agent。

现在就让我们开干。

实战

  • 文档

之前的RAG项目中我们用到的是Uniswap的白皮书,这个项目里,我们换成了arxiv.org/pdf/2308.00…, 这是一份rag和向量技术在医疗教育中的相关研究文章。让我们在notebook里把它下载到当前项目中。

python

复制代码!wget -o rag.pdf https://arxiv.org/pdf/2308.00479.pdf

image.png

  • 安装库
python

复制代码%pip install pyautogen[retrievechat] langchain "chromadb<0.4.15" -q

这次安装pyautogen,多加了retrieveChat功能包的声明。我们依然安装了langchain, 在这里主要使用它的splitter功能,当然autogen也是提供了。最后我们安装了指定版本的chromadb 向量数据库,存储文档embedding。

  • 配置autogen config_list
css复制代码import autogen # 大家可以使用gpt-4 或其它,我这里用的是3.5, 还能用。 config_list = [ { 'model': 'gpt-3.5-turbo', 'api_key': '' }]
llm_config={ "seed": 42, #为缓存做的配置 "config_list": config_list }

接下来是比较典型的文档机器人的构建步骤

  • 配置embedding函数

我们会对question和文档都在embedding, AI助理回答问题的过程,其实就是将question的embedding和文档的embedding进行cosine 计算,得到相似度的过程。我们使用openai 做embedding。

ini复制代码# 从chromadb数据库中引入embedding_functions
from chromadb.utils import embedding_functions
# 调用OpenAIEmbeddingFunction 
openai_embedding_function = embedding_functions.OpenAIEmbeddingFunction(api_key = config_list[0]["api_key"])
  • 设置文本拆分器
python复制代码from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(separators=["\n\n", "\n", "\r", "\t"])
  • 实例化arg agents
python复制代码from autogen.agentchat.contrib.retrieve_assistant_agent import RetrieveAssistantAgent
from autogen.agentchat.contrib.retrieve_user_proxy_agent import RetrieveUserProxyAgent

llm_config = {
    "request_timeout": 600,
    "config_list": config_list,
    "temperature": 0
}

assistant = RetrieveAssistantAgent(
    name="assistant",
    system_message="You are a helpful assistant.",
    llm_config=llm_config,
)

rag_agent = RetrieveUserProxyAgent(
    human_input_mode="NEVER",
    retrieve_config={
        "task": "qa",
        "docs_path": "./rag.pdf",
        "collection_name": "rag_collection",
        "embedding_function": openai_embedding_function,
        "custom_text_split_function": text_splitter.split_text,
    },
)

首先我们引入了RetrieveUserProxyAgentRetrieveAssistantAgent两个agent。从引入的路径autogen.agentchat.contrib.retrieve_assistant_agent来看,rag agent也是由autogen的chat agent派生,它这里称为"contrib"。接着,我们定义了llm_config,autogen使用的大模型配置,注意,这里的temperature为0, 基于文档的Q/A应该严谨。RetrieveAssistantAgent负责执行rag工作,system_message 指定了assistant的角色。RetrieveUserProxyAgent 的retrieve_config,提起了RAG的重担,我们做了以下配置:

  1. task:qa 指定任务为 QA问答任务类型
  2. docs_path 指定文档路径
  3. collection_name chromadb 向量数据库的名字
  4. embedding_function为上面设置的openai_embedding_function
  5. custom_text_split_function为上面设置的langchain的文本分割器
  • 启动对话,执行QA
python复制代码assistant.reset()
rag_agent.initiate_chat(assistant, problem="What is the workflow in docGPT?", n_results=2)

Rag_agent 初始化任务,提的问题是What is the workflow in docGPT?, n_results 表示返回多少个结果,默认是20个, 这里只需要2个。

image.png

  • 结果分析

image.png

在这里看到有两个文档分块被加入到上下文当中。上下文即context,等下将会交给assistant 进行回答生成。RetrieveChatAgent(to assistant) 表示向assistant提供了如下的内容,也就是上下文。

image.png

如上图,它包括了RAG QA任务的模板(You're a retrieve aumented chatbot. You answer user's questions based on your own knowledge and the context provied by the user....)和内容(context)。模板中也说的很清楚,如果基于context无法回复用户提出的问题,那么就向proxy 发出UPDATE CONTEXT的需要。上图的后半部分,就是通过embedding查询获得的文档内容。

image.png

最后, RetrieveAssistantAgent根据RetrieveUserProxyAgent提供的context,完成了回答的生成, 这也是大模型最擅长的summarize。

总结

RAG是LLM的经典应用,AutoGen通过提供chat agent的 rag 升级agent,完成了相应功能。

  • RetrieveUserProxyAgent的配置需要完成文档读取、向量数据库、分词器的配置
  • RetrieveUserProxyAgent的prompt模板预置了QA 内容。
  • RetrieveAssistantAgent对RetrieveUserProxyAgent提供的context,完成回答生成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1790364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【操作系统】(详细理解进程的状态)执行状态、就绪状态、阻塞状态、挂起状态

下面是进程的几种状态的概念&#xff1a; 执行状态&#xff1a;当一个进程已获得必要资源&#xff0c;并占有CPU进行执行。 就绪状体&#xff1a;进程已分配到除CPU外的所有必要资源&#xff0c;只要获取CPU允许就可立即执行。 阻塞状态&#xff1a;正在执行的进程&#xff0c;…

【NLP开发】Python实现聊天机器人(微信机器人)

&#x1f37a;NLP开发系列相关文章编写如下&#x1f37a;&#xff1a;1&#x1f388;【小沐学NLP】Python实现词云图&#x1f388;2&#x1f388;【小沐学NLP】Python实现图片文字识别&#x1f388;3&#x1f388;【小沐学NLP】Python实现中文、英文分词&#x1f388;4&#x1…

元宇宙3D品牌营销虚拟场景提升客户对企业的黏性

在这个充满创意与想象的3D元宇宙时代&#xff0c;我们为您推出了全新的3D元宇宙场景在线制作编辑平台&#xff0c;让您轻松构建专属的虚拟展厅&#xff0c;展现无限可能。 3D元宇宙场景在线制作编辑平台允许您快速完成空间设计&#xff0c;根据您的个性化需求&#xff0c;自由设…

云计算如何赋能工业数字化转型?

云计算在工业数字化转型中发挥着至关重要的作用&#xff0c;通过提供安全的数据存储与备份、强大的数据处理和分析能力、以及降低IT成本&#xff0c;为企业的数字化转型提供了坚实的技术支撑&#xff0c;助力企业实现数字化转型目标。 一、什么是云计算技术&#xff1f;有哪些基…

连锁品牌企业的税务策略,创业者的盈利秘籍!

随着全球经济的不断发展&#xff0c;连锁品牌企业已成为商业竞争中的重要力量。然而&#xff0c;在追求利润最大化的道路上&#xff0c;税务策略成为了企业不容忽视的一环。商淘云和你一起探讨连锁品牌企业的税务策略及创业者的盈利秘籍&#xff0c;着重介绍税务合规管理、税务…

适合初学者人手一本的LLM大语言模型综述,爆火全网

今天给大家推荐一本大模型&#xff08;LLM&#xff09;这块的一本外文书&#xff0c;经过整理已经出中文版了&#xff0c;就是这本《大型语言模型综述》&#xff01;本书在git上有9.2k star&#xff0c;还是很不错的一本大模型方面的书。 本教程内容主要内容&#xff1a;中文版…

防火墙是什么?探讨部署Web防火墙的必要性

如今&#xff0c;多云环境、API安全功能扩展、合作伙伴集成即时可用、可用性和可视化增强以及提高自动化程度已经成为基本要求。伴随企业应用架构的迁移&#xff0c;在用户端&#xff0c;需要在部署环境不断扩展但人员技能有限的情况下&#xff0c;保护数量日益增长的应用安全。…

libsystemctlm-soc项目分析

概述 libsystemctlm-soc项目是Xilinx的SystemC库。 环境安装 verilator安装 # Prerequisites: #sudo apt-get install git help2man perl python3 make autoconf g flex bison ccache #sudo apt-get install libgoogle-perftools-dev numactl perl-doc #sudo apt-get insta…

vulhub中PHP利用GNU C Iconv将文件读取变成RCE(CVE-2024-2961)

GNU C 是一个标准的ISO C依赖库。在GNU C中&#xff0c;iconv()函数2.39及以前存在一处缓冲区溢出漏洞&#xff0c;这可能会导致应用程序崩溃或覆盖相邻变量。 如果一个PHP应用中存在任意文件读取漏洞&#xff0c;攻击者可以利用iconv()的这个CVE-2024-2961漏洞&#xff0c;将…

Ubuntu20.04 Mysql基本操作知识

#Mysql基本知识 运行环境Ubuntu20.04 1.开启mysql服务 sytemctl start mysql不然&#xff0c;命令行进入myql交互行提交命令后&#xff0c;就会出现4200错误。 2.显示所有数据库 SHOW DATABASES;注意复数s&#xff0c;毕竟很多数据库 3.新建数据库test CREATE DATABASE …

算法训练营第四十六天 | 卡码网52 携带研究材料、LeetCode 518 零钱兑换II、LeetCode 377 组合总和IV

写在前面 这次算法训练营题目&#xff0c;其实完全是按照代码随想录一路跟着来的&#xff0c;上面也有更好的、讲得更清楚的题解&#xff0c;有需要的小伙伴可以去那里看。 我这里是之前已经大体刷过一遍&#xff0c;为了应对有可能会考到的面试题&#xff0c;现在在跟着一个专…

WordPress电脑版+手机版自动识别切换主题插件优化版

下载地址&#xff1a;WordPress电脑版手机版自动识别切换主题插件优化版 插件介绍&#xff1a; 电脑访问自动显示电脑版 手机访问自动显示手机版

Python编程学习第一篇——制作一个小游戏休闲一下

到上期结束,我们已经学习了Python语言的基本数据结构,除了数值型没有介绍,数值型用的非常广,但也是最容易理解的,将在未来的学习中带大家直接接触和学习掌握。后续我们会开始学习这门语言的一些基础语法和编程技巧,在这之前我们休闲一下,写一个小游戏娱乐一下。 小戏用…

深入理解可燃气体报警器检验标准:守护工业安全新举措

在工业生产领域&#xff0c;可燃气体报警器扮演着至关重要的角色。它能在气体浓度达到危险水平之前发出警报&#xff0c;为工作人员争取宝贵的逃生时间。 为了确保可燃气体报警器的准确性和可靠性&#xff0c;我们需要遵循一系列严格的检验标准。 在这篇文章中&#xff0c;佰…

TCP协议的核心机制

TCP协议的核心机制 一:确认应答机制1.2:超时重传接收缓冲区 超时重传时间重置连接 一:确认应答机制 对于TCP协议来说,要解决的一个很重要的问题,就是可靠传输 可靠传输,不是指发送方能够100%的把数据发送给接收方,而是尽可能. 尤其是让发送方知道,接收方是否收到. 举个例子: …

AI菜鸟向前飞 — LangChain系列之十六 - Agent系列:从现象看机制(下篇)一款“无需传递中间步骤“的Agent

前言 AI菜鸟向前飞 — LangChain系列之十四 - Agent系列&#xff1a;从现象看机制&#xff08;上篇&#xff09; AI菜鸟向前飞 — LangChain系列之十五 - Agent系列&#xff1a;从现象看机制&#xff08;中篇&#xff09;一个Agent的“旅行” 回顾前两篇文章&#xff0c;大家会…

QT 信号和槽教程,窗体和控件对象之间的沟通一般都使用信号和槽

Qt的信号和槽&#xff08;Signals and Slots&#xff09;机制是一种强大的对象间通信方式&#xff0c;它允许对象在完全解耦的情况下相互通信。以下是关于Qt信号和槽的简明教程&#xff1a; 基本概念 信号&#xff08;Signal&#xff09;&#xff1a;信号是由Qt对象发出的通知…

Python leetcode239滑动窗口最大值,单调队列解题思路,单调栈的代码模板,单调队列代码实战

1 题目 239. 滑动窗口最大值 给你一个整数数组 nums&#xff0c;有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。 返回 滑动窗口中的最大值 。 示例 1&#xff1a; 输入&#xff1a;nums [1…

硕士课程可穿戴作业归档之三

代码运行 挑战赛要求 根据比赛要求&#xff0c; As in recent challenges, the data have been divided into three sets:- **Learning (training) set A**: includes noninvasive fetal ECG signals, as well as the reference annotations for them (for participants use…

2022.9.26DAY678

课程学习&#xff1a;《数据处理技术》讲了“数据查询”的语法格式&#xff0c;语法格式也算是简单&#xff0c;就是没能跟之前的内容联系起来&#xff0c;之前的内容没有及时回顾。 高等数学&#xff1a;“ 函数的概念”&#xff0c;讲了函数的概念&#xff0c;反函数&#…