复杂 RAG 系统的检索规划

news2024/9/21 9:49:24

文章介绍了REAPER(Reasoning based Retrieval Planning for Complex RAG Systems),这是一种基于大型语言模型(LLM)的规划器,用于在复杂的对话系统中生成检索计划。REAPER旨在解决在大规模异构数据存储中进行有效证据检索的问题,尤其是在需要多步骤检索的情况下。传统的RAG(Retrieval Augmented Generation)系统通常采用链式思考(Chain-of-Thought, CoT)的方式,将推理和检索步骤交织在一起处理复杂的查询任务,但这种方式会增加系统的响应时间。REAPER能够显著降低这种延迟,并且比基于分类的方法更容易扩展到新的使用场景。

该研究展示了REAPER在零售对话助理中的应用效果,这类助手需要从多个来源如产品评论、信息页面等检索信息来回答客户的问题。这些对话系统通常被训练以理解产品目录和开放数据源,以便于帮助用户发现产品。对于复杂的对话系统来说,它们需要从可能包含PB级别的异构文档的多个索引中检索证据。REAPER通过决定查询哪些索引以及何时让LLM直接利用其预训练知识来回答问题,从而优化了检索过程。此外,REAPER还考虑到了多步骤检索的情况,例如当用户询问关于他们特定订单的问题时,系统首先需要找到相关的订单信息,然后再获取与该订单相关的产品信息。
在这里插入图片描述

RAG框架是一种用于复杂对话系统的架构,它通过从大型异构数据存储中检索相关证据来辅助生成事实性的回答。这些数据存储通常被组织成多个索引或API,而不是单一的数据源。在给定查询的情况下,需要从一个或少量可能的检索来源中获取相关的证据。

l多跳问答和生成

多跳问答涉及在生成最终答案之前执行一系列推理和检索步骤。例如,在零售对话系统中,当客户询问关于他们过去订单的问题时,系统首先需要检索正确的订单记录,然后根据该订单上下文检索与问题相关的证据。这种链式思考(Chain-of-Thought, CoT)任务需要在推理和检索之间交织操作。

l密集检索方法

密集检索方法是一种用于开放域问答的技术,其中使用编码器模型将文档嵌入到稠密向量空间中。查询也被转换为稠密向量,然后使用近似最近邻搜索算法来找到最相关的文档。这种方法比传统的稀疏检索技术(如TF-IDF或BM25)在性能上有所提高。

l对话系统中的知识增强

对话系统中的知识增强是指利用外部知识源来改进系统的响应质量。这可以通过检索相关证据并将其整合到语言模型的生成过程中来实现。例如,一个购物助手可以被训练以使用产品目录和开放数据源,以便在回答用户查询时提供更准确的信息,帮助用户发现合适的产品。

1 PEAPER的设计

REAPER是一个旨在提升复杂查询处理效率的系统,特别是对于需要从多种异构数据源检索证据的对话系统。它通过一个小规模语言模型快速生成完整的检索计划,包括所需工具的选择、调用顺序及参数设置,从而减少了处理延迟。REAPER在工具序列选择上的准确率达到95%,在参数生成上的准确率为92%,并且易于扩展至新的数据源和应用场景。作为一个独立的规划器,REAPER专注于优化检索流程,进而帮助最终的回答生成模型提供更高质量的响应。

2 系统架构

(1)输入:

用户查询以及相关的上下文信息作为REAPER的输入。

上下文信息可以包括产品信息、对话历史、提问的时间、用户信息等。

(2)工具理解和调用:

REAPER需要理解所有可用的工具,这些工具用于生成证据。

REAPER生成的计划包括工具的选择、调用顺序和传递给每个工具的参数。

(3)检索计划生成:

REAPER通过Chain-of-Thought (CoT) 推理生成检索计划。

单步或多步检索计划可以由REAPER生成,取决于查询的复杂性。

(4)证据检索:

基于REAPER生成的计划,相应的工具被调用来从不同的数据源中检索证据。

(5)响应生成:

一个较大的语言模型使用从REAPER生成的计划中获取的证据来生成适当的响应。

对于数据处理部分,大量异构数据存储通常被构建成多个索引或API,而不是单一的大型数据源。REAPER能够处理这种复杂的数据结构,有效地从一个或几个可能的检索源中检索相关证据。

3 结语

文章介绍了一种名为REAPER的推理基础检索规划方法,用于高效生成复杂查询所需的检索计划,以支持基于RAG的对话系统,通过减少延迟并保持响应质量。

论文题目: REAPER: Reasoning based Retrieval Planning for Complex RAG Systems

论文链接: https://arxiv.org/abs/2407.18553

PS: 欢迎大家扫码关注公众号_,我们一起在AI的世界中探索前行,期待共同进步!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2085327.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

linux中下载nginx

Nginx是一款高性能的开源Web服务器软件。它可以作为一个HTTP服务器进行网站的发布,也可以作为反向代理服务器进行负载均衡。Nginx以其出色的性能、稳定性和低资源消耗而受到广泛的使用。它的特点包括支持并发连接数高、内存消耗低、事件驱动等,适用于大部…

滚雪球学MyBatis-Plus(01):学前导读

🌀写在前面 我是bug菌,CSDN | 掘金 | InfoQ | 51CTO | 华为云 | 阿里云 | 腾讯云 等社区博客专家,C站博客之星Top30,华为云2023年度十佳博主,掘金多年度人气作者Top40,掘金等各大社区平台签约作者&#xff…

Python进阶05-多线程

零、文章目录 Python进阶05-多线程 1、进程 (1)单任务 单任务:指在同一时间内只执行单个任务。 import time# 定义一个函数,用于实现听音乐 def music():for i in range(3):print(正在听音乐...)time.sleep(0.2)# 定义一个函…

振弦式基岩位移计主要功能探析

在土木工程和地质监测领域,基岩位移计作为一种重要的监测设备,发挥着不可替代的作用。其主要功能在于长期、精准地测量水工结构物、桥梁、建筑、铁路等混凝土结构物与地基之间的开合度(位移),并同步监测埋设点的温度变化。本文将深入探讨基岩…

【漏洞复现】某联云采 SRM2.0 download 任意文件读取漏洞

声明:本文档或演示材料仅用于教育和教学目的。如果任何个人或组织利用本文档中的信息进行非法活动,将与本文档的作者或发布者无关。 一、漏洞描述 某联云采 SRM2.0 是一款专门为企业供应链管理设计的采购管理系统。它具备采购流程自动化、供应商管理优化…

LLM大模型入门天花板!《大模型入门:技术原理与实战应用》一本书让你轻松入门大模型(附PDF)

随着大模型技术的不断完善和普及,我们将进入一个由数据驱动、智能辅助的全新工作模式和生活模式。个人和企业将能够利用大模型来降本增效,并创造全新的用户体验。 人工智能是人类探索未来的重要领域之一,以GPT为代表的大模型应用一经推出在短…

【网络安全】服务基础第一阶段——第二节:Windows系统管理基础----虚拟化IP地址以及用户与组管理

目录 一、Windows网络测试工具 1.1.ping命令 1.2.tracert命令 二、IP实验内容 2.1 实验一 2.2 实验二 三、用户与组管理 3.1 用户与账户概述 3.2 用户管理 3.3 用户增删改查 3.4 增加用户 3.5 修改用户属性 3.6 删除用户 3.7 组账户概述 3.8 组账户增删改查 四、…

linux网络编程-原理到应用-附源码(全)

目录 一、计算机网络分层模型 1.1 概念 1.2 OSI 七层模型 1.3 五层模型 1.4 TCP/IP四层模型 二、传输层-TCP协议 2.1 什么是TCP协议? 2.2 TCP的连接的建立和释放 2.3 基于TCP协议-只接受一个连接的范例程序 一、计算机网络分层模型 1.1 概念 计算机网络…

装过mr又卸载了,max报错 mrmateralattribs missing dlls

rendering>scene converter 打开对话框后,current preset 中选择 remove invalid legacy elements,取消open scene converter。。勾选 automaticaly remove missing。再点 convet scene

HTML静态网页成品作业(HTML+CSS)——个人介绍网页(1个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有1个页面。 二、作品演示 三、代…

java-Spring框架02

1.AOP 1.概述 AOP (Aspect Oriented Programming):面向切面编程,通过预编译方式和运行期间动态代理实现程序功能的统一维护的一种技术。(是对面向对象编程的补充延续,) 面向切面编程思想&#…

Linux之ip命令详解

华子目录 1.ip命令是什么1.1ip命令的由来1.2ip命令的安装包1.2ip选项(基本不用) 2.查看网络信息2.1显示全部网络接口信息2.2显示单个网络接口信息2.3显示单个接口状态2.4查看路由表2.5查看arp缓存 3.设置网卡ip地址3.1启用或停用网卡3.2设置默认网关3.3新…

【数据集】遥感影像建筑物提取论文常用数据集

几个常用于遥感影像建筑物对比试验的数据集 WHU building dataset 下载链接: https://study.rsgis.whu.edu.cn/pages/download/building_dataset.html WHU数据集中包含多个子数据集: Aerial imagery dataset 航空影像建筑物数据集 数量:8…

SD3337C 恒流Boost DC/DC转换器的白色LED驱动器芯片IC

一般描述 SD3337C是一款升压型DC/DC转换器,具有恒定电流,可驱动白色LED或类似器件。该 器件可以从锂离子电池驱动多达八个串联的LED。LED电流由外部电阻器(RsET)设置,并由反馈(FB)电压(典型值:200mV)直接调节,该电压跨接在…

IntelliJ IDEA使用内网穿透工具配置的公网地址远程连接本地MySQL

文章目录 前言1. 本地连接测试2. Windows安装Cpolar3. 配置Mysql公网地址4. IDEA远程连接Mysql5. 固定连接公网地址6. 固定地址连接测试 前言 本教程主要介绍如何使用Cpolar内网穿透工具实现在IDEA中也可以远程访问家里或者公司的数据库,提高开发效率!无…

Stable Diffusion 使用详解(9)--- 字体及背景融入

目录 背景 方法一 利用controlNet lineart invert depth 提示词 效果 方法二 准备蒙版 绘制大型场景艺术字 controlnet Lora 模型 效果 PS 融入 背景 如果看过上一期你应该知道如何利用layer diffusion 制作场景动漫海报,其实掌握这个方法后&#xf…

Java 入门指南:初识 Java NIO

NIO 的引入 在传统的 Java I/O 模型(BIO)中,I/O 操作是以阻塞的方式进行的。当一个线程执行一个 I/O 操作时,它会被阻塞直到操作完成。这种阻塞模型在处理多个并发连接时可能会导致性能瓶颈,因为需要为每个连接创建一…

【Three.js基础学习】20.Environment map

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 课程回顾: 模型的加载 GLTFLoader 环境贴图实现; CubeTextureLoader LDR:低动态范围 backgroundBlurriness:设置背景模糊 (不生效 为…

CSND文章质量分批量查询

简介 CSDN 质量分是一项公开的 CSDN 博文内容质量分析服务,其综合分析了内容的标题、段落结构、正文长度、代码格式及复杂度、链接和超文本内容比例及质量等因素,为 IT 技术文章提供客观公共的质量分析结果 用途 可用与对文章质量做评估可申请创作者 …

更新RK3588开发板的rknn_server和librknnrt.so【这篇文章是RKNPU2从入门到实践 --- 【5】的配套文章】

作者使用的平台有: 一台装有Windows系统的宿主机,在该宿主机上装有Ubuntu 20.04虚拟系统; 瑞芯微RK3588开发板,开发板上的系统为Ubuntu22.04系统; 更新板子的 rknn_server 和 librknnrt.so,rknn_server 和…