检索增强生成(RAG)技术

news2025/1/11 4:10:43

随着大型语言模型(LLMs)在自然语言处理(NLP)领域的显著进步,它们在多个评估基准测试中显示出超越人类水平的语言和知识掌握能力。然而,这些模型在实际应用中也面临着一系列挑战,如制造事实、知识更新缓慢和答案缺乏透明度等问题。为了解决这些问题,研究者提出了检索增强生成(Retrieval-Augmented Generation,RAG)技术,它通过从外部知识库检索相关信息来辅助大型语言模型回答问题,已经被证明能显著提高回答的准确性。

RAG的核心优势

RAG技术的核心优势在于其能够提高答案的准确性、增加用户信任、便于知识更新和引入特定领域知识。它结合了LLMs的参数化知识和外部知识库的非参数化知识,有效地解决了知识更新的问题,并通过引用来源提高了答案的透明度。

  1. 提高答案准确性: RAG通过从外部知识库中检索相关信息,并将其与语言模型的生成能力结合,可以显著提升生成答案的准确性。这种准确性的提升尤其体现在知识密集型任务中,如专业领域的问答系统。

  2. 增加用户信任: 由于RAG能够引用外部知识库中的信息来支持其回答,用户可以追溯答案的来源,从而增加了对模型输出的信任度。这种可验证性是提高用户满意度和接受度的关键因素。

  3. 便于知识更新和引入特定领域知识: RAG结合了LLMs的参数化知识(即模型内部的知识)和外部知识库的非参数化知识(即存储在数据库中的信息)。这种结构允许模型轻松地通过更新知识库来获取最新信息,而不需要对模型本身进行重新训练。

  4. 减少模型幻觉: 大型语言模型有时会产生“幻觉”(即生成与现实不符的信息)。RAG通过检索真实可靠的信息来辅助生成过程,有效减少了这种幻觉现象。

  5. 透明度: RAG技术通过明确展示其检索到的信息来源,提高了模型的透明度。这种透明度不仅有助于用户理解模型的决策过程,也有助于研究人员分析和改进模型。

  6. 定制化能力: RAG允许根据不同领域的特定需求定制知识库,使得模型能够针对特定领域提供更加精准和深入的答案。

  7. 安全性和隐私管理: 通过在知识库中内置角色和安全控制,RAG可以更好地管理数据使用,保护用户隐私和数据安全。

  8. 可扩展性: RAG技术能够有效处理大规模数据集,而无需对模型的所有参数进行更新或重新创建训练集,这使得其在资源利用上更为高效。

  9. 结果的可信度: 与仅依赖模型内部知识的生成方法相比,RAG能够从最新的数据中选择确定性结果,提高了生成内容的可信度。

  10. 适应性和灵活性: RAG的模块化设计允许研究者和开发者根据具体任务和需求,灵活地添加、替换或调整RAG过程中的模块,从而提高模型的适应性和灵活性。

RAG的三种范式

论文概述了RAG在大型语言模型时代的发展范式,总结了三种RAG范式:原始RAG(Naive RAG)、高级RAG(Advanced RAG)和模块化RAG(Modular RAG)。

  1. 原始RAG:涉及基本的检索-阅读过程,将检索到的文档直接用于生成答案。
  2. 高级RAG:在原始RAG的基础上,进行了检索过程优化、预检索优化、后处理方法等改进,以提高检索生成的质量。
  3. 模块化RAG:提供了更大的多样性和整个过程的灵活性,整合了各种方法来扩展功能模块,允许采用序列化管道或跨多个模块的端到端训练方法。
RAG的三个主要组成部分

检索增强生成(Retrieval-Augmented Generation,RAG)技术由三个主要组成部分构成:检索器(Retriever)、生成器(Generator)和增强方法(Augmentation)。下面详细说明每个部分的作用和关键技术:

  1. 检索器(Retriever) 检索器是RAG框架中的“R”,负责从庞大的知识库中检索出与用户查询最相关的文档。这个过程通常涉及以下几个关键技术:

    • 块优化:选择合适的文档块大小以获得最佳的语义表示。
    • 微调嵌入模型:对嵌入模型进行微调,以更好地适应特定领域的数据集和下游任务。
    • 查询重写:通过生成伪文档或使用大型语言模型重写查询,以提高检索的相关性。
    • 嵌入变换:使用适配器或变换技术优化查询嵌入,使其更匹配文档的语义空间。
  2. 生成器(Generator) 生成器是RAG框架中的“G”,它使用检索到的信息作为输入,生成流畅且信息丰富的文本响应。生成器的关键技术包括:

    • 后检索处理:对检索到的文档进行压缩和重排,以提高信息的利用效率。
    • 优化生成器:通过一般优化过程、对比学习和利用不同优化目标,调整生成器以更好地适应输入数据。
    • 信息压缩:减少检索文档中的噪声和冗余,应对上下文长度限制。
    • 重排:优化检索到的文档集,将最相关的信息放在前面,提高生成文本的相关性。
  3. 增强方法(Augmentation) 增强方法在RAG中用于提升模型在预训练、微调和推理阶段的性能。这些方法包括:

    • 数据源增强:使用非结构化数据、结构化数据和LLM生成内容作为检索源,增强RAG的效果。
    • 过程增强:通过迭代检索和自适应检索优化检索过程,使模型能够根据任务需求动态调整检索策略。
    • 模块化RAG:引入新模块和新模式,如搜索模块、记忆模块、额外生成模块、任务适应模块、对齐模块和验证模块,以提供更大的灵活性和适应性。

每个组成部分都包含了一系列的技术,这些技术可以单独使用或组合使用,以解决特定的挑战并提升RAG系统的整体性能。RAG的这三个组成部分相互协作,共同提高了模型在处理复杂查询和生成信息丰富响应方面的能力。


参考链接:同济大学发布最新检索增强(RAG)的LLM生成技术综述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1619000.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java实现解析html获取图片或视频url

一、前言 有时在实际项目中,比如发布某篇文章,需要取文章中的某张图片作为封面,那么此时需要文章内容,获取html内容中的图片地址作为封面,下面讲下如何获取html中的图片或视频地址。 二、实现 1.先定义一个工具类&…

深度解析:云计算的三宝——IaaS、PaaS和SaaS

4月22日,腾讯宣布旗下协作SaaS产品全面接入腾讯混元大模型,除去企业微信、腾讯会议、腾讯文档等“一门三杰”产品,腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品也都已实现智能化升级。大模型应用落地再加速。 那么什么是…

【1646】医院人员管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 java 医院人员管理系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发,数据库为Mysql5.0&…

面试八股——RabbitMQ

消息丢失问题 消息确认机制 生产者与MQ之间的消息确认: 当MQ成功接收消息后,会返回给生产者一个确认消息。如果在规定时间内生产者未收到确认消息,则任务消息发送失败。 MQ与消费者之间的消息确认: 当MQ成功接收消息后&#…

OpenTelemetry-2.Go接入Jaeger(grpc,gin-http)

目录 1.什么是OpenTelemetry 2.搭建jaeger 3.链路追踪 本地调用 远程调用 GRPC proto server端 client端 Gin-HTTP 调用流程 api1 api2 grpc 4.完整代码 1.什么是OpenTelemetry 参考:OpenTelemetry-1.介绍-CSDN博客 2.搭建jaeger 参考:…

【C语言__指针02__复习篇12】

目录 前言 一、数组名的理解 二、使用指针访问数组 三、一维数组传参的本质 四、冒泡排序 五、二级指针 六、指针数组 七、指针数组模拟二维数组 前言 本篇主要讨论以下问题: 1. 数组名通常表示什么,有哪两种例外情况,在例外情况中…

OceanBase诊断调优 】—— 如何快速定位SQL问题

作者简介: 花名:洪波,OceanBase 数据库解决方案架构师,目前负责 OceanBase 数据库在各大型互联网公司及企事业单位的落地与技术指导,曾就职于互联网大厂和金融科技公司,主导过多项数据库升级、迁移、国产化…

人工智能时代的关键技术:深入探索向量数据库及其在AI中的应用

文章目录 1. 理解向量数据库:二维模型示例2. 向量数据库中的数据存储与检索3. 向量数据库如何工作?4. 向量数据库如何知道哪些向量相似? 在人工智能技术日益成熟的当下,向量数据库作为处理和检索高维数据的关键工具,对…

系统安全与应用(1)

目录 1、账号安全管理 (1)禁止程序用户登录 (2)锁定禁用长期不使用的用户 (3)删除无用的账号 (4)禁止账号和密码的修改 2、密码安全管理 设置密码有效期 1)针对已…

【kettle002】kettle访问人大金仓KingbaseES数据库并处理数据至execl文件

一直以来想写下基于kettle的系列文章,作为较火的数据ETL工具,也是日常项目开发中常用的一款工具,最近刚好挤时间梳理、总结下这块儿的知识体系。 熟悉、梳理、总结下人大金仓KingbaseES数据库相关知识体系 kettle访问人大金仓KingbaseES数据库…

Dropout Feature Ranking for Deep Learning Models

摘要 深度神经网络( deep neural networks,DNNs )在多个领域取得了最新的研究成果。不幸的是,DNNs因其不可解释性而臭名昭著,从而限制了其在生物和医疗保健等假说驱动领域的适用性。此外,在资源受限的环境下,设计依赖…

公链系统开发全指南: 从规划到实施

在区块链技术的迅速发展和应用推广下,公链系统的开发成为了当前数字资产领域的热门话题。从规划到实施,公链系统的开发过程需要经历多个步骤,下文将详细介绍每个步骤。 第一步: 规划和设计 市场调研: 分析市场需求和竞争情况,确定…

jvm知识点总结(一)

JVM的跨平台 java程序一次编写到处运行。java文件编译生成字节码,jvm将字节码翻译成不同平台的机器码。 JVM的语言无关性 JVM只是识别字节码,和语言是解耦的,很多语言只要编译成字节码,符合规范,就能在JVM里运行&am…

【目标检测】YOLOv7 网络结构(与 YOLOv4,YOLOv5 对比)

YOLOv7 和 YOLOv4 Neck 与 Head 结构对比 其实 YOLOv7 的网络结构网上很多文章已经讲得很清除了,网络结构图也有非常多的版本可供选择,因为 YOLOv7 和 YOLOv4 是一个团队的作品,所以在网络结构方面, YOLOv7 和 YOLOv4 有很多相似…

windows与linux搭建svn环境并自动更新代码

SVN搭建以及自动更新代码 目录 一、windows安装svn并且转成中文 第1步:先下载安装包如下下面是语言包与安装包 第2步:双击安装包一直点击下一步即可 第3步:双击安装中文语言包 第二步:勾选设置语言包 二、linux安装svn 第1步…

代码随想录算法训练营DAY32|C++贪心算法Part.2|122.买卖股票的最佳时机II、55.跳跃游戏、45.跳跃游戏II

文章目录 122.买卖股票的最佳时机II思路CPP代码 55.跳跃游戏思路CPP代码 45.跳跃游戏II思路方法一代码改善 CPP代码 122.买卖股票的最佳时机II 力扣题目链接 文章讲解:122.买卖股票的最佳时机II 视频讲解: 状态:本题可以用动态规划&#xff0…

模块三:二分——69.x的平方根

文章目录 题目描述算法原理解法一:暴力查找解法二:二分查找 代码实现暴力查找CJava 题目描述 题目链接:69.x的平方根 算法原理 解法一:暴力查找 依次枚举 [0, x] 之间的所有数 i (这⾥没有必要研究是否枚举到 x /…

消消乐算法总结

前言 最近在工作中遇到一个问题,做一个消消乐的demo项目,连续相同数目超过四个后就要消除。我在网上看了很多解决方案,有十字形,横向,纵向,梯形搜索。越看越迷糊。这不是用一个BFS就能解决的问题吗&#x…

用于割草机器人,商用服务型机器人的陀螺仪

介绍一款EPSON推出适用于割草机器人,商用服务型机器人的高精度陀螺仪模组GGPM61,具体型号为GGPM61-C01。模组GGPM61是一款基于QMEMS传感器的低成本航向角输出的传感器模组,它可以输出加速度、角速度及姿态角等信息,为控制机器人运…

界面组件DevExpress Blazor UI v23.2 - 支持.NET 8、全新的项目模版

DevExpress Blazor UI组件使用了C#为Blazor Server和Blazor WebAssembly创建高影响力的用户体验,这个UI自建库提供了一套全面的原生Blazor UI组件(包括Pivot Grid、调度程序、图表、数据编辑器和报表等)。 DevExpress Blazor控件目前已经升级…