今日分享丨浅谈RAG的技术特点及优势

news2024/11/25 20:42:11

一、引言

随着AI技术的发展,我们见证了人工智能在理解和处理自然语言方面取得的巨大进步。特别是结合了检索增强生成(Retrieval-Augmented Generation, RAG)和大语言模型(Large Language Model, LLM)的系统,为解决复杂查询和提供精确答案提供了强大的工具。RAG通过检索相关信息,增强了大模型的对问题的理解能力,利用RAG的优势,提供了广泛的知识覆盖和深入的分析能力。这种结合不仅提升了回答的准确性,也极大地丰富了交互的深度和广度。

在这一背景下,我们探索了RAG的技术特点,旨在创建一个能够理解复杂问题、检索相关信息,并以自然、准确的方式生成回答的智能系统。通过这种结合,我们希望能够更好地服务于用户,无论是在信息检索、问题解答还是数据分析等方面,都能提供更加智能化和个性化的服务体验。

二、RAG的优势,为什么用RAG?

LLM底层的设计机制决定了它所生成的回答本质是基于概率的而非既定事实的,生成内容基于训练数据并按照一定概率生成,因此生成内容会有偏差而其又不具备自我校验的能力,所以有时候会出现答非所问的情况。所以可以通过RAG检索到与问题相关的内容让大模型理解和学习,进而提高大模型的回答精度。

当使用像ChatGPT-3.5这种大模型时,它通常会指出其知识截止日期为2021年。这意味着模型可能无法访问或理解在此日期之后发生的事件或发展的信息。这种局限性可能会减少模型在某些应用场景中的有效性,因为现实世界是不断变化的,而最新的信息对于许多任务来说至关重要,所以通过RAG外挂最新的知识,既可以让大模型学习到最新的知识,又可以节约训练资源和成本。

企业通常不会将敏感的私有数据上传至公共网络中的大模型,如果这样做虽然可以利用大模型解决某些问题,但同时也存在数据泄露的风险。因此,企业需要寻找既能保护数据安全,又能利用大模型优势的解决方案。运用RAG外挂企业私有知识数据,可以让大模型根据企业知识回答问题,而不会有泄露私有数据的风险。

三、RAG的介绍

3.1 RAG整体流程

RAG是一种先进的文本生成技术,它通过结合检索(Retrieval)和生成(Generation)两个阶段,使得大型语言模型在输出答案时能够参考额外的数据资源。这种技术可以显著提升生成答案的相关性和精确度。RAG的整体流程图如下:

3.2 RAG文档预处理

RAG知识库的构建大部分情况需要将文档做一些预处理操作,其中包括文档的读取切分、向量化操作、向量数据库导入数据等。文档切分、向量化和存入向量数据库是RAG中的几个关键步骤:

文档切分:将文档分割成更小的单元,如句子或段落,以便于检索和处理。

向量化:将切分后的文档单元转换为数值向量,这通常通过使用诸如BERT、TF-IDF或其他词嵌入技术来实现。

存入向量数据库:将向量化后的文档单元存储在向量数据库中,以便于快速检索。向量数据库如Milvus、Faiss等,专门设计用来高效地存储和检索高维向量数据。

流程图如下所示:

3.3 RAG检索模块

在RAG流程中,采用多种相似度算法(例如欧式距离、余弦相似度等),我们先将用户问题转换为向量形式,并在向量数据库中寻找与该问题向量相似度最高的若干个内容片段。这种方式为RAG检索模块的主要检索方式,流程如下图所示:

添加图片注释,不超过 140 字(可选)

RAG其实也可以运用传统的关键词检索方式,例如ES、whoosh等,这样就可以不进行向量化操作,直接从文本知识库中搜索匹配到最相关的文档内容。

四、总结

RAG通过检索系统从大规模数据集中找到与输入查询相关的文档,然后将这些文档作为上下文信息,输入到大模型中,生成更加丰富和准确的回复。大模型利用RAG技术,可以更有效地理解和回答用户的问题。它不仅能够从大量数据中检索到相关信息,还能结合这些信息生成更加自然和准确的回答。这种技术的应用,极大地提高了问答系统的智能性和准确性,为用户提供了更好的交互体验。

写在最后,欢迎大家下载我们的inBuilder开源社区版,可免费下载使用,加入我们,开启开发之旅!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1846710.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华企网安技术博弈:白帽子团队如何破解网赌网站

在数字化时代,網賭作为一种新型犯罪形式,其隐蔽性和跨国性给执法机关带来了前所未有的挑战。一批专业的网络安全团队——白帽子,正利用他们的专业技能与犯罪分子进行技术博弈,有效地破解網賭网站,为打击網賭犯罪贡献力…

银河麒麟V10安装docker和docker-compose

1. 说明 系统镜像使用的是Kylin-Server-V10-SP3-2403-Release-20240426-x86_64.iso如果是在VMware中安装这个系统,需选择Ubuntu,如果选Centos会有问题。 尝试使用在线方式安装docker,报了很多错误,比较麻烦,建议使用离…

Bilibili开源发布轻量级 Index 系列语言模型:2.8T 训练数据,支持角色扮演

Bilibili首次发布 Index 系列模型中的轻量版本:Index-1.9B 系列 本次开源的 Index-1.9B系列包含以下模型: Index-1.9Bbase:基座模型,具有 19 亿 非词嵌入参数量,在 2.8T 中英文为主的语料上预训练,多个评测基准上与…

Marin说PCB之电源完整性PDN--Murata三端子电容--01

不知道诸位老铁们有没有忘记我们常用的电容的一些特性,例如在其谐振频率左边,电容主要呈容性,在谐振频率右边,电容主要呈感性。我随便找了一个电容:GRT188C80J226ME13,其频率特性图如下所示: 我…

Qt creator day5练习

Qt 中实现TCP 聊天服务器 大致流程 创建套接字服务器QTcpServer对象 通过QTcpServer对象设置监听,即QTcpServer::listen() 基于QTcpServer::newConnection()信号检测…

大模型面试题目精选分享

前言 掌握大模型面试关键,我精选了一系列面试题目。从模型理解到应用实践,全方位考察大模型知识。无论你是初学者还是资深专家,这里都有适合你的题目。快来挑战自己,提升面试技能吧! 面试题笔记分享 为了助力朋友们…

日常工作中常用的管理工具

日常工作中常用的管理工具 SWOT分析法: 帮你清晰地把我全局,分析自己在资源方面的优势域劣势,把握环境提供的机会,防范可能存在的风险与威胁,对我们的成功有非常重要的意义 PDCA循环规则: 每一项工作&#…

RPM 打包入门(基于openEuler)

主要参考内容(均为官方文档): https://rpm-packaging-guide.github.io/#building-rpms https://docs.redhat.com/zh_hans/documentation/red_hat_enterprise_linux/8/html/packaging_and_distributing_software/introduction-to-rpm_packagin…

用Python设置Excel工作表网格线的隐藏与显示

Excel表格界面的直观性很大程度上得益于表格中的网格线设计,这些线条帮助用户精确对齐数据,清晰划分单元格。网格线是Excel界面中默认显示的辅助线,用于辅助定位,与单元格边框不痛,不影响打印输出。然而,在…

Spring的启动扩展点机制详解

在Java的世界中,我们知道Spring是当下最主流的开发框架,没有之一。而在使用Dubbo、Mybatis等开源框架时,我们发现可以采用和Spring完全一样的使用方式来使用它们。 可能你在平时的使用过程中并没有意识到这一点,但仔细想一想&…

34 张动图:线缆,以太网与网络寻址

以太网 本地主机访服务器 以太网标准 非屏蔽双绞线(UTP) 电磁干扰 串扰 双绞线 真实的双绞线 线缆与引脚对齐方式 科普:网线每根芯的作用 引脚连接 数据传输与接收 主机直连到交换机 主机直连到主机(或交换器) Auto M…

C++ 矩阵的最小路径和解法

描述 给定一个 n * m 的矩阵 a,从左上角开始每次只能向右或者向下走,最后到达右下角的位置,路径上所有的数字累加起来就是路径和,输出所有的路径中最小的路径和。 数据范围: 1≤𝑛,𝑚≤5001≤n,m≤500&…

# 消息中间件 RocketMQ 高级功能和源码分析(九)

消息中间件 RocketMQ 高级功能和源码分析(九) 一、消息中间件 RocketMQ 源码分析: 同步刷盘分析 1、刷盘机制 RocketMQ 的存储是基于 JDK NIO 的内存映射机制(MappedByteBuffer)的,消息存储首先将消息追…

好用的便签是什么 电脑桌面上好用的便签

作为一名文字工作者,我经常需要在繁杂的思绪中捕捉灵感,记录下那些一闪而过的想法。在寻找一款适合电脑桌面的便签应用时,我偶然发现了敬业签便签软件简直是为我量身定制的,它不仅界面简洁,操作便捷,更重要…

前瞻展望,中国信通院即将发布“2024云计算十大关键词”

人类对于未知领域的探索欲望,似乎总是无穷无尽,而探索欲反过来推动了技术的革新与进步。今年以来,AI大模型成为科技领域最为确定的趋势之一。在大模型开启的AI原生时代,AI原生正在重构云计算的演化逻辑和发展走向,MaaS…

含铬废水有哪些危害?含铬废水怎么处理呢?

铬化物可以通过消化道、呼吸道、皮肤和粘膜侵人人体,主要积聚在肝、肾、内分泌系统和肺部。毒理作用是影响体内物质氧化、还原和水解过程,与核酸、核蛋白结合影响组织中的磷含量。铬化合物具有致癌作用。 铬化合物以蒸汽和粉尘的方式进入人体组织中&…

gstreamer+qt5实现简易视频播放器

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、安装环境1.QT52.gstreamer 二、代码1.Windows实现 三、测试效果总结 前言 最近在研究mpp,通过gstreamer实现了硬解码,但是我在想我…

ip地址怎么写才是的对的?合法ip地址正确的格式

IP地址怎么写才是的对的?在互联网的世界里,IP地址就像是我们生活中的门牌号码,它是每个设备在网络中的唯一标识。正确的书写IP地址对于确保网络通信的顺畅至关重要。本文将带您了解合法IP地址的正确格式与书写规范,并深入探讨其在…

【MySQL】索引的原理及其使用

文章目录 什么叫索引减少磁盘IO次数缓存池(Buffer Pool)MySQL的页页内目录页目录 正确理解索引结构为什么Innodb的索引是B树结构各种存储引擎支持的索引聚簇索引和非聚簇索引索引类型 关于索引的操作创建主键索引唯一索引的创建普通索引的创建查看索引删除索引 什么…

6月21日(周五)AH股总结:沪指失守3000点,恒生科技指数跌近2%,多只沪深300ETF午后量能显著放大

内容提要 沪指全天围绕3000点关口来回拉锯,收盘跌破3000点。白酒及光刻机概念集体走低,中芯国际港股跌超2%。CRO医药概念及水利股逆势走强。 A股低开低走 沪指全天围绕3000点关口来回拉锯,收盘跌破3000点,跌0.24%。深成指跌0.04…