什么是检索增强生成(Retrieval Augmented Generation)?RAG 架构如何实现?

news2025/1/19 23:17:33

检索增强生成(Retrieval Augmented Generation)时代

在不断发展的生成人工智能世界中,检索增强生成 (RAG) 标志着一项重大进步,它将检索模型的准确性与生成模型的创造性相结合,达到了准确&创新的更高层级。

这种创新架构可以同时达到:精确信息检索,上下文理解,以及响应式回应,三重效果。 RAG 利用广泛的数据库和大型语言模型 (LLM) 的动态功能来生成富有洞察力和准确性的结果。

RAG 架构由两个主要组件组成:数据准备(蓝色)和 RAG 系统本身(绿色)。数据准备涉及连接到原始数据源、使用上下文信息标注数据、将文档分块为更小的单元,以及将这些模块转换为向量嵌入。分块可以提高一致性,而嵌入可以为 RAG 生成器提供更好的语义匹配和相关知识检索。

RAG 系统接受用户提示,在嵌入中搜索相关段落,并将其发送到 LLM(大型语言模型)以生成响应。人类的参与在数据准备和 RAG 系统中都至关重要,在数据准备中,领域专业知识和上下文被添加到原始数据中,而在 RAG 系统中,人类增强了矢量检索的相关性并提供提示/响应质量保证。

RAG 的亮点:最佳用例

RAG 架构的多功能性极强,可满足从对话式 AI 和内容创建到搜索引擎中复杂查询解析的一系列应用。其独特的能力将生成响应基于实际的检索数据,使其特别适合:

  • 客服系统:为客户询问提供准确、上下文相关的答案。
  • 教育平台:基于广泛的知识库提供详细的解释或答案。
  • 研究和分析工具:将复杂的信息提炼成全面的摘要。
  • 内容生成:在各个领域制作丰富、信息丰富且相关的内容。

如何创建高质量的RAG模型

RAG 的功效取决于其架构中的细致决策:

  • 数据准备:选择数据并将其分成连贯的单元,而不丢失上下文本质。澳鹏在数据注释和分块(图中的步骤 B 和 C)方面的专业知识可确保数据在上下文中保持完整并准确标记。
  • 嵌入技术:选择正确的方法将文本块转换为嵌入,以实现高效检索。
  • 相关性和排名:用于确定检索到的数据与用户提示及其后续排名的相关性的算法。澳鹏的人机交互方法增强了检索数据的相关性和排名(图中的步骤 3)。

质量第一

确保 RAG 输出的最高质量和准确性需要考虑以下几个因素:

  • 全面的数据注释:让人类准确地标记和分类数据。澳鹏的数据注释服务(图中的步骤 B)确保精确且与上下文相关的数据注释。
  • 减少偏差:积极寻找并消除数据集和模型响应中的偏差。
  • 持续评估:根据各种提示定期测试模型,以确保一致性和可靠性。澳鹏的质量保证流程有助于长期保持模型的性能。

RAG评估

让我们深入研究 RAG 不同阶段使用的核心自动评估指标,涵盖检索和生成阶段。

检索指标

  • 上下文召回:该指标衡量检索组件成功返回的相关块的百分比。  
  • 上下文精度:上下文精度评估将检索到的块分类为相关的准确性。

生成指标

生成阶段指标侧重于输出的忠实度和与提示的相关性,确保生成的文本遵循事实的正确性和相关性。

  • 忠实度:测量生成的与检索到的相关块的事实正确性背离的句子/短语的数量。
  • 相关性:该指标评估生成的与用户查询不相关的句子/短语的数量,确保系统的响应保持重点和主题。

自动评估指标:监控 RAG 的精度和相关性

虽然人为参与对于提高 RAG 系统的质量和完整性是不可或缺的,但自动评估指标在持续监控这些架构的性能方面发挥着至关重要的作用。这些指标使 AI 团队能够快速识别需要改进的领域,确保 RAG 在实时应用中保持有效和高效。

人工评估

这些自动评估指标是人工智能开发工具包中的重要工具,可以定量衡量 RAG 系统的性能。然而,当辅以细致入微的人类评估时,它们的功能最佳,可以捕捉自动化系统可能错过的语言和上下文的微妙之处。在整个 RAG 架构中,人为因素至关重要:

  • 数据注释和分块:确保数据块上下文完整且注释精确。澳鹏的数据注释服务(图中的步骤 B 和 C)在这方面表现出色。
  • 模型训练和调整:根据细致入微的理解和反馈来完善模型。澳鹏在模型训练和调优方面的专业知识可确保最佳性能和模型漂移监控。
  • 质量控制:监督模型输出的准确性、有用性和安全性。澳鹏的质量保证流程(图中的提示/响应质量保证 – 步骤 1 和 5)保持最高标准。
  • 确保上下文完整性:解释目前人工智能无法掌握的细微差别和上下文。澳鹏的人机交互方法(提示/响应图中的步骤 1、3 和 5)可确保上下文完整性。
  • 防止错误:持续的人工监督有助于实时识别和纠正错误或不准确之处。

通过集成自动评估指标和人类判断,RAG 系统可以实现高度的准确性、相关性和可靠性,这对于实际应用至关重要。

与澳鹏合作,获得高质量RAG辅助

利用澳鹏在数据标注、模型训练和质量评估方面的丰富经验,组织可以释放 RAG 架构的全部潜力。澳鹏的定制服务涵盖 RAG 旅程的每一步,从数据准备,和模块改进,到优化模型响应。与澳鹏合作,确保您的人工智能计划不仅具有创新性,并且同时保证准确性和相关性。

结论

有效的人工智能系统需要在整个人工智能生命周期中进行人机交互。部署 AI 模型的一种有效方法是通过 RAG 架构。 RAG 系统允许 AI 团队通过更深入的领域专业知识来增强基础模型的语言能力。为 RAG 准备的文档和数据有助于通用基础模型更多地了解其从未接受过训练的领域。 澳鹏将以上述所有方式提供定制服务,在 RAG 流程的每个阶段(从数据准备到模型评估和完善)提供关键的人类专业知识和专家监督。如有需要,请联系我们,我们的专家会为您的RAG计划提供全面支持。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1682201.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

摸鱼大数据——Linux搭建大数据环境(Hadoop高可用环境搭建)六

Hadoop高可用环境搭建 确定提前安装好了hadoop和zookeeper 1.删除原有数据文件 三台机器都要进行删除 可以使用CRT发送交互到所有会话 rm -rf /export/data/hadoop-3.3.0 2.安装软件 三台机器都要进行安装 注意: 如果网络较慢安装失败,那就重复安装即可 # 实现多个服务的通讯 …

数字水印 | 奇异值分解 SVD 的 Python 代码实现

🥑原理:数字水印 | 奇异值分解 SVD 的定义、原理及性质 🥑参考:Python 机器学习笔记:奇异值分解(SVD)算法 正文 对于一个图像矩阵,我们总可以将其分解为以下形式: 通过…

Halcon 根据XYZ生成3D模型

Halcon 根据XYZ生成3D模型 x_points := [a_x_points, b_x_points, c_x_points]y_points := [a_y_points, b_y_points, c_y_points]z_points := [a_z_points, b_z_points, c_z_points]stop()gen_object_model_3d_from_points

某单位Oracle数据库性能优化方案参考

内容分析: 本文是一篇关于XX市XX单位中心数据库优化方案的详细报告。文章首先描述了数据库的现状,包括其运行的软件环境、硬件环境、数据存储情况以及与检测点的连接方式。接着,文章列出了信息系统优化的常用策略,并具体解释了每一…

线性回归模型之套索回归

概述 本案例是基于之前的岭回归的案例的。之前案例的完整代码如下: import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import Ridge, LinearRegression from sklearn.datasets import make_regression from sklearn.model_selectio…

对抗生成网络(GAN),DCGAN原理

目录 1. GAN基础原理 1.1 生成器 1.2 判别器 1.3 整体架构 2. 损失函数 3. DCGAN 3.1 问题 3.2 解决 1. GAN基础原理 GAN(Generative Adversarial Nets)是一种深度神经网络架构。它由生成器和判别器组成,生成器学习真实样本&#x…

微信公众号自定义分销商城小程序源码系统 带完整的安装代码吧以及系统部署搭建教程

系统概述 微信公众号自定义分销商城小程序源码系统是一款功能强大的电商解决方案,它集成了商品管理、订单处理、支付接口、分销管理等多种功能。该系统支持自定义界面设计,商家可根据自身需求调整商城的页面布局和风格,打造独特的品牌形象。…

月薪20K+的策划人简历应该怎么写?

一般咱们大多数策划在写简历前,都是先直接找模板,然后按照模板的框架直接往里面填内容。 最后草草收场,直接拿去海投简历,结果发现没有拿到任何面试邀约。 策划写简历前的第一件事要梳理自己的能力模型和岗位JD。 因为只有先梳…

解决谷歌浏览器无法登陆网站的问题,左下角弹出JavaScript(void:0)

破釜沉舟,全都试一遍: 如果还不行,那就关闭GPU加速:关了瞬间就好了 关闭之后,再打开GPU加速还是行的(咱也不知道为啥呀)

究极完整版!!Centos6.9安装最适配的python和yum,附带教大家如何写Centos6.9的yum.repos.d配置文件。亲测可行!

前言! 这里我真是要被Centos6.9给坑惨了,最刚开始学习linux的时候并没有在意那么的,没有考虑到选版本问题,直到23年下半年,官方不维护Centos6.9了,基本上当时配置的文件和安装的依赖都用不了了&#xff0c…

DCMM(数据管理能力成熟度模型)对企业的价值

随着大数据时代的来临,数据已成为企业发展的重要驱动力。为了有效地管理和利用数据,企业需要建立一套完善的数据管理体系,而DCMM(数据管理能力成熟度模型)正是这样一个帮助企业构建和优化数据管理能力的框架。 DCMM结构…

05-应用级开发者 AI 时代破局点

后端应用级开发者该如何拥抱 AI GC?就是在这样的一个大的浪潮下,我们的传统的应用级开发者。我们该如何选择职业或者是如何去快速转型,跟上这样的一个行业的一个浪潮? 0 AI金字塔模型 越往上它的整个难度就是职业机会也好,或者说…

Ubuntu 24 换国内源及原理 (阿里源)

备份原文件 sudo cp /etc/apt/sources.list.d/ubuntu.sources /etc/apt/sources.list.d/ubuntu.sources.bak 编辑源文件 sudo gedit /etc/apt/sources.list.d/ubuntu.sources (阿里源) Types: deb deb-src URIs: https://mirrors.aliyun.com/ubunt…

ArcGIS arcpy代码工具——关于标识码的那些事(查找最大标识码、唯一性检查、重排序、空值赋值)

系列文章目录 ArcGIS arcpy代码工具——批量对MXD文件的页面布局设置修改 ArcGIS arcpy代码工具——数据驱动工具批量导出MXD文档并同步导出图片 ArcGIS arcpy代码工具——将要素属性表字段及要素截图插入word模板 ArcGIS arcpy代码工具——定制属性表字段输出表格 ArcGIS arc…

二. Ast - 反混淆(基础篇-api的使用)

在线代码转AST语法树网站:AST explorer 什么是path对象 通过以下的代码,对以上图片中的AST语法树做例子。 VariableDeclarator(path) 是一个函数,表示 traverse 遍历AST时,要进入的节点path 参数,表示当前正在遍历的节…

Conda 常用命令大全

Conda 常用命令大全 配置源conda配置清华源pip配置清华源 环境管理创建一个新的虚拟环境列出虚拟环境激活虚拟环境退出虚拟环境删除虚拟环境复制某个虚拟环境 conda包管理列出全部包安装包卸载包 pip包管理列出全部包安装包卸载包 其他命令查询 conda 版本查看环境信息 简介&am…

某东-绑卡

声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!wx a15018601872 本文章未…

element 表格滚动条滑动,表格错位

解决办法(主要是根据滚动条的宽度决定的,可自行调整) 1、.el-table__header-wrapper { width: 99.3% !important; } 2、.el-table__header-wrapper { padding-right: 10px!important; }

鸿蒙应用布局ArkUI:【其他常用布局容器和组件】介绍

其他常用布局容器和组件 创建轮播(Swiper)实现轮播图功能 开发前请熟悉鸿蒙开发指导文档:gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到。 栅格布局(GridRow/GridCol)和Grid布局类似…

RockTree Capital石木资本品牌升级 沉浸式“加密朋克风”网站震撼上线

总部位于北京的领先的Web3 原生加密基金与投资机构 RockTree Capital 石木资本,宣布推出全新沉浸式网站,在其中呈现一个未来主义电影风格概念:赛博朋克加密城市。这个前沿互动型城市景观代表着 RockTree Capital 对 Web3 普及以及技术、金融与…