大语言模型入门(四)——检索增强生成(RAG)

news2024/10/8 10:32:29

一、什么是检索增强生成

        检索增强生成(Retrieval-Augmented Generation,RAG)由Facebook AI Research(FAIR)团队于2020年首次提出,这是一种结合了信息检索技术与语言生成模型的人工智能技术。它通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLM),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG技术的优势在于它能够提供更加准确、丰富且符合用户需求的文本内容。它允许开发人员为生成模型提供最新的研究、统计数据或新闻,从而保持信息的时效性和相关性,缓解知识截止问题(模型的知识仅限于训练时的数据)和模型幻觉(模型生成不准确或虚假的信息)。

二、RAG的流程

        RAG的工作流程通常包括以下几个步骤:

        1、检索(Retrieval):根据用户的查询,从预先构建的知识库中检索出相关的信息。这些信息通常被转换成向量形式存储在数据库中,通过计算查询与数据库中向量的相似度来检索最相关的信息。

        2、增强(Augmentation):将检索到的信息与原始查询结合起来,形成增强的提示词,这个增强的提示词包含了查询的上下文信息。

        3、生成(Generation):利用增强的提示词作为输入,大语言模型生成回答或完成特定的语言任务。

三、如何应用RAG

1、Kimi等智能助手

        最直接可以体验RAG优势的就是Kimi智能助手了(也有一些其他的智能助手支持联网),它支持可调节的网络访问,你可以选择让Kimi联网或者不联网响应你的需求,只需要在对话框的左下角点击按钮即可。联网模式下,对于有的需求,Kimi会自动联网搜索并生成回复,而有的需求并不会这样,这取决于上下文以及Kimi的判断逻辑。不过,当你需要它搜索的时候,可以尝试在提示词中强制它联网搜索(虽然有时候会失败):

e125603e03324ded9b4cc7c9d9cf425b.png

2、LangChain

        LangChain 是一个开源框架,用于构建由大型语言模型(LLM)驱动的应用程序。它通过提供工具和抽象,使开发人员能够将语言模型与外部数据源连接,这相当于给LLM配备了一个小型的专属数据库,它可以随时检索数据库中的知识来回答你的问题。LangChain 的工作流程通常包括以下步骤:

  • 用户提出问题。

  • 问题被转换成向量表示,用于在向量数据库中进行相似性搜索。

  • 从向量数据库中提取相关信息块,并将其输入给语言模型。

  • 语言模型生成答案或执行操作。

四、总结

        检索增强生成的概念很简单,复杂的是如何实现检索增强生成的这个流程。目前网上诸多跟LangChain类似的开源解决方案,但其中还有很多细节值得关注。例如,如何最大化压缩存储空间,如何提高检索速度,如何让大模型更好地应用检索到的知识或者信息等等,这些我们后面再逐一探究。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2196129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

局域网内探测在线好友是如何做到的?

一、前言 随着局域网(LAN)应用的广泛使用,网络通信已经成为软件设计中不可或缺的一部分。局域网聊天软件作为一种常见的网络应用,可以实现多个用户之间的实时通信,广泛应用于企业内部沟通和小型网络环境中。本项目设计…

‌视频尺寸修改与批量剪辑技巧

在当今这个数字化时代,视频内容已成为人们获取信息、娱乐和社交的重要方式。然而,面对海量的视频素材,如何高效地管理和编辑它们成为了一个挑战。 1打开视频剪辑高手软件,切换功能到“批量剪辑视频” 2把需要剪辑的视频导入到表格…

希尔排序和直接插入排序

因为排序这些比较复杂点我就分几期给大家来讲~~~ 直接插入排序 直接插入排序是一种简单的排序算法,主要用于对少量数据进行排序。其基本思想是将待排序的元素逐个插入到已经排好序的部分中,从而形成一个有序序列。 具体步骤如下: 初始化&…

基于32单片机的博物馆安全监控系统设计

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 检测 分别是温湿度 光照 PM2.5、烟雾、红外,然后用OLED屏幕显示, 红外超过阈值则蜂鸣器报警,这是防盗报警;温度或烟雾超过阈值,则蜂鸣器…

【目标检测】木制地板缺陷破损数据集338张6类VOC+YOLO格式

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):3383 标注数量(xml文件个数):3383 标注数量(txt文件个数):3383 标注…

fiddler抓包21_(性能测试)耗时分析

课程大纲 使用场景 1. 查看请求耗时。 2. (更多)前端性能分析、优化。 1. 查看单个请求耗时 耗时详情:选择请求 - 右侧标签菜单选择Statistics“请求统计”。 传输时间线:选择请求 - 右侧选择“TimeLine”。 2. 前端性能分析&a…

MYSQL 常见锁机制详解,常见锁问题排查及分析

1,锁分类 锁冲突是影响数据库性能的重要指标,本章节介绍MYSQL常见锁,及各种说的常用示例,mysql锁的分类如下: 从操作类型分类:读锁、写锁; 从操作粒度分类:表锁、页锁、行锁&#x…

【文献阅读】Transfer Learning For Text Classification Via Model Risk Analysis

前言:本文是以文本分类的迁移学习任务为例,对风险分析模型的整体框架流程做梳理。 目录 1. LearnRisk1.1 motivatio1.2 overall 2. LearnRisk-TC2.1 构造风险特征2.1.1 risk metric2.1.2 risk feature 2.2 构建风险模型2.3 训练风险模型2.4 微调base mod…

线性代数入门

线性代数入门 线性代数(Linear Algebra)是数学的重要分支之一,广泛应用于工程、计算机科学、物理学、经济学等领域。它主要研究向量、矩阵及其在空间中的变换。对于程序员来说,掌握线性代数的基础知识能够帮助更好地理解数据处理…

边缘人工智能(Edge Intelligence)

边缘人工智能(Edge AI)是指在边缘设备上直接运行人工智能(AI)和机器学习(ML)算法的技术。机器学习是一个广泛的领域,近年来取得了巨大的进步。它所基于的原则是,计算机可以通过从数据…

Qt-QGridLayout布局类控件(43)

目录 描述 属性 使用 常规使用 垂直布局 水平布局 布局是按照相对大小进行的 拉伸系数 使用 设置水平拉伸系数 设置垂直拉伸系数 描述 Qt 中还提供了 QGridLayout ⽤来实现⽹格布局的效果.可以达到 M * N的这种⽹格的效果 属性 layoutLeftMargin左侧边距layoutRig…

Windows 安装 Maven 并配置环境变量

一、简介 Maven 是一款基于 Java 平台的项目管理和整合工具,用来构建项目的。也就是清理、编译、测试、运行、打包、安装整个过程都交给 Maven 管理,整个过程就是构建。 二、安装 Java JDK Maven 依赖 Java JDK,如果本机没有安装过 Java 的…

NASA:第三版大气痕量分子光谱(ATMOS)2 级产品,包含垂直高度(千米)网格上的痕量气体

目录 简介 摘要 代码 引用 网址推荐 0代码在线构建地图应用 机器学习 ATMOS L2 Trace Gases on Altitude Grid, Fixed Field Format V3 (ATMOSL2AF) at GES DISC 简介 高度网格上的 ATMOS L2 跟踪气体,固定字段格式 V3 (ATMOSL2AF) 这是第三版大气痕量分子…

CMake学习笔记:项目的导出和安装-install命令

一、基本语法与概念 1.文件的安装 install(FILES) 用Poco库 usr/local/poco/CMakeLists.txt中内容 举例如下: 2.目标安装 install(TARGETS) 3.导出目标与导出配置文件 将目标mylib导出名为MyModules的目标。MyModules导出目标包含了关于mylib的所有信息&#xf…

【初阶数据结构】冒泡排序和选择排序(用C语言实现,主要讲思维)

文章目录 前言1. 冒泡排序1.1 算法思想1.2 冒泡排序的代码实现1.3 冒泡排序算法的改进 2. 选择排序2.1 算法思想2.2 选择排序的代码实现 3. 写排序算法的小技巧 前言 讲到排序相信大家一定对一种排序很熟悉,它的名字就叫做冒泡排序。这个排序大家在学习各种语言时&…

【优选算法】(第二十六篇)

目录 两数相加(medium) 题目解析 讲解算法原理 编写代码 两两交换链表中的节点(medium) 题目解析 讲解算法原理 编写代码 两数相加(medium) 题目解析 1.题目链接:. - 力扣(…

随着硬件水平的提升,LabVIEW有哪些过去的编程方法被淘汰掉了

随着硬件水平的不断提升,尤其是处理器性能、存储能力、通信速度等方面的飞跃,LabVIEW的一些早期编程方法逐渐被更高效、现代的编程技术所取代。以下是一些随着硬件升级而逐步淘汰的LabVIEW编程方法和技术: 1. 低效的数据流传输方式 过去由于…

SQL执行顺序是如何工作的,为什么它如此重要?

🎯SQL执行顺序是如何工作的,为什么它如此重要? SQL查询按照以下顺序执行其语句: 1️⃣FROM / JOIN 2️⃣WHERE 3️⃣GROUP BY 4️⃣HAVING 5️⃣SELECT 6️⃣DISTINCT 7️⃣ORDER BY 8️⃣LIMIT / OFFSET 你在每个步骤中实现的技…

特定类型的图与应用 - 离散数学系列(六)

目录 1. 树和生成树 树的定义 生成树与最小生成树 2. 二分图 二分图的定义 示例:最大匹配问题 3. 欧拉图与哈密顿图 欧拉图 哈密顿图 4. 实际应用场景 1. 文件系统中的树结构 2. 网络优化中的最小生成树 3. 社交网络分析 5. 例题与练习 例题1&#xf…

sv标准研读第十三章-task和function

书接上回: sv标准研读第一章-综述 sv标准研读第二章-标准引用 sv标准研读第三章-设计和验证的building block sv标准研读第四章-时间调度机制 sv标准研读第五章-词法 sv标准研读第六章-数据类型 sv标准研读第七章-聚合数据类型 sv标准研读第八章-class sv标…