RAG 与微调在大模型应用中如何抉择

news2025/2/26 3:06:00

随着大型语言模型热度的不断升温,越来越多的开发者和企业投身于基于这些大模型的应用程序开发中。然而,面对预训练基座模型未能达到预期的表现时,如何提升应用程序的性能就成为了一个迫在眉睫的问题。我们终将会问自己:为了优化结果,RAG (检索增强生成) 和 Fine-Tuning (微调) 怎么选?本文将探讨 RAG 和微调在各个维度之间的微妙差别,发掘它们的适用场景。

image.png

RAG 和 Finetuning 方法介绍

RAG 技术

RAG (Retrieval-Augmented Generation, 检索增强生成) 是一种结合了检索和生成能力的 NLP 技术。它首先从一个大型的文档数据库中检索出与输入查询最相关的文档,然后利用这些检索到的文档作为额外的上下文信息,辅助生成模型生成更准确、更丰富的回答。RAG 模型通过这种方式结合了 Retrieval (检索) 的精确性和 Generation (生成) 模型的创造性,旨在改善模型对复杂查询的回答能力,特别是在需要广泛背景知识进行回答的场景中。RAG 使得模型不仅依赖于其内部知识,还能动态地利用外部信息源来增强其回答的准确度和相关性。

rag1.png

Fine-Tuning 技术

Fine-Tuning (微调) 是机器学习和 NLP 领域的一个核心概念,指的是在一个已经预训练好的模型基础上进行微调,使其更好地适应特定任务或数据集的过程。这种方法在大语言模型中十分常见,因为它允许开发者利用在大量数据上预训练的模型 (如BERT、GPT等) 的通用知识,通过在特定任务的较小数据集上进行进一步训练,来快速提高模型在这个任务上的性能。通过微调,可以根据我们的数据调整模型的权重,使其更适合我们应用程序的独特需求。

fineturning.png

抉择方法论

做出合理抉择的重要性

RAG和微调都是增强基于 LLM 应用性能的强大技术,但它们解决优化过程的不同方面,所以做出合理的抉择至关重要。RAG和微调之间的细微差别涵盖了模型架构、数据需求、计算复杂性等方面,忽视这些细节可能会使项目进度和预算脱轨。

方法选择错误可能会导致:

  • 在特定任务的场景中,由于模型性能不佳,导致输出结果与理想结果相去甚远。
  • 如果使用的技术没有对使用情况进行针对性优化,模型训练和推断的计算成本会大幅增加。
  • 如果后续转向不同的技术,需要额外的开发和迭代时间。
  • 如果选择过于复杂的适应方法,模型的可解释性会受到影响。
  • 由于大小或计算约束,将模型部署到生产环境中存在困难。

灵魂六问

1. 用例需要访问外部数据源吗?

面对一个大模型在判断选择微调还是使用 RAG 时,一个关键考虑因素是应用程序是否需要访问外部数据源。如果答案是肯定的,那么 RAG 可能是更好的选择。

RAG 旨在通过从知识来源检索相关信息,然后生成响应来增强大模型的能力。这使得这种技术非常适用于需要查询数据库、文档或其他结构化和非结构化数据存储库的应用程序。检索器和生成器组件可以优化以利用这些外部来源。

相比之下,虽然可以对大模型进行微调以学习一些外部知识,但这需要一个大型的标记数据集,其中包含来自目标领域的问答对。随着基础数据的变化,这个数据集必须进行更新,这使得它在数据源频繁变化的情况下变得不切实际,微调过程也没有明确地对涉及查询外部知识的检索和推理步骤进行建模。

因此,如果应用程序需要利用外部数据源,使用RAG 技术可能比仅仅通过微调来“内置”所需的知识更有效和可扩展。

2. 需要修改模型的行为、写作风格或领域特定知识吗?

另一个非常重要的考虑因素是需要模型调整其行为、写作风格或为特定领域的应用量身定制回答的程度。微调在使大模型适应特定细微差别、语调或术语方面表现出色,如果希望模型听起来更像金融专业人士,或者以鲁迅风格写作,或者使用特定行业的专用术语进行表达,那么在这些数据基础上进行定制可以实现更好的效果,影响模型行为的能力对于需要与特定风格或领域专业知识保持一致的应用程序至关重要。

RAG 技术虽然在整合外部知识方面很强大,但主要专注于信息检索,并不会根据检索到的信息固有地调整其语言风格或领域特定性。它会从外部数据源中提取相关内容,但可能不会展现出经过精细调整的模型所能提供的定制细微差别或领域专业知识。

因此,如果应用程序需要专业的写作风格或与特定领域的术语和惯例深度契合,微调提供了更直接的实现途径。它通过定制化确保与特定受众或专业领域真正共鸣,确保生成内容的真实感。

3. 对于 “幻觉” 的容忍程度如何?

大模型的一个缺点是在使用过程中产生不可控的 “幻觉”,即编造没有现实基础的事实或细节。在精确性和真实性至关重要的应用场景中,这可能会带来比较严重的问题。

微调可以通过将模型基于特定领域的训练数据来一定程度上减少幻觉。然而,当面对不熟悉的输入时,模型仍可能会制造虚假的回应。需要重新训练以持续减少幻觉回复。

相比之下,RAG 由其特性决定天生更不容易产生幻觉,因为相关回答会基于检索到的依据。检索器在生成器构建答案之前从外部知识源中识别相关事实。这一检索步骤充当事实核查机制,降低了大模型产生虚构内容的可能,生成器会一定程度受限于合成受检索上下文支持的回应。

因此,在面对幻觉限制严格的应用场景中,RAG 系统提供了内置机制来最小化幻觉。

4. 可供使用的标记后训练数据有多少?

在选择 RAG 和微调之间时,还需要考虑手头拥有的领域或任务特定的标记训练数据的数量。

对大模型进行微调时,严重依赖于可用的标记数据的质量和数量。丰富的数据集可以帮助模型深入理解特定领域的内涵、复杂性和独特模式,从而使其能够生成更准确和与上下文相关的响应。然而,如果使用的是有限的数据集,微调可能带来的改进可能是微不足道的。在某些情况下,内容有限的数据集甚至可能导致过拟合,即模型在训练数据上表现良好,但丧失了原本具有的通用能力。

相反,RAG 与训练数据无关,因为利用的是外部知识源来检索相关信息。即使没有大量标记的数据集,RAG 仍然可以通过访问和整合来自外部数据源的见解来展现出色表现。检索和生成的结合确保系统保持了解,即使场景特定的训练数据很少。

在实际中,如果拥有大量从场景获取到的复杂性标记数据,微调可以提供更贴合和精细的模型行为。但在数据有限的情况下,RAG 提供了一个强大的替代方案,通过其检索能力确保应用程序保持数据驱动和上下文语境。

5. 数据是静态的还是动态的?

在选择 RAG 和微调之间时,还有一个需要考虑的基础方面是数据的动态性,数据更新频率如何,模型保持最新状态有多重要?

在特定数据集上微调模型意味着模型的知识范围变成了训练时数据的静态快照。如果数据经常更新、改变或扩展,很快就会使模型过时。为了在这样动态的环境中保持模型的时效性,就需要经常重新训练它,这个过程可能既耗时又资源密集。此外每次迭代都需要详细测试,以确保更新后的模型在不同场景下仍然表现良好,并且没有产生新的偏见或理解上的偏差。

比较而言,RAG 在动态数据环境中具有优势。它的检索机制不断查询外部来源,确保生成响应所使用的信息是最新的。随着外部知识库或数据库的更新,RAG 可以无缝集成这些变化,保持其相关性,而无需频繁重新训练模型。

如果当前正在应对快速发展的数据格局,RAG 提供了一种传统微调很难实现的灵活性。通过始终与最新数据保持连接,RAG 确保生成的响应与当前信息状态保持一致,使其成为动态数据场景的理想选择。

6. 对大模型在应用过程中的可解释性要求如何?

大模型虽然能力强大,但操作方式类似黑匣子,其响应背后的推理决策难以理解。仅着眼于模型内部吸收数据集的信息,很难确定每个响应的确切来源或推理过程。这可能会让开发人员或用户难以信任模型的输出,特别是在理解答案背后的“为什么”至关重要的关键应用中。

另一方面,RAG 系统提供了一定程度的透明度,这种透明度通常不会出现在微调后的模型中。考虑到 RAG 的两步性质 “先检索后生成” ,用户可以窥视这个过程。检索组件允许检查选择哪些外部文档或数据点相关。这提供了一系列有形的证据或参考资料,可以对其进行评估,从而理解构建回应的基础。在需要高度可靠性的应用程序中,或者在需要验证生成内容的准确性时,追溯模型对特定数据源的回答的能力是非常宝贵的。

如果透明度和解释模型响应基础是优先考虑的话,RAG 提供了明显的优势。通过将响应生成分解为不同阶段,并允许洞察其数据检索,RAG 促进了对其输出的更大信任和理解。

抉择总结

参考指标RAG微调
外部数据源
修改模型行为
应对 “幻觉”
庞大的训练数据
数据偏动态
数据可解释

额外补充

可扩展性

随着模型应用的深入和需求的演变,可扩展性方面也值得关注。鉴于 RAG 的模块化特性,尤其是在知识库增长的情况下,可能会提供更直接的可扩展性。另一方面,经常微调模型以满足不断扩大的数据集可能会对计算能力提出要求。

时效性

如果应用程序要求实时或接近实时的响应反馈,那么就需要考虑不同技术引入的延迟因素。与基于内部知识生成响应的微调相比,会在生成响应之前检索数据的 RAG 可能会导致更多延迟。

可集成性

如果企业已经建立了某些基础性设施,无论是数据库、云服务还是用户界面,RAG 或微调与现有组件的兼容性都可能影响选择。

可维护性

可维护性角度需要结合应用程序的定位和企业的布局考虑,RAG 可能需要对数据库和检索机制进行维护,而微调则需要持续的训练工作,特别是如果数据或需求发生变化时候。

可靠性

虽然 RAG 可以从外部数据来源获取信息,并且可以应对各种问题,但经过高质量微调的大模型在某些领域可能提供更有效的结果。

用户友好性

企业需要考虑最终用户及其需求,如果他们需要详细的、有参考支持的答案,RAG 可能更有效;如果他们重视速度和领域专业知识,那么一个经过微调的大模型可能更合适。

投入成本

微调可能花销更大,特别是对于大参数的模型而言。但在过去的几个月里,由于 QLoRA 等微调技术的出现,成本已经显著下降。建立 RAG 可能需要较大的初始投资,包括集成、数据库访问,甚至可能还有对外部知识库的定期维护等等。

合规性

存储和从外部数据库检索数据可能会引发隐私问题,特别是对于敏感数据。另一方面,一个经过高质量微调的大模型,虽然不会查询实时数据库,但仍可能根据其训练数据产生输出,这可能会引起其自身的道德问题。

RAG 与微调的未来

其实 RAG 与微调技术并不是两个对立面,它们既可以独立使用,也可以共同工作,特别是在企业计划塑造独有标签的应用程序的时候。

通过微调可以确保对客交互终端与企业的品牌、常用语及业务知识保持一致,处理大多数典型的客户问答场景。然后,RAG 可以作为一个补充支持,用于更具动态性或特定的查询场景,确保终端可以从最新的企业文件或数据库中获取信息,从而最大程度地减少错误。通过整合这两种方法,企业可以提供全面、及时和品牌一致的客户认可体验。

融合发展.png

结语

在 RAG 和微调之间抉择需要对特定应用程序的独特需求和优先事项进行谨慎评估,并不存在一种适合所有情况的解决方案,成功之道是将优化方法与任务的具体要求相匹配。需要注意的是避免先入为主的假设和思维定式,像任何其他技术一样,它们的适用性取决于具体的工作,手段和目标的不匹配会阻碍项目进展。通过评估 “灵魂六问” 中的关键标准,组织可以就最佳实践进行决策。在某些情况下,利用 RAG 和微调的混合方法可能是更好的选择。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1841832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

常用的Java日志框架:Log4j、SLF4J和Logback

日志是软件开发中不可或缺的一部分,它有助于记录应用程序的运行状态、调试问题和监控系统。Java中有多个流行的日志框架,如Log4j、SLF4J和Logback。 一、Log4j 1.1 什么是Log4j? Log4j是Apache基金会开发的一个开源日志框架,它…

【无线传感网】LEACH路由算法

1、LEACH路由算法简介 LEACH协议,全称是“低功耗自适应集簇分层型协议” (Low Energy Adaptive Clustering Hierarchy),是一种无线传感器网络路由协议。基于LEACH协议的算法,称为LEACH算法。 2、LEACH路由算法的基本思想 LEACH路由协议与以往的路由协议的不同之处在于其改变…

JavaSE 面向对象程序设计 正则表达式

正则表达式 正则表达式(Regular Expression,简称Regex)是用于匹配文本中模式的字符串表达式。它由普通字符(例如字母、数字)和特殊字符(称为元字符)组成,可以非常灵活地定义搜索模式…

【计算机网络仿真实验-实验3.1、3.2】交换路由综合实验

实验3.1 交换路由综合实验——作业1 一、实验目的 运用实验二(可前往博主首页计算机网络专栏下查看)中学到的知识,将这个图中的PC机连接起来组网并分析,本篇涉及代码以截图展示,过于简单的代码及操作不再详细介绍&…

数据分析第三讲:numpy的应用入门(二)

NumPy的应用(二) 数组对象的方法 获取描述统计信息 描述统计信息主要包括数据的集中趋势、离散程度和频数分析等,其中集中趋势主要看均值和中位数,离散程度可以看极值、方差、标准差等,详细的内容大家可以阅读《统计…

使用事件日志识别常见 Windows 错误

事件查看器,一个标准的诊断工具,嵌入在Windows操作系统,记录了所有的系统事件,该日志捕获有关硬件问题、软件中断和整体系统行为的详细信息。通过分析这些日志,管理员可以查明系统错误和运行时错误的根本原因。了解如何…

如何成为沟通高手,读懂人心的心理学

一、教程描述 人际关系和沟通能力是闯荡社会的重要资本,懂心理让你看透他人的心思,读懂人心让人占尽优势,有效沟通让你提高效率,知己知彼,谋定而后动,充分了解他人的心理是一个人立足于职场和社交场的基础…

SYD881X读取GATT VALUE的长度

SYD881X读取GATT VALUE的长度 现在具体遇到这样一个需要,机器生产后要更新profile,这个只能够通过升级4K来做,但是需要知道profile是否改变了,这个就要知道profile是否改变来决定是否要升级,这里的做法是增加一个函数&…

可以免费领取tokens的大模型服务

本文更新时间:2024年6月20日 豆包大模型 “亲爱的客户,模型提供方将在5月15日至8月30日期间,为您提供一次独特的机会,即高达5亿tokens的免费权益。这是我们对您长期支持的感谢,也是对未来合作的期待。” 在8月30日之…

手机网站制作软件是哪些

手机网站制作软件是一种用于设计、开发和创建适用于移动设备的网站的软件工具。随着移动互联网时代的到来,越来越多的用户开始使用手机浏览网页和进行在线交流,因此,手机网站制作软件也逐渐成为了市场上的热门工具。 1. Adobe Dreamweaver&am…

计算机组成原理(Wrong Question)

目录 一、计算机系统概述 *1.1 计算机发展历程 1.2 计算机系统层次结构 1.3 计算机的性能指标 二、 数据的表示和运算 2.1 数制和编码 2.2 运算方法和运算电路 2.3 浮点数的表示与运算 三、存储系统 3.1 存储器概述 3.2 主存储器 3.3 主存储器与CPU的连接 3.4 外部…

Springboot集成Mybatisplus过程

这里写目录标题 背景步骤明确标准实操过程创建好数据库,命名好(这里会考察一个命名规范),表的命名,中间使用下划线隔离开。使用idea创建Springboot项目(注意版本问题)使用插件生成代码常用代码p…

下载mysql-8.0.33-1.el7.x86_64.rpm-bundle.tar操作教程

1、下载地址:MySQL :: Download MySQL Community Server (Archived Versions) 2、截图如下

Nvidia Isaac Sim 入门教程 2024(3)图形界面

Isaac Sim 基本使用 版权信息 Copyright 2023-2024 Herman YeAuromix. All rights reserved.This course and all of its associated content, including but not limited to text, images, videos, and any other materials, are protected by copyright law. The author …

产品经理方法论

1、用户体验 5 要素 1,表现层是你拿到一个产品以后,视觉表现,配色,布局,排版等等 2,框架层,是交互层面的东西,比如,操作情况,刷新,页面跳转&…

android 在线程中更新界面

在Android中,你不能直接从子线程中更新UI,因为这会导致应用崩溃。你需要使用Handler或runOnUiThread()来更新UI。 使用Handler 以下是如何使用Handler在子线程中更新UI的示例: 1. 创建Handler实例: import android.os.Bundle;…

肩背筋膜炎怎么治疗最有效

肩背筋膜炎是一种常见的肌肉骨骼疾病,其症状主要包括:肩背区域疼痛:由于筋膜组织受到损伤,肩背部位会出现明显的疼痛,疼痛可能会放射到周围的其他部位,严重时会影响睡眠和休息。肌肉紧张和僵硬:…

数据库实战(二)(引言+关系代数)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀数据库 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 前言 常见概念 一、什么是数据库&#xf…

AJAX 原理-day3

XMLHttpRequest AJAX原理 是 XMLHttpRequest对象 定义: 关系:axios 内部采用 XMLHttpRequest 对象与服务器交互 步骤: 1. 创建 XMLHttpRequest 对象 2. 配置 请求方法 和请求 url 地址 3. 监听 loadend 事件,接收 …

AI绘画Stable Diffusion神级插件AnimateDiff超稳动画教程来了!手把手教你一次性学会

大家好,我是设计师阿威 今天给大家分享AI做稳定动画的新教程,这一次的稳定效果,比上一次和上上次都更加惊艳,而且实现难度直线下降!几乎可以说是有手就会,非常适合追求高效高质效果的商用场景!…