开发大模型应用,到底使用RAG还是微调?我们应该从哪些方面考虑?

news2024/9/8 23:05:00

现在基于大模型开发应用时,相信很多人都有这种疑问,到底对大模型进行微调还是外接RAG呢?因为两者在一定层面上有很多相似的地方,下面让我给大家从各个层面进行分析,结合具体的业务场景,看哪种方式更适合你的。

大模型微调和RAG的区别

RAG:本质上没有改变大模型,只不过是在大模型之外添加了额外的知识而已,所以RAG又被称作大模型外挂的知识库。使用流程上,当我们进行提问时,首先问题先会从RAG知识库中进行检索,然后将检索的结果和原始问题组成新的prompt,再交给大模型,最后由大模型给出结果。

图片

大模型微调:微调是指在一个已有大模型的基础上,将一些知识给这个大模型进行训练,此时训练后新的大模型就具备了那些知识,这个过程叫做微调。比如上面说的在RAG知识库的内容,我们可以给已有的大模型进行训练,那样训练后的大模型就具备RAG知识库的内容了,当用户进行提问时,直接跟大模型进行交互给出反馈。

图片

所以两者完全不同,简单理解就是微调需要对大模型进行训练,训练后新的大模型对外直接提供服务;而RAG则不需要,只是大模型外挂的一个知识库,RAG+大模型两者合起来对外提供服务。

微调 or RAG?

通过上面的介绍,两者属于完全不同的方式对外提供的丰富,但是可以达到同样的效果,那我们应该如何选择呢?

1、你的大模型需不需要具备一些特殊能力,也可以说是特殊定制的大模型。比如回答问题的方式,模型本身所具备的“性格”等。举个具体的场景,你的大模型的应用场景是新闻播报员,当你向他提问时,大模型就会以专业官方正式的口吻来回答问题。或者你的场景是一个智能客服,那大模型回答的口吻可能是礼貌、平易近人的语气回答问题。而这种需求必须通过对大模型进行特殊的训练,通过微调的方式去实现,RAG方式很难做到。

2、数据是否经常变化。如果你的数据经常变化,比如企业内的一些业务数据变化频繁,而且有些需要及时更新作出反馈,那实际上选择RAG是最合适的方式。因为如果我们使用微调的话,每次数据的更新我们都需要重新去微调大模型,这个显然是不现实的。但是RAG知识库则不同,因为是外挂的,本质上是去更新背后向量数据库的数据,操作简单,就类似于我们业务更新数据库mysql一样容易。

3、解决幻觉问题,RAG优于大模型微调。大模型的幻觉问题不可避免,并且大模型本身就是一个黑盒,当我们提出一个问题时,不清楚内部解析细节给出的反馈过程,出现了幻觉也难以追踪。但是RAG可以通过在外部添加专业知识,降低大模型出现幻觉的概率,并且可以对出现的具体幻觉通过加强RAG知识内容去解决,同时大模型之前的检索RAG知识库的步骤和结果是可以进行追踪的。

4、成本。这个我认为是特别重要的一点,使用RAG的成本要远低于微调一个大模型的成本。因为微调那我们需要收集和处理数据,然后做进行微调,如果微调的效果不好,我们还要接着去做迭代,所以它的成本是很高的。

5、反馈的延迟性。如果对大模型的反馈速度有要求,那很明显我们要选择微调。因为微调后的大模型没有其他东西,直接与其交互即可。但是RAG很明显是在大模型之外又新加的环节,并且RAG本身的步骤里就包含了检索、聚合prompt等步骤,都比较费时。

6、专业垂直领域大模型场景。毫无疑问,只能是微调。这种场景下,我们的关注点是大模型只要某个专业领域很强就可以,通用领域则不是我们关注的重点,例如编码大模型的场景,我们只需要用微调的方式,在编码层面对其进行专业的训练,使大模型成为编码领域的专家。这种场景下,RAG是办不到的,因为只有大模型训练才可以。

-------------

上面列举的几个点,就是我认为的,不同场景下到底是选择用微调还是RAG最重要的几个方向,大家可以作为参考。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1860229.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【OnlyOffice】 桌面应用编辑器,版本8.1发布,PDF编辑器、幻灯片版式、改进从右至左显示、新的本地化选项等功能,快来体验吧

继 ONLYOFFICE 文档 8.1 发布后,适用于 Linux、Windows 和 macOS 的 ONLYOFFICE 桌面应用程序最新版本也已推出。它具有在线套件的最主要功能,例如功能齐全的 PDF 编辑器、演示文稿中的幻灯片版式、改进的 RTL 支持、新的本地化选项等。 目录 ONLYOFFICE…

【Unity Android】Unity链接安卓手机调试

一、物理连接手机 1.USB数据线链接 2.打开开发者模式 大部分手机在手机设置->系统管理->关于手机->软件版本型号中,点击7次以上,来开启系统管理中的开发者模式选项。 3.打开USB调试 打开开发者模式后,开启USB调试 二、Unity中…

Hi3861 OpenHarmony嵌入式应用入门--LiteOS Timer

LiteOS Timer(定时器)是LiteOS操作系统中的一个重要组件,它提供了一种基于软件模拟的定时器功能,用于满足在硬件定时器数量不足时的定时需求。 软件定时器:基于系统Tick时钟中断,由软件来模拟的定时器。当经…

表单(forms)

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 在app1文件夹下创建一个forms.py文件,添加如下类代码: from django import forms class PersonForm(forms.Form): first_na…

GPT-5:AI新纪元的领航者,多维度的审视与准备

一、引言:GPT-5与AI的多维演进 GPT-5作为AI领域的里程碑式突破,不仅仅代表了技术的飞跃,更预示着社会、文化以及经济等多个层面的深刻变革。从技术的角度看,GPT-5代表着AI在自然语言处理领域的最新高度;而从更宽广的视…

中国高分辨率土壤侵蚀因子K

土壤可蚀性因子(K)数据,基于多种土壤属性数据计算,所用数据包括土壤黏粒含量(%)、粉粒含量(%)、砂粒含量(%)、土壤有机碳含量(g/kg)、…

我国季戊四醇市场规模逐渐扩大 出口量有所增长

我国季戊四醇市场规模逐渐扩大 出口量有所增长 季戊四醇(PETP/THME)又称为四羟甲基甲烷、2,2-双羟甲基-1,3-丙二醇等,是一种多元醇类有机化合物,多表现为一种白色结晶性粉末。季戊四醇可溶于水及乙醇等溶剂,但不溶于苯…

台式扫描电镜工作距离越远观察区越大?

台式扫描电镜(Scanning Electron Microscope, SEM)是一种高分辨率的显微镜,它利用电子束扫描样品表面,通过样品与电子束相互作用产生的信号来形成图像。这种显微镜广泛应用于材料科学、生物学和医学等领域,以观察样品的…

AI元宇宙

随着科技的迅猛发展,人工智能(AI)迎来了一个宇宙大爆发的时代。特别是以GPT为代表的生成式大模型的诞生和不断进步,彻底改变了人们的工作和生活方式。程序员与AI协同工作写代码已成为常态,大模型不仅提高了工作效率&am…

4418 HMI 更换logo 图片

逻辑说明: HMI 的 kernel 没有提供源码,只是提供了镜像,如果客户需要更换自己的logo 的话, 可以使用提供的工具,将内核logo 打包起来。 我觉得这里的打包的过程应该是参考了, 4418 build_android.sh 脚…

linux学习week1

linux学习 一.介绍 1.概述 linux的读法不下10种 linux是一个开源的操作系统,操作系统包括mac、windows、安卓等 linux的开发版:Ubuntu(乌班图)、RedHat(红帽)、CentOS linux的应用:linux在服…

百问网全志D1h开发板MIPI屏幕触摸功能适配

硬件了解 首先,还是从官方提供的资料,可以了解MIPI LCD对应的接口信息: [ 触摸功能涉及到DSI_SCL、DSI_SDA、TP_INT、TP_RESET。 从芯片的引脚图里面,可以了解到: [ 其中: DSI_SCL、DSI_SDA使用的是…

1954springboot VUE 天然气系统隐患管理系统开发mysql数据库web结构java编程计算机网页源码maven项目

一、源码特点 springboot VUE天然气系统隐患管理系统是一套完善的完整信息管理类型系统,结合springboot框架和VUE完成本系统,对理解JSP java编程开发语言有帮助系统采用springboot框架(MVC 模式开发),系统具有完整的…

JNI详解

JNI简介 Java是跨平台的语言,但在有的时候仍需要调用本地代码(这些代码通常由C/C++编写的)。 Sun公司提供的JNI是Java平台的一个功能强大的接口,JNI接口提供了Java与操作系统本地代码互相调用的功能。 Java调C++ 1)使用javah命令生成native的头文件 javah com.studio.j…

优化|PyOptInterface:高效且灵活的Python优化建模语言

优化建模语言作为优化求解器与终端用户之间的桥梁,是构建、求解和分析优化模型的重要工具。建模语言的效率直接影响优化模型的构建和求解时间。PyOptInterface是一种基于Python编程语言的优化建模语言,相比现有建模语言兼具高效率和灵活性,在…

Kotlin设计模式:深入理解桥接模式

Kotlin设计模式:深入理解桥接模式 在软件开发中,随着系统需求的不断增长和变化,类的职责可能会变得越来越复杂,导致代码难以维护和扩展。桥接模式(Bridge Pattern)是一种结构型设计模式,它通过…

【MySQL】如果表被锁可以尝试看一下事务

今天在MySQL中删除表的时候,发现无法删除,一执行drop,navicat就卡死。 通过 SHOW PROCESSLIST显示被锁了 kill掉被锁的进程后依旧被锁 最后发现是由于存在为执行完的事务 SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX; kill掉这些事务以…

九泰智库 | 医械周刊- Vol.36

⚖️ 法规动态 广东药监局 | 8家医疗器械公司体系不合规被停产 6月17日,广东省药品监督管理局组织开展医疗器械生产企业监督检查,发现8家企业质量管理体系存在严重缺陷,不符合《医疗器械生产质量管理规范》相关规定,广东省药品监督…

美食解压视频素材无水印无字幕的在哪找?海外美食解压网站分享

在如今快节奏的生活中,观看美食视频已成为许多人缓解压力的一种方式。这些视频不仅唤醒人们的味觉记忆,还能在繁忙中带来片刻的放松。然而,对于视频创作者来说,寻找高品质的美食视频素材,特别是那些无水印、无字幕、可…

HALCON-从入门到入门-提取小票上的斑点

测试效果 在一张超市小票上提取点阵数字 处理步骤解析 首先读取两张图,一张是小票的图片,一张是静脉的图片 为了让点阵数字提取更加困难,我们将两张图片合成到一起 read_image (ImageNoise, angio-part) crop_part (ImageNoise, ImagePart…