GPT微调和嵌入哪个好,大模型微调 和嵌入有什么区别?微调(fine-tuning),嵌入(embedding)的用法!

news2024/9/21 13:44:53

GPT擅长回答问题,但是只能回答它以前被训练过的问题,如果是没有训练过的数据,比如一些私有数据或者最新的数据该怎么办呢?

这种情况下通常有两种办法,一种是微调(fine-tuning),一种是嵌入(embedding)。

现在基于自然语言和文档进行对话的背后都是使用的基于嵌入的向量搜索。OpenAI在这方面做的很好,它的Cookbook(http://github.com/openai/openai-cookbook) 上有很多案例,最近他们对文档做了一些更新。

图片

大模型GPT微调 和嵌入有什么区别?

微调就是在大模型的数据基础上做二次训练,事先准备好一批prompt-complition(类似于问答Q&A)的数据,生成新的模型,这个模型将会包含微调后的数据。

而嵌入则是每次向GPT发送消息(prompt)的时候,把你自己数据结果带上。

王建硕老师对于微调和嵌入有过精妙的比喻:
GPT就像一个已经训练好的家政阿姨,她懂中文,会做家务,但是对你家里的情况不了解。

微调就相当于阿姨第一次到你家干活的时候,你要花一小时时间告诉她家里的情况,比如物件的摆放、哪些地方不能动,哪些地方要重点照顾。

嵌入就相当于你省去了对阿姨进行二次培训的,而是在家里贴满纸条,这样阿姨一看到纸条就知道该怎么做了。

大模型LLM嵌入和大模型微调哪个更好?

嵌入门槛低,效果也不错,修改起来容易。缺点就是反应慢,需要检索

微调门槛高,反应快,缺点就是价格高

图片

嵌入embedding的

OpenAI的Cookbook也有类似的比喻:
微调就像你通过学习准备考试,是一种长期记忆,但过了一周后考试来临,模型可能会忘记一些,或者记错它从来没有读过的事实。

嵌入就像记笔记,是一种短期记忆,当考试的时候,你把笔记带上,随时翻看笔记,对于笔记上有的内容可以得到准确的答案。

什么是 Search-Ask-RAG

也就是先在本地文档库中Search,拿到本地的数据结果,再去Ask,把搜索结果和问题一起交给GPT,这样GPT可以根据你提供的内容以及它模型中的数据,一起将结果返还给你。

必须用向量搜索RAG吗?

并非一定要基于向量的搜索,可以有多重搜索方式:

· 基于关键字搜索

· 基于图形的搜索

· 基于向量的搜索

对于技术实现的细节,OpenAI的Cookbook上也有详细的介绍。

更多细节建议参考:
https://github.com/openai/openai-cookbook/blob/main/examples/Question_answering_using_embeddings.ipynb

LLM嵌入embedding有什么限制?

嵌入的文本搜索相对于微调来说,会有输入限制

嵌入的搜索提问方式相对于微调有一个缺点就是它每次附带的文本数量是有限制的,因为除了原始的问题,它还需要带上搜索出来的问题。

就好比你有成书架的教科书可以借鉴,但每次却只能翻看其中几页笔记。

如果你想构建一个对大量文本问答的系统,OpenAI建议(Search-Ask)的方法。

文本搜索相对于微调来说,search-ask的缺点是每次带上下文,所有会有输入字数限制,但是这种对于准确问答,前面有一层精准的search,准确度来说模型更容易得到正确的答案

这两种方案,用户自有数据也都必须做成q&a形式吗?

比如我有1MB的纯文本私有数据,没有经过人工q&a处理。我想对这些数据提问,当问题不在笔记中时才用chatgpt。

A 对于嵌入的方案,数据不必做成Q&A,但是需要拆成小块,因为Ask的时候也是受最大长度限制的,所以先搜索到文本块(chunk),然后提问的时候带上搜索出来的若干块

GPT 的上下文窗口限制,你怎么能在 pdf、书籍、文档等上“训练”它呢?

你必须:

将数据压缩成数据嵌入并将其传递给提示(称为“上下文压缩”),或者使用通义千问的pdf api long text 进行提取!

如果嵌入的数据太大而无法放入上下文窗口,则需要使用矢量数据库并使用一些搜索/排名启发式方法分两部分回答查询:

\1. 找到与此矢量化用户查询相关的所有相关文档,然后

\2. 将前 n 个最接近的文档与用户查询一起传递到上下文中,并要求 ai 仅引用其上下文中的内容来回答用户问题。这称为“语义查询”

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2079075.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

四大神器:2024免费数据恢复软件推荐!

在这个数字化的时代,数据丢失可能是我们最不想面对的事情之一。但不用担心,今天我就来给大家介绍几款免费又好用的数据恢复软件! 第一款:福昕数据恢复 链接:www.pdf365.cn/foxit-restore/ 这是一款由福昕公司推出的…

Vue3+Ts封装input组件时遇到的问题

使用input事件监听输入框变化时,如果当前使用的输入法是中文,他也会触发input事件,正常来说,中文没有输入完毕是不用触发事件的。 控制台打印时发现: 那么我们应该怎么去规避这件事呢? 其实input还有几个事…

从永远到永远-日语学习-て形用法及变形规律

て形用法及变形规律 0.前置知识1.常见用法1.请求某人做某事 「~てください」2.几个连续发生的动作 ~て、~て、~て3.两个动作先后发生「てから」4. 表示许可 「てもいいです」5.表示禁止 「~てはいけません」6.「&#…

亚马逊新品如何获取评论,为店铺提高产品排名权重流量订单?测评

大多数消费者都会购买具有最佳评论和评级的产品。亚马逊评论是影响消费者决策的关键因素,卖家对评论的重视程度也非常之高,亚马逊卖家最常见的挑战之一是获得产品评论。 1.亚马逊Vine计划: 亚马逊Vine计划是亚马逊为品牌卖家提供的专属评论计…

猫咪浮毛如何清理?希喂、安德迈、范罗士宠物空气净化器功能实测

拥有一只属于自己的小猫咪,是一件非常幸福的事。美中不足的就是它掉毛,疯狂的掉毛,家里到处都是毛发散落的痕迹。和它亲近的时候,也会沾满一身毛,清理起来非常麻烦。特别是随着季节的转换,猫咪换毛季的到来…

使用IntelliJ IDEA将本地项目推送到远程Git

1,安装Git 打开 下载地址,下载Git安装包。根据引导程序,完成安装。 2,IntelliJ IDEA配置Git 打开IntelliJ IDEA,依次点击File>>Settings…>>Git,然后配置自己的Git的路径,然后点…

系统架构分析

一、速通一图流 二、系统架构功能、作用分析 1. Furion:框架核心层 功能:这是 Furion 框架的核心层,通常包含框架本身的基本功能和配置。这一层应该是比较稳定的,不应该包含业务逻辑,而是提供项目其他部分需要依赖的…

yolo7 自定义数据训练

数据打标labelimg 预定义标签 格式name label 数据集定义文件errimg.yaml train: /home/kean/works/yolov7/dataset/train.txt val: /home/kean/works/yolov7/dataset/val.txt # number of classes nc: 1 # class names names: ["error_dialog"] 数据定义文件train.…

【JS】使用MessageChannel实现深度克隆

前言 通常使用简便快捷的JSON 序列化与反序列化实现深克隆,也可以递归实现或者直接使用lodash。 但 JSON 序列化与反序列化 无法处理如下的循环引用: 实现 MessageChannel 内部使用了浏览器内置的结构化克隆算法,该算法可以在不同的浏览器上…

学习之在window上安装MySQL server 并连接到Navicat

一、下载 下载地址:https://www.mysql.com/ 二、安装 1、双击软件安装2、点击yes

【解析几何笔记】9. 向量的内积运算

9. 向量的内积运算 定义&#xff1a;有向量 α , β \pmb{\alpha},\pmb{\beta} α,β&#xff0c; α ⋅ β ∣ α ∣ ∣ β ∣ ⋅ cos ⁡ < α , β > \pmb{\alpha}\cdot\pmb{\beta}|\pmb{\alpha}||\pmb{\beta}|\cdot\cos<\pmb{\alpha},\pmb{\beta}> α⋅β∣α…

Commons Lang库中,StringUtils.isBlank()和StringUtils.isEmpty()区别

在Apache Commons Lang库中&#xff0c;StringUtils.isBlank()和StringUtils.isEmpty()方法都是用来判断字符串是否为空或者空白的。它们的主要区别在于处理空格的方式上。 StringUtils.isEmpty(String str): 这个方法会返回true当字符串为null或者长度为0时。也就是说&#xf…

自动化测试和性能测试面试题精选(含答案)

前言 今天分享软件测试工程师常见的面试题&#xff0c;主要来源于个人面试遇到的、网络搜集&#xff08;完善&#xff09;、工作日常讨论等&#xff0c;分为以下十个部分&#xff0c;供大家参考。如有错误的地方&#xff0c;欢迎指正。有更多的面试题或面试中遇到的坑&#xf…

javacv-ffmpeg ProcessBuilder实现对图片的旋转

javacv-ffmpeg ProcessBuilder实现对图片的旋转&#xff0c;最近需要处理很多图片&#xff0c;量有点多&#xff0c;所以不能一个一个去编辑旋转图片&#xff0c;所以写一个工具类&#xff0c;实现对图片的旋转 maven配置文件&#xff0c;加上对ffmpeg的依赖&#xff0c;由于f…

读论文《SHOW-O》8.22发布的贼强的大模型多模态理解和生成解决方案

全名&#xff1a;Show-o: One Single Transformer to Unify Multimodal Understanding and Generation 8月22发表的&#xff0c;一个名为Show-o的统一变换器&#xff08;transformer&#xff09; 论文地址&#xff1a;2408.12528v2 (arxiv.org) 项目地址&#xff1a;GitHub …

开放式耳机有哪些优点?开放式耳机推荐

开放式耳机&#xff0c;相较于封闭式耳机&#xff0c;以其独特的声学设计和佩戴体验&#xff0c;为用户带来了更加自然流畅的听觉享受。以下是开放式耳机几个显著优点&#xff1a; 宽广的音场与深度&#xff1a;开放式耳机最大的魅力之一在于它们能够模拟出更加宽广和深邃的音场…

P1533 可怜的狗狗

*原题链接* 题意&#xff1a;m次询问区间[l,r]中第k大的数&#xff0c;各询问区间互不相交。 这道题的解法可谓是八仙过海&#xff0c;而我看到询问区间[l,r]中第k大的数&#xff0c;直接就想到了权值线段树(本蒟蒻不会更高级的数据结构了)&#xff0c;权值线段树维护区间中数…

Python编写BC260Y TCP数据收发压力测试脚本

Python编写BC260Y TCP数据收发压力测试脚本 使用BC260Y的TCP AT命令发送数据时&#xff0c;能够在数据中带有’\r\n’&#xff08;回车换行&#xff09;&#xff0c;而其他模组会将’\r\n’当做AT命令处理的结束符&#xff0c;例如EC800E&#xff0c;为了验证TCP数据中带有’\r…

Zoom iOS 转录例子

一、在zoom marketplace创建通用app&#xff0c;zoom-recall 详见Zoom会议机器人转写例子-CSDN博客 二、mac下按照Xcode&#xff0c;创建APP项目meetingbot4ios 三、本实用的SDK为MobileRTC&#xff0c;即Meeting SDK的iOS版本 四、依赖如下&#xff1a; MobileRTC和Crypto…

Swift-UITableView列表动态设置高度,根据不同的内容长度,设置heightForRowAt

此篇文章主要阐述如何利用swift语言&#xff0c;实现返回内容不同长度文本的高度&#xff0c;比如第一个列表文字1行&#xff0c;只需要50像素高度&#xff0c;第二个列表文字超出了1行&#xff0c;如2行&#xff0c;那么就自动调整这个单元文本的高度&#xff1b; 用MVC实现&…