书生·浦语大模型（学习笔记-9）大模型微调的相关概念预训练与微调全量微调FFT 与 PEFT的区别

书生·浦语大模型（学习笔记-9）大模型微调的相关概念预训练与微调全量微调FFT 与 PEFT的区别

news2025/4/9 12:22:13

目录

一、什么是大模型微调

二、指令微调

三、微调的目的

三、微调的方式

四、微调的步骤

五、微调数据准备

六、微调的数据质量

一、什么是大模型微调

预训练和微调的区别，这个很关键

二、指令微调

这个地方主要是微调的角度不同，简单理解：前一个是相当于直接修改大模型的参数，后一个是更加精确的回答问题，让回答的泛化（其他内容的拓展）更少

三、微调的目的

四个问题对应四个目的

三、微调的方式

全量微调FFT：一般指全参数的微调（全量微调），指是一类较早诞生的微调方法，全参数微调需要消耗大量的算力，实际使用起来并不方便（其实就是第二部分的大模型微调）

PEFT：特指部分参数的微调方法，这种方法算力功耗比更高，也是目前最为常见的微调方法，比如lora微调、Prefix-Tuning、Prompt Tuning、P-Tuning v2等方法（就是第二部分的指令微调）

四、微调的步骤

主要步骤比较关键

这里主要是微调的数据（集）相关

五、微调数据准备

数据（集）直接决定了模型的最终效果。当然数据是什么样的取决于你的需求，你将收集、整理什么样的数据（集）。

六、微调的数据质量

数据（集）的质量直接反应在微调的效果上

七、微调结果评价

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1632007.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

（学习日记）2024.04.20：UCOSIII第四十八节：各文件功能概览

（学习日记）2024.04.20：UCOSIII第四十八节：各文件功能概览

之前的章节都是针对某个或某些知识点进行的专项讲解，重点在功能和代码解释。回到最初开始学μC/OS-III系统时，当时就定下了一个目标，不仅要读懂，还要读透，改造成更适合中国宝宝体质的使用方式。在学完野火的教程后&a…

阅读更多...

leetcode-包含min函数的栈-93

leetcode-包含min函数的栈-93

题目要求题目思路 1.设计上两个栈，第一个栈s1里面正常存储插入进来的数据，s2里面只存储s1里面最小的那个数据。 2.对于push函数，所有新来的value都需要在s1中插入，s2中，如果s2为空，那么也直接插入&#x…

阅读更多...

基于Springboot+Vue的Java项目-火车票订票系统开发实战(附演示视频+源码+LW)

基于Springboot+Vue的Java项目-火车票订票系统开发实战(附演示视频+源码+LW)

大家好！我是程序员一帆，感谢您阅读本文，欢迎一键三连哦。 💞当前专栏：Java毕业设计精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &am…

阅读更多...

Docker | 入门：安装与配置

Docker | 入门：安装与配置

Docker | 入门：安装与配置 Docker 和传统虚拟机区别对于传统虚拟机： 虚拟出一套硬件，运行一个完整的操作系统，并在这个操作系统上安装和运行软件。对于 Docker: 将一个个容器隔离开。容器内的应用直接运行在宿主机的内容&am…

阅读更多...

牛客NC242 单词搜索【中等递归DFS C++/Java/Go/PHP】

牛客NC242 单词搜索【中等递归DFS C++/Java/Go/PHP】

题目题目链接： https://www.nowcoder.com/practice/987f2981769048abaf6180ed63266bb2 思路递归：以word第一个字符为起点，在矩阵中递归搜索，检查是否存在完整的word路径， 注意恢复现场，又叫回溯&#…

阅读更多...

OmniReader Pro for Mac：强大且全面的阅读工具

OmniReader Pro for Mac：强大且全面的阅读工具

OmniReader Pro for Mac是一款专为Mac用户设计的强大且全面的阅读工具，它集阅读、编辑、管理等多种功能于一身，为用户提供了卓越的阅读体验。 OmniReader Pro for Mac v2.9.5激活版下载该软件支持多种文件格式的阅读，包括PDF、Word、Excel、…

阅读更多...

基础款：Dockerfile 文件

基础款：Dockerfile 文件

# bash复制代码# 使用 Node.js 16 作为基础镜像 # 指定一个已经存在的镜像作为模版，第一条必须是from FROM node:16# 将当前工作目录设置为/app # WORKDIR /app# 方法一：用dockerfile命令：进行下载打包文件 # 将 package.json 和 package-loc…

阅读更多...

简单易懂的下载学浪视频教程- 小浪助手

简单易懂的下载学浪视频教程- 小浪助手

接下来我就教大家如何通过小浪助手，轻松下载你想要下载的学浪app视频首先准备好小浪助手工具我已经打包好了，有需要的自己取一下学浪下载器链接：https://pan.baidu.com/s/1djUmmnsfLEt_oD2V7loO-g?pwd1234 提取码：1234 -…

阅读更多...

【机器学习】集成学习---Bagging之随机森林（RF）

【机器学习】集成学习---Bagging之随机森林（RF）

【机器学习】集成学习---Bagging之随机森林（RF） 一、引言1. 简要介绍集成学习的概念及其在机器学习领域的重要性。2. 引出随机森林作为Bagging算法的一个典型应用。二、随机森林原理1. Bagging算法的基本思想2. 随机森林的构造3. 随机森林的工作机制三…

阅读更多...

【kettle006】kettle访问华为openGauss高斯数据库并处理数据至execl文件

【kettle006】kettle访问华为openGauss高斯数据库并处理数据至execl文件

1.一直以来想写下基于kettle的系列文章，作为较火的数据ETL工具，也是日常项目开发中常用的一款工具，最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下华为openGauss高斯数据库相关知识体系 3.欢迎批评指正，跪谢…

阅读更多...

格瑞威特 | 邀您参加2024全国水科技大会暨技术装备成果展览会

格瑞威特 | 邀您参加2024全国水科技大会暨技术装备成果展览会

—— 展位号：A13 —— 企业介绍北京格瑞威特环保设备有限公司成立于2009年，是专业从事设计、研发、销售智能加药计量泵、在线水质分析仪表、便携式水质分析仪表、流量计、液位计、阀门、搅拌机、烟气报警仪、加药装置等各类水处理设备及配件的OEM供服…

阅读更多...

一、初识VUE

一、初识VUE

Vue Vue (读音 /vjuː/，类似于 view) 是一套用于构建用户界面的渐进式框架。与其它大型框架不同的是，Vue 被设计为可以自底向上逐层应用。Vue 的核心库只关注视图层，不仅易于上手，还便于与第三方库或既有项目整合。另一方面&…

阅读更多...

滑块验证码破解----Java使用opencv后端破解滑块验证

滑块验证码破解----Java使用opencv后端破解滑块验证

使用技术:Java SpringBootopenCV 在windows上首先需要下载opencv进行安装,先去官网:Releases - OpenCV 下载这个windows版本的安装包下载后直接安装解压就行,然后需要,然后找到安装位置里的这个文件: 你下载的是什么版本的,这里的数字就是多少,比如我下载4.5.3版本那么这…

阅读更多...

【CANoe示例分析】TCP Chat(CAPL) with TLS encription

【CANoe示例分析】TCP Chat(CAPL) with TLS encription

1、工程路径 C:\Users\Public\Documents\Vector\CANoe\Sample Configurations 15.3.89\Ethernet\Simulation\TLSSimChat 在CANoe软件上也可以打开此工程：File|Help|Sample Configurations|Ethernet - Simulation of Ethernet ECUs|Basic AUTOSAR Adaptive（SOA） 2、示例目…

阅读更多...

嘉楠堪智 CanMV K230 的 CanMV-IDE 环境与 MicroPython 编程

嘉楠堪智 CanMV K230 的 CanMV-IDE 环境与 MicroPython 编程

嘉楠推出了 CanMV IDE 开发环境，可以使用 MicroPython 开发针对 CanMV K230 的各种程序，同时也提供了大量的例子程序，方便使用者学习。嘉楠开发者社区，给出了详细的 CanMV K230 教程，可以借以快速上手。目录固件…

阅读更多...

【Java难点】多线程终极

【Java难点】多线程终极

悲观锁和乐观锁悲观锁 synchronized关键字和Lock的实现类都是悲观锁。它很悲观，认为自己在使用数据的时候一定有别的线程来修改数据，因此在获取数据的时候会一不做二不休的先加锁，确保数据不会被别的线程修改。适合写操作多的场景&…

阅读更多...

船用组装式中央空调案例

船用组装式中央空调案例

船用组装式空调的整体介绍 1.1 装置的主要技术数据及配套设备规格该轮采用的是船用组装式空调装置。 1.1.1 空调装置 1）型号：CJKR-116船用组装式空调装置；2）制冷型式：直接蒸发式；3）制冷量&…

阅读更多...

【汇编】#6 80x86指令系统其二（串处理与控制转移与子函数）

【汇编】#6 80x86指令系统其二（串处理与控制转移与子函数）

文章目录一、串处理指令1. 与 REP 协作的 MOVS / STOS / LODS的指令1.1 重复前缀指令REP1.2 字符串传送指令（Move String Instruction）1.2 存串指令（Store String Instruction）1.3 取字符串指令（Load String Instruct…

阅读更多...

VULHUB复现fastjson1.2.24反序列化漏洞

VULHUB复现fastjson1.2.24反序列化漏洞

蚌埠住了，遇到了很多奇奇怪怪的问题。如果你问我为啥不用kali，我会告诉你，我电脑上的kali装不成docker-compose!我急用了ubuntu如果你问我为啥用ubuntu克隆，我会告诉你，我电脑上的kali不能安装成功java8这个版本如果你…

阅读更多...

一二三应用开发平台使用手册——系统管理-权限项模块-使用说明

一二三应用开发平台使用手册——系统管理-权限项模块-使用说明

权限项概述在RBAC模型中，资源、角色、用户三个关键元素，构成权限体系。资源是权限控制的对象，因此常称之为权限项。平台中所有的权限项进行集中管理，菜单、按钮、请求、分组等通过类型进行区分，实体与库表公用&a…

阅读更多...

推荐文章

最新文章