大模型微调学习

大模型微调学习

news2026/4/7 5:31:23

用好大模型的层次：1. 提示词工程(prompt engineering); 2. 大模型微调(fine tuning)
为什么要对大模型微调： 1. 大模型预训练成本非常高； 2. 如果prompt engineering的效果达不到要求，企业又有比较好的自有数据，能够通过自由数据，更高的提升大模型在特定领域的能力
大模型微调的两个方案：全量微调（full fine tunning） ; 部分参数微调（parameter - effictient fine tuning）
全量微调的问题：1. 参数量和预训练相同，消耗大量资源； 2. 灾难性遗忘
常见的模型微调路线：1. 监督式微调SFT( Supervised Fine Tuning); 2. 基于人类反馈的强化学习微调RLHF(把人类的反馈通过强化学习的方式，引入到大模型的微调中)； 3. 基于AI反馈的强化学习微调RLAIF（人类反馈成本高）

从成本和效果角度考虑：PEFT是目前业界比较流行的微调方案

Prompt Tuning: 在输入序列X之前，增加特定长度的特殊Token，发生在Enbedding环节
Prefix Tuning: 在transformer的encoder和decoder的网络中都加入特定前缀
LoRA
QLoRA 量化的LoRA：量化的核心目标是降低成本，降低训练成本，特别是降低后期的推理成本

Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning

比较高效的finetuning方法包括adaptor, prefix-tuning, LoRA
adaptor
在这里插入图片描述
prefix-tunning

浅层特征通用性强，深层特征与具体任务的关联性强
在这里插入图片描述

finetuning扮演的角色：

拿到新数据集后，想要用预训练模型处理的时候，会首先将最后一层全连接层打开，其余层冻结(transfer learning)，看预训练模型在新数据上的效果怎么样，先摸个底，如果效果可以，就考虑打开更多的层，进行fine tuning
如果新的数据集和预训练数据集差别很大，一方面考虑从头训练，另一方面考虑打开更多的层，或干脆用预训练模型的参数作为初始值，对模型进行完整的训练

模型微调方式

固定一部分模型
固定全部预训练模型，添加可训练head
使用预训练模型推理过程，将数据处理为特征和标签，使用新的特征数据和标签，训练小的head，去进行下游任务(优点：数据特征提取一次可永久使用，特征提取结束后，下游任务和预训练模型无关，除了推理时需要将原有图片处理为特征外)

模型全调方式

加载预训练模型为模型初始权重，重训练

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1088909.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

IOS17 轻松签全能签还能不能用？多开能否使用？升级后微信底栏消失怎么办？BY：后厂村路灯

IOS17 轻松签全能签还能不能用？多开能否使用？升级后微信底栏消失怎么办？BY：后厂村路灯

从iphone15还没出就有小伙伴们追着问， 到现在也有人一直再问iOS17能不能用，看来换手机的人很多呀。这里统一回答一下：“iOS17苹果签名可以用，多开也可以用”但是还是有些地方注意。如果你是16系统直接升级刀17就可以&#xff…

阅读更多...

20.1CubeMx配置FMC控制SDRAM【W9825G6KH-6】

20.1CubeMx配置FMC控制SDRAM【W9825G6KH-6】

本文使用stm32h723zgt6的fmc驱动sdram，实现内存扩展 sdram型号W9825G6KH-6 原理图： MCU引脚与SDRAM对应关系引脚说明： SDRAM引脚： DQ[15:0]:数据线；数据位宽16 A[12:0]:地址线；行地址A[0:12]&#xff…

阅读更多...

10月13日丨第十六届智慧城市大会《实景三维技术创新与应用》论坛日程抢先看！

10月13日丨第十六届智慧城市大会《实景三维技术创新与应用》论坛日程抢先看！

第十六届智慧城市大会智慧城市是数字中国、智慧社会的核心载体，是数字时代城市发展的高级形态。由中国服务贸易协会中国测绘学会、中国遥感委员会主办的第十六届智慧城市大会，将以“数实融合开放创新智引未来为主题，邀请行业主管单位和智慧…

阅读更多...

【UE 插件】UE4 虚幻引擎插件开发（带源码插件打包、无源码插件打包）有这一篇文章就够了！！！

【UE 插件】UE4 虚幻引擎插件开发（带源码插件打包、无源码插件打包）有这一篇文章就够了！！！

目录 0 引言1 快速入门1.1 新建插件的前提1.2 创建插件步骤1.3 打包插件 2 无源代码的插件制作3 插件详细介绍3.1 插件的使用方法3.1 UE 预置插件模版3.1.1 空白3.1.2 纯内容3.1.3 编辑器独立窗口3.1.4 编辑器工具栏按钮3.1.5 编辑器模式3.1.6 第三方库3.1.7 蓝图库 3.2 插件中…

阅读更多...

milvus和相似度检索

milvus和相似度检索

流程 milvus的使用流程是创建collection -> 创建partition -> 创建索引(如果需要检索) -> 插入数据 -> 检索这里以Python为例, 使用的milvus版本为2.3.x 首先按照库， python3 -m pip install pymilvus Connect from pymilvus import connections c…

阅读更多...

Java初学者容易犯的错误,Java程序员必须知道的学习路线

Java初学者容易犯的错误,Java程序员必须知道的学习路线

万事开头难，java 编程的初学者常常会遇到各种各样的问题。对于自学的读者来说，则是需要花费更多的时间、精力来解决这些问题，而且一旦遇到的问题几天都得不到解决，往往会带来很大的挫败感。所以本节介绍一些初学者经常出现的错误…

阅读更多...

Flutter笔记：电商中文货币显示插件Money Display

Flutter笔记：电商中文货币显示插件Money Display

Flutter笔记电商中文货币显示插件 Money Display 作者：李俊才 （jcLee95）：https://blog.csdn.net/qq_28550263 邮箱 ：291148484163.com 本文地址：https://blog.csdn.net/qq_28550263/article/details/1338…

阅读更多...

Windows--CMD命令输出文件夹所有文件列表目录

Windows--CMD命令输出文件夹所有文件列表目录

GIF动图如下补充说明

阅读更多...

【数据结构】什么是线性表?

【数据结构】什么是线性表?

🦄个人主页:修修修也 🎏所属专栏:数据结构 ⚙️操作环境:Visual Studio 2022 目录线性表的定义生活中常见的线性表结语线性表的定义线性结构的特点: 在数据元素的非空有限集中: 存在唯一的一个被称作"第一个"的数据元素;存在唯一的一个…

阅读更多...

Linux系统编程_文件编程第1天：打开、写入、读取、关闭文件等编程

Linux系统编程_文件编程第1天：打开、写入、读取、关闭文件等编程

1. 文件编程概述（399.1） 内容超多： 文件系统原理及访问机制文件在内核中的管理机制什么是文件信息节点inode文件的共享文件权限，各种用户对其权限。。。。。。应用为王，如： 账单游戏进度配置文件等关心如…

阅读更多...

WEditor的安装和使用

WEditor的安装和使用

WEditor 编辑器能够提供辅助编写脚本，查看组件信息，调试代码等功能。 Screenshot 安装依赖项目 Python3.6 uiautomator2facebook-wda Only tested in Google Chrome, IE seems not working well. pip3 install -U weditor # uiautomator2, faceboo…

阅读更多...

龙迅LT86102UXE HDMI2.0转二路HDMI2.0/1.4，支持音频剥离，支持4K60HZ

龙迅LT86102UXE HDMI2.0转二路HDMI2.0/1.4，支持音频剥离，支持4K60HZ

龙迅LT86102UXE 1.描述： 龙迅 LT86102UXE HDMI2.0 分路器具有符合 HDMI2.0/1.4 规范的 1：2 分路器、最大 6Gbps 高速数据速率、自适应均衡 RX 输入和预加重 TX 输出（用于支持长电缆应用）、内部 TX 通道交换以实现灵活的 PCB…

阅读更多...

天眼查最新方式工商信息爬取（公开信息）

天眼查最新方式工商信息爬取（公开信息）

本章教程，主要介绍利用python效率提取天眼查公开工商信息。官网地址：天眼查-商业查询平台_企业信息查询_公司查询_工商查询_企业信用信息系统教程仅供参考，请勿滥用，由此带来的法律责任，需由自己承担。 1、数据预览 2、程序代码 #!/usr/bin/python # -*- coding: UTF-…

阅读更多...

vue3结合elemplent-plus组件初始化选择日期范围

vue3结合elemplent-plus组件初始化选择日期范围

实现的效果： 在使用时踩了个坑，耽搁了俩小时时间，气人！！！！ 注意： 1.获取上个月时间时必须使用正确的时间格式去获取，在获取时间的时候不能操作-等 2.获取到的时间必须…

阅读更多...

物联网AI MicroPython传感器学习之 HX711称重传感器

物联网AI MicroPython传感器学习之 HX711称重传感器

学物联网，来万物简单IoT物联网！！ 一、产品简介下图是一款量程为5kg的称重传感器，采用悬臂梁方式安装。传感器主体结构是一个开孔金属条，金属条上下表面各贴有两个应变电阻，当金属条受力发生变形时时&…

阅读更多...

接口测试如何高效管理接口文档 !

接口测试如何高效管理接口文档 !

痛点如果你负责测试的项目是一个前后端分离的项目。回忆下是不是有如下场景: 某个项目开发完成,接口文档发布在了 swagger 上,前后端各自进行开发。此时你负责这个项目的服务端测试。首先进行接口测试,熟练的打开 postman 导入 swagger 文档,然后开始进行接口测试。接口…

阅读更多...

自动化办公篇之python

自动化办公篇之python

1、如果没有安装xlwings库，先在控制台pip install xlwings,然后点击运行，创建四个空excel表。 import xlwings as xw app xw.App(visibleTrue,add_bookFalse) for dept in ["技术部","销售部","运营部","财务部&q…

阅读更多...

2023年中国渔业研究报告

2023年中国渔业研究报告

第一章行业概况 1.1 定义渔业，作为全球经济的重要支柱之一，其核心活动包括捕捞、水产养殖、产品加工与销售等。其不仅是食物安全的重要保障，还是许多沿海和内陆地区经济发展的重要动力。首先，捕捞活动是渔业的基础。通过海洋…

阅读更多...

中国走向碳中和：零碳联盟的关键角色

中国走向碳中和：零碳联盟的关键角色

随着近期联合国大会上主席宣布的中国碳中和目标，国家的低碳转型和绿色可持续发展再次成为焦点。面对这样的国家大政方针，不少企业和机构纷纷响应，其中零碳联盟的努力与成果更是备受瞩目。零碳联盟，作为中国投资协会联合多家机构…

阅读更多...

微信小程序生成海报

微信小程序生成海报

效果： js1: const cloudHelper = require(../../../helper/cloud_helper.js);async function config1({cover,title,desc,qr,bg = }) {var qr1 ="images/qr.png"var qr2 ="https://636c-cloud1-0gu29f2j63906b7e-1319556650.tcb.qcloud.la/activitycomm/setu…

阅读更多...

推荐文章

最新文章