【ChatGLM】大模型之 ChatGLM 微调

news2025/4/28 13:39:56

目录

1. 微调方法

2. 全量参数微调

3. P-tuning v2

4. LoRA

1. 微调方法

全参数微调

对模型全量参数进行训练。

P-tunning v2

前缀微调，在模型每一层都增加前缀，只训练这部分的参数，训练量明显小于全量微调。

LoRA

基于矩阵分解的微调，假设原权重喂 W_0，我们新增一个和 W_0 一摸一样形状的矩阵 W_delta，并且对 W_delta 分解为 A 和 B，在训练过程中只训练 A 和 B 的参数，最后的权重 W = W_0 + W_delta

2. 全量参数微调

代码下载见：

【ChatGLM】大模型之 ChatGLM 部署

### full parameter finetuning ### (need enough GPU, at least 4 A100) 
cd ptuning
sh ds_train_finetune.sh

3. P-tuning v2

代码下载见：

【ChatGLM】大模型之 ChatGLM 部署

### p-tuning v2 ###
# dataset
cd ptuning
wget https://cloud.tsinghua.edu.cn/seafhttp/files/802c9912-2742-47c9-a0d3-18ee08d83438/AdvertiseGen.tar.gz
tar -xvf AdvertiseGen.tar.gz

# modify model path and other parameter
sh train.sh

4. LoRA

### LoRA ###
git clone https://github.com/yuanzhoulvpi2017/zero_nlp.git
git clone https://huggingface.co/yuanzhoulvpi/chatglm6b-dddd

cd zero_nlp/simple_thu_chatglm6b
# execute jupyter notebook
# load model and lora need 24G, training need 17G
code02_训练模型全部流程.ipynb

执行 Juputer Notebook 后

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/850530.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

记录线上一次mysql只能查询，不能插入或更新的bug

记录线上一次mysql只能查询，不能插入或更新的bug

错误复现突然有一天产品通知xx服务不可用，想着最近也没有服务更新，就先排查一下服务日志使用postman测试的时候请求明显超时，查看日志显示是一个锁的问题使用工具连接到mysql，查看information_schema.INNODB_TRX,发现有一个事…

阅读更多...

flink+kafka+doris+springboot集成例子

flink+kafka+doris+springboot集成例子

目录一、例子说明 1.1、概述 1.1、所需环境 1.2、执行流程二、部署环境 2.1、中间件部署 2.1.1部署kakfa 2.1.1.1 上传解压kafka安装包 2.1.1.2 修改zookeeper.properties 2.1.1.3 修改server.properties 2.1.1.3 启动kafka 2.1.2、部署flink 2.1.2.1 上传解压f…

阅读更多...

LabVIEW开发高压配电设备振动信号特征提取与模式识别

LabVIEW开发高压配电设备振动信号特征提取与模式识别

LabVIEW开发高压配电设备振动信号特征提取与模式识别矿用高压配电设备是井下供电系统中的关键设备之一，肩负着井下供配电和供电安全的双重任务，其工作状态直接影响着井下供电系统的安全性和可靠性。机械故障占配电总故障的70%。因此，机械故…

阅读更多...

论文浅尝 | 面向多步推理任务专业化较小语言模型

论文浅尝 | 面向多步推理任务专业化较小语言模型

笔记整理：张沈昱，东南大学硕士，研究方向为自然语言处理链接：https://github.com/FranxYao/FlanT5-CoT-Specialization 动机本文的动机是探索如何在多步推理任务中通过大型语言模型提升较小的语言模型的性能。作者认为&#xff0…

阅读更多...

hive 字段注释乱码

hive 字段注释乱码

hive 字段注释乱码: 在mysql中运行： alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;OK

阅读更多...

Nginx与docker配置安装

Nginx与docker配置安装

目录： Nginx的安装配置： 1、安装依赖包： 2、下载Nginx安装包： 3、解压Nginx压缩包： 4、配置Nginx编译环境： 5、编译并安装Nginx： 6、安装完Nginx后，可以切换到Nginx的安装目录…

阅读更多...

对任意类型数都可以排序的函数：qsort函数

对任意类型数都可以排序的函数：qsort函数

之前我们学习过冒泡排序： int main() {int arr[] { 9,7,8,6,5,4,3,2,1,0 };int sz sizeof(arr)/sizeof(arr[0]);int i 0;for (i 0; i < sz-1; i) {int j 0;for (j 0; j < sz-1-i; j) {if (arr[j] > arr[j 1]){int temp 0;temp arr[j];arr[j] ar…

阅读更多...

中间件多版本冲突的4种解决方案和我们的选择

中间件多版本冲突的4种解决方案和我们的选择

背景在小小的公司里面，挖呀挖呀挖。最近又挖到坑里去了。一个稳定运行多年的应用，需要在里面支持多个版本的中间件客户端；而多个版本的客户端在一个应用里运行时会有同名类冲突的矛盾。在经过询问chatGPT，百度，googl…

阅读更多...

深度补全算法-CompletionFormer-已开源效果最好

深度补全算法-CompletionFormer-已开源效果最好

《CompletionFormer: Depth Completion with Convolutions and Vision Transformers 》摘要给定稀疏深度和相应的 RGB 图像，深度补全旨在整个图像中空间传播稀疏测量值，以获得密集的深度预测。尽管基于深度学习的深度补全方法取得了巨大进步&#xff0…

阅读更多...

NAND Flash 失效之 Data Rentention | 闪存数据保持力 | 数据放几年就坏掉了？

NAND Flash 失效之 Data Rentention | 闪存数据保持力 | 数据放几年就坏掉了？

依公知及经验整理，原创保护，禁止转载。专栏《深入理解Flash:闪存特性与实践》图1： Data Retention 对 Vt 电压分布影响图片来源：知乎 [2] 全文 1900 字，内容摘要 Data Retention 产生 Data Retention 的影响因素　如何规避 Data Rention 问题发生Data Retent…

阅读更多...

Vue + VSCode + 浏览器显示乱码

Vue + VSCode + 浏览器显示乱码

浏览器乱码： 将GBK改为UTF-8: 欧克:

阅读更多...

领航优配：沪指震荡涨0.47%，保险、券商板块强势，互联金融概念活跃

领航优配：沪指震荡涨0.47%，保险、券商板块强势，互联金融概念活跃

4日早盘，两市股指高开高走，沪指一度涨逾1%打破3300点，随后涨幅有所收窄；两市半日成交超6000亿元，北向资金小幅净流入。截至午间收盘，沪指涨0.47%报3295.91点，深成指涨0.67%，创业板指…

阅读更多...

CrossOver是什么软件 CrossOver软件好用吗

CrossOver是什么软件 CrossOver软件好用吗

CrossOver是一款由CodeWeavers公司开发的软件，它可以在Mac和Linux等操作系统上运行Windows软件，而无需在计算机上安装Windows操作系统。这款软件的核心技术是Wine，它是一种在Linux和macOS等操作系统上运行Windows应用程序的开源软件。本文将会…

阅读更多...

github pages 用法详解发布自己的网站

github pages 用法详解发布自己的网站

github pages 基础用法 URL 规则假设你的 github 帐号为 mygithub，需要发布的仓库名为 myrepo，那么 pages 的 URL 为： https://mygithub.github.io/myrepo 添加内容用任意编辑器写好（或者生成）标准的网页内容&a…

阅读更多...

【QT调用ST-link-使用QT编写程序-调用ST-LINK_CLI.exe-烧写STM32F4xxx-基础样例】

【QT调用ST-link-使用QT编写程序-调用ST-LINK_CLI.exe-烧写STM32F4xxx-基础样例】

【QT结合ST-link，使用QT编写程序，调用ST-LINK_CLI.exe,烧写STM32F4xxx-基础样例】 1、前言2、实验环境3、先前了解-自我总结4、实验过程（0）硬件连接与供电（1）安装&使用STM32 ST-LINK Utility&#xff0…

阅读更多...

骑士牛（BFS）

骑士牛（BFS）

题面 john用他的一头母牛和Don先生交换了一头“骑士牛”。这头牛有一个独特的能力——在牧场中能像中国象棋中的马一样跑跳（会中国象棋吗？不会？注意：本题不考虑马被“蹩脚”的情况）。当然，这头牛不能跳到岩…

阅读更多...

Flutter：文件读取—— video_player、chewie、image_picker、file_picker

Flutter：文件读取—— video_player、chewie、image_picker、file_picker

前言简单学习一下几个比较好用的文件读取库 video_player 简介用于视频播放官方文档 https://pub-web.flutter-io.cn/packages/video_player 安装 flutter pub add video_player加载网络视频 class _MyHomePageState extends State<MyHomePage> {// 控制器late…

阅读更多...

uniapp 将标题背景更换背景图片完美解决（附加源码+实现效果图）

uniapp 将标题背景更换背景图片完美解决（附加源码+实现效果图）

问题描述今天拿到小程序的设计效果图后，标题部分背景需要加背景图片，以往我做的都是标题背景更换颜色等，加背景图片还是第一次遇到，大家可以先看下我的效果图是否与你遇到的问题一致！ 首页标题的背景是个背景图片。 …

阅读更多...

MachineLearningWu_13/P60-P64_Tensorflow

MachineLearningWu_13/P60-P64_Tensorflow

P60-P64的学习目录如下， x.1 TF网络模型实现以一个简单的TF的分类网络为例，将模型翻译成框架下的语义，即如右侧所表达的。当然上面对于分类网络的解释是一个简洁的解释，我们来进行更加具象的了解一下。左边是机器学习的三步骤&…

阅读更多...

RS485实验

RS485实验

RS485实验介绍 RS485采用差分信号进行传输，半双工通信。RS485是一个总线，在同一总线上最多可以挂接32个节点。通信流程简单理解为默认为接收状态，发送数据时切换为发送状态，数据发送完毕后切换为接收状态。发送和接收分别由一个…

阅读更多...

推荐文章

最新文章