初探大模型微调

news2024/11/18 15:44:19

目标:低成本微调大模型,拥有属于自己的AI助手。
一切的一切,都得益于LoRA、QLoRA微调方法,没有A100一样可以微调大模型(用3090 24G显存微调70亿参数的baichuan绰绰有余,甚至参数量小一点的模型3060也能跑)。具体原理可以看论文,或者去看知乎上的总结,这里只谈怎么用。

这里,有一个极其方便的大模型项目推荐:Github传送地址,打开即用,然后我在这个基础上做一些小小小改动。

下面介绍一下微调的步骤:
实验在Linux上进行,先用conda创建一个虚拟环境:baichuan,要求python版本3.8,pytorch版本1.13.0,CUDA Toolkit11.7,装完长这样:
在这里插入图片描述

pytorch仍然推荐用whl安装,不知道怎么装可以看看我这篇博客关于pytorch安装的部分,传送地址

Step1: 运行conda activate baichuan进入环境

conda activate baichuan

Step2: 克隆Firefly仓库并进入项目文件夹中,安装项目必要依赖

git clone https://github.com/noob-dqt/QLoRA_baichuan.git
cd QLoRA_baichuan
pip install -r requirements.txt

Step3: 可以前往huggingface下载baichuan-7B模型,下载后模型文件位于baichuan-inc/baichuan-7B中,其中包含预训练模型,模型配置参数,特定的分词器等文件,项目文件夹里有baichuan-inc/baichuan-7B这个目录,不过里面的模型文件被我删除了,下载直接覆盖这个文件夹就行,或者单独把下载后的模型文件复制到baichuan-inc/baichuan-7B/下也可以。没用魔法的话官网很慢,这里提供一种比较快的方法,运行:

pip install modelscope
python
from modelscope.hub.snapshot_download import snapshot_download
snapshot_download('../baichuan-inc/baichuan-7B', cache_dir='../baichuan-inc')

Step4: 准备训练数据集,在这里选用了Firefly提供的数据集moss-003-sft-data(下载地址),其来源于复旦大学MOSS项目,包含大量中文训练对话,考虑训练设备、时长限制,可以从数据集中采样部分对话作为训练集,其中,训练数据文件为jsonl,以如下形式组织:

{
    "conversation_id":44,
    "category":"Brainstorming",
    "conversation":[
        {
            "human":"怎么高效学习英语?",
            "assistant":"想要高效学习英语可以通过以下几个…"},
        {
            "human":"对于初学者来说,如何快速掌握英语?",
            "assistant":"以下是几个建议,可以帮助初学者快速掌…"}
		],
}

PS:选用任何想用的数据集,不过格式都必须和上面一样,后缀是jsonl,Firefly里本身也有一个简单的小数据集(几条对话)供测试。

Step5: 编辑配置训练参数,主要是修改配置文件baichuan-qlora.json,位于文件夹finetune中(你不用其他模型可以不改)。

Step6: 编写文件训练入口文件train_qlora.py,不用修改

Step7: 开始训练,若使用3090设备进行训练,使用下面命令设置两个环境变量,否则会报错

export NCCL_P2P_DISABLE="1"
export NCCL_IB_DISABLE="1"

训练,启动!

torchrun --nproc_per_node=2 train_qlora.py --train_args_file finetune/baichuan-qlora.json

在这里使用了两张显卡进行训练,根据卡的数量修nproc_per_node。

Step7: 训练结束后,需要将Adapter与基座模型进行权重合并。Adapter的权重保存到了output_dir设置的目录这里是output/baichuan-7b/中,使用merge.py脚本获得合并后的模型权重,合并后模型文件位于checkpoint文件夹下。

Step8: 编写测试脚本。模型可支持多轮对话,主要原理即通过在限制上下文长度的范围内,将历史对话保存,并在新提问产生时进行拼接,使用拼接后的问题作为模型输入进行推理,从而达到对话的记忆功能,回答更加个性化。加载合并后模型文件,使用轻量库tkinter编写一个简洁的对话界面方便使用,脚本名为ChatMulti.py,对提问进行推理并将结果返回到界面。

这里面基本上不需要做改动,影响训练的是配置文件baichuan-qlora.json,这里也基本没改,用的就是Firefly中的参数。

{
    "output_dir": "./output/baichuan-7b",
    "model_name_or_path": "baichuan-inc/baichuan-7B",
    "train_file": "./data/moss.jsonl",	# 改成自己训练数据文件路径
    "num_train_epochs": 1,
    "per_device_train_batch_size": 6,
    "gradient_accumulation_steps": 2,
    "learning_rate": 2e-4,
    "max_seq_length": 900,
    "logging_steps": 300,
    "save_steps": 500,
    "save_total_limit": 1,
    "lr_scheduler_type": "constant_with_warmup",
    "warmup_steps": 3000,
    "lora_rank": 64,
    "lora_alpha": 16,
    "lora_dropout": 0.05,
    "gradient_checkpointing": true,
    "disable_tqdm": false,
    "optim": "paged_adamw_32bit",
    "seed": 42,
    "fp16": true,
    "report_to": "tensorboard",
    "dataloader_num_workers": 0,
    "save_strategy": "steps",
    "weight_decay": 0,
    "max_grad_norm": 0.3,
    "remove_unused_columns": false
}

目录结构长这样子:
在这里插入图片描述

本文整理了包括知乎、CSDN在内的很多网络资源,在此鸣谢各位博主,如果有侵权的地方可以联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1338388.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于电商场景的高并发RocketMQ实战-Broker写入读取流程性能优化总结、Broker基于Pull模式的主从复制原理

🌈🌈🌈🌈🌈🌈🌈🌈 【11来了】文章导读地址:点击查看文章导读! 🍁🍁🍁🍁🍁🍁&#x1f3…

Windows实现MySQL5.7主从复制(详细版)

使用免安装版本(官网下载地址) 在Windows上安装两种MySQL服务并同时开启服务 1.下载配置 打开解压文件所在位置,就新建一个配置文件my.ini。 2.主库安装 主库的my.ini配置文件如下: [mysqld] #设置主库端口,注意须是…

UDP信号多个电脑的信息传输测试、配置指南

最近要做一个东西,关于一个软件上得到的信号,如何通过连接的局域网,将数据传输出去。我没做过相关的东西,但是我想应该和软件连接数据库的过程大致是差不多的,就一个ip和一个端口号啥的。 一.问题思路 多个设备同时连…

释放创造力的终极工具——Adobe Photoshop 2022 Mac/win

作为全球最受欢迎的图像处理软件,Adobe Photoshop一直是专业设计师和摄影师的首选工具。而最新推出的Adobe Photoshop 2022更是在功能和性能上迈出了重要的一步,为用户提供了更强大、更便捷的创作体验。 首先,Adobe Photoshop 2022引入了许多…

html table可编辑表格数据实现删除

这里教大家使用纯html和js脚本结合实现删除表格数据 <!DOCTYPE html> <html> <head><style>table {border-collapse: collapse;width: 100%;}th, td {border: 1px solid black;padding: 8px;text-align: left;}</style> </head> <body…

5G阅信应用场景有哪些?

5G阅信的应用场景非常广泛&#xff0c;以下是一些常见的应用场景&#xff1a; 1.工业自动化&#xff1a;5G阅信可以连接各种工业设备和传感器&#xff0c;实现设备之间的实时通信和控制&#xff0c;提高生产效率和自动化水平。 2.物联网和智能家居&#xff1a;5G阅信可以连接各…

【每日一题】LeetCode206.反转链表

个人主页&#xff1a;白日依山璟 专栏&#xff1a;Java|数据结构与算法|每日一题 文章目录 1. 题目描述示例1示例2示例3提示 2. 思路3.代码 1. 题目描述 给你单链表的头节点 head &#xff0c;请你反转链表&#xff0c;并返回反转后的链表。 示例1 输入&#xff1a;head [1…

文件夹改名方法:文件夹随机重命名的实用技巧,轻松管理

在日常生活和工作中&#xff0c;会遇到大量的文件夹要处理和管理。方便查找或分类&#xff0c;要对文件夹进行重命名。如果手动一个个重命名不仅耗时&#xff0c;还容易出错。现在一起来看看云炫文件管理器如何批量随机重命名文件夹&#xff0c;掌握这些技巧能更加轻松地应对工…

idea自动注释

前言 保存一下自己的自动注释代码 idea自动注释 前言1 创建类时&#xff0c;自动生成注释2 在方法上使用快捷键生成注释3 使用方法4 效果图 1 创建类时&#xff0c;自动生成注释 如下&#xff1a; #if (${PACKAGE_NAME} && ${PACKAGE_NAME} ! "")package …

SParC数据集介绍

导语 SParC是Text-to-SQL领域的一个多轮查询数据集。本篇博客将对该数据集论文和数据格式进行简要介绍。 SParC数据集概述 SParC是一个跨领域的多轮Text-to-SQL数据集。它包含有4298个问题轮次&#xff0c;大约有12k的自然语言问句到SQL标注的Question-SQL对。这些问题来自于…

【Python终端报错】“python.exe: can‘t open file”【及解决方法】

一、问题描述 如下图&#xff0c;在PyCharm中使用自带的Python终端运行源代码文件时&#xff0c;提示出错&#xff1a; D:\Program Files\Python3.10.0\python.exe: can’t open file ‘D:\Desktop\Python Security Chapter 4\Whois’: [Errno 2] No such file or directory 翻…

Winserver上如何配置和开启NTP客户端进行时间同步

场景 Winserver 2012 服务器&#xff0c;需要与其它服务器保持时间一致。 已知NTP服务器的ip,在winserver 服务器上如何进行配置和开启。 注&#xff1a; 博客&#xff1a;霸道流氓气质_C#,架构之路,SpringBoot-CSDN博客 实现 1、运行-输入 gpedit.msc 打开组策略管理器…

个性化定制的知识付费小程序,为用户提供个性化的知识服务,知识付费saas租户平台

明理信息科技知识付费saas租户平台 在当今数字化时代&#xff0c;知识付费已经成为一种趋势&#xff0c;越来越多的人愿意为有价值的知识付费。然而&#xff0c;公共知识付费平台虽然内容丰富&#xff0c;但难以满足个人或企业个性化的需求和品牌打造。同时&#xff0c;开发和…

c++学习笔记(13)-左值和右值

一、左值与右值 啥是左值和右值呢&#xff1f; 左值&#xff1a;在内存有确定存储地址、有变量名&#xff0c;表达式结束依然存在的值&#xff0c;简单来说左值就是非临时对象。 右值&#xff1a;就是在内存没有确定存储地址、没有变量名&#xff0c;表达式结束就会销毁的值&…

1764程控直流电源

1764程控直流电源 交流输入电压范围&#xff1a;100&#xff5e;242Vac 在自动测试环境中提供偏置和对部件或最终产品提供激励的理想设备 国产思仪电源 01 产品综述 1764程控直流电源是在自动测试环境中提供偏置和对部件或最终产品提供激励的理想设备。其广泛应用于民用测…

无线路由器DHCP导致网络故障一例

多个DHCP故障 这几天公司网络很难用&#xff0c;也不知道原因。通过路由器的检测功能&#xff0c;领导截图如下&#xff1a; 故障解决 其实解决办法也很简单&#xff0c;就是关闭设备排查。结果发现是一个无线路由器导致的。进入路由器管理界面&#xff0c;关闭DHCP即可。 反思…

SAP PP BAPI 成本收集器的操作

成本收集器常见用tcode:KKF6n 删除标记也是在这里操作 那业务提出批量打删除标记的事务代码却是没有&#xff0c;预研一下 SAP 关于成本收集器的BAPI KOSA KK_F_PKOSA_AUTHORITY KK_F_PKOSA_COPY KK_F_PKOSA_CREATE KK_F_PKOSA_DISPLAY KK_F_PKOSA_FILL KK_F_PKOSA_FIND KK…

华为——使用ACL限制内网主机访问外网网站示例

组网图形 图1 使用ACL限制内网主机访问外网网站示例 ACL简介配置注意事项组网需求配置思路操作步骤配置文件 ACL简介 访问控制列表ACL&#xff08;Access Control List&#xff09;是由一条或多条规则组成的集合。所谓规则&#xff0c;是指描述报文匹配条件的判断语句&#…

如何使用iframe嵌套跨域类型的网址?

本章教程&#xff0c;主要介绍一下&#xff0c;如何利用iframe嵌套一些存在跨域性的问题。 这里我们以百度首页网址进行举例说明。 如果我们直接嵌套百度的首页地址&#xff0c;如下 <!DOCTYPE html> <html lang"en"><head><meta charset"…

基于 OV2640 的以太网 RGMII 图像传输系统设计

相关文章: (1)千兆以太网网络层 ARP 协议的原理与 FPGA 实现 (2)千兆以太网硬件设计及链路层 MAC 协议格式 (3)CRC校验原理及实现 (4)RGMII 与 GMII 转换电路设计 (5)千兆以太网网络层 IP 协议介绍与 IP 校 验和算法实现 (6)千兆以太网传输层 UDP 协议原理与 FPGA…