大模型学习与实践笔记（七）

news2025/4/7 16:05:32

一、环境配置

1.平台：

Ubuntu + Anaconda + CUDA/CUDNN + 8GB nvidia显卡

2.安装

# 构建虚拟环境
conda create --name xtuner0.1.9 python=3.10 -y 

# 拉取 0.1.9 的版本源码
git clone -b v0.1.9  https://github.com/InternLM/xtuner

# 从源码安装 XTuner
pip install -e '.[all]'

3.模型下载

# 安装modelscope库
pip install modelscope

# 从 modelscope 下载下载模型文件
apt install git git-lfs -y
git lfs install
git lfs clone https://modelscope.cn/Shanghai_AI_Laboratory/internlm-chat-7b.git -b v1.0.3

4.数据集下载

数据集链接：https://huggingface.co/datasets/timdettmers/openassistant-guanaco/tree/main

5.拷贝模型配置文件到当前目录

`# xtuner copy-cfg ${CONFIG_NAME} ${SAVE_PATH}`

本次实践拷贝文件为：

xtuner copy-cfg internlm_chat_7b_qlora_oasst1_e3 .

数据集与配置文件准备完成后的文件目录：

二、修改配置文件并进行微调

1.配置文件修改

# 修改模型为本地路径
- pretrained_model_name_or_path = 'internlm/internlm-chat-7b'
+ pretrained_model_name_or_path = './internlm-chat-7b'

# 修改训练数据集为本地路径
- data_path = 'timdettmers/openassistant-guanaco'
+ data_path = './openassistant-guanaco'

其他超参数：

2.开始微调

# 训练：
xtuner train ${CONFIG_NAME_OR_PATH}

# 也可以增加 deepspeed 进行训练加速：
xtuner train ${CONFIG_NAME_OR_PATH} --deepspeed deepspeed_zero2

# 后台加速运行
nohup xtuner train ./internlm_chat_7b_qlora_oasst1_e3_copy.py --deepspeed deepspeed_zero2 >>./train.log 2>&1 &

3. 将训练后的模型转为HuggingFace 模型

mkdir hf
export MKL_SERVICE_FORCE_INTEL=1

xtuner convert pth_to_hf ./internlm_chat_7b_qlora_oasst1_e3_copy.py ./work_dirs/internlm_chat_7b_qlora_oasst1_e3_copy/epoch_3.pth ./hf

三、部署与测试

1. 将 HuggingFace adapter 合并到大语言模型

# xtuner convert merge \
#     ${NAME_OR_PATH_TO_LLM} \
#     ${NAME_OR_PATH_TO_ADAPTER} \
#     ${SAVE_PATH} \
#     --max-shard-size 2GB

# 示例：
xtuner convert merge ./internlm-chat-7b ./hf ./merged --max-shard-size 2GB

2.与合并后的模型对话

xtuner chat ./merged --prompt-template internlm_chat

默认是float 16格式加载模型，如果需要设置4bit量化加载

# 4 bit 量化加载
# xtuner chat ./merged --bits 4 --prompt-template internlm_chat

3. 运行demo

四、微调InternLM-Chat-7B 模型修改模型身份认知

1.训练过程截图

2.训练结束后截图

3.gradio部署截图

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1399108.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

大模型学习与实践笔记（七）

一、环境配置

1.平台：

2.安装

3.模型下载

4.数据集下载

5.拷贝模型配置文件到当前目录

二、修改配置文件并进行微调

1.配置文件修改

2.开始微调

3. 将训练后的模型转为HuggingFace 模型

三、部署与测试

1. 将 HuggingFace adapter 合并到大语言模型

2.与合并后的模型对话

3. 运行demo

四、微调InternLM-Chat-7B 模型修改模型身份认知

1.训练过程截图

2.训练结束后截图

3.gradio部署截图

相关文章

python爬取图片（thumbURL和html文件标签分别爬取）

typing python 类型标注学习笔记

tcp/ip协议2实现的插图，数据结构7 (27 - 章)

【AI Superman workshop】AI excel类工具体验

CVPR 2023 Hybrid Tutorial: All Things ViTs之DINO attention map

Windows 11 UEFI引导修复的方法有哪些？

红队打靶练习:W34KN3SS: 1

接口测试遇到500报错？别慌，你的头部可能有点问题

SSE[Server-Sent Events]实现页面流式数据输出(模拟ChatGPT流式输出)

idea上传本地项目到gitlab

（学习日记）2024.01.19

C和指针课后答案

ISA Server 2006部署网站对比nginx

全网最详细丨2024年AMC8真题及答案来了

基于JavaWeb+SSM+Vue基于微信小程序的网上商城系统的设计和实现

应届生必读：Java真实项目的开发流程和常用工具

Helm Dashboard — Kubernetes 中管理 Helm 版本的 GUI

鸿蒙 HarmonyOS ArkTS ArkUI 动画中心扩展、向下扩展、纵向扩展

二叉树基础oj题目

（C语言）编译和链接

大模型学习与实践笔记（七）

一、环境配置

1.平台：

2.安装

3.模型下载

4.数据集下载

5.拷贝模型配置文件到当前目录

二、修改配置文件并进行微调

1.配置文件修改

2.开始微调

3. 将训练后的模型转为HuggingFace 模型

三、部署与测试

1. 将 HuggingFace adapter 合并到大语言模型

2.与合并后的模型对话

3. 运行demo

四、微调InternLM-Chat-7B 模型 修改模型身份认知

1.训练过程截图

2.训练结束后截图

3.gradio部署截图

相关文章

四、微调InternLM-Chat-7B 模型修改模型身份认知