快速训练自己的大语言模型：基于LLAMA-7B的lora指令微调

news2026/2/10 7:22:59

目录

1. 选用工程：lit-llama
2. 下载工程
3. 安装环境
4. 下载LLAMA-7B模型
5. 做模型转换
6. 初步测试
7. 为什么要进行指令微调？
8. 开始进行指令微调
- 8.1. 数据准备
- 8.2 开始模型训练
- 8.3 模型测试

前言：

系统：ubuntu 18.04
显卡：A100-80G（蹭的，嘿嘿~）
（本次主要记录如何快速进行大模型的指令微调）

1. 选用工程：lit-llama

地址：https://github.com/Lightning-AI/lit-llama

2. 下载工程

git clone https://github.com/Lightning-AI/lit-llama.git

3. 安装环境

切换到工程目录

cd ./lit-llama

使用pip安装依赖库

pip install -r requirements.txt

（当然，这里可能会遇到网络问题，安装不了lightning）
可使用以下方式安装：

下载lightning工程
解压进入工程目录，使用以下命令安装
```
python setup.py install
```
查看lightning是否安装成功：
```
pip list|grep lightning
```
（这里注意lightning的版本是2.1.0）

4. 下载LLAMA-7B模型

这里我们要基于LLAMA-7B做指令微调，所以要先下载模型权重，并作一系列转换。

切换到 lit-llama 所在位置，使用以下命令下载权重：

python scripts/download.py --repo_id openlm-research/open_llama_7b --local_dir checkpoints/open-llama/7B

（文件有点大，需要等待一些时间）

下载完毕之后，会得到如下的文件：

5. 做模型转换

还是切换到 lit-llama 所在位置，使用以下指令进行转换

python scripts/convert_hf_checkpoint.py --checkpoint_dir checkpoints/open-llama/7B --model_size 7B

转换完毕之后，在 lit-llama/checkpoints/lit-llama/7B 位置，会得到大小为26G左右的 lit-llama.pth 文件，在上一级目录（lit-llama/checkpoints/lit-llama）还有一个tokenizer.model文件

6. 初步测试

在命令行，使用如下命令运行：

 python generate.py --prompt "Today is a"

在这里插入图片描述

使用中文测试，发现效果不好（开始胡说八道了~）

7. 为什么要进行指令微调？

因为原始的预训练LLAMA模型是一个大语言模型（废话~），会根据前面的单词预测下一个词语，如果你问它问题，它不会正确回答你，你问它一个问题，它可能会续写一些跟你一样的句子，例如，
Prompt为 “What is the capital of China?”，它的回复如下所示：

8. 开始进行指令微调

8.1. 数据准备

这里使用alpaca的52k指令数据进行微调，使用如下指令：
```
python scripts/prepare_alpaca.py
```
如果下载不下来的话，我们直接打开scripts/prepare_alpaca.py文件，如下所示：
直接打开链接 https://raw.githubusercontent.com/tloen/alpaca-lora/main/alpaca_data_cleaned_archive.json，然后全选页面复制，再保存到新建的文件里。
得到alpaca_data_cleaned_archive.json（看名字的clean应该是清洗过的），每条指令包含"instruction"、“input”、"output"三个关键字，本次先不具体展开讲解，如下所示：
运行指令后，还会作数据划分，train-49759, val-2000如下所示：
最后，会在lit-llama/data/alpaca路径下得到以下文件：

8.2 开始模型训练

使用以下指令：
```
python finetune/lora.py
```
训练过程如下所示:
整个训练过程大约要1.5个小时（16:51 ~ 18:22）
训练完毕之后，会在out/lora/alpaca得到一系列lora的权重文件，如下图所示：

8.3 模型测试

使用如下指令进行提问，其中prompt为"what is the capital of China?"，
```
python generate/lora.py --prompt "what is the capital of China?"
```
得到的结果如下所示
可以看到，经过指令微调之后，模型已经可以正常回答我们的问题了。

（ps：其他细节可以参考工程的README，写的很清楚~）

结束。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/693074.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

大数据ETL工具对比（Sqoop, DataX, Kettle）

大数据ETL工具对比（Sqoop, DataX, Kettle）

前言在实习过程中，遇到了数据库迁移项目，对于数据仓库，大数据集成类应用，通常会采用ETL工具辅助完成，公司和客户使用的比较多的是Sqoop, DataX和Kettle这三种工具。简单的对这三种ETL工具进行一次梳理。 ETL工具&…

阅读更多...

无法更新iPhone，提示“无法检查更新”怎么办？

无法更新iPhone，提示“无法检查更新”怎么办？

当我们需要 iPhone更新系统时，可以前往iPhone设置-通用-软件更新中获取更新推送。不过一些用户可能会遇到无法更新的问题，例如会提示“无法检查更新，检查软件更新时出错”。以上情况可能是网络问题，可以尝试重新打开设置&#xf…

阅读更多...

vue2实现公式规则编辑校验弹窗功能

vue2实现公式规则编辑校验弹窗功能

文章目录需求描述技术栈最终效果演示功能实现逻辑拆分代码目录结构实现思路光标实现底部单个符号或字段结构设计监听键盘事件&处理光标公式规则校验总结需求描述需要一个弹窗，弹窗内部需要能够进行公式规则的配置并进行公式规则合法性校验。技术栈 vue2e…

阅读更多...

Thymeleaf的常用语法

Thymeleaf的常用语法

🌟 Thymeleaf的常用语法 Thymeleaf是一个Java模板引擎，用于处理HTML、XML、JavaScript、CSS等文件。它可以与Spring框架无缝集成，为Web应用程序提供优雅的模板解决方案。本文将介绍Thymeleaf的常用语法，包括th属性、表达式、内置…

阅读更多...

Spring Boot 中的 @RestController 注解，如何使用

Spring Boot 中的 @RestController 注解，如何使用

Spring Boot 中的 RestController 注解在 Spring Boot 中，我们经常需要编写 RESTful Web 服务，以便于客户端与服务器之间的通信。为了简化 RESTful Web 服务的开发，Spring Boot 提供了 RestController 注解，它可以让我们更方便地…

阅读更多...

Jmeter实现参数加密

Jmeter实现参数加密

目录一、使用__digest自带函数以md5加密算法演示使用方法二、在BeanShell 中使用JAVA代码实现算法加密规避BUG的方法 JMeter有两种方法可以实现算法加密一、使用__digest自带函数参数说明： Digest algorithm：算法摘要，可输入值&a…

阅读更多...

如何避免在处理数据时出现错误？

如何避免在处理数据时出现错误？

介绍当业务运营管道中发生大量事情时，数据输入任务的优先级往往较低。但是，数据输入被认为是所有行业部门中经常发生的最重要的任务之一。从销售数据到客户分析，从财务数据到库存管理，每项工作都依赖于数据输入，这意…

阅读更多...

前端vue入门(纯代码)16

前端vue入门(纯代码)16

【18.如何在Vue中配置代理服务器】 vue脚手架配置代理总结：修改了vue.config.js文件后必须重启项目【npm run serve】方法一在vue.config.js中添加如下配置： devServer:{proxy:"http://localhost:5000" }说明： 优点&#…

阅读更多...

家政上门预约小程序；

家政上门预约小程序；

家政上门预约小程序开发是一款本地生活类服务上门预约系统，覆盖家政保洁、保姆月嫂、上门维修、管道疏通、上门安装等各种到家服务。可以帮助创业者在不需要相关技术人员及大量资金投入的情况下，就能够轻松搭建并运营一个上门家政服务平台。那么开发一…

阅读更多...

【零基础入门学习Python---Python错误处理和异常保姆级教程】

【零基础入门学习Python---Python错误处理和异常保姆级教程】

🚀 Python 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持，因为它具有很高的价值，算法就是这样✨ 🌲 作者简介：硕风和炜，…

阅读更多...

【图像处理OpenCV(C++版)】——5.3 图像平滑之均值平滑(滤波)

【图像处理OpenCV(C++版)】——5.3 图像平滑之均值平滑(滤波)

前言： 😊😊😊欢迎来到本博客😊😊😊 🌟🌟🌟 本专栏主要结合OpenCV和C来实现一些基本的图像处理算法并详细解释各参数含义，适用于平时学习、工作快…

阅读更多...

Flutter学习四：Flutter开发基础（一）Widget

Flutter学习四：Flutter开发基础（一）Widget

目录 0 引言 1 Widget 简介 1.1 Widget 概念 1.2 Widget 接口 1.3 Flutter中的四棵树 1.4 StatelessWidget 1.4.1 简介 1.4.2 Context上下文 1.5 StatefulWidget 1.6 State 1.6.1 简介 1.6.2 State生命周期 1.7 在 widget 树中获取State对象 1.7.1 通过Context…

阅读更多...

详解如何使用nvm管理Node.js多版本

详解如何使用nvm管理Node.js多版本

目录 NVM进行NodeJS多版本管理背景安装步骤 1. 下载nvm安装包 2. 安装nvm 使用步骤下载nodejs 切换版本nodejs 编辑常用命令 NVM进行NodeJS多版本管理背景有的时候开发环境需要多个NodeJS的版本，这个时候就可以用NVM进行管理。安装步骤 1. 下载n…

阅读更多...

9 从0开始学PyTorch | 过拟合欠拟合、训练集验证集、关闭自动求导

9 从0开始学PyTorch | 过拟合欠拟合、训练集验证集、关闭自动求导

这一小节在开始搞神经网络之前，我们先熟悉几个概念，主要还是把模型训练的流程打通。过拟合和欠拟合我们在日常的工作中，训练好的模型往往是要去评价它的准确率的，通过此来判断我们的模型是否符合我的要求。几个可能的方案是&…

阅读更多...

国外学位论文去哪里查找下载

国外学位论文去哪里查找下载

查找下载国外博士论文最合适的文献数据库就是ProQuest学位论文全文数据库。 ProQuest学位论文全文数据库覆盖了大部分北美地区高等院校以及世界其他地区数千个高等院校每年获得通过的博硕士论文。是将ProQuest公司PQDD文摘库（现名PQDT）中适合中国科研人…

阅读更多...

Windows 11 22H2 中文版、英文版 (x64、ARM64) 下载 (updated Jun 2023)

Windows 11 22H2 中文版、英文版 (x64、ARM64) 下载 (updated Jun 2023)

Windows 11 绕过 TPM 方法总结，通用免 TPM 镜像下载 (2023 年 6 月更新) 在虚拟机、Mac 电脑和 TPM 不符合要求的旧电脑上安装 Windows 11 的通用方法总结请访问原文链接：https://sysin.org/blog/windows-11-no-tpm/，查看最新版。原创作品…

阅读更多...

nuxt3 多级动态路由

nuxt3 多级动态路由

需求： 写法： 对应文件目录 pages\product\[class]\[brand]\[SPU].vue pages/ --| product/ ----| [class] ------| [brand] --------| [SPU].vue script 内跳转方法 const router useRouter() const nuxtApp useNuxtApp()const jumpSPU () >…

阅读更多...

caffeine和google-guava cache缓存使用详解和源码介绍

caffeine和google-guava cache缓存使用详解和源码介绍

google-guava cache 1.pom引入其依赖 <dependency><groupId>com.google.guava</groupId><artifactId>guava</artifactId><version>20.0</version></dependency> 2.具体使用 com.google.common.cache.LoadingCache<Strin…

阅读更多...

【selenium】问题记录

【selenium】问题记录

1、驱动和浏览器版本不一致报错：selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 106 问题原因： chrome版本114，Chromedriver版本106 …

阅读更多...

机器学习之深度神经网络

机器学习之深度神经网络

目录卷积神经网络与全连接神经网络前向后向传播推导通用手写体识别模型人脸识别模型电影评论情感分析模型卷积神经网络与全连接神经网络卷积神经网络（Convolutional Neural Network，CNN）和全连接神经网络（Fully Conn…

阅读更多...

推荐文章

最新文章