ChatGLM-6b的微调与推理

news2024/11/20 12:32:26

基于ChatGLM-6B的推理与部署

1.使用git clone命令ChatGLM项目地址,将项目clone到本地。
2.下载ChatGLM-6B模型文件

【注意】运行下面代码的时候,要将源代码中的模型文件路径改成自己的地址,不然会报错!!!

运行以下代码可以在命令行中与ChatGLM进行交互式的对话

python cli_demo.py

在这里插入图片描述
在这里插入图片描述
运行以下代码可以在网页与ChatGLM进行交互式的对话

python web_demo.py

在这里插入图片描述

微调

①从仓库中下载微调的项目

git clone https://github.com/mymusise/ChatGLM-Tuning.git

在这里插入图片描述

②配置环境

conda create -n torch1.13 python==3.8
conda activate torch1.13
pip install bitsandbytes==0.37.1
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116
pip install accelerate==0.17.1
pip install tensorboard==2.10
pip install protobuf==3.19.5
pip install transformers==4.27.1
pip install icetk
pip install cpm_kernels==1.0.11
pip install datasets==2.10.1
pip install git+https://github.com/huggingface/peft.git # 最新版本 >=0.3.0.dev0

③下载ChatGLM模型地址
在这里插入图片描述
④数据处理

python cover_alpaca2jsonl.py \
--data_path data/alpaca_data.json \
--save_path data/alpaca_data.jsonl \

⑤运行 tokenize_dataset_rows.py 文件
【注】这里需要把tokenize_dataset_rows.py 中的model_name改为自己ChatGLM的地址。
【报错】在这里插入图片描述
解决方法

pip install pyarrow==6.0.0
python tokenize_dataset_rows.py \
--jsonl_path data/alpaca_data.jsonl \
--save_path data/alpaca \
--max_seq_length 200 \
--skip_overlength False \

⑥微调
【注】这里需要把finetune.py 中的模型地址改为自己ChatGLM的地址。

python finetune.py \
--dataset_path data/alpaca \
--lora_rank 8 \
--per_device_train_batch_size 1 \
--gradient_accumulation_steps 1 \
--max_steps 52000 \
--save_steps 1000 \
--save_total_limit 2 \
--learning_rate 1e-4 \
--fp16 True \
--remove_unused_columns false \
--logging_steps 50 \
--output_dir output;

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1017487.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

destoon自定义一个archiver内容文档

在archiver目录建立以下代码&#xff1a; <?php define(DT_REWRITE, true); require ../common.inc.php; $EXT[archiver_enable] or dheader(DT_PATH); //$DT_BOT or dheader(DT_PATH); $N $M $T array(); $mid or $mid 5; $vmid $list 0; foreach($MODULE as $k>…

微服务保护-授权规则

个人名片&#xff1a; 博主&#xff1a;酒徒ᝰ. 个人简介&#xff1a;沉醉在酒中&#xff0c;借着一股酒劲&#xff0c;去拼搏一个未来。 本篇励志&#xff1a;三人行&#xff0c;必有我师焉。 本项目基于B站黑马程序员Java《SpringCloud微服务技术栈》&#xff0c;SpringCloud…

【JUC】Java并发编程从挖坑到入土全解(2)

目录 我们锁的到底是什么&#xff08;8个案例&#xff09; 案例1 案例2 案例3 案例4 案例5 案例6 案例7 案例8 总结 我们锁的到底是什么&#xff08;8个案例&#xff09; 有a、b两个线程&#xff0c;我们基于如下代码进行改造&#xff1a; public static void main…

数据结构---二叉搜索树

二叉搜索树 二叉搜索树什么是二叉搜索树&#xff1f; 二叉搜索树的操作查找插入删除 源代码非递归版 二叉搜索树 什么是二叉搜索树&#xff1f; 二叉搜索树(Binary Search Tree 简称BST)又称二叉排序树&#xff0c;是一种二叉树的特殊形式&#xff0c;它在每个节点上存储的键…

动态规划-货币问题

动态规划-货币问题 题目一 arr是货币数组&#xff0c;其中的值都是正数。再给定一个正数aim。每个值都认为是一张货币&#xff0c;即便是值相同的货币也认为每一张都是不同的&#xff0c;返回组成aim的方法数。例如 : arr { 1,1,1 }&#xff0c;aim 2&#xff0c;第0个和第…

C++之std::monostate应用实例(二百二十一)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 人生格言&#xff1a; 人生…

安卓恶意应用识别(三)(批量反编译与属性值提取)

前言 上篇说到对安卓APK反编译&#xff0c;本篇实现批量反编译和批量特征提取及计算&#xff0c;主要就是通过python代码与cmd进行批量化交互&#xff0c;我在写文章之前&#xff0c;尝试批量下载了安卓apk&#xff08;大约10来个&#xff09;&#xff0c;发现现在这个应用软件…

基于SSM的珠宝首饰交易平台

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

GMAC PHY介绍

1.1PHY接口发展 &#xff08;1&#xff09;MII支持10M/100Mbps&#xff0c;一个接口由14根线组成&#xff0c;它的支持还是比较灵活的&#xff0c;但是有一个缺点是因为它一个端口用的信号线太多。参考芯片&#xff1a;DP83848 、DM900A&#xff08;该芯片内部集成了MAC和PHY接…

义乌购yiwugo根据ID取商品详情 API 接口系列,可测试

义乌购是义乌市场官方网站&#xff0c;以义乌市场为核心&#xff0c;覆盖全国小商品产业带优质供应商&#xff0c;提供一手货源&#xff0c;品类丰富&#xff0c;在线商品达500万&#xff0c;涉及玩具、饰品、工艺品、日用百货等26个大类。同时提供线上线下对应&#xff0c;交易…

线上论坛之性能测试

使用loadrunner进行简单性能测试&#xff1a;针对用户登录、发布帖子、点赞帖子、修改帖子内容、修改用户名、退出等功能进行简单的性能测试。 然后在实现的过程中&#xff0c;插入集合点以及事务等&#xff0c;并通过设置来实现用户的并发操作。 创建Vuser脚本。在自动化脚本中…

FIR数字滤波器设计及MATLAB实现

摘要&#xff1a;FIR数字滤波器是数字信号处理中得重要组成部分。本文主要介绍了利用MATLAB软件采用窗函数法设计符合指标的FIR数字滤波器。该方法也是窗函数法设计FIR数字滤波器的一般方法。 一、设计目的 MATLAB是一款功能强大的软件&#xff0c;它将数值分析、矩阵计算、科…

使用python实现短线选股

经常做短线的朋友都知道&#xff0c;选股是个较为复杂的工作&#xff0c;尤其是像我们这种非职业选手&#xff0c;下面就分享一些通过python实现选股的思路。 股票信息获取 炒短线离不开龙虎榜&#xff0c;我们先来通过龙虎榜来进行股票选择 url https://applhb.longhuvip…

深入网络底层,了解Linux系统收发网络数据包的过程、原理、流程,附图文说明

深入网络底层&#xff0c;了解Linux系统收发网络数据包的过程、原理、流程&#xff0c;附图文说明。 Linux 服务器收到网络数据包&#xff0c;需要经过哪些处理&#xff0c;一步步将数据传给应用进程的呢&#xff1f;应用进程发送数据包时&#xff0c;Linux 又是如何操作将数据…

【Rust日报】2023-09-15 RustRover:JetBrains单行版Rust IDE

RustRover&#xff1a;JetBrains单行版Rust IDE 深入了解 RustRover 的公共预览版&#xff0c;这是我们专为 Rust 开发人员设计的新 IDE&#xff01;体验其先进功能&#xff0c;并根据您的反馈帮助塑造其未来。现在就成为第一批探索它的人吧&#xff01; X post: https://x.com…

智能家居产品公司网站源码,自适应布局设计,带完整演示数据

适合各类智能家居电子产品使用的网站源码&#xff0c;深色大气设计&#xff0c;自适应布局设计&#xff0c;pc手机均可完美适配&#xff0c;带完整演示数据。 独家原创资源。源码是asp开发的&#xff0c;数据库是access&#xff0c;主流的虚拟主机空间都支持asp&#xff0c;直…

2.数据分析报告制作

文章目录 2. 数据分析报告制作2.1 &#xfeff;产品基础信息2.2 产品生命周期2.4 产品发展情况2.4 核心业务逻辑【重点】2.5潜在运营可能2.6 用戶决策流程2.7 典型用户场景 2. 数据分析报告制作 2.1 &#xfeff;产品基础信息 产品介绍 今日头条是一款基于用户和信息数据挖掘的…

多输入多输出 | MATLAB实现CNN-BiGRU卷积双向门控循环单元多输入多输出

多输入多输出 | MATLAB实现CNN-BiGRU卷积双向门控循环单元多输入多输出 目录 多输入多输出 | MATLAB实现CNN-BiGRU卷积双向门控循环单元多输入多输出预测效果基本介绍程序设计往期精彩参考资料 预测效果 基本介绍 MATLAB实现CNN-BiGRU卷积双向门控循环单元多输入多输出&#xf…

Truenas scale 配置 TrueChart zerotier

起源 Official zerotier 总是在系统重启或者服务重启后&#xff0c;会丢失之前配置的IP等信息&#xff0c;使用&#xff0c;转投 TrueChart zerotier 步骤 TrueChart 官方步骤&#xff0c;按这个配置完还是不能使用&#xff0c;需要后续设置。 添加TrueChart步骤到应用库的步…

pickle反序列化RCE分析

pickle反序列化 一. pickle模块1.1 什么是pickle模块1.2 常用函数1.3 魔术方法 二. 例题[[BUUOJ]HFCTF 2021 Final]2.1 题目分析2.2 payload 三. opcode编写3.1 为什么要用到opcode3.2 什么是opcode3.3 常见的指令符3.4 opcode执行原理3.5 R指令被禁绕过3.6 构造示例3.7 一些ti…