ChatGLM2-6B的P-Tuning微调

news2025/4/5 16:59:03

ChatGLM2-6B：https://github.com/THUDM/ChatGLM2-6B
模型地址：https://huggingface.co/THUDM/chatglm2-6b

详细步骤同：ChatGLM-6B的P-Tuning微调详细步骤及结果验证

环境可复用ChatGLM-6B（上述部署教程），即

Python 3.8.10
CUDA Version: 12.0
torch                2.0.1
transformers         4.27.1

注：ChatGLM2-6B官网给的环境P-Tuning微调报错

AttributeError: ‘Seq2SeqTrainer’ object has no attribute 'is_deepspeed_enabl
torch.distributed.elastic.multiprocessing.errors.ChildFailedError:

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/721219.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

简要介绍 | 知识蒸馏：轻量级模型的智慧之源

注1：本文系“简要介绍”系列之一，仅从概念上对知识蒸馏进行非常简要的介绍，不适合用于深入和详细的了解。知识蒸馏：轻量级模型的智慧之源 A Gentle Introduction to Hint Learning & Knowledge Distillation | by LA Tran | …

Some about RMI

（备份防止忘掉） 一开始编译javac所有文件这个问题概率遇到解决方法： 然后java编译impl文件直到出现bound in registry这一句然后这个cmd不要关掉重新在eclipse这个类的工作路径打开一个cmd 看到这个之后回到eclipse里面运行app这个文…

数据结构--树的性质

数据结构–树的性质树的常考性质常见考点 1 : 结点数总度数 1 \color{red}常见考点1:结点数总度数1 常见考点1:结点数总度数1 结点的度 ―― 结点有几个孩子(分支) 树的度 ―― 各结点的度的最大值 m叉树 ―― 每个结点最多只能有m个孩子的树常见考点 2 : 度为 m 的树、…

MySQL安装以及体系结构

1.简述mysql体系结构 MySQL 最重要、最与众不同的特性是它的存储引擎架构，这种架构的设计将查询处理 （Query Processing）及其他系统任务（Server Task）和数据的存储/提取相分离。这种处理和存储分离的设计可以在使用时…

【简单认识LVS及LVS-NAT负载均衡群集的搭建】

文章目录一、LVS群集简介1、群集的含义2、性能扩展方式3、群集的分类4、负载均衡群集架构1、负载均衡的结构 5、三种负载调度工作模式1、NAT模式2、TUN模式3、DR模式二、LVS虚拟服务器1、Linux Virtual Server简介2、启用LVS虚拟服务3、LVS调度算法（1）…

YoloV5/YoloV7改进---注意力机制:高斯上下文变换器GCT，性能优于ECA、SE等注意力模块 | CVPR2021

目录 1.GCT介绍实验结果 2.GCT引入到yolov5 2.1 加入common.py中： 2.2 加入yolo.py中： 2.3 yolov5s_GCT.yaml 2.4 yolov5s_GCT1.yaml 1.GCT介绍论文：https://openaccess.thecvf.com/content/CVPR2021/papers/Ruan_Gaussian_Context_Tra…

Spring源码解析(二)：bean容器的创建、默认后置处理器、扫描包路径bean

Spring源码系列文章 Spring源码解析(一)：环境搭建 Spring源码解析(二)： 目录一、Spring源码基础组件1、bean定义接口体系2、bean工厂接口体系3、ApplicationContext上下文体系二、AnnotationConfigApplicationContext注解容器1、创建bean工厂-beanFa…

计算机网络概述（三）

常见的计算机网络体系结构 OSI体系结构： 物理层→数据链路层→网络层→运输层→会话层→表示层→应用层 TCP/IP体系结构： 网络接口层→网际层→运输层→应用层一般用户的设备都有TCP/IP协议用于连接因特网，TCP/IP的网络接口层并没有规定使用…

Linux基础+html和script一些基本语法

文章目录 linux 基础名字含义指令 html 语法style 样式属性样式标签属性颜色margin 边距ransform 旋转角度重复样式opacity 透明度div 方块元素box-shadow 阴影属性浮动 script获取节点onclick 点击触发setTimeout 定时器利用定时器实现动画效果 javascript强弱语言区分parseI…

简单详细的MySQL数据库结构及yum和通用二进制安装mysql的方法

目录 mysql体系结构mysql的安装方法一，yum安装1，首先下载一个网络源仓库：2，然后安装 mysql-community-server3，启动mysqld 服务4，然后登录数据库5，初次登录要设置密码，而且不能太简单…

小型电子声光礼花器电子烟花爆竹电路设计

节日和庆典时燃放礼花，其绚丽缤纷的图案，热烈的爆炸声、欢乐的气氛，能给人们留下美好的印象，但有一定的烟尘污染和爆炸危险隐患。本电路可以模拟礼花燃放装置，达到声型兼备的效果，给人们在安全、环保的环境…

dict结构 dictEntry即键值对，每个桶就是dictEntry连接的链表 typedef struct dictEntry {void *key;union {void *val; // 自定义类型uint64_t u64;int64_t s64;double d;} v;struct dictEntry *next; } dictEntry;数据真正指向的地方 typedef struct dictht {di…

京东网站登录二维码显示不出来

环境： 360急速浏览器 Win10专业版问题描述： 京东网站登录二维码显示不出来解决方案： 1.打开安全卫士 2.功能大全找到断网急救箱 3.全面诊断一下有问题修复一下，重启浏览器解决

数字迷宫：探秘统计位数为偶数的奇妙世界

本篇博客会讲解力扣“1295. 统计位数为偶数的数字”的解题思路，这是题目链接。统计位数是偶数的数据个数，关键在于如何统计一个整数的位数。方法是：对于一个整数n，每次/10，都会缩小一位，所以一直进行/10操…

【爬虫】AOI

目前几个大厂，高德百度腾讯，都支持POI爬取，而AOI是需要自己找接口的。换言之，爬虫需谨慎 1 百度AOI 参考链接是： 这两个链接是选定范围爬取范围内选定类别的AOI 黑科技 | 百度地图抓取地块功能（上&#x…

DeepSpeed-Chat 打造类ChatGPT全流程笔记二之监督指令微调

文章目录系列文章0x0. 前言0x1. 🐕 Supervised finetuning (SFT) 教程翻译🏃 如何训练模型🏃 如何对SFT checkpoint进行评测?💁 模型和数据☀️来自OPT-1.3B及其SFT变体（使用不同微调数据）的提示示例☀️…

关于layui实现按钮点击添加行的功能

关于layui实现按钮点击添加行的功能实现效果代码实现 <!DOCTYPE html> <html lang"zh" xmlns:th"http://www.thymeleaf.org"> <head><meta charset"UTF-8"><title>Title</title><link rel"styl…

帅气的头像-InsCode Stable Diffusion 美图活动一期

1.运行地址 Stable Diffusion 模型在线使用地址： https://inscode.csdn.net/inscode/Stable-Diffusion 界面截图： 2.模型版本及相关配置模型：chilloutmix-Ni.safetensor [7234b76e42] 采样迭代步数（steps）: 30 采样…

QtDesigner的使用

QtDesigner的使用 1、快速入门2、布局管理 1、快速入门主窗口菜单栏、工具栏、状态栏快捷预览方式，工具箱对象查看器属性编辑器英文名作用objectName控件对象名称geometry相对坐标系sizePolicy控件大小策略minnimumSize最小宽度、高度maximumSize最大宽度…

基于jsp+Servlet+mysql学生信息管理系统V2.0

基于jspServletmysql学生信息管理系统V2.0 一、系统介绍二、功能展示1.项目骨架2.数据库表3.项目内容4.登陆界面5.学生-学生信息6、学生-修改密码7、管理员-学生管理8、管理员-添加学生9.管理员-修改学生信息10.管理员-班级信息11.管理员-教师信息四、其它1.其他系统实现五.获…