VisualGLM训练缺失latest文件问题解决

news2024/12/23 13:10:15

清华已经公布了VisualGLM 模型,图像预测也取得了比较好的效果,但是我在调试微调的过程遇到不少问题,这里记录一下缺失latest问题解决(ValueError: could not find the metadata file ../latest, please)

修正后的代码可以参考这个git

GitHub - qjzcy/Visualglm-image-to-text: 补充了一些Visualglm缺少的文件,可以对Visualglm进行训练,实例中是对人脸做了面相的识别

——————————————————————————————————————————

如下所示,训练的时候模型会提示我们,找不到latest这个文件。(ValueError: could not find the metadata file ../latest, please check --load)

ValueError: could not find the metadata file ../visualglm-6b/latest, please check --load

一,可不可以用其它方法跳开

查看代码可以看到,报错的地方是这段代码

 既然这种调用model的方式不行,那我们用其它调用modle的方法能解决这个问题么?

调用LLM model我们一般有下面几种方式

AutoModel.from_pretrained ,FineTuneVisualGLMModel.from_pretrained() 和 VisualGLMModel.from_pretrained()

 这几种种调用的区别在于它们返回的模型类型不同。

1,AutoModel 类型的模型是 Hugging Face Transformers 库中的一个通用模型类型,用于加载任意预训练模型。该模型类型可以自动检测预训练模型的类型,并返回相应类型的模型对象。但是,AutoModel 类型的模型目前还不能识别 VisualGLMModel 模型,因为 VisualGLMModel 不是 Hugging Face Transformers 库中的标准模型类型。VisualGLM训练的时候我们强行把调用model的类改为AutoModel,会导致错误,比如输入的时候无法识别图像的输入,因为其它类型的模型不支持 image 这个关键字参数,这个方案不行

2,VisualGLMModel.from_pretrained() 方法返回一个 VisualGLMModel 类型的对象,该对象包含了预训练模型的参数。这个方法通常用于加载预训练模型。

3,FineTuneVisualGLMModel.from_pretrained() 方法返回一个 FineTuneVisualGLMModel 类型的对象,是 VisualGLMModel 类型的子类,它添加了一些额外的属性和方法,用于支持 fine-tune。例如,FineTuneVisualGLMModel 类型可能包含了 fine-tune 的相关参数,例如学习率、批次大小等。此外,FineTuneVisualGLMModel 类型可能还包含了一些额外的方法,例如 train() 方法,用于继续训练模型。该对象包含了预训练模型的参数和 fine-tune 的相关参数。这个方法通常用于加载 fine-tune 后的模型,以便进行推理或者继续训练。

这两个方法都会遇到刚刚的问题,会找你要latest,所以这个问题躲是躲不掉了。我们再看看这个文件是干啥用的。

二,latest这个文件是做啥用的

我们在其它finetune的文件夹里找到这个文件,打开后可以看到是,这个文件包含的是fintune迭代信息

再查看源码,会看到在from_pretrained这个方法里,会用到它生成的路径,以及路径下的文件,无法绕开。

既然无法跳开,那我们就找找看能不能找到这个文件,在网上找到个项目提供了这个文件

项目链接

GitHub - qjzcy/Visualglm-image-to-text: 补充了一些Visualglm缺少的文件,可以对Visualglm进行训练,实例中是对人脸做了面相的识别

进入checkpoints文件夹把文件拷入对应目录,代码如下问题解决!!

文件获取代码如下 

cd checkpoints/

wget https://huggingface.co/wangrongsheng/XrayGLM-300/resolve/main/latest

wget https://huggingface.co/wangrongsheng/XrayGLM-300/resolve/main/model_config.json

mkdir 300

cd 300/

wget https://huggingface.co/wangrongsheng/XrayGLM-300/resolve/main/300/mp_rank_00_model_states.pt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/622870.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyEMD算法解析

算法背景 经验模态分解(Empirical Mode Decomposition,缩写EMD)是由黄锷(N. E. Huang)在美国国家宇航局与其他人于1998年创造性地提出的一种新型自适应信号时频处理方法,特别适用于非线性非平稳信号的分析处…

易基因|一种全新的检测DNA羟甲基化的技术:ACE-Seq

大家好,这里是专注表观组学十余年,领跑做组学科研服务的易基因。今天给大家介绍一种全新的检测DNA羟甲基化的技术:APOBEC-coupled epigenetic sequencing,简称【ACE-seq】。 前言 DNA序列中胞嘧啶(C)5’ 碳…

sed命令对文件内的指定字符串进行替换

目录 一、创建一个txt文件 二、替换每行第一个huawei为apple,第三个“/”后,不加参数就是只替换第一个 三、替换每行所有的xiaomi为iphone,第三个“/”后,加参数g就是替换所有 四、替换每行第二个redmi为potato,第…

ubutun22.04使用deb包安装mysql8.0.33

下载:https://dev.mysql.com/downloads/mysql/ 下载完毕,在ubuntu服务器解包。 安装使用dpkg命令,依次执行如下: sudo dpkg -i mysql-common_8.0.33-1ubuntu22.04_amd64.deb sudo dpkg -i mysql-community-client-plugins_8.0.33-1ubuntu22.04_amd64.deb sudo dpk…

云原生|秒懂云原生容灾备份实践

作者:刘健 后端开发工程师 目录 一、需备份的数据 二、在云航项目中使用 三、备份任务说明 一、需备份的数据 kubernetes在运行中,通常会产生两类数据: kubernetes集群资源对象数据。 容器运行时产生的数据。 针对cloudUp项目而言&am…

淘宝商品信息存入数据库

python 爬虫程序: #京东.pyimport json import pprint import re import requests # name_turnover {} url "https://s.taobao.com/search?data-keys&data-value88&ajaxtrue&_ksTS1686118766568_2290&callbackjsonp2291&ieutf8&in…

用AI写出的高考作文!

今天是6月7日,又到了每一年高考的日子。小灰自己参加高考是在2004年,距离现在已经将近20年,现在回想起来,真的是恍如隔世。 今天高考语文的作文题是什么呢? 全国甲卷的题目是:人技术时间 人们因技术发展得以…

centos7 部署 Redis

从源安装Redis 一、安装Redis1.1 下载源文件1.2 编译源文件1.2.1 解压文件1.2.2 编译Redis 1.2.3 安装Redis1.2.4 启动 Redis 二、Redis设置2.1 缓存设置2.2 redis 环境优化2.3 安全设置 一、安装Redis 1.1 下载源文件 使用下列命令获取最新版的稳定Redis wget https://down…

Live800:智能客服有哪些未来发展趋势?

智能客服,也称智能问答系统,是一种利用机器学习、自然语言处理等技术实现自主询问、自主应答、自主维护的自动化系统。它们可以通过文字形式,为用户提供个性化、一对一的服务,避免了人工客服的人力成本和等待时间。 未来&#xff…

【Protobuf速成指南】enum类型的使用

文章目录 2.1枚举类型一、如何定义枚举类型?二、语法规范三、重定义问题四、enum类型相关函数五、Contact 2.1 改写六、总结 2.1枚举类型 本系列文章将通过对通讯录项目的不断完善,带大家由浅入深的学习Protobuf的使用。这是Contacts的2.1版本&#xff0…

【IMX6ULL驱动开发学习】02.IMX6ULL烧写Linux系统

由于我买的是正点原子的IMX6ULL阿尔法开发板,但是我是看韦东山老师视频学习的驱动 所以这里我烧录的方法是按照韦东山老师的课程来的 这里给出烧写Linux系统用到的工具 链接:https://pan.baidu.com/s/1bD-xxn3K8xQAVkJSaJmTzQ 提取码:af6w …

操作系统1-操作系统的基本特征和主要功能

目录 1、操作系统的目标和作用 (1)操作系统的目标 (2)操作系统的作用 2、操作系统的发展过程 (1)未配置操作系统的计算机系统 (2)单道批处理系统(Simple Batch Processing Sys…

企企通受邀出席多场高质量数智化活动,推进行业数字化升级转型

当前,数字经济已成为引领全球经济社会变革、推动我国经济高质量发展的重要引擎。Chat GPT的横空出世,宣告虚实无缝结合的跨场景体验时代即将到来。在云计算、大数据、人工智能、物联网等技术助推下,经过大量实践证明,数字化、智能…

工业RFID读写器选择指南

工业RFID读写器在工业领域上可提升自动化、现代化工业生产的效率,那么企业在选择工业读写器的时候,需要注重哪些方面,如何选择呢?以下是ANDEWELL给大家准备的工业RFID读写器选择指南! 1、根据应用场景选择 根据不同的应用场景,要…

【Docker安装部署Neo4j保姆级教程】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

大数据架构师岗位的主要职责概述(合集)

大数据架构师岗位的主要职责概述1 职责: 1.参与公司数据平台系统规划和架构工作,主导系统的架构设计和项目实施,确保项目质量和关键性能指标达成; 2.统筹和推进制造工厂内部数据系统的构建,搭建不同来源数据之间的逻辑关系&#x…

10.无监督学习

10.1 无监督学习的定义 监督学习:我们有一些列标签,然后用假设函数去拟合它 无监督学习:给出的数据不带任何标签。对于无监督学习来说,需要做的就是将数据输入到算法中,让算法找到一些隐含在数据中的结构,通…

IDEA代码提示设置

1. 打开File -> setting -> Editor -> Live Templates 2. 点击中间框框中的右侧""号,选择 Template Group, 命名为MyGroup(随便起名字) 3. 选中 MyGroup 点击右侧""号,选择Live Template Abbreviation 快捷提示 Description 描述 Template tex…

探究核心技术最佳实践,云原生OLAP论坛火热开启!

2023/06/11,09:00-12:30,在DataFunSummit 2023:OLAP引擎架构峰会上,由阿里云资深技术专家,实时数仓 Hologres 研发负责人姜伟华老师出品的云原生OLAP论坛讲邀请来自阿里云、亚马逊云科技、三七互娱、聚水潭、诺亚财富的…

相机成像模型(二)

相机内参/外参 将上述公式整合到一起,得到世界坐标系中点(Xw,Yw,Zw)映射到像素坐标系中点(u,v)的计算过程,同时给出相机内参、外参的定义如下。 相机外参:描述世界坐标系与相机坐标系之间的变换关系,可将世界坐标系中的点变换至相机坐标系;依赖世界坐标系的定义。 相机内参…