labelme使用labelme2voc.py忽略部分标签生成VOC/coco类型数据集(Ignore a label in json file)

news2024/11/23 12:55:07

一:背景和问题描述

这是一个比较小众,且查找全网未有答案的问题。

在使用labelme标注数据之后,生成了json文件。在利用json文件生成可用于训练分割模型的voc或者coco数据集时,可以使用labelme中自带的示例文件labelme2voc.py,如下

但是我在制作数据集时为了数据集更加多样可用,标注了很多种暂时用不到的标签,转换时忽视指定的标签,如何做呢。

GitHub中有人提出了这样的问题,但是没有详细的解决办法,如下,

问题详情:

github见https://github.com/wkentaro/labelme/discussions/1097

Hi, I did what you say but got an error
Traceback (most recent call last):
File "labelme2voc.py", line 139, in
main()
File "labelme2voc.py", line 102, in main
cls, ins = labelme.utils.shapes_to_label(
File "/Users/azzz/.pyenv/versions/3.8.3/lib/python3.8/site-packages/labelme/utils/shape.py", line 69, in shapes_to_label
cls_id = label_name_to_value[cls_name]
KeyError: 'truck'
truck is the label I want to ignore
——————————————————————————————————
Hi, I have the same error, too.
Traceback (most recent call last):
File "./labelme2voc.py", line 106, in
main()
File "./labelme2voc.py", line 88, in main
label_name_to_value=class_name_to_id,
File "/Users/tajimakeijiro/anaconda3/envs/labelme/lib/python3.6/site-packages/labelme/utils/shape.py", line 68, in shapes_to_label
cls_id = label_name_to_value[cls_name]
KeyError: 'wall'
I wanted to ignore the class 'wall', so I removed it from labels.txt.
But I got this error.

二、解决办法

查看了labelme2voc.py源码,因此我们直接在源码中进行修改,修改方式比较愚笨且直接,但是能够解决问题。

假设我们所有的标签'crack,shedding,damage,face1,face2,face3,其中face1,face2,face3,是我们不需要的。 正常情况下我们转换所有标签,修改labels.txt,即

__ignore__
_background_
crack
shedding
damage
face1
face2
face3
background

如果我们不需要face1,face2,face3,从上面中删除face1,face2,face3会报错。我们只需要将如下代码添到labelme2voc.py中的class_names = tuple(class_names) 下面,即可达到忽略face1,face2,face3的目的。此时修改labels.txt操作变得可有可无了。

class_names=['_background_','crack','shedding','damage','face1','face2','face3','background']
class_name_to_id={'__ignore__':-1,'face1':0,'face2':0,'face3':0,'_background_':0,'crack':1,'shedding':2,'damage':3,'background':4}

如图所示:

三:原理和解释

在转换过程中,背景(background)用值0表示,因此我们如果忽视标签'face1','face2','face3',我们将其也设置为0即可达到目的。

class_name表示所有的类别。其中_background_必须要有

而'crack,shedding,damage,face1,face2,face3,background是类别。

class_name_to_id表示这些类别的数字表示。其中的'__ignore__':-1和'_background_':0必须要有

而待忽略的标签,将其值设置为背景的值,即0即可,即'face1':0,'face2':0,'face3':0;,不忽略的标签,后面依次按照想要的顺序写出来并赋值即可,从1开始

四:总结

在使用labelme2voc.py时,进行调试,可以更好地理解添加上面两行代码的原理,这也是我使用该方法的思路来源。coco类型应该类似,可以自行调试或者构造出代码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/169033.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第二章.线性回归以及非线性回归—弹性网

第二章.线性回归以及非线性回归 2.14 弹性网(Elastic Net) Elastic Net是一种使用L1和L2作为正则化矩阵的线性回归模型,这种组合用于只有很少的权重非零的稀疏模型。 当多个特征和另一个特征相关时,弹性网络非常有用,L…

C++ STL简介

文章目录前言一、STL概述二、STL历史三、STL六大组件功能与运用前言 对C/C学习感兴趣的可以看看这篇文章哦:C/C教程 一、STL概述 在软件行业,一直都希望建立一种可以重复运用的东西和一种可以制造出“可重复使用的东西”的方法,来让程序员…

什么是基于模型设计(MBD)?

MBD(Model based Design)是什么? 随着嵌入式行业的快速发展,MBD作为解决专家紧缺、国内解决方案匮乏的新软件开发方式备受关注。 MBD是一种通过建模自动生成代码的(Auto-generation Code)开发方式。 可以说它与如何用传统的C/C等计…

CANoe-仿真总线上的红蓝线、“CANoe DEMO“ license下的软件限制

1、仿真总线上的红蓝线 最近有人问我一个问题,就是Simulation Setup界面下的仿真网络里,有两条线:红线、蓝线。它们表示什么意思呢? 有人可能首先想到:会不会是代表CAN总线的两条物理连线? 那LIN网络呢?LIN网络属于单条线,它在仿真网络里应该显示一条线咯? LIN总线也…

ThreadLocal 详解

ThreadLocal 详解 1. ThreadLocal简介 1.1 官方介绍 /*** This class provides thread-local variables. These variables differ from* their normal counterparts in that each thread that accesses one (via its* {code get} or {code set} method) has its own, indep…

【go语言http2.0代码实现】

go语言之http2.0Serverclient之前主要说的是基于http1.1的。然后因为http1.1存在的局限性,现在http2.0越来越流行,这里来根据go的源码来分析一下http2.0的实现。首先需要注意的是http2.0是在https的基础之上,因此推荐有https的基础或者看前面…

如何在Microsoft Teams中发布作业

之前我们介绍了在Microsoft Teams中收发批改作业的基础使用方法。今天我们会在“发布作业”这个方面上进行详细介绍。 首先我们进入Teams的“作业”点击“创建”。 选择“作业”。 可以通过“附加”的形式发布已创建的作业文件。 可以通过选择OneDrive的形式来选取里面的文件发…

BOSS直聘依然面临监管和估值过高的风险

来源:猛兽财经 作者:猛兽财经 BOSS直聘是中国重新开放和经济复苏的受益者 由于中国已经全面放开,所以,全球各地的分析师们正在上调对中国2023年经济增长的预测。 比如CNBC的文章就提到摩根士丹利(MS)的经…

Pandas 数据结构 - Series

前言Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。Series 由索引(index)和列组成,函数如下:pandas.Series( data, index, dtype, name, copy)参…

基于springboot,vue电影院售票系统

开发工具:IDEA服务器:Tomcat9.0, jdk1.8项目构建:maven数据库:mysql5.7系统用户前台和管理后台两部分,项目采用前后端分离前端技术:vue elementUI服务端技术:springbootmybatis项目功…

Java 线程的几种状态及其切换的条件

1.线程状态及其含义2.状态之间切换的条件1.线程状态及其含义 NEW(初始化): 表示创建了Thread对象,但是还没有调用start (也就是系统内核还是没有创建对应的PCB) RUNNABLE(运行): 表示可运行的.线程创建后,调用了start方法,等待CPU的调度或者正在CPU中运行. BLOCKED(阻塞): 表…

【白皮书】PROFIBUS网络诊断

PROFIBUS标准已有30多年的历史,如今已是一种成熟的数字现场总线技术。PROFIBUS通常用于工厂和过程自动化行业,也可用于食品、饮料或制药等混合行业。此外,其还适用于楼宇自动化和轨道交通等领域。可见,PROFIBUS是一种可服务于这些…

华为OD机试 - 信号发射和接收

题目描述 有一个二维的天线矩阵,每根天线可以向其他天线发射信号,也能接收其他天线的信号,为了简化起见,我们约定每根天线只能向东和向南发射信号,换言之,每根天线只能接收东向或南向的信号。 每根天线有自己的高度anth,每根天线的高度存储在一个二维数组中,各个天线…

第三方美颜sdk人脸识别的流程以及代码分析

小编曾经多次提到过人脸检测和人脸是被技术,那么这些算法在第三方美颜sdk中有用吗?答案是肯定的,不止有用,而且还非常重要。我们可以将人脸识别算法分为基础层算法与应用层算法,开头提到的人脸检测,实际上是…

Python程序设计-第1章Python程序基础

第1章Python程序基础一.预习笔记 1.1 Python简介: Python是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido Van Rossum于1989年发明。Python的第一个公开发行版于1991年发行。 1.2 Python开发环境搭建: python解释器的安装&#…

2017 hypernetworks 笔记

HYPERNETWORKS 这篇文章来自谷歌的一篇文章 Introduction 这篇文章中提出了一种方法:使用一个小网络(hypernetwork),小网络的作用是给一个larger network(main network)来生成权重,这个main ne…

结构型模式

1.代理模式 提供对象的替代品或其占位符。 代理控制着对于原对象的访问, 并允许在将请求提交给对象前后进行一些处理结构 抽象主题类:通过接口或抽象类声明真实主题和代理对象实现的业务方法真实主题类:实现抽象主题中的具体业务&#xff0c…

小程序API

小程序APIapi介绍api类型示例小程序api-网络请求示例合法域名npm基础应用核心步骤npm下载vant-weapp组件库核心步骤api介绍 小程序开发中,会使用到很多内置的功能,这些功能都被封装到小程序的api中了。比如 弹出提示框发送网络请求等上传文件、下载文件…

centos的官网下载和vm16虚拟机安装centos8【保姆级教程图解】

centos8的官网下载和vm16虚拟机安装centos8【保姆级图解】centos下载vm虚拟机安装centos可能出现的问题vcpu-0centos下载 centos官网:https://www.centos.org/ 进入官网后,点击Download 选择 Centos Stream 8 x86_64,并且点击进入 然后会出现国内的…

穿越寒冬 向新而行 | 智和信通2022年度年终总结大会圆满落幕

岁序更迭,新程再启,2022年在挑战与成就中谢幕。日迈月征,朝暮轮转,2023年在希望中启航。2023年1月13日,北京智和信通技术有限公司(以下简称“智和信通”)召开2022年度年终总结大会。会议全面总结…