一:背景和问题描述
这是一个比较小众,且查找全网未有答案的问题。
在使用labelme标注数据之后,生成了json文件。在利用json文件生成可用于训练分割模型的voc或者coco数据集时,可以使用labelme中自带的示例文件labelme2voc.py,如下
但是我在制作数据集时为了数据集更加多样可用,标注了很多种暂时用不到的标签,转换时忽视指定的标签,如何做呢。
GitHub中有人提出了这样的问题,但是没有详细的解决办法,如下,
问题详情:
github见https://github.com/wkentaro/labelme/discussions/1097
Hi, I did what you say but got an error
Traceback (most recent call last):
File "labelme2voc.py", line 139, in
main()
File "labelme2voc.py", line 102, in main
cls, ins = labelme.utils.shapes_to_label(
File "/Users/azzz/.pyenv/versions/3.8.3/lib/python3.8/site-packages/labelme/utils/shape.py", line 69, in shapes_to_label
cls_id = label_name_to_value[cls_name]
KeyError: 'truck'
truck is the label I want to ignore
——————————————————————————————————
Hi, I have the same error, too.
Traceback (most recent call last):
File "./labelme2voc.py", line 106, in
main()
File "./labelme2voc.py", line 88, in main
label_name_to_value=class_name_to_id,
File "/Users/tajimakeijiro/anaconda3/envs/labelme/lib/python3.6/site-packages/labelme/utils/shape.py", line 68, in shapes_to_label
cls_id = label_name_to_value[cls_name]
KeyError: 'wall'
I wanted to ignore the class 'wall', so I removed it from labels.txt.
But I got this error.
二、解决办法
查看了labelme2voc.py源码,因此我们直接在源码中进行修改,修改方式比较愚笨且直接,但是能够解决问题。
假设我们所有的标签'crack,shedding,damage,face1,face2,face3,其中face1,face2,face3,是我们不需要的。 正常情况下我们转换所有标签,修改labels.txt,即
__ignore__
_background_
crack
shedding
damage
face1
face2
face3
background
如果我们不需要face1,face2,face3,从上面中删除face1,face2,face3会报错。我们只需要将如下代码添到labelme2voc.py中的class_names = tuple(class_names) 下面,即可达到忽略face1,face2,face3的目的。此时修改labels.txt操作变得可有可无了。
class_names=['_background_','crack','shedding','damage','face1','face2','face3','background']
class_name_to_id={'__ignore__':-1,'face1':0,'face2':0,'face3':0,'_background_':0,'crack':1,'shedding':2,'damage':3,'background':4}
如图所示:
三:原理和解释
在转换过程中,背景(background)用值0表示,因此我们如果忽视标签'face1','face2','face3',我们将其也设置为0即可达到目的。
class_name表示所有的类别。其中_background_必须要有,
而'crack,shedding,damage,face1,face2,face3,background是类别。
class_name_to_id表示这些类别的数字表示。其中的'__ignore__':-1和'_background_':0必须要有;
而待忽略的标签,将其值设置为背景的值,即0即可,即'face1':0,'face2':0,'face3':0;,不忽略的标签,后面依次按照想要的顺序写出来并赋值即可,从1开始。
四:总结
在使用labelme2voc.py时,进行调试,可以更好地理解添加上面两行代码的原理,这也是我使用该方法的思路来源。coco类型应该类似,可以自行调试或者构造出代码。