背景:要用yolov5-7.0训练分割,这里使用自己的数据,mask是二值化的数据,要先转换成COCO格式,这里用imantics实现。
详见:https://zhuanlan.zhihu.com/p/427096258
截取部分代码如下图,读取image图片与对应的mask数据,手动指定好类别号,dataset.coco()将数据转换成coco格式,dataset.yolo()会转成yolo格式,在执行的目录下生成对应的json文件。
这里yolo格式只有{ 图片路径:类别号,[cx, cy, width, height] },并没有把分割标签一起生成出来,形式如下:
在yolov5-7.0的训练中,训练数据每张图片要有自己对应的一个同名txt文件,记录属于的类别,bbox与segmentation信息,类似这种
所以,需要根据json文件生成对应图片的txt。
上面说到imantics生成yolo格式的数据是没有mask的分割信息的,所以只训检测可以使用,训实例分割的话,不行,再次查阅,发现yolo系列是有提供json2coco的工程的,链接如下:
https://github.com/ultralytics/JSON2YOLO
COCO格式的Json文件转换成yolo的txt格式
点击上方链接,下载之后将工程可以拷贝至yolov5-v7.0目录下,修改general_json2yolo.py中的COCO格式json文件所在的文件夹路径(注意:是文件夹路径,不要直接写文件路径)。在代码里会glob搜索文件夹下json文件,运行general_json2yolo.py,在JSON2YOLO文件夹下会生成new_dir文件夹,在new_dir下包含labels和images两个文件夹,一般来讲,images是空的,labels中即为yolo格式的标注数据。如果想改变txt路径的话,只需在代码中改变生成txt的路径即可。
另外,用imantics生成coco格式的json文件时,会遇到一个递归报错的问题,
RecursionError: maximum recursion depth exceeded in comparison
这里,确实是python对最大递归次数是有限制的,这里可以粗暴添加这两行代码,即可解决:
import sys
sys.setrecursionlimit(100000)
详细可以见博客:
https://blog.csdn.net/cliviabao/article/details/79927186