文章目录
- 参考链接
- 一、coco数据集
- 1. 简介
- 2. 下载
- 3.解压后的数据
- 4. COCO数据集(.json)训练格式转换成YOLO格式(.txt)
参考链接
为YOLOv5搭建COCO数据集训练、验证和测试环境
CoCo数据集下载
一、coco数据集
1. 简介
MS COCO的全称是Microsoft Common Objects in Context,起源于微软2014年的Microsoft COCO数据集,主要用于目标检测,图像分割,姿态估计等,共有80个类
MSCOCO 是具有80个类别的大规模数据集,其数据分为三部分:训练、验证和测试,每部分分别包含 118287, 5000 和 40670张图片,总大小约25g。其中测试数据集没有标注信息,所以注释部分只有训练和验证的。
关于COCO的测试集:2017年COCO测试集包含〜40K个测试图像。 测试集被分成两个大致相同大小的split约20K的图像:test-dev 和test-challenge。
Test-Dev:test-dev split 是在一般情况下测试的默认测试数据。通常应该在test-dev集中报告论文的结果,以便公正公开比较。
Test-Challenge:test-challenge split被用于每年托管的COCO挑战
2. 下载
(1) 官网
第一种方法肯定是官网,来到下载页面:官网
Images就是数据集,Annotations表示标注信息使用 JSON 格式存储( annotations ), COCO API用于访问和操作所有“标注”进行预处理
不同年份的数据集用在不同的任务上,常用的是2017 train/val/test images
(2) 其他下载方式
CoCo数据集下载
Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
3.解压后的数据
下载后,依据https://github.com/cocodataset/cocoapi 的要求,将图片解压到coco/images/,如下图所示。
下载并按路径要求解压图片
接着下载标注文件annotations_trainval2017.zip,并按cocoapi 的要求,将标注文件解压到coco/annotations/
下载并按路径要求解压标注,其中用于目标检测的是:instances_val2017.json和instances_train2017.json
4. COCO数据集(.json)训练格式转换成YOLO格式(.txt)
详细!正确!COCO数据集(.json)训练格式转换成YOLO格式(.txt)
yolov5的数据集格式 :COCO数据集转换成yolov5训练的数据集格式代码