一、前言
之前寒假好像就学了,但是没有记笔记,现在看来还是得记笔记,都忘得差不多了啊。
二、数据集的介绍
2.1数据集背景
分类类别
2.2数据集文件结构:
2.3文件夹
2.3.1Annotations文件夹
对于标注文件Annotations:里面保存的是每一张图片的标注信息,具体来看:举例2007_00087.xml文件
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 | <annotation> <folder>VOC2012</folder> <filename>2007_000187.jpg</filename> <source> <database>The VOC2007 Database</database> <annotation>PASCAL VOC2007</annotation> <image>flickr</image> </source> <size> <width>500</width> <height>375</height> <depth>3</depth> </size> <segmented>1</segmented> <object> <name>tvmonitor</name> <pose>Frontal</pose> <truncated>1</truncated> <difficult>0</difficult> <bndbox> <xmin>1</xmin> <ymin>95</ymin> <xmax>240</xmax> <ymax>336</ymax> </bndbox> </object> </annotation> |
annotation为主结点;folder为保存的文件夹;source表示图片来源;size表示图片长和身高;segmented为图片分割信息,1表示有分割信息。
object来表示目标检测的信息,name为目标类别,truncated表示目标是否被截断,difficult表示图片是否难检测,bndbox表示图片左上角的坐标与右下角的坐标。
2.3.2ImageSets文件夹
对于Imagesets里面的Main文件夹记录目标检测的信息,train.txt,val.txt,trainval.txt分别保存训练集、测试集、训练集+测试集图片信息,训练集与测试集互斥,这里的trainval.txt是参加官方比赛用的
因为不公开提供测试集的图片,需要参赛者提交自己的训练模型。
里面的其余txt文件,保存每张图片是否有相应的目标,1表示有该目标,-1表示没有,0表示该目标检测起来困难
三、标注自己的数据集
使用labeImg
步骤:
四、参考视频、博客、与文献
B站博主霹雳吧啦Wz学习视频地址:PASCAL VOC2012数据集讲解与制作自己的数据集_哔哩哔哩_bilibili
博主CSDN的地址:PASCAL VOC2012数据集介绍_太阳花的小绿豆的博客-CSDN博客
官方数据集地址:The PASCAL Visual Object Classes Challenge 2012 (VOC2012) (ox.ac.uk)
官方介绍数据集论文地址:everingham15.pdf (ox.ac.uk)