深度学习之目标检测
PASCAL数据集
PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。
PASCAL VOC挑战赛主要包括以下几类:图像分类(Object Classification),目标检测(Object Detection),目标分割(Object Segmentation),动作识别(Action Classification)等
数据集的官网链接
数据集官网链接
分类数据集类别
数据集目录结构
图像标注信息的XML文件
<annotation>
<folder>VOC2012</folder>
<filename>2007_000027.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
</source>
<size>
<width>486</width>
<height>500</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>person</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>174</xmin>
<ymin>101</ymin>
<xmax>349</xmax>
<ymax>351</ymax>
</bndbox>
<part>
<name>head</name>
<bndbox>
<xmin>169</xmin>
<ymin>104</ymin>
<xmax>209</xmax>
<ymax>146</ymax>
</bndbox>
</part>
<part>
<name>hand</name>
<bndbox>
<xmin>278</xmin>
<ymin>210</ymin>
<xmax>297</xmax>
<ymax>233</ymax>
</bndbox>
</part>
<part>
<name>foot</name>
<bndbox>
<xmin>273</xmin>
<ymin>333</ymin>
<xmax>297</xmax>
<ymax>354</ymax>
</bndbox>
</part>
<part>
<name>foot</name>
<bndbox>
<xmin>319</xmin>
<ymin>307</ymin>
<xmax>340</xmax>
<ymax>326</ymax>
</bndbox>
</part>
</object>
</annotation>
对应的txt文件
每一个txt文件对应一个图片标注信息
标注自己的数据集
使用开源的标注图片的软件labellmg
https://github.com/heartexlabs/labelImg
使用pip命令进行安装
Install pyinstaller and execute:
pip3 install labelImg
labelImg
labelImg [IMAGE_PATH] [PRE-DEFINED CLASS FILE]
输入标注图片的路径 和对应的分类文件
下载软件
标注数据集之前的准备工作
创建对应格式的文件夹
1.创建test文件夹
按照这种格式创建对应的文件夹,将图片放到image文件夹的下面
按照分类下载猫狗人的图片,使用labelImg进行标注
在当前的文件夹下面打开终端
参考官网输入指定信息,打开LabelImg标注图像信息
在进行图像标注之前完成初始设置,选择标注后xml文件保证的路径
通过矩形框,框选目标,标注完成之后选择类别信息。全部完成之后查看目标信息。
将标注完整的文件放到PASCAL VOC对应目录的下面完成数据集的制作过程
标注完成之后产生的xml文件