文章目录
- 一、数据下载
- 二、数据介绍
- 3.1 图案示意
- 3.2 标注属性
CUA-200-2011 是CUB-200的拓展,包含了200个鸟类,共11788张图片,每张图片都标注了物体的框、关键点和属性类别,常被用于小样本细粒度图像分类或者检测任务中。
一、数据下载
官网下载:https://www.vision.caltech.edu/datasets/cub_200_2011/
百度云下载 链接: https://pan.baidu.com/s/1o60hA0qrupDjtMGPVCke3A 密码: u0sr
数据发布的论文下载: https://authors.library.caltech.edu/27452/1/CUB_200_2011.pdf
二、数据介绍
CUA-200-2011 是CUB-200的拓展,包含了200个鸟类,通常用于小目标分类、检测等任务。
所有的图片都是注释了 bounding boxes, part locations, 和属性。
图像和标注都是手工进行的。
下载后,解压如上所示,包含3个文件夹,5个标签文档,和一个README说明文档。
-
images 文件夹 有200个子文件夹,每个文件夹存放着对应图像类别的图片
-
parts 文件夹 存放着每个图像的关键点标注信息 ,包含了三个文件
- parts/parts.txt : 关键点种类以及对应的类别,每行格式为 <part_id> <part_name>
- parts/part_locs.txt : 包含了所有的关键点的标注,每行格式为<image_id> <part_id>
- parts/part_click_locs.txt : 每一行对应于不同MTurk工作人员对特定图像中特定关键点的标注,每行格式为<image_id> <part_id>
-
attributes 文件夹 放着标注的一些属性
- attributes/certainties.txt :确定的属性,代表着标注人员标注时对类别是否确定的信息,每行格式为<certainty_id> <certainty_name> 其中 0 代表看不见,1 代表猜测的,2 代表可能,4 代表确定
- attributes/image_attribute_labels.txt : 图像感知属性标注。<image_id> <attribute_id> <is_present> <certainty_id>
-
images.txt 包含每张图片的名字以及对应的序列号, 每行格式为<image_id> <image_name>
-
train_test_split.txt 推荐的训练集和测试集划分,每行格式为 <image_id> <is_training_image>
-
image_class_labels.txt 每张图片对应的类别,每行格式为 <image_id> <class_id>
-
classes.txt 图像class类别以及对应的类别ID,每行格式为 <class_id> <class_name>
-
bounding_boxes.txt 每张图像的物体框 ,每行格式为 <image_id>
3.1 图案示意
3.2 标注属性
标注的关键点和属性,15个关键点(喙眼头背等),28个属性组(喙的形状、颜色、长等、背部有颜色,有图案等)
见下图