1. 行人红外数据集总结
(1)OSU Thermal Pedestrian Database
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/01/download.html
(2)IRIS Thermal/Visible Face Database
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/02/download.html
(3)OSU Color-Thermal Database
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/03/download.html
(4)Terravic Facial IR Database
下载链接:http://vcipl-okstate.org/pbvs/bench/
(5)Terravic Motion IR Database
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/05/download.html
(6)Terravic Weapon IR Database
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/06/download.html
(7)CBSR NIR Face Dataset
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/07/download.html
(8)Audio-Visual Vehicle (AVV) Dataset
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/08/download.html
(9)CSIR-CSIO Moving Object Thermal Infrared Imagery Dataset (MOTIID)
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/09/Benchmark.zip
(10)Pedestrian Infrared/visible Stereo Video Dataset
下载链接:https://www.polymtl.ca/litiv/codes-et-bases-de-donnees
(11)Thermal Infrared Video Benchmark for Visual Analysis
下载链接:http://csr.bu.edu/BU-TIV/BUTIV.html
(12)Maritime Imagery in the Visible and Infrared Spectrums
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/12/VAIS.zip
(13)ContactDB: Analyzing and Predicting Grasp Contact via Thermal Imaging
下载链接:https://github.com/samarth-robo/contactdb_utils
(14)DIAST Variability Illuminated Thermal and Visible Ear Image Dataset
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/14/DIAST_Datasets.zip
(15)M3FD: A Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection
下载链接:https://github.com/dlut-dimt/TarDAL
(16)MHAD-D-Mocap data: A Multiview Depth-based Motion Capture Benchmark Dataset for Human Motion Denoising and Enhancement Research
下载链接:http://vcipl-okstate.org/pbvs/bench/Data/16/MHAD-D-Mocap.zip
2. 行人检测数据集总结
(1)SCUT FIR行人检测数据集
下载链接:https://sourl.cn/4VK3Bn
SCUT FIR Pedestrian Datasets 是一个大型远红外行人检测数据集。它由大约 11 小时长的图像序列( 帧)组成,速度为 25 Hz,以低于 80 km/h 的速度在不同的交通场景中行驶。图像序列来自中国广州市中心、郊区、高速公路和校园 4 种场景下的 11 个路段。该数据集注释了 211011 帧,总共 477907 个边界框,包含 7659 个独特的行人。
(2)SCUT FIR行人检测数据集
下载链接:https://sourl.cn/mgxHEY
包含 4372 张图像和 151 万条注释的综合数据集。与现有数据集相比,所提出的数据集是在各种不同的场景和环境条件下收集的。此外,该数据集提供了相对丰富的注释集,如点、近似边界框、模糊级别等。
(3)CIHP人体解析数据集
下载链接:https://sourl.cn/W3Tm2J
Crowd Instance-level Human Parsing (CIHP) 数据集包含 38,280 张多人图像,这些图像具有精细的注释、高外观可变性和复杂性。该数据集可用于人体部分分割任务。
(4)AHU-Crowd人群数据集
下载链接:https://sourl.cn/XFJDCh
人群数据集是从各种来源获得的,例如 UCF 和数据驱动的人群数据集,以评估所提出的框架。序列多样,代表了朝圣、车站、马拉松、集会和体育场等各种场景中公共空间的密集人群。此外,这些序列具有不同的视野、分辨率,并表现出多种运动行为,涵盖了明显和微妙的不稳定性。
(5)AudioVisual 人群计数
下载链接:https://sourl.cn/wfd7wD
一个用于人群计数的新数据集,该数据集由中国不同位置的大约 2000 个带注释的图像令牌组成,每个图像对应一个 1 秒的音频剪辑和一个密度图。图像处于不同的照明条件下。
(6)UCF-CC-50
下载链接:http://c.nxw.so/9LYoK
该数据集包含极其密集人群的图像。图像主要是从 FLICKR 收集的。
(7)北京BRT数据集
下载链接:http://c.nxw.so/c1PV9
该数据集包含 1,280 张图像和 16,795 个标记的行人,用于人群分析。该数据集使用 720 张图像进行训练,使用 560 张图像进行测试。
(8)MIT-CBCL Pedestrian Database(MIT行人数据库)
下载链接:http://cbcl.mit.edu/software-datasets/PedestrianData.html
该数据库为较早公开的行人数据库,共924张行人图片(ppm格式,宽高为64x128),肩到脚的距离约80象素。该数据库只含正面和背面两个视角,无负样本,未区分训练集和测试集。Dalal等采用“HOG+SVM”,在该数据库上的检测准确率接近100%。
(9)USC Pedestrian Detection Test Set(USC行人数据库)
下载链接:https://sites.usc.edu/iris-cvlab/
该数据库包含三组数据集(USC-A、USC-B和USC-C),以XML格式提供标注信息。USC-A[Wu, 2005]的图片来自于网络,共205张图片,313个站立的行人,行人间不存在相互遮挡,拍摄角度为正面或者背面;USC-B的图片主要来自于CAVIAR视频库,包括各种视角的行人,行人之间有的相互遮挡,共54张图片,271个行人;USC-C有100张图片来自网络的图片,232个行人(多角度),行人之间无相互遮挡。
(10)Caltech Pedestrian Detection Benchmark(Caltech行人数据库)
下载链接:http://www.vision.caltech.edu/datasets/
该数据库是目前规模较大的行人数据库,采用车载摄像头拍摄,约10个小时左右,视频的分辨率为640x480,30帧/秒。标注了约250,000帧(约137分钟),350000个矩形框,2300个行人,另外还对矩形框之间的时间对应关系及其遮挡的情况进行标注。
(11)Daimler Pedestrian Detection Benchmark (戴姆勒行人检测标准数据库)
下载链接:http://www.gavrila.net/Datasets/Daimler_Pedestrian_Benchmark_D/Daimler_Pedestrian_Segmentatio/daimler_pedestrian_segmentatio.html
该数据库采用车载摄像机获取,分为检测和分类两个数据集。检测数据集的训练样本集有正样本大小为18×36和48×96的图片各15560(3915×4)张,行人的最小高度为72个象素;负样本6744张(大小为640×480或360×288)。测试集为一段27分钟左右的视频(分辨率为640×480),共21790张图片,包含56492个行人。分类数据库有三个训练集和两个测试集,每个数据集有4800张行人图片,5000张非行人图片,大小均为18×36,另外还有3个辅助的非行人图片集,各1200张图片。
(12)CrowdHuman
下载链接:http://www.crowdhuman.org/
CrowdHuman数据集是旷世发布的用于行人检测的数据集,图片数据大多来自于google搜索。
CrowdHuman 数据集数据量比较大,训练集15000张,测试集5000张,验证集4370张。训练集和验证集中共有 470K 个实例,约每张图片包含23个人,同时存在各种各样的遮挡。每个人类实例都用头部边界框、人类可见区域边界框和人体全身边界框注释。
(13)WiderPerson数据集
下载链接:http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/
WiderPerson数据集是比较拥挤场景的行人检测基准数据集,其图像是从多种场景中选择的,不再局限于交通场景。 选择13382张图像,并用各种遮挡标记约40万个注释,随机选择8000/1000/4382图像作为训练,验证和测试集,与CityPersons和WIDER FACE数据集相似,不发布测试图像的标注文件。
(14)CityPersons数据集
下载链接:https://github.com/CharlesShang/Detectron-PYTORCH/tree/master/data/citypersons
CityPersons 数据集是基于CityScapes数据集在行人检测领域专门建立的数据集,它选取了CityScapes 中5000张精标图片,并对其中的行人进行边界框标注。其中训练集包含2975张图片,验证集包含500张,测试集包含1575张。图片中行人的平均数量为7人,标注提供全身标注和可视区域标注
(15)CityScapes数据集
下载链接:https://www.cityscapes-dataset.com/
Cityscapes数据集,即城市景观数据集,其中包含从50个不同城市的街景中记录的各种立体视频序列,除了更大的20000个弱注释帧之外,还有高质量的5000帧像素级注释。Cityscapes数据集共有fine和coarse两套评测标准,前者提供5000张精细标注的图像,后者提供5000张精细标注外加20000张粗糙标注的图像。train、val、test总共5000张精细释,2975张训练图,500张验证图和1525张测试图,每张图片大小都是1024x2048。
3. 行人跟踪数据集总结
(1)MOT数据集
下载链接:https://motchallenge.net/
包含MOT15、MOT16、MOT17等数据集
文中部分代码及图片引用自其他博主博客,仅用作学习用途,在此表示感谢,如有侵权,可联系我删除。