1. 行人红外数据集总结

（1）OSU Thermal Pedestrian Database

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/01/download.html
在这里插入图片描述

（2）IRIS Thermal/Visible Face Database

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/02/download.html
在这里插入图片描述

（3）OSU Color-Thermal Database

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/03/download.html
在这里插入图片描述

（4）Terravic Facial IR Database

下载链接：http://vcipl-okstate.org/pbvs/bench/
在这里插入图片描述

（5）Terravic Motion IR Database

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/05/download.html
在这里插入图片描述

（6）Terravic Weapon IR Database

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/06/download.html
在这里插入图片描述

（7）CBSR NIR Face Dataset

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/07/download.html
在这里插入图片描述

（8）Audio-Visual Vehicle (AVV) Dataset

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/08/download.html
在这里插入图片描述

（9）CSIR-CSIO Moving Object Thermal Infrared Imagery Dataset (MOTIID)

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/09/Benchmark.zip
在这里插入图片描述

（10）Pedestrian Infrared/visible Stereo Video Dataset

下载链接：https://www.polymtl.ca/litiv/codes-et-bases-de-donnees
在这里插入图片描述

（11）Thermal Infrared Video Benchmark for Visual Analysis

下载链接：http://csr.bu.edu/BU-TIV/BUTIV.html
在这里插入图片描述

（12）Maritime Imagery in the Visible and Infrared Spectrums

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/12/VAIS.zip
在这里插入图片描述

（13）ContactDB: Analyzing and Predicting Grasp Contact via Thermal Imaging

下载链接：https://github.com/samarth-robo/contactdb_utils
在这里插入图片描述

（14）DIAST Variability Illuminated Thermal and Visible Ear Image Dataset

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/14/DIAST_Datasets.zip
在这里插入图片描述

（15）M3FD: A Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection

下载链接：https://github.com/dlut-dimt/TarDAL
在这里插入图片描述

（16）MHAD-D-Mocap data: A Multiview Depth-based Motion Capture Benchmark Dataset for Human Motion Denoising and Enhancement Research

下载链接：http://vcipl-okstate.org/pbvs/bench/Data/16/MHAD-D-Mocap.zip
在这里插入图片描述

2. 行人检测数据集总结

（1）SCUT FIR行人检测数据集

下载链接：https://sourl.cn/4VK3Bn

SCUT FIR Pedestrian Datasets 是一个大型远红外行人检测数据集。它由大约 11 小时长的图像序列（帧）组成，速度为 25 Hz，以低于 80 km/h 的速度在不同的交通场景中行驶。图像序列来自中国广州市中心、郊区、高速公路和校园 4 种场景下的 11 个路段。该数据集注释了 211011 帧，总共 477907 个边界框，包含 7659 个独特的行人。
在这里插入图片描述

（2）SCUT FIR行人检测数据集

下载链接：https://sourl.cn/mgxHEY

包含 4372 张图像和 151 万条注释的综合数据集。与现有数据集相比，所提出的数据集是在各种不同的场景和环境条件下收集的。此外，该数据集提供了相对丰富的注释集，如点、近似边界框、模糊级别等。
在这里插入图片描述

（3）CIHP人体解析数据集

下载链接：https://sourl.cn/W3Tm2J

Crowd Instance-level Human Parsing (CIHP) 数据集包含 38,280 张多人图像，这些图像具有精细的注释、高外观可变性和复杂性。该数据集可用于人体部分分割任务。
在这里插入图片描述

（4）AHU-Crowd人群数据集

下载链接：https://sourl.cn/XFJDCh

人群数据集是从各种来源获得的，例如 UCF 和数据驱动的人群数据集，以评估所提出的框架。序列多样，代表了朝圣、车站、马拉松、集会和体育场等各种场景中公共空间的密集人群。此外，这些序列具有不同的视野、分辨率，并表现出多种运动行为，涵盖了明显和微妙的不稳定性。
在这里插入图片描述

（5）AudioVisual 人群计数

下载链接：https://sourl.cn/wfd7wD

一个用于人群计数的新数据集，该数据集由中国不同位置的大约 2000 个带注释的图像令牌组成，每个图像对应一个 1 秒的音频剪辑和一个密度图。图像处于不同的照明条件下。
在这里插入图片描述

（6）UCF-CC-50

下载链接：http://c.nxw.so/9LYoK

该数据集包含极其密集人群的图像。图像主要是从 FLICKR 收集的。

在这里插入图片描述

（7）北京BRT数据集

下载链接：http://c.nxw.so/c1PV9

该数据集包含 1,280 张图像和 16,795 个标记的行人，用于人群分析。该数据集使用 720 张图像进行训练，使用 560 张图像进行测试。

在这里插入图片描述

（8）MIT-CBCL Pedestrian Database（MIT行人数据库）

下载链接：http://cbcl.mit.edu/software-datasets/PedestrianData.html

该数据库为较早公开的行人数据库，共924张行人图片（ppm格式，宽高为64x128），肩到脚的距离约80象素。该数据库只含正面和背面两个视角，无负样本，未区分训练集和测试集。Dalal等采用“HOG+SVM”，在该数据库上的检测准确率接近100%。
在这里插入图片描述

（9）USC Pedestrian Detection Test Set（USC行人数据库）

下载链接：https://sites.usc.edu/iris-cvlab/

该数据库包含三组数据集（USC-A、USC-B和USC-C），以XML格式提供标注信息。USC-A[Wu, 2005]的图片来自于网络，共205张图片，313个站立的行人，行人间不存在相互遮挡，拍摄角度为正面或者背面；USC-B的图片主要来自于CAVIAR视频库，包括各种视角的行人，行人之间有的相互遮挡，共54张图片，271个行人；USC-C有100张图片来自网络的图片，232个行人（多角度），行人之间无相互遮挡。
在这里插入图片描述

（10）Caltech Pedestrian Detection Benchmark（Caltech行人数据库）

下载链接：http://www.vision.caltech.edu/datasets/

该数据库是目前规模较大的行人数据库，采用车载摄像头拍摄，约10个小时左右，视频的分辨率为640x480，30帧/秒。标注了约250,000帧（约137分钟），350000个矩形框，2300个行人，另外还对矩形框之间的时间对应关系及其遮挡的情况进行标注。
在这里插入图片描述

（11）Daimler Pedestrian Detection Benchmark (戴姆勒行人检测标准数据库）

下载链接：http://www.gavrila.net/Datasets/Daimler_Pedestrian_Benchmark_D/Daimler_Pedestrian_Segmentatio/daimler_pedestrian_segmentatio.html

该数据库采用车载摄像机获取，分为检测和分类两个数据集。检测数据集的训练样本集有正样本大小为18×36和48×96的图片各15560（3915×4）张，行人的最小高度为72个象素；负样本6744张（大小为640×480或360×288）。测试集为一段27分钟左右的视频（分辨率为640×480），共21790张图片，包含56492个行人。分类数据库有三个训练集和两个测试集，每个数据集有4800张行人图片，5000张非行人图片，大小均为18×36，另外还有3个辅助的非行人图片集，各1200张图片。
在这里插入图片描述

（12）CrowdHuman

下载链接：http://www.crowdhuman.org/

CrowdHuman数据集是旷世发布的用于行人检测的数据集，图片数据大多来自于google搜索。
CrowdHuman 数据集数据量比较大，训练集15000张，测试集5000张，验证集4370张。训练集和验证集中共有 470K 个实例，约每张图片包含23个人，同时存在各种各样的遮挡。每个人类实例都用头部边界框、人类可见区域边界框和人体全身边界框注释。
在这里插入图片描述

（13）WiderPerson数据集

下载链接：http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/

WiderPerson数据集是比较拥挤场景的行人检测基准数据集，其图像是从多种场景中选择的，不再局限于交通场景。选择13382张图像，并用各种遮挡标记约40万个注释，随机选择8000/1000/4382图像作为训练，验证和测试集，与CityPersons和WIDER FACE数据集相似，不发布测试图像的标注文件。在这里插入图片描述

（14）CityPersons数据集

下载链接：https://github.com/CharlesShang/Detectron-PYTORCH/tree/master/data/citypersons

CityPersons 数据集是基于CityScapes数据集在行人检测领域专门建立的数据集，它选取了CityScapes 中5000张精标图片，并对其中的行人进行边界框标注。其中训练集包含2975张图片，验证集包含500张，测试集包含1575张。图片中行人的平均数量为7人，标注提供全身标注和可视区域标注

在这里插入图片描述

（15）CityScapes数据集

下载链接：https://www.cityscapes-dataset.com/

Cityscapes数据集，即城市景观数据集，其中包含从50个不同城市的街景中记录的各种立体视频序列，除了更大的20000个弱注释帧之外，还有高质量的5000帧像素级注释。Cityscapes数据集共有fine和coarse两套评测标准，前者提供5000张精细标注的图像，后者提供5000张精细标注外加20000张粗糙标注的图像。train、val、test总共5000张精细释，2975张训练图，500张验证图和1525张测试图，每张图片大小都是1024x2048。
在这里插入图片描述