MOT学习笔记 — 行人检测及行人跟踪数据集总结

news2025/1/13 7:56:54

1. 行人红外数据集总结

(1)OSU Thermal Pedestrian Database

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/01/download.html
在这里插入图片描述

(2)IRIS Thermal/Visible Face Database

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/02/download.html
在这里插入图片描述

(3)OSU Color-Thermal Database

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/03/download.html
在这里插入图片描述

(4)Terravic Facial IR Database

下载链接:http://vcipl-okstate.org/pbvs/bench/
在这里插入图片描述

(5)Terravic Motion IR Database

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/05/download.html
在这里插入图片描述

(6)Terravic Weapon IR Database

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/06/download.html
在这里插入图片描述

(7)CBSR NIR Face Dataset

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/07/download.html
在这里插入图片描述

(8)Audio-Visual Vehicle (AVV) Dataset

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/08/download.html
在这里插入图片描述

(9)CSIR-CSIO Moving Object Thermal Infrared Imagery Dataset (MOTIID)

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/09/Benchmark.zip
在这里插入图片描述

(10)Pedestrian Infrared/visible Stereo Video Dataset

下载链接:https://www.polymtl.ca/litiv/codes-et-bases-de-donnees
在这里插入图片描述

(11)Thermal Infrared Video Benchmark for Visual Analysis

下载链接:http://csr.bu.edu/BU-TIV/BUTIV.html
在这里插入图片描述

(12)Maritime Imagery in the Visible and Infrared Spectrums

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/12/VAIS.zip
在这里插入图片描述

(13)ContactDB: Analyzing and Predicting Grasp Contact via Thermal Imaging

下载链接:https://github.com/samarth-robo/contactdb_utils
在这里插入图片描述

(14)DIAST Variability Illuminated Thermal and Visible Ear Image Dataset

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/14/DIAST_Datasets.zip
在这里插入图片描述

(15)M3FD: A Multi-scenario Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection

下载链接:https://github.com/dlut-dimt/TarDAL
在这里插入图片描述

(16)MHAD-D-Mocap data: A Multiview Depth-based Motion Capture Benchmark Dataset for Human Motion Denoising and Enhancement Research

下载链接:http://vcipl-okstate.org/pbvs/bench/Data/16/MHAD-D-Mocap.zip
在这里插入图片描述

2. 行人检测数据集总结

(1)SCUT FIR行人检测数据集

下载链接:https://sourl.cn/4VK3Bn

SCUT FIR Pedestrian Datasets 是一个大型远红外行人检测数据集。它由大约 11 小时长的图像序列( 帧)组成,速度为 25 Hz,以低于 80 km/h 的速度在不同的交通场景中行驶。图像序列来自中国广州市中心、郊区、高速公路和校园 4 种场景下的 11 个路段。该数据集注释了 211011 帧,总共 477907 个边界框,包含 7659 个独特的行人。
在这里插入图片描述

(2)SCUT FIR行人检测数据集

下载链接:https://sourl.cn/mgxHEY

包含 4372 张图像和 151 万条注释的综合数据集。与现有数据集相比,所提出的数据集是在各种不同的场景和环境条件下收集的。此外,该数据集提供了相对丰富的注释集,如点、近似边界框、模糊级别等。
在这里插入图片描述

(3)CIHP人体解析数据集

下载链接:https://sourl.cn/W3Tm2J

Crowd Instance-level Human Parsing (CIHP) 数据集包含 38,280 张多人图像,这些图像具有精细的注释、高外观可变性和复杂性。该数据集可用于人体部分分割任务。
在这里插入图片描述

(4)AHU-Crowd人群数据集

下载链接:https://sourl.cn/XFJDCh

人群数据集是从各种来源获得的,例如 UCF 和数据驱动的人群数据集,以评估所提出的框架。序列多样,代表了朝圣、车站、马拉松、集会和体育场等各种场景中公共空间的密集人群。此外,这些序列具有不同的视野、分辨率,并表现出多种运动行为,涵盖了明显和微妙的不稳定性。
在这里插入图片描述

(5)AudioVisual 人群计数

下载链接:https://sourl.cn/wfd7wD

一个用于人群计数的新数据集,该数据集由中国不同位置的大约 2000 个带注释的图像令牌组成,每个图像对应一个 1 秒的音频剪辑和一个密度图。图像处于不同的照明条件下。
在这里插入图片描述

(6)UCF-CC-50

下载链接:http://c.nxw.so/9LYoK

该数据集包含极其密集人群的图像。图像主要是从 FLICKR 收集的。

在这里插入图片描述

(7)北京BRT数据集

下载链接:http://c.nxw.so/c1PV9

该数据集包含 1,280 张图像和 16,795 个标记的行人,用于人群分析。该数据集使用 720 张图像进行训练,使用 560 张图像进行测试。

在这里插入图片描述

(8)MIT-CBCL Pedestrian Database(MIT行人数据库)

下载链接:http://cbcl.mit.edu/software-datasets/PedestrianData.html

该数据库为较早公开的行人数据库,共924张行人图片(ppm格式,宽高为64x128),肩到脚的距离约80象素。该数据库只含正面和背面两个视角,无负样本,未区分训练集和测试集。Dalal等采用“HOG+SVM”,在该数据库上的检测准确率接近100%。
在这里插入图片描述

(9)USC Pedestrian Detection Test Set(USC行人数据库)

下载链接:https://sites.usc.edu/iris-cvlab/

该数据库包含三组数据集(USC-A、USC-B和USC-C),以XML格式提供标注信息。USC-A[Wu, 2005]的图片来自于网络,共205张图片,313个站立的行人,行人间不存在相互遮挡,拍摄角度为正面或者背面;USC-B的图片主要来自于CAVIAR视频库,包括各种视角的行人,行人之间有的相互遮挡,共54张图片,271个行人;USC-C有100张图片来自网络的图片,232个行人(多角度),行人之间无相互遮挡。
在这里插入图片描述

(10)Caltech Pedestrian Detection Benchmark(Caltech行人数据库)

下载链接:http://www.vision.caltech.edu/datasets/

该数据库是目前规模较大的行人数据库,采用车载摄像头拍摄,约10个小时左右,视频的分辨率为640x480,30帧/秒。标注了约250,000帧(约137分钟),350000个矩形框,2300个行人,另外还对矩形框之间的时间对应关系及其遮挡的情况进行标注。
在这里插入图片描述

(11)Daimler Pedestrian Detection Benchmark (戴姆勒行人检测标准数据库)

下载链接:http://www.gavrila.net/Datasets/Daimler_Pedestrian_Benchmark_D/Daimler_Pedestrian_Segmentatio/daimler_pedestrian_segmentatio.html

该数据库采用车载摄像机获取,分为检测和分类两个数据集。检测数据集的训练样本集有正样本大小为18×36和48×96的图片各15560(3915×4)张,行人的最小高度为72个象素;负样本6744张(大小为640×480或360×288)。测试集为一段27分钟左右的视频(分辨率为640×480),共21790张图片,包含56492个行人。分类数据库有三个训练集和两个测试集,每个数据集有4800张行人图片,5000张非行人图片,大小均为18×36,另外还有3个辅助的非行人图片集,各1200张图片。
在这里插入图片描述

(12)CrowdHuman

下载链接:http://www.crowdhuman.org/

CrowdHuman数据集是旷世发布的用于行人检测的数据集,图片数据大多来自于google搜索。
CrowdHuman 数据集数据量比较大,训练集15000张,测试集5000张,验证集4370张。训练集和验证集中共有 470K 个实例,约每张图片包含23个人,同时存在各种各样的遮挡。每个人类实例都用头部边界框、人类可见区域边界框和人体全身边界框注释。
在这里插入图片描述

(13)WiderPerson数据集

下载链接:http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/

WiderPerson数据集是比较拥挤场景的行人检测基准数据集,其图像是从多种场景中选择的,不再局限于交通场景。 选择13382张图像,并用各种遮挡标记约40万个注释,随机选择8000/1000/4382图像作为训练,验证和测试集,与CityPersons和WIDER FACE数据集相似,不发布测试图像的标注文件。 在这里插入图片描述

(14)CityPersons数据集

下载链接:https://github.com/CharlesShang/Detectron-PYTORCH/tree/master/data/citypersons

CityPersons 数据集是基于CityScapes数据集在行人检测领域专门建立的数据集,它选取了CityScapes 中5000张精标图片,并对其中的行人进行边界框标注。其中训练集包含2975张图片,验证集包含500张,测试集包含1575张。图片中行人的平均数量为7人,标注提供全身标注和可视区域标注

在这里插入图片描述

(15)CityScapes数据集

下载链接:https://www.cityscapes-dataset.com/

Cityscapes数据集,即城市景观数据集,其中包含从50个不同城市的街景中记录的各种立体视频序列,除了更大的20000个弱注释帧之外,还有高质量的5000帧像素级注释。Cityscapes数据集共有fine和coarse两套评测标准,前者提供5000张精细标注的图像,后者提供5000张精细标注外加20000张粗糙标注的图像。train、val、test总共5000张精细释,2975张训练图,500张验证图和1525张测试图,每张图片大小都是1024x2048。
在这里插入图片描述

3. 行人跟踪数据集总结

(1)MOT数据集

下载链接:https://motchallenge.net/

包含MOT15、MOT16、MOT17等数据集
在这里插入图片描述

文中部分代码及图片引用自其他博主博客,仅用作学习用途,在此表示感谢,如有侵权,可联系我删除。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/399188.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

React 服务端渲染

React 服务器端渲染概念回顾什么是客户端渲染CSR(Client Side Rendering)服务器端只返回json数据,Data和Html的拼接在客户端进行(渲染)。什么是服务器端渲染SSR(Server Side Rendering)服务器端返回数据拼接过后的HTML,Data和Html…

Ubuntu20.04下安装vm17+win10/11

一、安装vmware17 1、官网下载 vmware官网:https://www.vmware.com/cn/products/workstation-pro/workstation-pro-evaluation.html 2、安装依赖 sudo apt update sudo apt install build-essential linux-headers-generic gcc make3、权限和安装 到下载的目录下…

vector你得知道的知识

vector的基本使用和模拟实现 一、std::vector基本介绍 1.1 常用接口说明 std::vector是STL中的一个动态数组容器,它可以自动调整大小,支持在数组末尾快速添加和删除元素,还支持随机访问元素。 以下是std::vector常用的接口及其说明&#xf…

品牌软文怎么写?教你几招

软文是什么?软文的本质就是广告,当然不是明晃晃的推销,而是自然隐晦地植入产品信息,引导更多用户自愿下单。 品牌软文对于写手的经验、内容的质量要求都相对较高,否则写出来的软文无法达到预期的效果。品牌软文怎么写…

一个古老的html后台的模板代码

效果图下: css部分代码:/* CSS Document / body{font-family:“宋体”, Arial,Verdana, sans-serif, Helvetica;font-size:12px;margin:0;background:#f4f5eb;color:#000;} dl,ul,li{list-style:none;} a img{border:0;} a{color:#000;} a:link,a:visit…

[css]通过网站实例学习以最简单的方式构造三元素布局

文章目录二元素布局纵向布局横向布局三元素布局b站直播布局实例左右-下 布局左-上下 布局上下-右 布局方案一方案二后言二元素布局 在学习三元素布局之前,让我们先简单了解一下只有两个元素的布局吧 两个元素的相对关系非常简单,不是上下就是左右 纵向布…

Anaconda配置Python科学计算库SciPy的方法

本文介绍在Anaconda环境中,安装Python语言SciPy模块的方法。 SciPy是基于Python的科学计算库,用于解决科学、工程和技术计算中的各种问题。它建立在NumPy库的基础之上,提供了大量高效、易于使用的功能,包括统计分析、信号处理、优…

用一个例子告诉你 怎样在spark中创建累加器

目录 1.说明 1.1 什么是累加器 1.2 累加器的功能 2. 使用累加器 3. 累加器和reduce、fold算子的区别 1.说明 1.1 什么是累加器 累加器是Spark提供的一个共享变量(Shared Variables) 默认情况下,如果Executor节点上使用到了Driver端定义的变量(通过算子传…

Redis常用命令及数据类型参数

1. 针对于string SET key value / GET key SET k1 v1 GET k1 // v1String是二进制安全的,是可变长度的, 底层类似于ArrayList 是可扩容的,最大存储内存为 512MB。 2. 判断key中是否存在某个内容 EXISTS key SET k1 v1 EXISTS k1 // …

Noah-MP陆面过程模型建模方法与站点、区域模拟

陆表过程的主要研究内容以及陆面模型在生态水文研究中的地位和作用 熟悉模型的发展历程,常见模型及各自特点; Noah-MP模型的原理 Noah-MP模型所需的系统环境与编译环境的搭建方法您都了解吗?? linux系统操作环境您熟悉吗&…

Linux驱动中的fasync(异步通知)和fsync

一、fsync用来同步设备的写入操作,考虑把一块设局写入到硬盘的操作,如果使用write函数,函数返回后只能保证数据被写入到驱动程序或者内核管理的数据缓存中,而无法保证数据被真正写入到硬盘的存储块里。但是fync可以做到这一点&…

查找、排序、二叉树的算法,统统记录于此。

文章目录一、查找1. 无序表的顺序查找2. 折半查找3. 分块查找4. 二叉排序树BST5. 哈希表查找二、排序1. 不带哨兵的直接插入排序2. 带哨兵的直接插入排序3. 带哨兵、折半查找的直接插入排序4. 希尔排序5. 冒泡排序6. 快速排序7. 选择排序8. 堆排序9. 归并排序二叉树1. 递归先序…

八,iperf3源代码分析:状态机及状态转换过程--->运行正向TCP单向测试时的客户端代码

本文目录一、测试用命令二、iperf3客户端状态机中各个状态解析状态机迁移图运行正向TCP单向测试时的客户端的状态列表三、iperf3客户端状态机迁移分析A-初始化测试对象(NA--->初始化状态):B-建立控制连接,等待服务端PARAM_EXCHANGE的指令&…

西电机试数据结构核心算法与习题代码汇总(机考真题+核心算法)

文章目录前言一、链表问题1.1 反转链表1.1.1 题目1.1.2 代码1.2 多项式加减法1.2.1 题目1.2.2 代码二、队列和栈2.1 学生退学2.1.1 问题2.1.2 代码三、矩阵和串题目3.1 矩阵对角线求和3.1.1 问题3.1.2 代码四、排序问题4.1 多元素排序4.1.1 问题4.1.2 代码五、二叉树5.1 相同二…

synchronize优化偏向锁

偏向锁 轻量级锁在没有竞争时(只有自己一个线程),仍然会尝试CAS替换mark word; 会造成一定的性能的损耗; JDK6之中引入了偏向锁进行优化,第一次使用时线程ID注入到Mark word中,之后重入不再进…

旅游预约APP开发具有什么优势和功能

旅游活动目前正在作为广大用户休闲娱乐的一个首选内容,不仅是公司团建活动可以选择旅游,而且一些节假日也可以集结自己的亲朋好友来一次快乐有趣的旅游活动,随着当代人对于旅游的需求呈现上升的趋势,也让旅游预约APP开发开始流行并…

大家都在用哪些研发流程管理软件?

全球知名的10款流程管理软件分享:1.IT/研发项目流程管理:PingCode;2.通用项目流程管理:Worktile;3.销售流程管理:Salesforce Workflow;4.合同流程管理:Agiloft;5.IBM Bus…

20230308 APDL Lsdyna结构学习笔记

可以用鼠标右键进行结构的旋转视图。 一、编辑材料 输入参数分别为: 密度; 弹性模量; 泊松比; 屈服应力; 切线模量 由于模型是分块建立的,这里需要把模型进行粘接 点击booleans(布尔工具) 点击Glue、areas,结构物是由面单元构成的

ReactDOM.render函数内部做了啥

ReactDOM.render函数是整个 React 应用程序首次渲染的入口函数&#xff0c;它的参数是什么&#xff0c;返回值是什么&#xff0c;函数内部做了什么&#xff1f; ReactDOM.render(<App />, document.getElementById("root")); 前序 首先看下首次渲染时候&…

二叉树OJ题目详解

根据二叉树创建字符串 采用前序遍历的方式&#xff0c;将二叉树转换成一个由括号和数字组成的字符串。 再访问每一个节点时&#xff0c;需要分情况讨论。 如果这个节点的左子树不为空&#xff0c;那么字符串应加上括号和左子树的内容&#xff0c;然后判断右子树是否为空&#x…