介绍动作识别数据集:“NTU RGB+D”数据集和“NTU RGB+D 120”数据集

news2024/11/25 11:54:23

动作识别数据集:“NTU RGB+D”数据集和“NTU RGB+D 120”数据集

(还包括AUTH UAV手势数据集:NTU 4级)
本页介绍两个数据集:“NTU RGB+D”和“NTU RGB+D 120”。
“NTU RGB+D”包含60个动作类和56,880个视频样本。
“NTU RGB+D 120”扩展了“NTU RGB+D”,增加了另外60个类和另外57,600个视频样本,即“NTU RGB+D 120”总共有120个类和114,480个样本。
这两个数据集都包含每个样本的 RGB 视频、深度图序列、3D 骨骼数据和红外 (IR) 视频。每个数据集由三个 Kinect V2 相机同时捕获。
RGB视频的分辨率为1920x1080,深度图和红外视频均为512x424,3D骨骼数据包含每帧3个身体关节的25D坐标。

  1. 行动类
    这两个数据集中的动作分为三大类:日常行动、相互行动和医疗状况,如下表所示。
    注意:从 A1 到 A60 标记的操作包含在“NTU RGB+D”中,从 A1 到 A120 标记的操作包含在“NTU RGB+D 120”中。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
6. 使用条款和条件
数据集仅供学术研究之用,教育或研究机构的研究人员可免费用于非商业目的。

这两个数据集的使用受以下条款和条件的约束: • 未经 ROSE 实验室明确许可,以下任何行为都将被视为非法:
从该数据集重新分发、派生或生成新数据集,以及以任何方式或形式(部分或全部)将任何这些数据集用于商业用途。
• 为了保护隐私,任何这些数据集中所有主题的图像只允许在学术出版物和演示文稿中进行演示。
• “NTU RGB+D”和“NTU RGB+D 120”动作识别数据集的所有用户同意对ROSE实验室及其管理人员、员工和代理商进行赔偿、辩护并使其免受任何和所有损失、费用和损害。

如果有兴趣,研究人员可以注册一个帐户,提交申请表并接受发布协议。我们将验证您的请求并批准下载数据集。登录ID可用于“NTU RGB+D”和“NTU RGB+D 120”。

  1. 相关出版物
    所有使用“NTU RGB+D”或“NTU RGB+D 120”动作识别数据库或任何派生数据集(见第8节)的出版物都应包括以下确认:“(部分)本文中的研究使用了南洋理工大学ROSE实验室提供的NTU RGB + D(或NTU RGB + D 120)动作识别数据集, 新加坡。

此外,这些出版物应引用以下论文:

Amir Shahroudy, Jun Liu, Tian-Tsong Ng, Gang Wang, “NTU RGB+D: A Large Scale Dataset for 3D Human Activity Analysis”, IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016 [PDF].
Jun Liu,Amir Shahroudy,Mauricio Perez,Gang Wang,Ling-Yu Duan,Alex C. Kot,“NTU RGB + D 120:3D人类活动理解的大规模基准”,IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI),2019。 [PDF]。

关于RGB+D动作识别的一些相关著作:

Amir Shahroudy, Tian-Tsong Ng, Qingxiong Yang, Gang Wang, “深度视频中动作识别的多模态多部分学习”, TPAMI, 2016.
Amir Shahroudy,Tian-Tsong Ng,Yihong Gong,Gang Wang,“RGB + D视频中动作识别的深度多模态特征分析”TPAMI,2018。
Amir Shahroudy, Gang Wang, Tian Tsong Ng, “RGB-D 序列中动作识别的多模态特征融合”, ISCCSP, 2014.
刘军,Amir Shahroudy,徐东,王刚,“具有3D人类行为识别信任门的时空LSTM”,ECCV,2016。
刘军, 王刚, 胡平, 段玲宇, Alex C. Kot, “用于 3D 动作识别的全局上下文感知注意力 LSTM 网络”, CVPR, 2017.
刘军,Amir Shahroudy,徐东,Alex C. Kot,王刚,“基于骨架的动作识别使用时空LSTM网络与信任门”,TPAMI,2018。
Jun Liu, Gang Wang, Ling-Yu Duan, Kamila Abdiyeva, Alex C. Kot, “基于骨骼的人类行为识别与全球上下文感知注意LSTM网络”, TIP, 2018.
刘军,Amir Shahroudy,王刚,段玲宇,Alex C. Kot,“基于骨骼的在线动作预测使用尺度选择网络”,TPAMI,2019。
杨思源、刘军、卢世建、二孟华和Alex Kot,“基于多阶特征分析的手势识别和3D手部姿势估计的协作学习”,ECCV 2020。
杨思源、刘军、卢世建、二梦华和 Alex Kot,“用于无监督 3D 动作表示学习的骨架云着色”,ICCV 2021。

  1. 基于NTU RGB+D数据集的衍生作品
    以下是一些派生自或部分使用NTU RGB + D数据集的数据集:

8.1. LSMB19:用于在连续运动数据流中搜索和注释的大规模运动基准 (http://mocap.fi.muni.cz/LSMB)。

J. Sedmidubsky,P. Elias,P. Zezula,“连续人类骨骼序列中的基准搜索和注释”,ICMR,2019 年。

8.2. AUTH 无人机手势数据集 (https://aiia.csd.auth.gr/auth-uav-gesture-dataset/ ).

F. Patrona,I. Mademlis,I. Pitas,“用于自主无人机处理的手势语言概述”,在空中机器人系统与环境物理相互作用研讨会 (AIRPHARO) 的论文集,2021 年。
您可以使用相同的申请表请求NTU RGB+D数据集的相关4类子数据集,并从下载页面的第3.0节下载

参考资料

https://rose1.ntu.edu.sg/dataset/actionRecognition/

代码参考:
https://github.com/shahroudy/NTURGB-D
https://github.com/kchengiva/Shift-GCN
https://github.com/Hrener/3D-Action-recognition
https://blog.csdn.net/Hren0412/article/details/89495678

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/519757.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

傅里叶分析的历史背景

目录 1. Fourier级数(三角级数)的历史背景 2. 圆和复平面 3. Fourier的大胆猜想 1. Fourier级数(三角级数)的历史背景 自古以来,圆形一直是(现在仍然是)最简单的抽象理解形状。您只需要一个中心点和一个半径就可以了。圆上的所有点与圆心的距离都是固定…

无监督域适应 (UDA)(1)

一、定义 1、无监督域自适应 Unsupervised domain adaptation 经典机器学习假设训练集和测试集来自相同的分布。 然而,这个假设在现实世界的应用程序中可能并不总是成立,例如,数据来源不同。 这种情况下,域分布之间会存在差异…

进阶自定义类型——结构体,枚举,联合

本章重点: 1.结构体 1.1 结构体类型的声明 1.2 结构的自引用 1.3 结构体变量的定义和初始化 1.4 结构体内存对齐 1.5 结构体传参 1.6 结构体实现位段(位段的填充&可移植性) 2.枚举 2.1 枚举类型的定义 2.2 枚举的优点 2.3 枚举的使用 3.联合 3.1 联合类…

年月日计算器——操作符重载的应用(含完整代码,简洁)

前言&#xff1a;大家好&#xff0c;这里是YY&#xff1b;此篇博客主要是操作符重载的应用&#xff1b;包含【流插入&#xff0c;流提取】【>,<,>,<,】【&#xff0c;-&#xff0c;&#xff0c;-】【前置&#xff0c;后置&#xff0c;前置--&#xff0c;后置--】 P…

Goby 漏洞更新 | Weblogic Commons Collections 序列化代码执行漏洞(CVE-2015-4852)

漏洞名称&#xff1a;Weblogic Commons Collections 序列化代码执行漏洞&#xff08;CVE-2015-4852&#xff09; English Name&#xff1a;Weblogic Commons Collections serialization code execution vulnerability (CVE-2015-4852) CVSS core: 7.5 影响资产数&#xff1a…

Docker ELK 监控日志(附yml)

目录 一 安装docker-commpose 二 编写yml文件 2.1 docker配置文件 2.2 filebeat配置文件 2.3 kibana配置文件 三 运行启动 四 打开kibana 一 安装docker-commpose 可以看我之前的docker文章 二 编写yml文件 2.1 docker配置文件 使用的7.17.9版本 &#xff0c;请保…

linux 下 ps、sort、top 命令详解

1、 ps命令 作用&#xff1a;查看系统进程&#xff0c;比如正在运行的进程有哪些&#xff0c;什么时候开始运行的&#xff0c;哪个用户运行的&#xff0c;占用了多少资源。 参数&#xff1a; -e 显示所有进程 -f 显示所有字段&#xff08;UID&#xff0c;PPIP&#xff0c;C…

Redis学习——单机版安装

目录 1.解压 2.安装gcc 3.执行make命令 4.复制redis的配置文件到默认安装目录下 5.修改redis.conf文件 6.启动redis服务与客户端 7.查看redis进行是否启动 8.关闭redis服务 9.redis性能测试 注意&#xff1a;安装redis前要安装jdk。 1.解压 [rootlxm148 install]# t…

ubuntu卷积神经网络——图片数据集的制作以及制作好的数据集的使用

首先我事先准备好五分类的图片放在对应的文件夹&#xff0c;图片资源在我的gitee文件夹中链接如下&#xff1a;文件管理: 用于存各种数据https://gitee.com/xiaoxiaotai/file-management.git 里面有imgs目录和npy目录&#xff0c;imgs就是存放5分类的图片的目录&#xff0c;里面…

Lesson14 高级IO

前言 IO 等待 数据拷贝,比如read/recv,write/send只要在单位事件里,让等的比重减低,IO的效率就越高 五种IO模型 钓鱼小案例 阻塞式 阻塞式: 张三拿着一根鱼竿,一直在岸边钓鱼,期间一直盯着鱼竿,等待鱼上钩 非阻塞式轮询式 非阻塞式轮询式: 李四拿着一根鱼竿,在岸边钓鱼,期…

Weblogic RCE合集

文章目录 CVE-2023-21839(T3/IIOP JNDI注入)前言漏洞简单分析漏洞复现防护措施 CVE-2020-2551(RMI-IIOP RCE)漏洞简单分析漏洞复现防护措施 CVE-2017-3506(wls-wsat组件XMLDecoder反序列化漏洞)漏洞简单分析漏洞复现防护措施 CVE-2020-14882&CVE-2020-14883漏洞简单分析 CV…

2023.05.11 c高级 day3

编写一个名为myfirstshell.sh的脚本&#xff0c;它包括以下内容。 包含一段注释&#xff0c;列出您的姓名、脚本的名称和编写这个脚本的目的和当前用户说“hello 用户名”显示您的机器名 hostname显示上一级目录中的所有文件的列表显示变量PATH和HOME的值显示磁盘使用情况用id命…

算法修炼之练气篇——练气十五层

博主&#xff1a;命运之光 专栏&#xff1a;算法修炼之练气篇 前言&#xff1a;每天练习五道题&#xff0c;炼气篇大概会练习200道题左右&#xff0c;题目有C语言网上的题&#xff0c;也有洛谷上面的题&#xff0c;题目简单适合新手入门。&#xff08;代码都是命运之光自己写的…

来领略一下带头双向循环链表的风采吧

&#x1f349; 博客主页&#xff1a;阿博历练记 &#x1f4d6;文章专栏&#xff1a;数据结构与算法 &#x1f68d;代码仓库&#xff1a;阿博编程日记 &#x1f339;欢迎关注&#xff1a;欢迎友友们点赞收藏关注哦 文章目录 &#x1f344;前言&#x1f37c;双向循环链表&#x1…

Qt使用星空图作为窗口背景,点击键盘的WASD控制小飞机在上面移动。

事件函数的使用依托于Qt的事件机制&#xff0c;一个来自于外部事件的传递机制模型如下所示 信号槽虽然好用&#xff0c;但是无法包含所有的情况&#xff0c;事件函数可以起到对信号槽无法覆盖的一些时机进行补充&#xff0c;事件函数的使用无需连接。 常用的事件函数如下所示。…

设计模式5—抽象工厂模式

5.抽象工厂模式 概念 抽象工厂模式&#xff1a;提供一个创建一系列相关或相互依赖对象的接口&#xff0c;而无须指定他们具体的类。抽象工厂又称为Kit模式&#xff0c;属于对象创建型模式。 抽象工厂可以将统一产品族的单独工厂封装起来&#xff0c;在正常使用中&#xff0c…

计算机网络笔记——网络层、传输层、应用层(方老师408课程)(持续更新)

文章目录 前言网络层网络层提供的两种服务网际协议——IP虚拟互联网络IP数据报格式逐一理解整体理解IP数据报分片与长度精算 IP地址IP地址概述分类的IP地址——ABCDE分类IP的子网划分不分类的IP地址——CIDRIP地址总结 IP分组的转发网际控制报文协议——ICMP下一代网络协议——…

我用 ChatGPT 干的 18 件事!【人工智能中文站创始人:mydear麦田访谈】

新建了一个网站 https://ai.weoknow.com/ 每天给大家更新可用的国内可用chatGPT 你确定你可以使用ChatGPT吗&#xff1f; 今天我整理了18种ChatGPT的使用方法&#xff0c;让大家看看你可以使用哪些。 1.语法修正 2.文本翻译 3.语言转换 4.代码解释 5.修复代码错误 6.作为百科…

初识HTML的基础知识点!!!

初识HTML&#xff01;&#xff01;&#xff01; 一、系统构架 1.B/S构架 &#xff08;1&#xff09;B/S构架&#xff08;Browser / Server) 就是&#xff08;浏览器/服务器的交互形式&#xff09; Browser支持HTML、CSS、JavaScript &#xff08;2&#xff09;优缺点 优点…

UI--基本组件

目录 1. Designer 设计师 2. Layout 布局 3. 基本组件 3.1 QWidget 3.2 ui指针 3.3 QLabel 标签&#xff08;掌握&#xff09; 示例代码&#xff1a; dialog.h dialog.cpp 3.4 QAbstractButton 按钮类&#xff08;掌握&#xff09; 示例代码&#xff1a; dialog.ui dialog.h di…