手语检测识别

news2024/11/25 21:37:27

论文:Real-Time Sign Language Detection using Human Pose Estimation

Github:https://github.com/google-research/google-research/tree/master/sign_language_detection

SLRTP 2020

手语识别任务包括手语检测(Sign language detection),手语识别(sign language recognition)2个部分。本文主要研究手语检测,目的就是判断当前视频的某一帧是否有做手语操作。文章首先使用openpose进行人体的关键点检测,然后基于前后帧的关键点归一化位移基于lstm进行2分类判断,即输出当前视频帧是否有做手语操作。最终文章在DGS Corpus(German Sign Language)数据集上达到了91%的准确性。

论文首先考虑使用光流方法区别每一帧图片的动作区别,但是这样会将背景等信息的变化也引入,这是不想看到的。所以决定使用关键点的归一化位移作为特征。

关键点的检测使用openpose实现,

Pose-all:全部的关键点,包括脸部,身体,手部

Pose-body:身体的关键点

Pose-hand:手部关键点

BBOX:身体框,脸部框,手部框

最终实验效果Pose-all的效果是最佳的,因此论文也采用Pose-all。

通过将每个身体部位的位移特征向量可视化,更可以直接看出不同身体部位的影响程度。

蓝色的线条代表不同身体部位的位移特征,主要的特征集中在手部,最下面的黄色线表示是否进行手语的ground_truth。

具体的身体不同部位的特征向量的计算方式如下,

其中fps表示视频的帧率,P表示关键点坐标,t表示t时刻,t-1表示t-1时刻,然后将t时刻的关键点坐标和t-1时刻的关键点坐标计算L2距离,然后再乘以fps,得到归一化的关键点位移特征,保证了该特征不会随着视频帧率不同而有差异。

得到相邻帧的关键点位移特征向量后,在该向量的基础上做一个包含64个隐藏层的一层单向lstm。然后再做一个卷积操作,将特征维度变化为2维,然后直接基于这2维特征进行是否有打手语的2分类就可以。

总结:

使用openpose进行关键点检测,然后基于关键点位移特征向量进行2分类操作。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/346039.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝桥杯C/C++VIP试题每日一练之回形取数

💛作者主页:静Yu 🧡简介:CSDN全栈优质创作者、华为云享专家、阿里云社区博客专家,前端知识交流社区创建者 💛社区地址:前端知识交流社区 🧡博主的个人博客:静Yu的个人博客 🧡博主的个人笔记本:前端面试题 个人笔记本只记录前端领域的面试题目,项目总结,面试技…

以掘金示例,利用内链/外链进行网站SEO优化

前言 内链:从自己网站的一个页面指向另外一个页面。通过内链让网站内部形成网状结构,让蜘蛛的广度和深度达到最大化。 外链:在别的网站导入自己网站的链接。通过外链提升网站权重,提高网站流量。 一般来说,内链和外链…

JVM类加载机制

回到2018年的抖音哈哈. 回顾下: java开发环境: java编译运行过程: 1) 编译期:.java源文件,经过编译,生成.class字节码文件 2) 运行期:JVM加载.class并运行.class(0和1) 特点: 跨平台、一次编程,处处报错 名词解释: 1…

线上商超博弈:老将固守,抖音掀浪

配图来自Canva可画 2023年,抖音对本地生活服务的野心愈加膨胀了。 近日,关于“抖音将于3月1日上线全国外卖服务”的消息传得沸沸扬扬。虽然抖音官方出面回应“团购配送”项目在北京、上海、成都等城市试点中,目前暂无具体时间表,…

api是什么意思?又该如何使用呢?

一、应用程序编程接口 API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件的以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。 API全称 "…

kkfileview从Git拉取代码编译部署到服务器

今天遇到了需求是,使用kkfileview预览的时候自带的页面嵌套后页面显示的不是很友好,然后就配合前端下载了源码,本地测试运行很完美,但是部署到服务器(centos8)上安装openOffice环境坑死了 1、从gitee拉取代…

计算机网络 - 1. 体系结构

目录概念、功能、组成、分类概念功能组成分类分层结构概念总结OSI 七层模型应用层表示层会话层传输层网络层数据链路层物理层TCP/IP 四层模型OSI 与 TCP/IP 相同点OSI 与 TCP/IP 不同点为什么 TCP/IP 去除了表示层和会话层五层参考模型概念、功能、组成、分类 概念 &#x1f…

kail工具的使用--- cewl

1.介绍 Cewl是一款采用Ruby开发的应用程序,可以给他的爬虫指定URL地址和爬取深度,还可以添加外部链接,接下来Cewl会给你返回一个字典文件,你可以把字典用到类似John the Ripper这样的密码破解工具中。 2.使用 输入以下命令之后…

Python 处理Excel内的数据

(一)案例一介绍 现在有一匹电商产品跟当日销量的数据,如下,总共有上万笔的数据,现在需要统计每个品牌当日的销售量,比如美宝莲今天总共卖出了多少的商品,另外需要统计每个品牌下面的每个子品类…

【Flutter】DartPad 终极在线Dart编程环境

文章目录一、什么是DartPad二、如何使用三、使用技巧四、如何利用好DartPad五、总结一、什么是DartPad "Success is not final, failure is not fatal: it is the courage to continue that counts." - Winston Churchill"成功不是终点,失败不是致命…

cas 登录成功不跳转 CommonUtils.getResponseFromServer

目录报错信息问题背景问题原因现场服务器情况流程修改方法报错信息 2016-08-18 17:05:08.718 [http-bio-8080-exec-9] ERROR org.jasig.cas.client.util.CommonUtils.getResponseFromServer - 连接超时 java.net.ConnectException: 连接超时 java.net.ConnectException: Conne…

Springboot + VUE+Uniapp全套JAVA高端WMS仓库管理系统源码

WMS框架:springboot mybatis redis mysql VUE uniapp 包含:服务端JAVA全套源码, VUE后台前端代码uniapp前端微信小程序源码 说明:uniapp前端如需发布其他端小程序,请自行进行适配调整。 功能: 1、支持入库、质检…

【2023最新教程】从0到1开发自动化测试框架(0基础也能看懂)

一、序言 随着项目版本的快速迭代、APP测试有以下几个特点: 首先,功能点多且细,测试工作量大,容易遗漏;其次,代码模块常改动,回归测试很频繁,测试重复低效;最后&#x…

css书写方式

目录标题一、css是什么?二、css的书写方式1、行内样式【不推荐使用,太固定】2、页面样式(又叫内联样式)3、外联样式【店家推荐】4、import与link标签的区别一、css是什么? css(cascade style sheet)是用来装饰和装扮页…

【速通版】吴恩达机器学习笔记Part4

开启第二课! 目录 1.神经网络概述 2 前向传播(forward propogation)神经网络 3. tensorflow实现 Numpy中的matrix: 用循环写NN: ​用numpy写NN:​ AGI​ 关于矩阵运算的解释(略) 用tf训练…

Redis主从、哨兵、集群原理

1、 前言 大家好,我是捡田螺的小男孩。今天跟小伙伴们一起学习Redis的主从、哨兵、Redis Cluster集群。 Redis主从 Redis哨兵 Redis Cluster集群 1、Redis 主从 面试官经常会问到Redis的高可用。Redis高可用回答包括两个层面,一个就是数据不能丢失&#…

叮当网上书城项目简介

叮当网上书城项目 一、项目功能 1.前台功能 图书基本展示,包括推荐图书展示和类图书类型展示.推荐图书包括条幅推荐,热销推荐和新品推荐.按照图书类型展示商品.图书详细信息展示.图书加入购物车.修改购物车内图书信息,例如数量等.用户登录.用户注册.修改个人信息,包括密码和…

漏洞修改全记录(工作总结)

漏洞修改记录1 : zookeeper 取消对外暴露2 : web服务器配置 CSP header 配置安全配置3 : 不安全的访问4 : 静态资源未授权访问1 : zookeeper 取消对外暴露 解决方式:增加密码增加密码 2 : web服务器配置 CSP header 配置安全配置 解决方式:接口配置CS…

new bing的申请与使用教程

文章目录新必应申请新必应免代使用教程总结新必应申请 下载安装 Edge dev 版本,这个版本可以直接使用 对于没有更新的用户而言,不容易找到入口,所以我们直接使用 集成new bing的dev版本 Edge dev 下载链接:https://www.microso…

14- 决策树算法 (有监督学习) (算法)

决策树是属于有监督机器学习的一种决策树算法实操: from sklearn.tree import DecisionTreeClassifier # 决策树算法 model DecisionTreeClassifier(criterionentropy,max_depthd) model.fit(X_train,y_train)1、决策树概述 决策树是属于有监督机器学习的一种,起源…