设备上的实时自定义手势识别

news2024/9/22 5:25:37

这篇论文的标题是《On-device Real-time Custom Hand Gesture Recognition》,主要研究了如何在移动设备上实时识别自定义手势。以下是论文的主要内容概述:

摘要

  • 论文指出现有的手势识别系统大多限于预定义的手势集,但用户和开发者通常希望识别新的、未见过的手势。
  • 提出了一个用户友好的框架,允许用户轻松定制和部署自己的手势识别流程。
  • 框架提供了一个预训练的单手嵌入模型,可以针对自定义手势识别进行微调。
  • 用户可以在网络摄像头前进行手势,收集每个手势的少量图像。
  • 提供了一个低代码解决方案来训练和部署自定义手势识别模型,使得即使没有机器学习(ML)专业知识的用户也能使用框架。
  • 还提供了一个无代码的Web前端,供没有任何ML专业知识的用户使用。
  • 自定义手势识别(HGR)可以在设备上实时运行,通过调用开源模型推理API MediaPipe Tasks中的简单函数实现。

1. 引言

  • 手势识别在增强现实(AR)、虚拟现实(VR)、视频会议和远程控制应用中起着关键作用。
  • 论文提出了一种创新的方法,即使用预训练模型和有限的训练数据来训练准确且健壮的HGR模型。
  • 预训练模型是在大量手语视频数据集上训练的,然后对权重进行微调以用于自定义手势分类。

2. 架构

  • 使用了“On-device Real-Time Hand Gesture Recognition”中的工作作为起点。
  • 解决方案使用了一个实时运行的模型,该模型提取手部地标。
  • 为了训练词级手指拼写模型,使用了内部收集的数据集,包含79K个视频和21K个独特的手指拼写单词。
  • 通过使用双向LSTM和连接时序分类(CTC)损失来训练模型,能够提取区分性特征。

3. 结果

  • 通过微调单手嵌入模型的权重来训练自定义手势识别模型,并报告了结果。
  • 使用了8个类别的内部数据集,包括7个手势类别和1个背景类别。
  • 进行了不同训练样本数量的试验,发现当样本数量为50或更多时,模型表现良好。

4. 手部地标检测改进

  • 当两只手非常接近或相互遮挡时,地标模型可能无法准确提取两只手的所有地标。
  • 通过在训练和推理期间提供手部地标模型的手性提示,可以提高地标的准确性。

5. 实现

  • 开发了低代码训练管道MediaPipe Model Maker,使用户能够轻松训练新的手势识别模型。
  • 实现了模块化的推理管道,该管道以原始手部图像序列为输入,并顺序处理所有图像。

6. 结论

  • 研究提出了一种易于使用的方法,通过微调预训练的手势地标嵌入来训练准确的自定义手势识别模型。
  • 还介绍了对手势地标模型的改进,这些改进增强了手势识别系统的有效性。

参考文献

  • 论文列出了相关的参考文献,包括关于实时手势识别、手部跟踪、LSTM、CTC损失、深度迁移学习、批量归一化等的研究。

论文的重点在于提出了一种新的框架,使得用户可以自定义手势识别流程,并且通过预训练模型和少量的训练数据来实现高准确率的手势识别,这对于AR、VR等领域具有重要的应用价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2091135.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙(HarmonyOS)常见的三种弹窗方式

最近有一个想法,做一个针对鸿蒙官方API的工具箱项目,介绍常用的控件,以及在项目中如何使用,今天介绍Harmony中如何实现弹窗功能。 警告弹窗 警告弹窗是一个App中非常常用的弹窗,例如: 删除一条记录&…

帕金森患者在运动时有哪些类型的运动推荐?

帕金森病患者在进行运动时,可以考虑以下几种类型的运动: 有氧运动:如散步、慢跑、爬山、骑自行车、健美操、广场舞等,这些运动有助于改善心肺功能,同时也能提升肌肉力量和灵活性。 柔性运动:包括瑜伽、太极…

<Rust>egui学习之小部件(七):如何在窗口中添加颜色选择器colorpicker部件?

前言 本专栏是关于Rust的GUI库egui的部件讲解及应用实例分析,主要讲解egui的源代码、部件属性、如何应用。 环境配置 系统:windows 平台:visual studio code 语言:rust 库:egui、eframe 概述 本文是本专栏的第七篇博…

笔记整理—内核!启动!

常规启动时,各镜像都在SD卡中的各种分区中,内核放在kernel分区,从SD卡到DDR的连接处(内核不需要进行重定位,直接从链接处启动)。uboot从sd卡分区读使用movi命令。 使用fastboot指令可以查看分区情况&#x…

【赵渝强老师】MongoDB的MMAPv1存储引擎

在MongoDB 3.2版本以前,MongoDB使用MMAPv1作为默认的存储引擎。在MMAPv1的存储引擎中,包含以下的组成部分: Database 每个Database由一个.ns名称空间文件及若干个数据文件组成。数据文件从0开始编号,依次为.0、.1、.2等。数据文件…

小心GitHub账号被盗

最近有小伙伴反馈在 GitHub 上解压了不明文件之后,GitHub 账号被盗了。 事情是这样的: 有小伙伴在 GitHub 某仓库的 issue 中正常和人讨论问题,有个人光速回复了一条消息,给了一个链接,让下载一个名为 fix.rar 的文件…

C++系列-STL容器之list

STL容器之list list容器的基本结构list容器的特点list容器的优点list容器的缺点 list容器的构造函数list容器的常用接口list大小及空否list访问list迭代器相关list增删查改push and popinsert其它 list赋值操作 list容器的基本结构 list容器的内部结构是双向循环链表&#xff…

Java笔试面试题AI答之面向对象(8)

文章目录 43. 解释Java接口隔离原则和单一原则如何理解 ?单一职责原则(Single Responsibility Principle, SRP)接口隔离原则(Interface Segregation Principle, ISP) 44. Java 有没有 goto? 如果有,一般用…

004.Python爬虫系列_web请求全过程剖析(重点)

我 的 个 人 主 页:👉👉 失心疯的个人主页 👈👈 入 门 教 程 推 荐 :👉👉 Python零基础入门教程合集 👈👈 虚 拟 环 境 搭 建 :👉&…

2024年8月31日历史上的今天大事件早读

1449年8月31日 明朝“土木之变” 1907年8月31日 英、法、俄三国协约形成 1914年8月31日 “骆派”京韵大鼓的创建者骆玉笙诞生 1916年8月31日 蔡锷东渡日本养病 1935年8月31日 美国通过《中立法案》 1937年8月31日 日本华北方面军成立 1941年8月31日 晋察冀边区完成民主大…

2024最新最全:国内外人工智能AI工具网站大全!

国内外人工智能AI工具网站大全(一键收藏,应有尽有) 摘要一、AI写作工具二、AI图像工具 2.1、常用AI图像工具2.2、AI图片插画生成2.3、AI图片背景移除2.4、AI图片无损调整2.5、AI图片优化修复2.6、AI图片物体抹除 三、AI音频工具四、AI视频工…

南京观海微电子----CMOS门电路(OD门、传输门、双向模拟开关、三态门)

【 1. MOS管】 MOS管:绝缘栅型场效应管。 【 2. CMOS电路】 当NMOS管和PMOS管成对出现在电路中,且二者在工作中互补,称为CMOS管(Complementary Metal-Oxide-Semiconductor)。 电路结构 拉电流 如下图所示,输入低电平&#xff…

王者荣耀 设置游戏头像 不用微信头像

我们在微信 我 选择 设置 在里面找到 个人信息与权限 如果找不到看看有木有一个叫隐私的选项 点击 进入之后 选择授权管理 找到王者荣耀 然后点击右侧的小箭头进入 点击下面的 解除授权 确认一下 解除授权 然后重新打开王者 选择微信登录 我们这里 选择新建昵称头像 选…

线性代数之线性方程组

目录 线性方程组 1. 解的个数 齐次线性方程组: 非齐次线性方程组: 2. 齐次线性方程组的解 3. 非齐次线性方程组的解 4. 使用 Python 和 NumPy 求解线性方程组 示例代码 齐次线性方程组 非齐次线性方程组 示例结果 齐次线性方程组 非齐次线性…

Unity获取SceneView尺寸

获取SceneView尺寸 var sceneView SceneView.lastActiveSceneView; var size new Vector2(sceneView.position.width,sceneView.position.height);

Elasticsearch学习(1)-mac系统安装elasticsearch基础

Elasticsearch基础 1. 传统数据库与elasticsarch2. 下载Elasticsearch7. 经过上述所有操作,就可以得到一个具体的连接可视化页面3. 安装kibana4. 其余知识点 elasticsearch是什么? Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能…

sql-labs靶场(41-50)

四十一 1.查看数据库名 ?id-1 union select 1,2,database()-- 2.查看表名 ?id-1 union select 1,group_concat(table_name),3 from information_schema.tables where table_schemadatabase()-- 3.查看user表列名 ?id-1 union select 1,group_concat(column_name),3 from…

SpringMVC处理流程介绍

SpringMVC请求处理流程 发起请求到前端控制器(DispatcherServlet)前端控制器请求HandlerMapping查找Handler(可以根据xml配置,注解进行查找) 对应Spring源码 //在类DispatcherServlet里面 protected void doDispatch(HttpServletRequest request, HttpServletResponse respon…

Leetcode102二叉树的层序遍历(java实现)

今天分享的题目是lee102题,题目的描述如下: 可能做到这道题的小伙伴写过其他关于二叉树的题目,但是一般是使用递归的方式做一个深度遍历,而层序遍历我们该如何做呢? 解题思路:使用一个队列来记录本层节点&a…

浅谈新能源汽车充电桩安装以及防范

摘要:随着国家对绿色环保的倡导,新能源电动汽车应运而生,它们采用清洁能源替代传统能源,有效避免了对自然环境的污染,并减少了资源消耗,实现了资源的高效利用。新能源电动汽车的普及降低了使用成本&#xf…