9个最常用的人体姿态估计模型

news2024/11/18 10:37:59

“姿态估计?”……“姿态”一词对于不同的人来说可能有不同的含义,但我们不是在讨论阿诺德经典、奥林匹亚或选美表演。 那么,姿态估计到底是什么? 那么,让我们深入探讨这个话题。

在这里插入图片描述

推荐:用 NSDT编辑器 快速搭建可编程3D场景

姿态估计(Pose Estimation)在计算机视觉领域引起了极大的关注。 人们越来越感兴趣的是使用计算机视觉技术来实时识别和跟踪人或物体的运动的能力,这为跨行业提供了很多用处。 在先进技术不断发展的时代,姿势估计可以成为运动生物力学、动画、游戏、机器人、医疗康复和监视领域的有效工具。

本质上,姿态估计根据图像或视频中人的身体部位和关节位置来预测不同的姿势。 例如,我们可以在深蹲时自动检测关节、手臂、臀部和脊柱的位置。 现在,我们中的一些人可能想知道它有什么用处? 然而,考虑一下运动员受伤后康复或接受力量训练的例子; 姿态估计可以帮助运动分析师分析从深蹲的起始位置到结束位置的关键点。 因此,这些分析师可以纠正姿势并帮助防止训练损伤(图 1)。

在这里插入图片描述

图 1:蹲下时的人体姿势估计

1、姿态估计的要点

用于从图像和视频中检测人物或物体的姿势估计。 然而,我们应该意识到姿势估计有不同的类别。

当研究对象是人类时,姿态分析是通过确定各种身体关节来执行的。 例如,可以通过某人的肘部位置或膝关节位置来确定。 这种形式的姿态检测属于人体姿态估计的范畴。 姿态估计模型以经过良好处理的图像或视频作为输入。 该模型根据输入图像中的信息提供有关不同关键点的输出。 一般来说,关键点配有 ID 和置信度分数,确定关键点存在于给定输入的特定位置的概率。 现在,如果我们回想起运动员之前进行深蹲的图像,我们可以分配各种 ID,例如:
在这里插入图片描述

相反,与人类主体不同,可以对主要是刚性的物体进行姿态估计; 因此,它们属于刚性姿态估计的范畴。

2、姿态估计:2D 还是3D?

姿态估计可以通过两种方式进行,即 2D 和 3D。 也许,我们中的一些人将 2D 和 3D 这些概念与动画领域联系起来。 然而,姿态估计的 2D 方面与基于像素值从图像中预测关键点相关。 因此,大多数二维人体姿态估计技术都实现特征提取方法来提供人体的适当关键点。

类似地,3D 姿态估计与从图像和视频中预测特定人或物体的空间位置相关。 随着深度学习的出现,这些模型的性能得到了显着提高,但它们的使用更加复杂,因为数据集需要根据人体的适当 3D 结构信息(包括背景和照明条件)进行整理。 此外,还有分别与检测一个人或物体或跟踪多个人和物体相关的单姿势和多姿势估计的新方法。

3、姿势估计模型

不同的研究人员提出了不同的姿态估计模型。 在我们深入研究之前,有必要了解人体姿势估计模型基本上分为三种类型:

  • 运动学模型
  • 平面模型
  • 体块模型
    在这里插入图片描述

运动学模型可用于 2D 和 3D 位姿估计。 本质上,该模型侧重于不同的关节和肢体位置,以提供人体的结构信息。 因此,此类模型可以有效识别人体部位之间的各种关系。 然而,运动学模型在表示基于纹理或形状的信息时几乎没有限制。

接下来,我们讨论强调 2D 位姿估计的平面模型。 理想情况下,人体部位用矩形表示以提供近似的身体轮廓。

最后,体积姿态估计模型侧重于 3D 姿态估计。 这些是端到端深度学习模型,使用复杂的数据集进行训练,其中包括全身扫描的高分辨率数据,以得出各种形状和姿势的人体网格。

尽管不可能涵盖广泛的模型,但我们将讨论近年来用不同方法提出的一些最可靠和鲁棒的模型。

让我们看看9个最流行的姿势估计模型。

3.1 OpenPose

OpenPose 是卡内基梅隆大学开发的第一个实时估计模型。 该模型主要针对实时场景下多人的手部、面部、足部等人体关键点进行检测。 一般来说,图像在卷积神经网络(CNN)的帮助下进行处理,以生成特定输入的特征图。 此外,特征图通过 CNN 管线的不同阶段进行处理,以获得置信度图和亲和力场。

在这里插入图片描述

图 3:OpenPose 测试结果

如需更多信息,你可以在其 GitHub 存储库上找到更多信息。

3.2 MoveNet

MoveNet 是由 Google 研究人员使用 TensorFlow.js 开发的。 研究人员声称该模型超快且高度准确,能够检测人体的 17 个关键点。
在这里插入图片描述

图 4:MoveNet 姿态检测

MoveNet有两个版本:Lighting版本针对低延迟要求的应用程序,而Thunder版本是为专注于实现更高准确度的应用程序而设计的。 此外,这两种模型都能够进行实时检测,并已被证明可有效检测实时健身、运动或基于医疗保健的应用。

3.3 PoseNet

PoseNet 是另一种流行的姿势检测模型。 该模型可以实时检测姿势,并且可以有效地进行人体的单姿势和多姿势检测。

在这里插入图片描述

图4:PoseNet-17关键点

PoseNet 是一种深度学习模型,它使用 TensorFlow 来检测不同的身体部位,并通过加入其他关键点来提供全面的骨骼信息。 此外,PoseNet还为人体从眼睛到脚踝的各个部位提供了17个关键点。 生成置信度分数以确定模型从图像中识别特定关键点的准确程度,从而确定模型的准确性。 有关测试和配置的所有信息都可以通过 GitHub 访问。

3.4 DC姿势

DCPose 代表深度双连续网络(Deep Dual Consecutive Network),旨在从多个帧中检测人体姿势。
在这里插入图片描述

图5:DCPose姿态估计结果

DCPose框架利用深度学习技术来克服多帧人体姿势估计中的关键挑战,例如运动模糊、视频散焦以及由于依赖每个视频帧而发生的遮挡。 此外,在这些视频帧之间提供各种时间参考,以促进准确的关键点检测。 此外,时间合并器充当编码器以实现更广泛的搜索范围,而残差融合模块负责计算不同方向上的残差。

3.5 DensePose

DensePose 是一种人体姿势估计器,旨在从有关人体 3D 表面的 RGB 图像中映射各种基于人体的像素。
在这里插入图片描述

图 6:DensePose根据 RGB 图像进行姿势估计

DensePose可以针对单姿势和多姿势估计需求来实现。 DensePose 使用包含图像到表面标注信息的大规模数据集形式的地面实况。 此外,还提出了一种循环神经网络(RCNN),能够以每秒多帧的速度回归每个人类受试者之间与不同身体部位相关的 UV 坐标。

3.6 HighHRNet

HighHRNet 是一种流行的自下而上姿势估计模型,旨在解决由于尺度差异而预测矮个子正确姿势时的一些挑战。

特征金字塔是HighHRNet不可或缺的组成部分,允许所提出的方法从尺度感知表示中学习,帮助估计精确的关键点,以确定矮个子的姿势估计的变化。 特征金字塔主要包括HRNet模型生成的特征图输出,包括转置卷积生成的高分辨率输出。

此外,作者还透露,对于中等身材的人来说,该模型的 AP 性能比一些现有的自下而上的方法高出 2.5%。 此外,该模型在估计拥挤场景中的姿势时也能有效地执行。

3.7 Lightweight OpenPose

Lightweight OpenPose 是 OpenPose 的优化版本,专注于实时推理,而不会在模型的准确性方面下降太多。 该模型可以通过不同的关键点检测图像中每个人的人体姿势。 作者声称该模型在不涉及任何后处理的情况下实现了 40% 的单尺度推理 AP。
在这里插入图片描述

图 7:Lightweight OpenPose 结果

3.8 AlphaPose

AlphaPose 是一个令人兴奋的姿势估计产品。 无论你是尝试检测购物街中的多个人、快闪族还是街头表演者,现在都可以借助此模型实现。

在这里插入图片描述

图 8:AlphaPose 跟踪结果

此外,AlphaPose 估计器是第一个在 COCO 数据集和 MPII 数据集上分别实现超过 70 mAP 和 80 mAP 的开源产品。 理想情况下,该模型可以匹配不同帧中人的姿势,并且非常有能力作为在线姿态跟踪器表现良好。

3.9 TransPose

TransPose 是一种姿态估计模型,它实现了基于 CNN 的特征提取方法、Transformer编码器和预测功能。

在这里插入图片描述

图 9:TransPose 估计结果

Transpose具有Transfermer等内置功能,可以从不同关键点之间的远程空间关系中捕获信息。 最终输出提供了有关预测关键点位置及其依赖的各种依赖关系的关键信息。 此外,该模型在 COCO 数据集上产生了 75.8AP 的优异结果,并根据 MPII 基准通过适当的传输实现了卓越的性能。

4、结束语

姿态检测是计算机视觉领域不断发展的研究领域。 从提供现实生活中的应用程序到在云中服务器上运行的应用程序,姿态估计在业界获得了极大的关注。 事实上,先进的姿态估计模型更快、更小,可以在移动设备上发挥作用,这提供了充足的机会。

这些模型对于实时体育分析师来说是有效的,对于医疗康复、私人教练和现实游戏来说甚至是可靠的。 尽管已经开发了各种应用程序,但每个新模型都旨在改进以前模型的一些局限性。 然而,随着深度学习和多种开源技术的出现,各种产品都可以改变未来人体姿势估计的执行方式。 因此,令人兴奋的前景已经打开,使得跨行业有效实施最先进的姿势检测应用成为可能。


原文链接:TOP9 人体姿态估计模型 — BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1072854.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【git】git命令行

首先要了解git整个流程的一个分类: workspace:工作区staging area:暂存区/缓存区local repository:版本库或本地仓库remote repository:远程仓库 创建仓库 git clone gitgithub.comxxxxxxxxxxxx//拷贝一份远程仓库 …

笔记34:转置卷积 Transposed Convolution 的由来

注:该文章为视频课的笔记补充 视频课:转置卷积(transposed convolution)_哔哩哔哩_bilibili 更详细的推导在:抽丝剥茧,带你理解转置卷积(反卷积)_逆卷积-CSDN博客 a a a 补充1…

3D模型轻量化工具HOOPS Communicator在3D打印行业中的应用分析

3D打印技术自问世以来,已经在制造业、医疗领域、航空航天和建筑等行业中产生了革命性的影响。随着3D打印技术的不断发展,对3D模型的需求也在不断增加。 随着3D模型复杂性的增加,模型文件的体积也不断膨胀,这对计算资源和数据传输提…

当zk某个节点坏掉如何修复

2.1 当zk某个节点坏掉如何修复 当发生zk数据文件丢失(误删或者磁盘损坏节点损坏都可能出现)时,cdh会出现如下告警

CoreData + CloudKit 在初始化 Schema 时报错 A Core Data error occurred 的解决

问题现象 如果希望为 CoreData 支持的 App 增加云数据备份和同步功能,那么 CloudKit 是绝佳的选择。CloudKit 会帮我们默默处理好一切,我们基本不用为升级而操心。 不过,有时在用本地 CoreData NSManagedObjectModel 初始化 iCloud 中的 Schema 时会发生如下错误: Error …

产品工程师工作的职责十篇

一、岗位职责的作用意义 1.可以最大限度地实现劳动用工的科学配置; 2.有效地防止因职务重叠而发生的工作扯皮现象; 3.提高内部竞争活力,更好地发现和使用人才; 4.组织考核的依据; 5.提高工作效率和工作质量; 6.规范操作行为; 7.减少违章行为和违章事故的发生…

菜单子节点的写法

菜单子节点的写法 1.测试数据2.实现代码3.获取父ID层级 1.测试数据 1.表结构SQL CREATE TABLE test (id int DEFAULT NULL,u_id int DEFAULT NULL,p_u_id int DEFAULT NULL ) ENGINEInnoDB DEFAULT CHARSETutf8mb4 COLLATEutf8mb4_general_ci;2.数据SQL INSERT INTO test (i…

解决maven骨架加载慢问题(亲测解决)

1、下载archetype-catalog.xml 网站 : https://repo.maven.apache.org/maven2/ 2、放在这个文件夹下面 3、setting–>build–>Runner : -DarchetypeCataloglocal

访问Apache Tomcat的manager页面

配置访问Tomcat manager页面的用户名、密码、角色 Tomcat安装完成后&#xff0c;包含了一个管理应用&#xff0c;默认安装在 <Tomcat安装目录>/webapps/manager 例如&#xff1a; 要使用管理页面的功能&#xff0c;需要在conf/tomcat-users.xml文件中配置用户、密码及…

学习Consul中踩过的坑

一、杀不死的consul 通过mac的homebrew安装了consul以后&#xff0c;手动启动consul报8300端口已被占用&#xff0c;通过lsof -i:8300和lsof -i:8500查看端口占用情况&#xff0c;发现consul已经启动了。然后手动kill -9对应的进程id&#xff0c;再启动consul&#xff0c;还是…

springboot 如何更新json串里面的内容

我的需求是这样的 如果新字符串中的key在原字符串中存在&#xff0c;则更新原字符串的对应key的value。如果新字符串中的key在原字符串中不存在&#xff0c;则将新字符串中的key和value添加到原字符串中。如果原字符串中存在&#xff0c;新字符串中不存在的key&#xff0c;则不…

亚马逊买家号怎么评论?快速留评软件有哪些?

对于亚马逊买家留评&#xff0c;其实是很简单的&#xff0c;首先亚马逊买家号账号上找到你购买该产品的订单。可以点击页面上的“我的账户”或类似的链接&#xff0c;然后选择“我的订单”或“订单历史记录”。然后选择要评论的订单&#xff1a;在订单历史记录中&#xff0c;找…

CS5801电路设计|HDMI转EDP转接板方案|HDMI2.0转EDP数据采集卡方案

CS5801国产(北京集睿致远&#xff09;研发HDMI转DP/EDP(4K60)转换器方案芯片,其设计HDMI转EDP转接板方案电路&#xff1a; CS5801输入端可以是1080P、4K30、4K60HZ这三种规格,输出的接口可以是DP信号接口,或者是EDP信号接口,输入端HDMI由4路信号组成&#xff0c;支持1.62Gbps、…

openwrt rm500u ncm方式拨号步骤记录

1.进入设备页面 用户名&#xff1a;root 2.创建接口 3.配置接口 国内APN 信息 中国移动APN&#xff1a;CMNET 中国联通APN&#xff1a;3GNET 中国电信APN&#xff1a;CTNET 4.防火墙配置 5.点击Save&Apply 6.配置完成后重启设备。重新进入设备页面&#xff0c;可以看…

搭建一个Vue3+Ts+Vite项目

Vue3TsVite项目(目录篇)——如何从零到一搭建Vue3后台管理系统_从零开始搭建后台管理系统_礼貌而已的博客-CSDN博客

tomcat整体设计解析

&#x1f514;简介 简介从各个视角看tomcat tomcat是一个Servlet 容器&#xff1f;Servlet规范与tomcat实现整体架构 启动过程io处理 connector 架构io 和线程模型 业务处理 container 架构 tomcat的类加载Sprint Boot如何利用Tomcat加载Servlet&#xff1f;Tomcat如何支持异步…

Springboot+vue的应急救援物资管理系统,Javaee项目,springboot vue前后端分离项目。

演示视频&#xff1a; Springbootvue的应急救援物资管理系统&#xff0c;Javaee项目&#xff0c;springboot vue前后端分离项目。 项目介绍&#xff1a; 本文设计了一个基于Springbootvue的前后端分离的应急救援物资管理系统&#xff0c;采用M&#xff08;model&#xff09;V&…

mysql学习实践

这里写目录标题 查找重复数据查找重复数据的字段值以及重复的次数如果你只想查找重复数据&#xff0c;而不需要知道重复的次数&#xff0c;可以简化查询如下 根据某个字段查询重复的数据&#xff0c;并取id最大的那条数据&#xff08;用于商机列表展示&#xff09;将逗号分隔的…

SpringCloud溯源——从单体架构到微服务Microservices架构 分布式和微服务 为啥要用微服务

前言 单体架构好好的&#xff0c;为啥要用微服务呢&#xff1f;微服务究竟是啥&#xff0c;怎么来的&#xff0c;有啥优缺点&#xff0c;本篇博客尝试追根溯源&#xff0c;阐述单体应用到分布式&#xff0c;微服务的演变,微服务架构的定义及优缺点&#xff0c;厘清相关的概念。…

手摸手系列之批量修改MySQL数据库所有表中某些字段的类型

在迁移老项目的数据库时&#xff0c;使用Navicat Premium的数据传输功能同步了表结构和数据。但是&#xff0c;发现某些字段的数据类型出现了错误&#xff0c;例如&#xff0c;租户ID从Oracle的NUMBER类型变成了MySQL的decimal(10)&#xff0c;正确的应该是bigInt(20)。此外&am…