【论文阅读】 AdaptivePose: Human Parts as Adaptive Points

news2024/12/25 23:40:06

DOI:https://doi.org/10.1609/aaai.v36i3.20185

AAAI 2022         Published:2022-06-28

Others阅读/整理:翻译1、翻译2

Intro&Background

多人姿态估计方法

two-stage methods【图a】

这些方法使用绝对关键点位置,定位的是独立的点,所以需要额外的步骤来为他们之间的关系建模

1. Top-down Methods:先crop+resize定位人区域然后分别定位其关键点/HRNet

mainly focus on the design of the network to extract better feature representation.

不足:①性能和box紧密相关;②先检测的方法高内存低效率

2. Bottom-up Methods:先用不同尺度来定位所有人的关键点,再将它们group到相应的人身上

mainly focus on the effective grouping process.

不足:虽快但group后处理过程复杂且需要技巧

3. Point-based Representation

CenterNet:centerpoint+center2joint offsets【图b】

由于各种姿态变化、中心具有固定的接受场,难以处理长距离center2joint偏移量,性能受限。

SPM:用rootjoint表示实例,并根据关节运动学将根关节和关键点划分为四个层次。【图c】

长距离offset分解为短距离offsets积累,但是沿骨架传播也有误差积累呀

本文MethodBody Representation

1、方法基本思路:center -> 7parts -> joints的方法

白色是每个个体的中心;把人体分成7个adaptive部分(a中另外7个点);再给每个parts定keypoints

The novel representation starts from instance-wise (body center) to part-wise (adaptive human-part related points), then to joint-wise (body keypoints) to form human pose.

2、Overall Architecture:单阶段网络包括三个模块+一个辅助 

AdaptivePose(d) 端到端可微网络 body2part2joint(center2adaptivepoints2point)

组成:三个branch+辅助parallel branch

(1)Part Perception Module:部分感知模块-得到7parts

These adaptive points act as intermediate nodes, which are used for subsequent predictions.

(2)Enhanced Center-aware Branch:增强中心感知分支-得到center

aggregate the features of seven adaptive human-part related points for precise center estimation.

(3)Two-hop Regression Branch:两跳跃回归分支-displacements:center2part、part2joint

预测displacements而不是直接回归center2jiont偏移量

在(1)7parts基础上,将长距离center2joint变成center2part2joint offsets

(4)parallel branch(train):17keypoints做gt

 LOSStotal(6) =LOSSct(3) + LOSSkp(5) +LOSShm(3)

experiment

参数设置:

Dataset:COCO2017

Metric:基于OKS(Object Keypoint Similarity)的平均精度和平均召回率

Augmentation: random flip, random rotation, random scaling and color jitter

预处理:每个input有条件的裁剪,512/640-DLA34、800-HRNetW48

Adam optimizer with a mini-batch size of 64 (8 per GPU)

SOTA比较

消融实验分析

Part Perception Module(定位7个位置): conduct the experiments that using shared adaptive points and unshared adaptive points

Enhanced Center-aware Branch(定位center): conduct the controlled experiments to explore the effect of receptive field adaptation process

Two-hop Regression Branch(offsets):

conduct the controlled experiments that is capable of factorizing long-range center-to-joint offsets and avoiding the accumulated errors

auxiliary loss(帮助training)【实验4/5】

the keypoint heatmap can retain more structural geometric information to improve regression performance.

Heatmap Refifinement for our regression result.

snap the closest confidence peaks on the keypoint heatmap to refine the regressed predictions

结论: the heatmap refinement is negligible for our two-hop regression method(热图细化可忽略不计,结果如下图所示)

边角料

摘要(机翻)

多人姿态估计方法通常遵循自上而下和自下而上的范式,这两种方法都可以被认为是两阶段的方法,从而导致计算成本高,效率低。对一个紧凑的和有效的管道多人姿态估计任务,在本文中,我们建议将人类部分表示为点和提出一个新颖的身体表示,利用一个自适应点集包括人体中心和七个人体部分相关点来表示人类实例以更细粒度的方式。这种新的表示更能够捕捉各种姿态变形,并自适应因式分解长距离中心-关节位移,从而提供了一个单阶段可微网络来更精确地回归多人姿态,称为自适应姿态。对于推理,我们提出的网络消除了分组和改进,只需要一个单步的分离过程来形成多人的姿态。在没有任何附加功能的情况下,我们使用DLA-34和HRNet-W48分别实现了67.4% AP / 29.4 fps和71.3% AP / 9.1 fps 

AdaptivePose:端到端可微网络、优点×2(细粒度点表示、长距离位移分解为短位移

①与中心表示相比,这种细粒度的点集表示更能够捕捉人体不同程度的变形。

②它自适应地将长距离位移分解为较短的位移,同时通过神经网络自动学习自适应的人体部分相关点,避免了沿骨架传播的累积误差。

结论(机翻)

在本文中,我们提出将人体的各个部分表示为点,并引入一种自适应的身体表示,它以细粒度的方式表示人体。在此基础上,我们构建了一个单阶段的网络,其中包括三个有效的组成部分:部分感知模块、增强的中心感知分支和两跳回归分支。在推理过程中,我们消除了分组和改进,只需要一个单步的过程来形成人体姿势。我们通过实验证明,自适应算法获得了最佳的速度-精度的权衡,并优于以前的最先进的自下而上和单阶段的方法。

知识点

1、a warp operation

2、AE

3、centernet:论文

翻译、精读、详解、CenterTrack、阅读、CenterNet、

4、finely grained细粒度

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/75884.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

顺时针打印矩阵

大概题意为: 第一步: 第二步: 第三步: 第四步 : 这样核心就设计好了,接下来设计剩余的东西 设计题目程序 1.题目要求我们返回一个地址,所以我们创造一个一维数组,它的元素个数为行…

华为机试_HJ61 放苹果【简单】【收藏】

目录 描述 输入描述: 输出描述: 解题过程 提交代码 递归方法 动态规划方法 学习代码 递归方法 动态规划方法 收藏点 描述 把m个同样的苹果放在n个同样的盘子里,允许有的盘子空着不放,问共有多少种不同的分法&#xff…

Postman(七): postman应用实战

Postman(13): postman应用实战 postman应用实战 下面以微信公众平台举例: 第一步、先创建文件夹 第二步、打开postman,创建collections 第三步、设置环境变量,全局变量 设置环境变量;如下图: 设置全局变量&#xf…

银河麒麟V10 + 飞腾CPU编译安装 Qt5.9.9

一、准备工作 1. 下载Qt源码包 这里我们要编译的是Qt5.9.9,下载网址:https://download.qt.io/archive/qt/5.9/5.9.9/single/ 在任意空闲位置新建文件夹,并将源码包放到该目录下。(这里在/home目录下新建名为Qt_Source的文件夹&a…

Unity Animancer插件(二)精确控制

一、通过名称播放动画 前面我们讲的都是直接通过动画片段的引用播放动画,Animancer也提供了直接通过动画名称来播放动画的方法。但这并不是推荐的使用方式,因为通过字符串播放比通过引用播放效率略低,且更难维护。 首先我们需要在角色身上挂…

2022年ACM杰出会员名单公布:23位华人学者入选

12月7日,2022年度ACM杰出会员(Distinguished Member)名单公布! 本次评选设有三个奖项,分别表彰在计算机领域做出的教育贡献、工程贡献和科学贡献。 ACM创立于1947年,目前在全球130多个国家和地区拥有超过…

OceanBase 4.0 解读:降低分布式数据库使用门槛,谈谈我们对小型化的思考

关于作者 赵裕众 OceanBase 资深技术专家,2010 年加入支付宝后从事分布式事务框架的研发,2013 年加入 OceanBase 团队,目前负责存储引擎相关的研发工作。 近年来,随着应用场景多样化和数据量的增长,我们看到分布式数据…

判别分析-书后习题回顾总结

5-2 题目 理论基础 多总体的距离判别 马氏距离:dG2(x)(x−μ)2σ2d^{2}_{G}(x)\frac{(x-\mu)^{2}}{\sigma^{2}}dG2​(x)σ2(x−μ)2​ 取马氏距离最小的那一个,就属于这类。 贝叶斯判别准则 计算qtft(x)q_{t}\times f_{t}(x)qt​ft​(x) ft(x)12πσ…

001:Object-C介绍、创建第一个iOS工程、MVC架构

常见APP基础业务模块: 常见App类型:通信与存储、流媒体、直播技术、图片处理、内容展示、Web、组件化、IM类型、音视频、直播类型、摄影摄像类型、资讯类型、工具、购物类型。 App 展示界面动画:底部TabBar、Navigation、列表、图片ImageVi…

一文囊括Ceph所有利器(工具)

原文链接: 知乎专栏: 一文囊括Ceph所有利器(工具) - 知乎 前言 ceph的工具很多,包括集群管理与运维,还有性能分析等等。 所以本文期望应收尽收所有的工具,也当做自己的一个梳理与总结,当自己需要的时候知道有哪些利器可以使用…

一文搞懂SSL/TLS

SSL/TLS1. 概述2. 协议组成2.1 握手协议(Handshake protocol)2.2 记录协议(Record Protocol)2.3 警报协议(Alert Protocol)3. 密码套件与密钥生成1. 概述 安全套接字层(SSL,Secure …

使用 X2MindSpore 迁移 Pytorch 训练脚本mobileNet支持分布式训练

简介 MindSpore是华为昇腾开发的深度学习框架,旨在提供端边云全场景的AI框架。 Pytorch是由Facebook推出的AI框架。 本教程使用MindStudio中的X2MindSpore功能自动将Pytorch脚本转换为MindSpore脚本的案例。使用的模型是分类任务模型mobileNet,数据集是c…

【自动化测试】Selenium IDE脚本编辑与操作(了解)

之前,我们录制脚本时是录制鼠标和键盘的所有在浏览器的操作,那么脚本会出现多余的步骤,有时候我们需要手动填写脚本或修改脚本,所以我们有必要对selenium IDE脚本编辑与操作有所了解;(采用录制的方式很容易…

2023最新SSM计算机毕业设计选题大全(附源码+LW)之java校园招聘管理系统968b0

毕业设计也不需要做多高端的程序,毕业设计对于大多数同学来说,为什么感觉到难,最重要的一个原因,那就是理论课到实践课的转变,很多人一下不适应,本能开始拒绝,如果是一个考试,大家都…

【大数据入门核心技术-Hbase】(一)HBase简介

目录 一、HBase基本概述 1、Hbase是什么 2、什么时候用Hbase? 二、HBase基本架构 1、Client 2、Zookeeper 3、HMaster 4、 RegionServer 三、HBase逻辑结构 一、HBase基本概述 1、Hbase是什么 HBase是一个分布式的、面向列的开源数据库,该技术…

pstore

pstore简介 pstore最初是用于系统发生oops或panic时,自动保存内核log buffer中的日志。不过在当前内核版本中,其已经支持了更多的功能,如保存console日志、ftrace消息和用户空间日志。同时,它还支持将这些消息保存在不同的存储设…

新手教程 | 手把手教你 谷歌浏览器如何使用HTTP代理?

本文将针对谷歌浏览器如何使用代理IP进行详细说明,具体步骤如下: 1、代理IP信息查看 查看自己所购买的相对应的代理IP面板,点击代理IP -查看详情-进行查看“AuthKey”以及“AuthPwd”信息。 2、代理IP资源提取 在控制台-代理IP-中的“提取…

Spring cloud Gateway 服务网关 实战

Spring cloud Gateway 服务网关一、简介优点:特性:总结:二、核心概念三、路由规则1、Path2、Query3、Method4、Datetime5、RomoteAddr6、Header四、动态路由1、依赖2、配置动态获取URI服务名称转发五、过滤器1、网关过滤器 GatewayFilter局部…

Allegro如何给差分过孔添加禁布操作指导

Allegro如何给差分过孔添加禁布操作指导 Allegro支持给差分过孔添加禁布,让它避让周围的铜皮,具体操作如下 以下图两个过孔为例,需要做一个和via避让铜皮尺寸一样大的禁布 选择show element命令 Find选择Other segs 鼠标移动到铜皮避让圆形的地方 出现一个report,记住…

【并发编程】SemaphoreCountDownLatchCyclicBarrier

一、Semaphore Semaphore 通常又被称为信号量, 可以用来控制同时访问特定资源的线程数量,通过协调各个线程,以保证合理的使用资源。 1.简单的使用 1-1.控制线程的并发连接数 public static void main(String[] args) {// 只允许两个线程执…