AI实战营:人体姿态估计与MMPose

news2024/10/7 2:32:05

目录

人体姿态估计的介绍与应用

2D姿态估计

多人姿态估计:自顶向下方法

多人姿态估计:自底向上方法

多人姿态估计:单阶段方法

基于Transformer的方法

基于回归的自顶向下方法

DensePose(2014)

通过级联提升精度

回归方法的优势与劣势

Residual Log-likelihood Estimation(RLE)(2021)

背景知识:回归和最大似然估计的联系

背景知识:标准化流Normalizing Flow

RLE的整体设计

残差似然函数

完整的RLE模型

基于热力图的自顶向下方法

Hourglass(2016)

局部图像的局限

级联Hourglass模块

不同的级联和监督方式

Hourglass模块

Simple Baseline(2018)

HRNet(2020)

HRNet的特征融合方式

HRNet配合不同任务头

自底向上方法

Part Affinit Fields & OpenPose(2016)

关键点与肢体的预测

关键点与关节预测

基于亲和度匹配关键点

单阶段方法

SPM(2019)

Structrued Pose Representation(SPR)

Hierarchical SPR

网络设计 

回归策略

基于Transformer的方法

PRTP 2021

PRTR两阶段算法

PRTR单阶段算法

TokenPose(2021)

2D姿态估计小结

3D姿态估计

任务描述

绝对坐标VS相对坐标

难点

思路1:直接预测

思路2:利用视频信息

思路3:利用多视角图像

直接预测:Coarse-to-Fine Volumetric Prediction 2017

直接预测:Simple Baseline 3D(2017)

利用视频信息:VideoPose3D(2018)

利用多角度图像:VoxelPose(2020)

人体姿态估计的评估方法

Percentage of Correct Parts(PCP)

Percentage of Detected Joints(PDJ)

Percentage of Correct Key-points(PCK)

Object Keypoint Similarity (OKS) base mAP

DensePose(2014)与人体参数模型

SMPL人体参数化模型

SMPLify

HMR

总结


  • 人体姿态估计的介绍与应用

    • 什么是人体姿态估计
      • 从给定的图像中识别人脸、手部、身体等关键点。
    • 3D姿态估计
      • 预测人体关键点在三维空间中的坐标,可以在三维空间中还原人体的姿态 
    • 人体参数化模型
      • 从图像或视频中恢复出运动的3D人体模型
    • 下游任务:行为识别、人机交互、动作行为分析

  • 2D姿态估计


    • 任务描述
  • 基本思路:基于回归(Regression Based)
  • 基本思路:基于热力图(Heatmap Based)

    • 热力图可以基于原始关键点坐标生成,作为训练网络的监督信息
    • 网络预测的热力图也可以通过求极大值等方法得到关键点的坐标
    • 模型预测热力图比直接回归坐标相对容易,模型精度相对更高,因此主流算法更多基于热力图,但预测热力图的计算消耗大于直接回归
  • 从数据标注生成热力图
  • 使用热力图训练模型
  • 从热力图还原关键点
  • 多人姿态估计:自顶向下方法

  • 多人姿态估计:自底向上方法

  • 多人姿态估计:单阶段方法

  • 基于Transformer的方法

  • 基于回归的自顶向下方法

    • DensePose(2014)

    • 通过级联提升精度

    • 回归方法的优势与劣势

      • 优势:
        • 回归模型理论上可以达到无线精度,热力图方法的精度受限于特征图的空间分辨率
        • 回归模型不需要维持高分辨率特征图,计算层面更高效,相比之下,热力图方法需要计算和存储高分辨率的热力图和特征图,计算成本高
      • 劣势:
        • 图像到关键点坐标的映射高度非线性,导致回归坐标比回归热力图更难,回归方法的精度也弱于热力图方法,因此DeepPose提出之后的很长一段时间内,2D关键点预测算法主要基于热力图
    • Residual Log-likelihood Estimation(RLE)(2021)

    • 背景知识:回归和最大似然估计的联系

    • 背景知识:标准化流Normalizing Flow

    • RLE的整体设计

    • 残差似然函数

    • 完整的RLE模型

  • 基于热力图的自顶向下方法

    • Hourglass(2016)

    • 局部图像的局限

    • 级联Hourglass模块

    • 不同的级联和监督方式

    • Hourglass模块

    • Simple Baseline(2018)

    • HRNet(2020)

    • HRNet的特征融合方式

    • HRNet配合不同任务头

  • 自底向上方法

    • Part Affinit Fields & OpenPose(2016)

    • 关键点与肢体的预测

    • 关键点与关节预测

    • 基于亲和度匹配关键点

  • 单阶段方法

    • SPM(2019)

    • Structrued Pose Representation(SPR)

    • Hierarchical SPR

    • 网络设计 

    • 回归策略

    • 损失函数

  • 基于Transformer的方法

    • PRTP 2021

    • PRTR两阶段算法

    • PRTR单阶段算法

    • TokenPose(2021)

    • 2D姿态估计小结

  • 3D姿态估计

    • 任务描述

    • 绝对坐标VS相对坐标

    • 难点

    • 思路1:直接预测

    • 思路2:利用视频信息

    • 思路3:利用多视角图像

    • 直接预测:Coarse-to-Fine Volumetric Prediction 2017

    • 直接预测:Simple Baseline 3D(2017)

    • 利用视频信息:VideoPose3D(2018)

    • 利用多角度图像:VoxelPose(2020)

  • 人体姿态估计的评估方法

    • Percentage of Correct Parts(PCP)

    • Percentage of Detected Joints(PDJ)

    • Percentage of Correct Key-points(PCK)

    • Object Keypoint Similarity (OKS) base mAP

  • DensePose(2014)与人体参数模型

    • 人体表面参数化
    • 标注方法
    • 网络结构
    • 改进设计
    • 身体表面网格(Body Mesh)
    • 混合蒙皮技术(Blend Skinning)
    • 线性混合蒙皮LBS(Linear Blend Skinning)
    • SMPL人体参数化模型

    • 形参参数与姿态参数
    • SMPL的基本设计逻辑
    • SMPL人体模型表示
    • 训练设计
    • SMPL模型的应用
    • SMPLify

    • SMPLify算法流程
    • 关键点投影损失
    • 人体姿态约束
    • “胶囊”近似人体
    • 人体形态约束
    • 损失函数
    • HMR

    • 算法设计
    • 回归模型设计
    • 2D投影损失
    • 引入判别器
    • 损坏函数

总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/601074.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

考前必看|PMP考试通关宝典

项目进度管理 (1)项目进度计划 如何及何时交付项目范围中的产品、服务和成果,为绩效报告提供进度依据。 选择进度计划的方法,如关键路径法或敏捷方法。 (2)定义活动 活动由工作包分解而来,作…

【蓝桥杯选拔赛真题59】Scratch影院选座 少儿编程scratch图形化编程 蓝桥杯选拔赛真题解析

目录 scratch影院选座 一、题目要求 编程实现 二、案例分析 1、角色分析

SpringCloudAlibaba:服务容错之Sentinel学习

目录 一、高并发带来的问题 服务雪崩效应 二、常见容错方案 (一)隔离 (二)超时 (三)限流 (四)熔断 (五)降级 三、常见的容错组件 四、Sentinel概述 …

子集-回溯算法

1题目 给你一个整数数组 nums ,数组中的元素 互不相同 。返回该数组所有可能的子集(幂集)。 解集 不能 包含重复的子集。你可以按 任意顺序 返回解集。 示例 1: 输入:nums [1,2,3] 输出:[[],[1],[2],[1…

SpringBoot项目整合Redis作为缓存中间件的详细步骤

SpringBoot项目整合Redis作为缓存中间件的详细步骤 1.链接2.整合步骤3.测试Demo4.遇到的问题5.待考虑问题 有更好的建议,欢迎评论区留言~ 有不详细或者不准确的地方,欢迎评论区指正~ 有技术群嘛 hahh 可以拉我么 ~ 1.链接 哔哩教程视频 Redis官方 2.整…

线程池的工作原则揭秘:如何合理管理线程数量?

大家好,我是小米,一个热爱技术分享的小伙伴。在多线程编程中,线程池是一种非常实用的工具,可以帮助我们更好地管理线程,提高程序的性能和稳定性。今天,我将详细介绍线程池的概念、使用方法以及常用参数&…

MFC 状态栏梳理

MFC状态栏梳理 MFC状态栏,觉得挺简单的,但是用的时候总是不得劲,梳理了一下代码。理解通透些。 先说状态栏窗口怎么来的 在MainFrame里面会有一个成员变量,状态栏 m_wndStatusBar protected: // 控件条嵌入成员CMFCMenuBar …

VMware ESXi 8.0U1a 发布 - 领先的裸机 Hypervisor

VMware ESXi 8.0U1a 发布 - 领先的裸机 Hypervisor 请访问原文链接:https://sysin.org/blog/vmware-esxi-8-u1/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org 2023-06-01, VMware vSphere 8.0U1a 发布。 详见&am…

I.MX6ULL_Linux_驱动篇(36) GPIO输入驱动

在前面我们都是使用的 GPIO 输出功能,还没有用过 GPIO 输入功能,本章我们就来学习一下在 Linux 下编写 GPIO 输入驱动程序。我们使用一个 GPIO 加输入驱动程序,同时利用原子操作来对按键值进行保护。 按键驱动和 LED 驱动原理上来讲基本都是…

浅谈TTF字体和Fnt字体的本质和优缺点

前言 本篇在讲什么 浅浅对TTF字体和Fnt字体的本质了解一下 本篇的特色 具有全流程的图文教学 重实践,轻理论,快速上手 提供全流程的源码内容 ★提高阅读体验★ 👉 ♠ 一级标题 👈 👉 ♥ 二级标题 &#x1f448…

【Java 接口】接口(Interface)的定义,implements关键字,接口实现方法案例

博主:_LJaXi Or 東方幻想郷 专栏: Java | 从入门到入坟 专属:六月一日 | 儿童节 Java 接口 接口简介 🎃接口的定义 🧧接口实现类名定义 🎁接口实现类小案例 🎈后话 🎰 接口简介 &…

从架构到特性:JuiceFS 企业版首次全面解析

大多数用户是通过社区版初次接触 JuiceFS,企业版对大家来说可能比较陌生。与其他开源项目不同的是,JuiceFS 企业版比社区版更早发布,社区版的架构设计大量参考了企业版。对 JuiceFS 用户而言,这意味着社区版具有更加稳定的特性。 …

onnx模型转 ncnn 模型全连接层输出shape不对问题解决

1.简述 最近在把paddleocr 中cls分类模型通过ncnn部署框架部署时,发现onnx -> ncnn 模型的转换过程中出现问题。因为之前的项目都是使用ncnn框架部署的,只能去解决模型转换问题了。 2. 问题描述与分析 模型在onnx推理代码上正常,当把模型…

Fabric.js 复制粘贴元素

theme: smartblue 本文简介 点赞 关注 收藏 学会了 当你要复制一个 fabric 的元素时,你考虑到的是什么?是深拷贝当前选中对象再添加到画布中? 其实,fabric.js 提供了一个克隆方法,在 fabric.js 官网的案例里也有这个…

自动驾驶赛道回暖?传统Tier1加速入场,真正赢家正在浮出水面

自动驾驶赛道,在经历过去三年的持续降温之后,正在迎来新一轮上升势头。整合、并购、协作,正在成为新一轮产业周期的关键词。 本周,滴滴自动驾驶与法雷奥签署战略合作及投资意向书,法雷奥将对滴滴自动驾驶进行战略投资…

【VMware】局域网里机器A访问机器B内部的vm虚拟机

一、机器B配置 1、打开机器B上面的VMware,在菜单里找到编辑,在编辑里找到“虚拟网络编辑器” 2、选择 net 项,点击NET设置 3、填写主机端口8090,主机端口不要和其它端口冲突就行,这个端口后面会在机器A上面用到 3.1、…

111.(cesium篇)cesium地球自转

听老人家说:多看美女会长寿 地图之家总目录(订阅之前建议先查看该博客) 文章末尾处提供保证可运行完整代码包,运行如有问题,可“私信”博主。 效果如下所示: 下面献上完整代码,代码重要位置会做相应解释 <html lang="en">

电脑病毒怎么彻底清理?这3个方法可以解决!

案例&#xff1a;电脑中毒无法正常使用怎么办&#xff1f;怎么清理电脑病毒&#xff1f;如何彻底清除病毒&#xff1f;有没有小伙伴知道解决的方法&#xff1f; 在使用电脑的过程中&#xff0c;我们经常会遇到电脑中病毒的情况&#xff0c;它们能够通过各种渠道感染你的计算机…

搭建服务器环境

如果是刚安装好的操作系统 先安装源里的gcc cmake make 等 apt-get install gcc g make cmake autoconf automake libtool 1.gcc 4.8.2 (1)上传gcc 源码在source/下 把gcc-4.8.2.tar.gz放在/home/download/ cd /home/download/ tar -xzvf gcc-4.8.2.tar.gz cd gcc-4.8.2 (2)安…

[POJO]POJO的设计规范Lombok框架

POJO的设计规范 所有用于声明属性的类&#xff0c;都应该遵循以下规范&#xff1a; 存在无参数构造方法 所有属性都是私有权限&#xff08;private&#xff09;的 添加每个属性对应的Setters & Getters 添加基于所有属性的hashCode()与equals() 必须保证&#xff1a;如…