【学习笔记】Integral Human Pose Regression

news2026/2/15 8:20:37

【学习资料】一文总结Integral Pose Regression方法的方方面面 - 知乎（总结的很到位，一定要去看）

1.两种基本方法的对比

1.解码方式

softmax和argmax的区别：

由于深度神经网络中的下采样步骤，热图的分辨率低于输入图像的分辨率。这导致不可避免的量化误差将“取最大值”操作修改为“取期望值”。关节估计为热图中所有位置的积分，并根据其概率（从似然度归一化）进行加权。我们称这种方法为积分回归。

2.监督上
Detection-based方法通过人工渲染高斯热图，逐像素地对网络的输出进行监督
IPR通过坐标值直接进行监督
3.性能上
结论：积分回归在`困难样本`上的效果更好
Detection-based方法由于受纹理信息影响严重，因此一旦遇到严重遮挡，响应区很容易丢失或偏移，而Regression-based方法则能更好地记住关键点之间的相对位置关系。

2.IPR方法

2.1局部性

其响应值集中在一块局部区域内，以外的地方响应几乎为0，响应值最大的地方对应了目标点，以真实位置为中心的一个概率分布，距离越远，被人标注的概率越低，这里我姑且称之为“局部性”。

2.1.1 为什么IPR方法的局部性更强？

在监督时我们就是在隐式地学习拉普拉斯分布。

在COCO数据集上关键点的真实分布实际上是介于拉普拉斯和高斯分布之间的，边缘比高斯分布更尖锐，比拉普拉斯分布更平滑。

2.2 形状约束

2.2.1 为什么需要对形状进行约束

Soft-Argmax计算流程是对输出特征图进行Softmax归一化后，求期望作为坐标值，直接通过坐标值进行监督，因此只要期望值正确，即只要符合期望要求的分布，不管他长什么样子，loss就会降低，因此预测的Heatmap可能出现“多峰”、“扁平”、最大响应值点偏移等情况。

2.2.2 解决形状

除了非常极端的和的情况性能下降，其他情况均有性能提升，可见增加形状约束是有效的。

2.3 监督方式与梯度差异

梯度形式的差异使得IPR的训练过程比起Detection-based方法艰难得多。

2.4 总结

Integral Pose Regression方法的性能劣势主要来源于四个方面：

Softmax性质引入的偏差
数据真实分布与人工预定义的简单分布存在差异
缺乏概率分布性质约束导致的学习目标不明确
梯度形式不稳定导致学习效率低下

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/431273.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

如何在电脑本地下载镜像重装系统

如何在电脑本地下载镜像重装系统

现在网上随处可以下载操作系统，下载下来的是镜像系统，很多朋友都不知道电脑镜像重装系统是什么意思，怎么用镜像重装系统，今天小编就给大家带来了电脑镜像重装系统是什么意思的相关解答，一起往下看。电脑镜像重装系统是…

阅读更多...

从FPGA说起的深度学习（七）-循环并行化

从FPGA说起的深度学习（七）-循环并行化

这是新的系列教程，在本教程中，我们将介绍使用 FPGA 实现深度学习的技术，深度学习是近年来人工智能领域的热门话题。在本教程中，旨在加深对深度学习和 FPGA 的理解。用 C/C 编写深度学习推理代码高级综合 (HLS) 将 C/C 代码转换为硬…

阅读更多...

不良事件上报系统源码开发，不良事件上报系统源码

不良事件上报系统源码开发，不良事件上报系统源码

不良事件管理系统源码，有演示，支持二开，可正常上线运营。相关技术：PHPvscodevue2elementlaravel8mysql5.7 文末获取联系！ 医院安全不良事件上报系统，对患者安全（不良）事件实施全过…

阅读更多...

微分方程的基本概念（通解、特解，线素场）

微分方程的基本概念(通解、特解，线素场)1 微分方程的定义同学们大家好，今天我们来学习微分方程的基础概念。微分方程就是含有导数的方程，例如： 它就含有导数 ，因此它就是一个微分方程。而我们知道导数的写法不止一…

阅读更多...

androidstudio虚拟机运行react-native项目踩坑指南

androidstudio虚拟机运行react-native项目踩坑指南

androidstudio虚拟机运行react-native项目踩坑指南安装JDK安装android studio配置环境变量新建虚拟机新建RN项目运行项目本文详细的记录了照react-native官网文档运行项目踩到的所有坑，诚然，官网只介绍了每一步，最后确实是可以正常运行项目&a…

阅读更多...

VS2022配置Opencv贴心教程

VS2022配置Opencv贴心教程

所用VS2022是官网Professional版本，OpenCV版本是4.7.0 一、下载OpenCV 官网下载地址：Releases - OpenCV 选择Windows版本下载并解压到本地磁盘，建议路径不带中文，我的解压安装地址是： C:\opencv 二、配置Windows环…

阅读更多...

快速部署个人-ChatGPT Next Web

前提：要有梯子、谷歌账号。目录一、源码地址： 二、演示地址： 三、获取API密钥四、部署五、重新部署一、源码地址： GitHub - Yidadaa/ChatGPT-Next-Web: One-Click to deploy well-designed ChatGPT web UI on Verc…

阅读更多...

1.Shell编程自动化之Shell编程基础

1.Shell编程自动化之Shell编程基础

一、Shell可以用来做什么 1.自动化批量系统初始化程序； 2.自动化批量软件部署程序； 3.应用程序管理； 4.日志分析处理程序； 5.自动化备份恢复程序； 6.自动化信息采集及监控程序； 7.自动化管理程序&am…

阅读更多...

Python数据结构-----leetcode232.用栈实现队列

Python数据结构-----leetcode232.用栈实现队列

目录前言： 方法讲解示例： 代码实现 232. 用栈实现队列前言： 我们都知道队列的特征是先进先出，就跟排队一样先到先得，而栈的特征是后进后出，那这里我们怎么去通过两个栈来实现一个队列的功能呢&#xf…

阅读更多...

GitHub和Gitee的源码下载

GitHub和Gitee的源码下载

1.使用clone命令下载如果本地安装了Git环境的话，可以直接在命令行中使用git clone命令把仓库中的文件全部下载到本地。通过GitHub下载源码，执行如下命令： git clone https://github.com/******.git其中后面下载链接可以从项目下图处查看:…

阅读更多...

excel动态获取sheet页单元格内容

excel动态获取sheet页单元格内容

1、问题描述如下图所示，名称列可能是动态赋值的，名称列的内容有对应新的sheet页，如名称为PJ1及其PJ1的sheet页，最终需要获取PJ1的sheet页的B1单元格的内容。如下图所示，是要获取PJ1的sheet页的B1的值。 2、解决办法…

阅读更多...

Qt音视频开发33-vlc和mpv打开后鼠标打圈圈问题的解决

Qt音视频开发33-vlc和mpv打开后鼠标打圈圈问题的解决

一、前言如果采用的vlc句柄模式，如果鼠标停留在句柄控件中会发现在打开后鼠标打圈圈，mpv句柄模式是在关闭后鼠标打圈圈，这两者真是一前一后，这种给人的体验其实很不友好的，播放开始后或者播放完成后鼠标指针居然变成了繁忙，但是当你将鼠标位置从句柄控件中移到外面的时…

阅读更多...

瑟瑟发抖吧～OpenAI刚刚推出王炸——引入ChatGPT插件，开启AI新生态

瑟瑟发抖吧～OpenAI刚刚推出王炸——引入ChatGPT插件，开启AI新生态

5分钟学会使用ChatGPT 插件（ChatGPT plugins）——ChatGPT生态建设的开端ChatGPT插件是什么OpenAI最新官方blog资料表示，已经在ChatGPT中实现了对插件的初步支持。插件是专门为以安全为核心原则的语言模型设计的工具，可帮助ChatGPT…

阅读更多...

电脑CPU/GPU处理器知识普及

电脑CPU/GPU处理器知识普及

处理器知识普及处理器主要分为两种：CPU与GPU，二者针对不同的业务进行工作； CPU主要处理数量小、难度大的任务，能比较好的处理单线程任务； GPU主要处理数量达，难度小的任务，比如图形渲染、多线…

阅读更多...

C语言实现三子棋教学

C语言实现三子棋教学

本篇博客会教你如何使用C语言实现三子棋。主要包含以下步骤： 初始化棋盘。打印棋盘。玩家下棋。电脑下棋。判断输赢 0.预备工作先定义一些符号，后面会用到。主要是棋盘的大小（行数列数），以及棋子。 #define ROW …

阅读更多...

skvideo.io.vread无法读取视频(九天毕生版)

skvideo.io.vread无法读取视频(九天毕生版)

Vread无法读取视频使用九天GPU时遇到的错误以及解决方法: 、vread无法读取视频需要下载ffmpeg的exe（从网上找） 下载ffmpeg.exe（一共三个）后将exe的上级目录（bin）文件路径添加到系统路径中（…

阅读更多...

Grounding DINO-开集目标检测论文解读

Grounding DINO-开集目标检测论文解读

文章目录摘要背景算法3.1Feature Extraction and Enhancer3.2. Language-Guided Query Selection3.3. Cross-Modality Decoder3.4. Sub-Sentence Level Text Feature3.5. Loss Function实验4.2 Zero-Shot Transfer of Grounding DINOCOCO数据集LVIS数据集ODinW，开放…

阅读更多...

超级账本与区块链应用场景

超级账本与区块链应用场景

文章目录区块链3.0去中心化应用的新需求区块链技术在行业应用中的条件区块链3.0架构与超级账本区块链3.0架构超级账本(Hyperledger Fabric)超级账本的项目FabricFabric的典型运行模型在Fabric中完成一次交易的整体步骤Fabric的节点链码(Chaincode)数字身份证书组织通道区块…

阅读更多...

Java之重载重写的区别

Java之重载重写的区别

重载在同一个类中，多个方法有相同的方法名，但参数列表不同，这种同名不同参的方法就是重载重写子类在继承父类方法的基础上（方法名和参数列表相同），对父类方法的实现进行覆盖的操作叫重写规则重载的规则…

阅读更多...

【详细教程】国内部署ChatGPT镜像网站

【详细教程】国内部署ChatGPT镜像网站

文章目录一、准备阶段0、注册Open AI账号1、创建API密钥2、国内云服务器3、国外云服务器4、镜像网站代码5、效果重要：部署时会修改glibc库，为了防止云服务器被搞坏，请提前进行备份或者创建快照重要：部署时会修改glibc库&#xff…

阅读更多...

推荐文章

最新文章