025_SSS_BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction

news2025/1/12 3:54:29

BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction

本文关注的问题是human motion prediction(HMP),也就是在给定观测到的人体运动的前提下,预测人体的后续运动。本文的思路是,将人的behavior从motion中motion和pose中解耦出来,然后在给定观测到的人体behavior的条件下,利用conditional latent diffusion,预测之后的behavior,结合motion和pose从而实现Stochastic human motion prediction(HMP)

在这里插入图片描述

1. Introduction

已有方法的缺点:

  1. 已有的方法利用分散骨骼关节来预测高度多样化的运动,这导致了这些方法在预测快速和多样化的运动的时候,预测的结果并不现实,并且与已经观测到的运动不一致。
  2. 已有的方法还忽略了需要预测具有细微关节位移的各种小范围的动作和行为。

本文的贡献:

  1. 本文提出了BeLFusion(Behavior Latent Diffusion),与之前的工作相比,可以生成更加真实和连贯的人体行动预测,同时达到SOTA的准确率。
  2. BeLFusion是在behavior层面应用了Latent Diffusion从而具有behavioral diversity。这样可以同时支持小范围和大范围的运动。
  3. 本文扩展了对于Stochastic HMP的评测。并且提出了一些新的指标。

2.Methodology

2.1 Problem definition

在这里插入图片描述

2.2 Behavioral Latent Diffusion

首先需要从人体的motion中解耦出Behavior的隐编码。

在这里插入图片描述

定义Observation window X中最后C个pose为target motion x m = { p t − C , . . . , p t − 2 , p t − 1 } ⊂ X x_m = \lbrace p_{t-C}, ..., p_{t-2}, p_{t-1} \rbrace \subset X xm={ptC,...,pt2,pt1}X,这C个pose给出了人体移动的速度和方向,而预测出来的Prediction window中的人体的移动速度和方向需要与之保持一致。定义 Y e = x m ∪ Y Y_e = x_m \cup Y Ye=xmY

为了将Y中的behavior从motion和pose中解耦出来,本文用了一种对抗的思路。

如图中, Y e Y_e Ye 经过behavior encoder p θ p_{\theta} pθ 得到隐式编码 z z z ,再由auxiliary decoder r ω r_{\omega} rω 重建出 Y e Y_e Ye。这部分可以看做是一个VAE,不同之处在于只训练解码器 r ω r_{\omega} rω部分。

在这里插入图片描述

接下来为了能让隐式编码 z z z 中只包含有behavior相关的信息,作者利用另一个编码器 g α g_{\alpha} gα x m x_m xm 编码出速度和方向等信息,与behavior隐编码 z z z 一起,经过behavior coupler B ϕ B_{\phi} Bϕ,得到输出重建的 Y e Y_e Ye

在这里插入图片描述

以上两个损失在一个iteration内交替使用一次,分别在固定网络 α , θ , ϕ \alpha, \theta, \phi α,θ,ϕ 参数的情况下,利用 L a u x L_{aux} Laux 训练网络 ω \omega ω , 以及在固定 ω \omega ω 参数的情况下,利用 L m a i n L_{main} Lmain 训练 α , θ , ϕ \alpha, \theta, \phi α,θ,ϕ 的参数。

得到了产生隐编码 z z z 的编码器 p θ p_{\theta} pθ 之后,就可以用conditional latent diffusion来预测人体的behavior。

在这里插入图片描述

本文主要感兴趣的就是这个解耦的部分,后边的有需要再看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/82603.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux文件服务NFS共享存储服务

作者简介:一名99年软件运维应届毕业生,正在自学云计算课程。宣言:人生就是B(birth)和D(death)之间的C(choise),做好每一个选择。创作不易,动动小手…

高视医疗在港交所上市:IPO首日跌破发行价,高铁塔为控股股东

12月12日,高视医疗(HK:02407)在港交所上市。本次上市,高视医疗的发行价确定为每股发售股份51.40港元。据此计算,高视医疗预计募资约6.72亿港元。而招股书则显示,该公司预计募资净额约为2.83亿港元&#xff…

java 剑指 Offer 57 - II. 和为s的连续正数序列

题目所属分类 双指针的做法 O&#xff08;n)的时间复杂度 同时末尾有List<int[]> res 这种的转化成二位数组 原题链接 输入一个正整数 target &#xff0c;输出所有和为 target 的连续正整数序列&#xff08;至少含有两个数&#xff09;。 序列内的数字由小到大排列&…

Spring Boot自定义starters

一、简介 SpringBoot 最强大的功能就是把我们常用的场景抽取成了一个个starter&#xff08;场景 启动器&#xff09;&#xff0c;我们通过引入springboot 为我提供的这些场景启动器&#xff0c;我们再进行 少量的配置就能使用相应的功能。即使是这样&#xff0c;springboot也不…

R语言绘制复杂抽样设计数据cox回归生存曲线(Kaplan-Meier)

上期咱们已经介绍了咱们绘制复杂抽样设计数据的基础图形&#xff0c;今天咱们来介绍一下咱们绘制复杂抽样设计cox回归生存曲线(Kaplan-Meier)。 废话不多说咱们先导入数据和R包 library(survey) pbc<-read.csv("E:/r/test/pbc.csv",sep,,headerTRUE) 这是一个原…

web前端-javascript-prototype原型(说明,访问,优势,判断是否含有一个属性,原型对象的原型)

prototype 原型 1. 原型介绍 function Person() {} function MyClass() {}//向MyClass中添加属性a MyClass.prototype.a 123;//向MyClass的原型中添加一个方法 MyClass.prototype.sayHello function () {alert("hello"); };var mc new MyClass(); var mc2 new …

使用VUE自定义组件封装数据字典实战

背景 照惯例&#xff0c;先交待下背景&#xff0c;从真实需求出发&#xff0c;讲述设计思路和实现方式。 软件系统中&#xff0c;会有一些成组的常量值&#xff0c;来描述业务实体的属性&#xff0c;如性别、证件类型、审批状态等。我们通常称之为数据字典&#xff0c;作为系统…

Seata

Seata的三大角色 TC&#xff08;Transaction Coordinator&#xff09;-事务协调者 维护全局和分支事务的状态&#xff0c;驱动全局事务提交或回滚。 TM&#xff08;Transaction Manager&#xff09;-事务管理器 定义全局事务的范围&#xff1a;开始全局事务、提交或回滚全局…

图片怎么编辑里面的文字?这篇文章告诉你方法

大家平时在分享自己拍摄的照片时&#xff0c;会不会觉得照片有点单调&#xff0c;留白面积大呢&#xff1f;其实这时候&#xff0c;我们可以给图片添加一些文字描述&#xff0c;就能够丰富图片的内容&#xff0c;并且我们也可以将这些加文字的图片当做表情包来使用。那么你们知…

【人工智能】【总结】CMSC5707 Advanced Topics in Artificial Intelligence

文章目录1. 音频信号处理介绍2. 音频信号预处理3. 特征4. 特征重现5. 语音识别6. AdaBoost7. 人脸识别8. 神经网络9. 卷积神经网络10. Auto-Encoder11. 循环神经网络 和 LSTM12. Word Representation13. 决策树1. 音频信号处理介绍 x KHz, y bit, n s 多少 byte: x∗1000∗y/8…

【12月9日更新1/4决赛预测】用二元泊松模型预测2022年世界杯淘汰赛结果

用二元泊松模型预测2022年世界杯淘汰赛结果 网上有很多文章用双泊松&#xff08;Double Poisson&#xff09;模型来预测世界杯比赛结果。但是双泊松模型有一个严重的缺陷&#xff0c;那就是它假设比赛中两队的比分是条件独立的。而我们都知道&#xff0c;在对抗性比赛中&…

【PCB设计】孔间距不可忽视,小心废板!

为什么有时候明明PCB设计没有检查出错误&#xff0c;但是在生产加工后还是出现短路、断板等不良情况&#xff1f; 那是因为你没有考虑到孔间距问题&#xff0c;导致在装配过程中无法避免的产生损耗。 PCB单面板或双面板的制作&#xff0c;都是在下料之后&#xff0c;直接进行非…

商品信息管理系统(Python)完整版

目录 功能模块&#xff1a; 实现思路&#xff1a; 运行功能演示&#xff1a; 具体实现过程&#xff1a; 定义商品类&#xff1a; 定义商品管理类 定义显示商品信息函数 输入销量函数&#xff1a; 添加商品信息&#xff1a; 删除商品信息 修改商品信息 导入商品信息…

Linux下安装Zookeeper教程

ZooKeeper 简介 ZooKeeper是一个分布式的&#xff0c;开放源码的分布式应用程序协调服务&#xff0c;是Google的Chubby一个开源的实现&#xff0c;是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件&#xff0c;提供的功能包括&#xff1a;配置维护、域名服…

字符串匹配算法(BFRK)

文章目录题目一、BF算法二、RK算法补充题目 有字符串 str1 和 str2 &#xff0c;str1 中是否包含 str2&#xff0c;如果没有包含返回 -1&#xff0c;如果包含&#xff0c;则返回 str2 在 str1 中开始的位置 注&#xff1a;保证 str1 和 str2 字符串的长度大于 0 举例&#x…

k8s-kubeadm安装1.25.5

准备环境&#xff1a; 想体验下新的版本 主机名IP资源k8s-master192.168.1.1912u2G内存20G磁盘k8s-node192.168.1.1922u2G内存20G磁盘 1 修改主机名&#xff0c;配置hosts文件 # 修改主机名 hostnamectl set-hostname k8s-master hostnamectl set-hostname k8s-node # 修改h…

CMMI2.0配置管理工作及访谈学习笔记(续)

1. 配置管理岗位职责 范围&#xff1a;组织级和项目级配置管理管理对象为过程和产品&#xff0c;产品为识别出的配置项建立配置库&#xff1a;为项目建立开发库&#xff08;管理库&#xff09;、基线库&#xff0c;建立配置库结构并分配权限&#xff08;命名规范&#xff09;基…

猿如意中的【DBeaver】工具详情介绍

猿如意中的【DBeaver】工具详情介绍一、工具名称二、下载安装渠道2.1 什么是猿如意&#xff1f;2.2 如何下载猿如意&#xff1f;2.3 如何在猿如意中下载开发工具&#xff1f;三、工具介绍四、DBeaver功能介绍五、软件截图六、DBeaver安装过程6.1 在猿如意中下载DBeaver6.2 选择…

道路裂缝坑洼图像开源数据集汇总

CrackForest数据集 数据集下载链接&#xff1a;http://suo.nz/2wdNdX CrackForest数据集是一个带注释的道路裂缝图像数据库&#xff0c;可以大致反映城市路面状况。 道路裂缝坑洼图像数据集 数据集下载链接&#xff1a;http://suo.nz/3eEDlj 这个数据集是一个极具挑战性的集…

67、INGeo:利用占用网格先验加速/减少迭代次数

简介 论文地址&#xff1a;INGeo: Accelerating Instant Neural Scene Reconstruction with Noisy Geometry Priors 首先我们知道Instant-ngp利用最先进的射线推进技术&#xff08;指数步进、空白跳过、样本压缩&#xff09;实现密集网格自剪枝的采样策略&#xff0c;这种采样…