MimicMotion-腾讯开源视频生成框架

MimicMotion-腾讯开源视频生成框架

news2026/2/13 17:16:04

腾讯宣布开源可控视频生成框架 MimicMotion，该框架可以通过提供参考人像及由骨骼序列表示的动作，来产生平滑的高质量人体动作视频

MimicMotion 具有以下几个亮点：

首先，通过引入了置信度感知的姿态引导信号，大幅提升了帧间一致性，使得产生的视频在时序上能够做到平滑自然。
其次，通过放大置信度感知的区域损失，显著减少了图像失真，使得局部画面如人体手部细节得到了大幅改善。
最后，通过结合扩散过程的渐进式潜在特征融合策略，MimicMotion 能够在有限的算力资源内生成无限长的视频同时保证画面连贯。

MimicMotion 在生成多种形式的人体动作视频上均具有良好的结果，包括半身动作、全身动作以及谈话动作视频。相比现有的开源方案如 MagicPose、Moore-AnimateAnyone 等；

MimicMotion 具有以下几点优势：

1. 生成结果细节更加丰富且清晰，包括人体手部细节；

2. 帧间连续性更加优秀，画面无明显跳变；

3. 支持平滑的长视频生成

在量化指标评估实验中，MimicMotion 相比现有开源方案 MagicPose、Moore-AnimateAnyone 以及 MuseV，在 FID-VID 及 FVD 测试指标上均取得了领先。

官方网站：MimicMotion
代码仓库：https://github.com/Tencent/MimicMotion
论文地址：https://arxiv.org/abs/2406.19680

MagicPose:

MagicPose可以精确地生成外观一致的结果，而原始的文本到图像模型(如Stable Diffusion和ControlNet)很难准确地保持主体身份信息。

此外，MagicPose模块可以被视为原始文本到图像模型的扩展/插件，而无需修改其预训练的权重

论文链接：https://arxiv.org/pdf/2311.12052

项目链接：https://github.com/Boese0601/MagicDance

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1933431.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

读书笔记：改善既有代码的设计

读书笔记：改善既有代码的设计

差不多两年都没写过博客了，好学的习惯差不多都落下了，两年里几乎也把学到的很多东西都应用了，但不学习好像就有点停步不前的感觉了，以后给自己定个目标每周写一遍博客。写博客好处： 一是加深自己的印象（能…

阅读更多...

幽微之处见真章:数据类型与内存存储的内在联系

幽微之处见真章:数据类型与内存存储的内在联系

嘿嘿,家人们,今天咱们来深度剖析数据类型在内存中的存储,好啦,废话多不讲,开干! 1.:数据类型介绍在前面呢,博主已经介绍了基本的数据类型: char //字符数据类型 ---->占据1个字节 short //短整型 …

阅读更多...

51单片机STC89C52RC——18.1 HC-SR04超声波测距

51单片机STC89C52RC——18.1 HC-SR04超声波测距

目的/效果独立按键K1按下后开始测距，LCD显示距离（mm） 一，STC单片机模块二，HC-SR04 超声波测距 2.1 HC-SR04 简介 HC-SR04超声波测距模块提供2cm~400cm的测距功能，精度达3mm。 2.2 时序以上时序图表明…

阅读更多...

前端面试题(JS篇五)

一、同步与异步的区别同步指的是当一个进程在执行某一个请求的时候，如果这个请求需要等待一段时间才能返回，那么这个进程会一直等待下去，直到这个消息返回之后才会继续执行。指的是当一个进程在执行某一个请求的时候，如果这个请…

阅读更多...

Leetcode 1302.层数最深子叶结点的和

Leetcode 1302.层数最深子叶结点的和

大家好，今天我给大家分享一下我关于这个题的想法，我这个题过程比较复杂，但大家如果觉得好的话，就请给个免费的赞吧，谢谢了^ _ ^ 1.题目要求: 给你一棵二叉树的根节点 root ，请你返回层数最深的叶子节点的…

阅读更多...

初学者如何通过建立个人博客盈利

初学者如何通过建立个人博客盈利

建立个人博客不仅能让你在网上表达自己，还能与他人建立联系。通过博客，可以创建自己的空间，分享想法和故事，并与有相似兴趣和经历的人交流。本文将向你展示如何通过建立个人博客来实现盈利。你将学习如何选择博客主题、挑选合适…

阅读更多...

【华为OD笔试】2024D卷命题规律解读【分析300+场OD笔试考点总结】

【华为OD笔试】2024D卷命题规律解读【分析300+场OD笔试考点总结】

可上欧弟OJ系统练习华子OD、大厂真题绿色聊天软件戳 od1441了解算法冲刺训练（备注【CSDN】否则不通过） 文章目录相关推荐阅读华为OD笔试2024D卷命题规律解读华为OD算法/大厂面试高频题算法练习冲刺训练相关推荐阅读【华为OD笔试】2024D卷机考套题…

阅读更多...

Android Framework学习笔记（4）----Zygote进程

Android Framework学习笔记（4）----Zygote进程

Zygote的启动流程 Init进程启动后，会加载并执行init.rc文件。该.rc文件中，就包含启动Zygote进程的Action。详见“RC文件解析”章节。根据Zygote对应的RC文件，可知Zygote进程是由/system/bin/app_process程序来创建的。 app_process大致处…

阅读更多...

LLM 的储备知识

LLM 的储备知识

GPT一代模型堆叠了12个解码器层。由于在这种设置中没有编码器，这些解码器层将不会有普通transformer解码器层所具有的编码器-解码器注意力子层。但是，它仍具有自注意力层。训练过程 Transformer Decoder 结构编码器（6 layers&#xff09…

阅读更多...

Template_C++

Template_C++

C模板 C提供了function template. function template：实际上是建立一个通用函数，其函数类型和形参类型不具体制定，用一个虚拟的类型来代表。这个通用的函数就称为函数模版。是不是可以这样理解，函数模版就是给了一种功能&…

阅读更多...

Linux 下 ElasticSearch 集群部署

Linux 下 ElasticSearch 集群部署

目录 1. ElasticSearch下载 2. 环境准备 3. ElasticSearch部署 3.1 修改系统配置 3.2 开放端口 3.3 安装 ElasticSearch 4. 验证本文将以三台服务器为例，介绍在 linux 系统下ElasticSearch的部署方式。 1. ElasticSearch下载下载地址：Past Rel…

阅读更多...

vue 如何做一个动态的 BreadCrumb 组件，el-breadcrumb ElementUI

vue 如何做一个动态的 BreadCrumb 组件，el-breadcrumb ElementUI

vue 如何做一个动态的 BreadCrumb 组件 el-breadcrumb ElementUI 一、ElementUI 中的 BreadCrumb 定义 elementUI 中的 Breadcrumb 组件是这样定义的 <template><el-breadcrumb separator"/"><el-breadcrumb-item :to"{ path: / }">主…

阅读更多...

算法 —— LRU算法

算法 —— LRU算法

算法 —— LRU算法 LRULRU算法的工作原理：实现方法：性能考虑： 模拟过程splice函数对于std::list和std::forward_list基本语法：功能描述： 示例：注意事项： 如果大家已经学习过了Cache的替换算法和…

阅读更多...

《人性的弱点》

《人性的弱点》

This book is called ‘How to Win Friends & Influence People’. [COPY] 卡耐基《人性的弱点》有什么干货么？

阅读更多...

自学鸿蒙HarmonyOS的ArkTS语言＜十＞@BuilderParam装饰器

自学鸿蒙HarmonyOS的ArkTS语言＜十＞@BuilderParam装饰器

作用：当子组件多处使用时，给某处的子组件添加特定功能一、初始化 1、只能被Builder装饰的方法初始化 2、使用所属自定义组件的builder方法初始化 3、使用父组件的builder方法初始化 - 把父组件的builder传过去，参数名和子组件的builderPar…

阅读更多...

【信号频率估计】MVDR算法及MATLAB仿真

【信号频率估计】MVDR算法及MATLAB仿真

目录一、MVDR算法1.1 简介1.2 原理1.3 特点1.3.1 优点1.3.2 缺点二、算法应用实例2.1 信号的频率估计2.2 MATLAB仿真代码三、参考文献一、MVDR算法 1.1 简介最小方差无失真响应（Mininum Variance Distortionless Response，MVDR）算法最…

阅读更多...

AI初学者的利器——香橙派AIpro

AI初学者的利器——香橙派AIpro

目录引言香橙派介绍公司简介（来自官网）香橙派AIpro介绍香橙派AIPro硬件规格参数开发板接口详情系统登陆与使用指示灯 AI运行实例AI CPU和control CPU的设置方法香橙派AIpro cpu知识查询AIcpu占用率与cpu类别设置 Juypter lab使用JuypterLab介绍JuypterL…

阅读更多...

8款可以替代Axure的设计软件推荐

一个好的原型设计工具对于产品经理或者UI/UX设计师来说非常重要。一个好的原型设计软件可以帮助你快速构建一个还原度高、信息结构清晰的原型图，也可以大大降低工作中与同事的沟通成本，更高效地推进工作。那么，什么是易于使用和免费的原型设…

阅读更多...

C51语言及通用I/O口应用

C51语言及通用I/O口应用

4.1 C51的程序结构 4.2 C51的数据结构 4.3 C51与汇编的混合编程 4.4 C51仿真开发方法 4.5 通用I/O口的简单应用 4.6 通用I/O口的进阶应用 4.1.1 C51语言概述 C51语言是51单片机的一种高级编程语言，与低级语言的汇编语言相比，一方面具有结构化语…

阅读更多...

Chapter12 屏幕后处理效果——Shader入门精要学习笔记

Chapter12 屏幕后处理效果——Shader入门精要学习笔记

Chapter12 屏幕后处理效果一、屏幕后处理概述以及基本脚本系统1.OnRenderImage 函数 —— 获取屏幕图像2.Graphics.Blit 函数 —— 使用特定的Shader处理3.在Unity中实现屏幕后处理的基本流程4.屏幕后处理基类二、调整亮度、饱和度和对比度1.BrightnessSaturationAndContrast…

阅读更多...

推荐文章

最新文章