【AI论文与新生技术】Follow-Your-Emoji:精细可控且富有表现力的自由式人像动画技术

news2024/11/29 0:52:40

我们提出了 Follow-Your-Emoji,这是一种基于扩散的肖像动画框架,它使用目标地标序列对参考肖像进行动画处理。肖像动画的主要挑战是保留参考肖像的身份并将目标表情转移到该肖像,同时保持时间一致性和保真度。为了应对这些挑战,Follow-Your-Emoji 为强大的稳定扩散模型配备了两项精心设计的技术。

喜好儿网

具体来说,我们首先采用一种新的显式运动信号,即表情感知地标,来指导动画过程。我们发现这个地标不仅可以确保推理过程中参考肖像和目标运动之间的准确运动对齐,而且还可以提高描绘夸张表情(即大瞳孔运动)并避免身份泄漏的能力。然后,我们提出了面部细粒度损失,以通过使用表情和面部掩模来提高模型的微妙表情感知和参考肖像外观重建的能力。因此,我们的方法在控制自由式肖像的表达方面表现出了显着的性能,包括真人、卡通、雕塑,甚至动物。

通过利用简单有效的渐进生成策略,我们将模型扩展到稳定的长期动画,从而增加其潜在的应用价值。为了解决该领域缺乏基准的问题,我们推出了 EmojiBench,这是一个包含各种肖像图像、驾驶视频和地标的综合基准。我们在 EmojiBench 上进行了广泛的评估,以验证 Follow-Your-Emoji 的优越性。

一个名为"Follow-Your-Emoji"的新技术,它是一个基于扩散模型的头像动画框架。这个框架能够将目标表情和动作序列应用到参考头像上,无论是真人、卡通、雕塑甚至动物的头像。这项技术的主要挑战在于,在动画过程中保持参考头像的身份特征,同时传递目标表情,并确保时间上的连贯性和逼真度。

为了应对这些挑战,"Follow-Your-Emoji"采用了两种关键技术:首先,它使用一种新的显式动作信号——表情感知的关键点,来指导动画过程。这种关键点可以确保在推理过程中参考头像与目标动作之间的准确对齐,并且增强了表现夸张表情(例如,瞳孔的大幅度运动)的能力,同时避免了身份信息的泄露。其次,论文提出了一种面部细粒度损失函数,通过使用表情和面部掩码来提高模型对微妙表情变化和参考头像外观重建的能力。

此外,为了训练模型,研究者构建了一个包含18种夸张表情和115名受试者20分钟真实视频的高质量表情训练数据集。通过简单有效的渐进式生成策略,他们将模型扩展到稳定的长期动画,从而增加了其潜在的应用价值。为了解决该领域缺乏基准的问题,他们还引入了一个名为EmojiBench的综合基准,包含多种风格的头像图像、驱动视频和关键点。

最后,通过在EmojiBench上的广泛评估,验证了"Follow-Your-Emoji"的优越性,特别是在控制自由风格头像表情方面的表现,包括真实人类、卡通、雕塑甚至动物。与现有的基线方法相比,"Follow-Your-Emoji"在视觉逼真度、身份忠实度和动作渲染的精确度方面都有显著提升。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1802335.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

四、利用启发式算法进行特定数据集的残差网络结构搜索【框架+源码】

背景:工作之后干的事情跟算法关联甚少,整理下读书期间的负责和参与的work,再熟悉学习下。 边熟悉边整理喽~ CV Tradictional workCV AI based work机械臂视觉抓取项目机器学习全流程 Pipeline训练平台OCR生产线喷码识别三维重建(SfM)ROS机器人…

SpringBoot Elasticsearch06-以黑马商场为例-黑马程序员学习笔记

黑马商城作为一个电商项目,商品的搜索肯定是访问频率最高的页面之一。目前搜索功能是基于数据库的模糊搜索来实现的,存在很多问题。 首先,查询效率较低。 由于数据库模糊查询不走索引,在数据量较大的时候,查询性能很…

学习笔记——路由网络基础——汇总静态路由

4、汇总静态路由 (1)定义 静态路由汇总:多条静态路由都使用相同的送出接口或下一跳 IP 地址。(将多条路由汇总成一条路由表示) (2)目的 1.减少路由条目数量,减小路由表,加快查表速度 2.增加网络稳定性 (3)路由黑洞以及路由环路的产生…

旧衣回收小程序开发,轻松回收旧衣物

随着环保理念的增强,回收市场得到了快速发展,吸引了不少年轻人进入到市场中创业。除了传统的废品回收外,旧衣回收也受到了大众的重视,市场规模迅速扩大,大众浪费的衣物也获得了归处。 目前旧衣回收的方式主要是线上与…

如何将HTTP升级成HTTPS?既简单又免费的方法!

在当今数字化时代,网络安全已成为用户和企业关注的焦点。HTTPS作为一种更加安全的网络通信协议,正逐渐取代传统的HTTP成为新的标准。对于许多网站管理员和内容创作者来说,如何免费升级到HTTPS是一个值得探讨的问题。本文将详细介绍一些免费的…

Flash均衡算法几个点

Flash均衡保存算法是一种用于调整更改数据时擦除Flash存储器区域大小的高效算法。 在Flash存储器中,写入新数据时需要先将原有数据所在的块进行擦除,然后再进行写入操作。由于Flash存储器的特性,擦除操作比写入操作要慢得多,而且…

Python私教张大鹏 Vue3整合AntDesignVue之Anchor 锚点

用于跳转到页面指定位置。 何时使用 需要展现当前页面上可供跳转的锚点链接&#xff0c;以及快速在锚点之间跳转。 案例&#xff1a;锚点的基本使用 核心代码&#xff1a; <template><a-anchor:items"[{key: part-1,href: #part-1,title: () > h(span, {…

使用Python操作Redis

大家好&#xff0c;在当今的互联网时代&#xff0c;随着数据量和用户量的爆发式增长&#xff0c;对于数据存储和处理的需求也日益增加。Redis作为一种高性能的键值存储数据库&#xff0c;以其快速的读写速度、丰富的数据结构支持和灵活的应用场景而备受青睐。本文将介绍Redis数…

elasticsearch安装与使用(4)-搜索入门

1、创建索引 PUT /hotel {"mappings": {"properties":{"title":{"type": "text"},"city":{"type": "keyword"},"price":{"type":"double"}}} }2、写入文档 …

大语言模型的sft

https://zhuanlan.zhihu.com/p/692892489https://zhuanlan.zhihu.com/p/6928924891.常见的sft的开发流程 a.根据业务场景调整提示词;越详细越好,不要让模型理解歧义,拆分。 b.尝试闭源和开源,以评估LLM能够解决这类场景问题。 c.准备数据,包括多个子任务。 d.训练上线…

产气荚膜梭菌定植与婴儿食物过敏之间的关联

谷禾健康 牛奶蛋白过敏&#xff08;CMPA&#xff09;是婴儿最常见的食物过敏类型之一。粪便病原菌培养显示产气荚膜梭菌阳性率超过30%&#xff0c;明显高于其他细菌。因此推测产气荚膜梭菌定植可能是婴儿牛奶蛋白过敏的发病因素之一。 一项真实世界的研究&#xff0c;杨敏团队从…

2024年跨平台应用解决方法

个人博客:Sekyoro的博客小屋 个人网站:Proanimer的个人网站 很久没有写这类high-level的文章了,本身这类框架就一直层出不穷,但是其中历久弥坚,坚韧不拔的框架又有多少呢? 首先考虑到学习成本以及掌握一些编程语言在工作、学习生态上的价值,给这些东西适用生态划分一下. Reac…

能放在桌面上的倒数提醒软件 桌面提醒软件倒数日

在忙碌的生活中&#xff0c;我们总有许多待办事项和重要的纪念日需要牢记。可是&#xff0c;人的记忆毕竟有限&#xff0c;有时候一不小心就会错过那些重要的时刻。 桌面提醒软件是我日常生活中的得力助手。它小巧轻便&#xff0c;静静地待在我电脑的桌面上&#xff0c;每次打…

【漏洞复现】多客圈子论坛系统 httpGet 任意文件读取漏洞

0x01 产品简介 多客圈子论坛系统是一种面向特定人群或特定话题的社交网络&#xff0c;它提供了用户之间交流、分享、讨论的平台。在这个系统中&#xff0c;用户可以创建、加入不同的圈子&#xff0c;圈子可以是基于兴趣、地域、职业等不同主题的。用户可以在圈子中发帖、评论、…

2024教资认定报名流程,点赞收藏!

2024年要进行教资认定的宝子们提早准备 &#x1f525;教资认定网上报名流程概览 一、进入教资认定网报入口 二、进行实名核验 三、申请网报时间查询 四、个人信息维护 五、认定申请报名 &#x1f525;教资认定所需材料 1⃣️身份证 2⃣️户口本&#xff0f;居住证&#xff0f;学…

17_Vue高级监听器生命周期Vue组件组件通信

文章目录 1. 数据监听器watch2. Vue生命周期3. Vue组件4. Vue组件通信Appendix 1. 数据监听器watch 首先watch需要单独引 import {watch} from vuewatch函数监听ref响应式数据 watch(监听的内容&#xff0c;监听行为)监听行为默认为(newValue,oldValue) let firstname ref…

[职场] 生产安全员求职简历范文 #媒体#经验分享

生产安全员求职简历范文 生产安全员是现代企业中不可或缺的职位&#xff0c;他们的主要职责是确保生产过程中的安全和健康。下面是生产安全员求职简历范文&#xff0c;供大家参考。 个人信息 姓名&#xff1a;蓝山 年龄&#xff1a;25岁 地址&#xff1a;嘉兴 工作经验&am…

Inpaint9.1软件下载附加详细安装教程

软件简介: Inpaint 是个人开发者Max开发的图片处理软件&#xff0c;可以高效去除水印&#xff0c;修复照片等。使用方法和操作都很简单&#xff0c;非常适合不会PS等软件的小白用户。 安 装 包 获 取 地 址&#xff1a; Iinpaint win版&#xff1a;​​https://souurl.cn/b…

xm文件怎么转换成mp3文件,亲测有效!附工具下载

朋友们&#xff0c;你们有没有遇到过喜马拉雅的.xm文件转成MP3格式的麻烦&#xff1f;别急&#xff0c;我这儿有个好消息告诉你&#xff0c;有个免费的转换工具&#xff0c;简单几步就能搞定&#xff0c;还能批量处理呢&#xff01; 咱们先聊聊这个数字音频的小困扰。喜马拉雅…

使用Rufus工具制作Ubuntu To Go——很详细

一、准备工作 准备工具&#xff1a; 1、下载Rufus(主角)软件 2、准备一个U盘&#xff08;制作启动盘&#xff0c;32G足够&#xff09; 3、准备一个U盘或硬盘&#xff08;小白128G足够&#xff0c;装Ubuntu系统&#xff09; 4、下载Ubuntu系统镜像文件 1、下载软件Rufus 先来看…