利用机器学习重构视频中的人脸

news2024/11/25 4:22:55

引言

中国与英国的研究团队携手合作,开创了一种创新的视频面孔重塑技术。这项技术能够以极高的一致性对视频中的面部结构进行逼真的放大和缩小,且避免了常见伪影的产生。

从研究人员选取的YouTube视频样例中可见,经过处理后,女演员詹妮弗·劳伦斯的面容显得更加瘦削(如图右方所示)。欲观看更高分辨率的示例,请参阅文章底部的嵌入式视频。该技术源自链接:[视频链接]

传统上,此类面部变换需要借助复杂的CGI方法实现,这不仅成本高昂,还涉及到繁琐的动作捕捉、绑定和纹理处理流程,以完整重建面部特征。

然而,这项新技术另辟蹊径,将CGI与神经网络管道相结合,作为参数化的3D面部信息处理的一部分。这种方法随后构成了机器学习工作流程的基础,为视频编辑和面部动画领域带来了革命性的变革。

传统的参数化面孔越来越多地被用作使用 AI 而不是 CGI 的变革过程的指导方针。 资料来源:https://arxiv.org/pdf/2205.02538.pdf

概述

传统的参数化面孔技术越来越多地被用作利用人工智能(AI)而非计算机生成图像(CGI)的变革性过程的指导原则。在这项研究中,作者们提出了一个目标:

“我们的目标是根据现实世界中的自然面部变形编辑人像面部的整体形状,生成高质量的人像视频重塑结果。这可用于诸如用于美化的匀称脸部生成和用于视觉效果的脸部夸张等应用。”

自从Photoshop这类图像编辑软件普及以来,消费者已经能够对2D图像进行面部扭曲和变形的操作。然而,这些操作有时会导致不自然甚至令人难以接受的结果,特别是当涉及到身体畸形的图像处理时。作者指出,尽管在静态图像上的应用相对成熟,但在视频上实现类似的面部变形技术,如果不借助CGI,仍然是一个挑战。这项研究的成果,旨在通过AI技术,使得在视频内容中进行面部重塑变得更加容易和高效,同时保持高质量和连贯性。

马克·扎克伯格的尺寸因中英技术而扩大和缩小。

形体重塑,或称为人体形态编辑,是计算机视觉领域中一个非常活跃的研究方向。它涉及到使用人工智能算法来修改和调整人体图像或视频中的形态特征,例如身高、体型或骨骼结构。这项技术在时尚电子商务中具有巨大的应用潜力,例如,允许顾客在购买前预览服装在不同体型上的效果。

然而,这项技术面临着一些挑战。例如,使某人看起来更高或改变其骨骼结构,需要在不扭曲背景或周围环境的情况下,对图像进行复杂的几何变换。这在技术上是非常困难的,因为需要考虑人体和服装的三维结构,以及它们与环境的交互。

关于使用人工智能技术重塑人体形态的研究。这项研究提出了一种新的方法,通过深度学习模型来改善人体形态的编辑,使得结果更加自然和逼真。

关于改变视频中头部形状的研究。这项工作尝试在视频序列中以一种连贯和令人信服的方式改变人物的头部形状,但可能会受到一些技术限制的影响。

关于新系统的训练环境和使用的技术的描述。这个系统在一台高性能的台式电脑上进行训练,使用了多种技术和工具,包括OpenCV库进行运动估计、结构流框架进行图像修复、面部对齐网络(FAN)进行面部特征点的检测,以及Ceres求解器进行优化问题求解。

这些技术结合起来,使得新系统能够处理更为复杂的任务,比如从静态图像编辑扩展到视频编辑,提高编辑结果的质量和真实感。随着技术的不断进步,我们可以期待在未来形体重塑技术将更加成熟,应用范围也会更加广泛。

这是新系统面部扩大的一个极端例子。

关于人脸

在新系统下,视频被提取为图像序列,并且首先估计每张脸的刚性姿势。 然后,联合估计代表性数量的后续帧,以沿着整个图像运行(即视频的帧)构建一致的身份参数。

面部扭曲系统的架构流程。

之后,对表达式进行求值,产生通过线性回归实现的重塑参数。接下来是一个新颖的有符号距离函数(自卫队)方法在重塑之前和之后构建了面部轮廓的密集二维映射。

最后,对输出视频执行内容感知的扭曲优化。

参数化面

该过程利用了 3D Morphable Face Model (3DMM),这是一种日益流行的技术。 流行的辅助语t 到基于神经和 GAN 的人脸合成系统,以及 相应 用于深度伪造检测系统。

不是来自论文,而是 3D Morphable 脸部模型 (3DMM) 的示例 - 新项目中使用的参数化原型脸部。 左上角,3DMM 面上的地标应用。 右上方是等位图的 3D 网格顶点。 左下角显示地标拟合; 中下,提取的面部纹理的等位图; 右下角是最终的装配和形状。 资料来源:http://www.ee.surrey.ac.uk/CVSSP/Publications/papers/Huber-VISAPP-2016.pdf

不是来自新论文,而是 3D Morphable 脸部模型 (3DMM) 的示例 - 新项目中使用的参数化原型脸部。 左上角,3DMM 面上的地标应用。 右上方是等位图的 3D 网格顶点。 左下角显示地标拟合; 中下,提取的面部纹理的等位图; 右下角是最终的装配和形状。_ 资料来源:http://www.ee.surrey.ac.uk/CVSSP/Publications/papers/Huber-VISAPP-2016.pdf

新系统的工作流程必须考虑遮挡的情况,例如主体将视线移开的情况。 这是 Deepfake 软件面临的最大挑战之一,因为 FAN 地标几乎没有能力解释这些情况,并且随着面部避开或被遮挡,质量往往会下降。

新系统能够通过定义一个 轮廓能量 它能够匹配 3D 人脸 (3DMM) 和 2D 人脸(由 FAN 地标定义)之间的边界。

优化

这种系统的一个有用部署是实现实时变形,例如在视频聊天过滤器中。 当前的框架无法实现这一点,并且所需的计算资源将使“实时”变形成为一个显着的挑战。

根据该论文,假设视频目标为 24fps,管道中的每帧操作表示每秒镜头的延迟为 16.344 秒,另外还有用于身份估计和 3D 面部变形的一次性命中(分别为 321 毫秒和 160 毫秒) 。

因此,优化是降低延迟方面取得进展的关键。 由于跨所有帧的联合优化会给过程增加严重的开销,并且初始化式优化(假设第一帧中说话者的后续身份一致)可能会导致异常,因此作者采用了稀疏模式来计算系数以实际间隔采样的帧数。

然后对该帧子集执行联合优化,从而实现更精简的重建过程。

脸部变形

该项目中使用的变形技术改编自作者 2020 年的作品 深邃匀称的肖像 (数字信号处理器)。

Deep Shapely Portraits,2020 年提交给 ACM Multimedia 的作品。 该论文由浙江大学-腾讯游戏与智能图形创新技术联合实验室的研究人员领导。 来源:http://www.cad.zju.edu.cn/home/jin/mm2020/demo.mp4

Deep Shapely Portraits,2020 年提交给 ACM Multimedia 的作品。 该论文由浙江大学-腾讯游戏与智能图形创新技术联合实验室的研究人员领导。 来源:http://www.cad.zju.edu.cn/home/jin/mm2020/demo.mp4

作者观察到 “我们将这种方法从重塑一个单眼图像扩展到重塑整个图像序列。”

检测

该论文指出,没有可比的现有材料来评估新方法。 因此,作者将扭曲视频输出的帧与静态 DSP 输出进行了比较。

针对 Deep Shapely Portraits 中的静态图像测试新系统。

作者指出,由于 DSP 方法使用了稀疏映射,因此出现了伪影,而新框架通过密集映射解决了这个问题。 此外,该论文还指出,DSP 制作的视频, 演示 缺乏流畅度和视觉连贯性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1827775.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

nvm 管理多版本node

因有多个前端项目,不同项目使用的node版本不一样,所以在本地使用nvm管理不同的node版本。 一、安装nvm 1)nvm理解 nvm全英文也叫node.js version management,是一个nodejs的版本管理工具。nvm和n都是node.js版本管理工具&#xff…

经销商的生意好坏很大程度上跟这群人有关

可以说经销商企业的营收几乎都是靠业务员跑出来的,无论在什么时期、无论在什么区域、无论什么市场情况、无论销售哪些商品,业务员都是企业销售工作的基础,一方面企业需要通过各种手段去提升业务员工作效率,让他们有能力去获得更多…

《C语言》动态内存管理

文章目录 一、动态内存分配二、关于动态内存开辟的函数1、malloc2、free3、calloc4、realloc 三、常见的动态内存的错误1、对NULL指针的解引用操作2、对动态开辟空间的越界访问3、对非动态开辟内存使用free释放4、释放free释放一块动态开辟的内存的一部分5、对同一块动态内存多…

牛客小白月赛96 解题报告 | 珂学家

前言 题解 A. 最少胜利题数 签到 n1 len(set(input())) n2 len(set(input()))if n1 < n2:n1, n2 n2, n1print (-1 if n1 6 else n1 - n2 1)B. 最少操作次数 思路: 分类讨论 只有-1,0,1,2这四种结果 特判 01, 10 n int(input()) s input()# 枚举 from collectio…

Nginx配置文件详解指令示咧Nginx配置文件深入详解与实战

本人详解 作者:王文峰,参加过 CSDN 2020年度博客之星,《Java王大师王天师》 公众号:JAVA开发王大师,专注于天道酬勤的 Java 开发问题中国国学、传统文化和代码爱好者的程序人生,期待你的关注和支持!本人外号:神秘小峯 山峯 转载说明:务必注明来源(注明:作者:王文峰…

线上教育培训办公系统系统的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;管理员管理&#xff0c;教师管理&#xff0c;学生管理&#xff0c;运营事件管理 教师账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;学生管理&#xff0c;作业管理&#xff0c;电…

了解统计学中不同类型的分布

目录 一、说明 二、均匀分布&#xff1a; 三、机器学习和数据科学中的均匀分布示例&#xff1a; 3.1 对数正态分布&#xff1a; 3.2 机器学习和数据科学中的对数正态分布示例&#xff1a; 四、 帕累托分布 4.1 什么是幂律&#xff1f; 4.2 机器学习和数据科学中的帕累托分布示例…

atmega8 上传程序

使用icsp 烧写时先关闭串口程序&#xff0c;与串口uart连接相关的电路勿于电脑连接 接触不良 1.使用icsp 上传 1&#xff09;可以直接上传程序 如官方示例blink 或是 serial示例 2&#xff09;可以先烧录bootload 方便下次使用串口上传程序代码 A)使用专门的icsp 上传器上传…

慧天卓特:2024年春夏之季山东旱情干旱监测分析

2024年开春以来&#xff0c;山东省平均降水量较常年同期偏少92.8%&#xff0c;同时受高温天气影响&#xff0c;山东出现了阶段性气象旱情。截至6月10日&#xff0c;山东省农作物受旱面积121.5万亩&#xff0c;农田缺墒面积262.4万亩。为全力抗旱保夏种&#xff0c;山东自5月29日…

datax的安装及使用入门

1 下载解压Datax tar包 下载到自己指定的安装目录 #wget http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz 进行解压 tar -zxvf datax.tar.gz 2 Datax验证 #修改datax/bin目录下datax.py的权限 chmod 777 datax/bin/datax.py 2.1运行官方给定的任务…

代理设计模式,框架AOP思想

文章目录 引言&#x1f92a;代理对象(Proxy)如何开发一个代理对象开发中的业务层代码冗余问题开发静态代理类动态代理 引言&#x1f92a; 代理 (proxy) &#xff0c;举个生活中常见的现象&#xff0c;在之前网路还未走进大众的时代里&#xff0c;如果我们想买一些东西&#xf…

从零开始:打造你的MySQL数据库环境

mysql下载与安装全教程 mysql简介下载安装MSI下载安装ZIP下载解压缩my.ini文件环境变量启动mysql 主页传送门 &#xff1a; &#x1f4c0; 传送 mysql简介 MySQL是一个关系型数据库管理系统&#xff0c;它是最流行的关系型数据库管理系统之一。   MySQL是一种连接型数据库&a…

NVIDIA Triton系列02-功能与架构简介

NVIDIA Triton系列02-功能与架构简介 B站&#xff1a;肆十二-的个人空间-肆十二-个人主页-哔哩哔哩视频 (bilibili.com) 博客&#xff1a;肆十二-CSDN博客 问答&#xff1a;(10 封私信 / 72 条消息) 肆十二 - 知乎 (zhihu.com) 前面文章介绍微软 Teams 会议系统、微信软件与腾讯…

零基础入门学用Arduino 第三部分(三)

重要的内容写在前面&#xff1a; 该系列是以up主太极创客的零基础入门学用Arduino教程为基础制作的学习笔记。个人把这个教程学完之后&#xff0c;整体感觉是很好的&#xff0c;如果有条件的可以先学习一些相关课程&#xff0c;学起来会更加轻松&#xff0c;相关课程有数字电路…

企业化运维(2)_nginx

###1.nginx源码安装部署### ###2.平滑升级### &#xff08;1&#xff09;版本升级 当服务器在运行时&#xff0c;需要升级的情况下&#xff0c;平滑升级即就是不断开服务器就可以进行升级&#xff0c;最大限度保证数据的完整性。 下载nginx新版本软件&#xff0c;正常执行./c…

【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用

【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用 本次修炼方法请往下查看 &#x1f308; 欢迎莅临我的个人主页 &#x1f448;这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合&#xff0c;智慧小天地&#xff01; &#x1f387; 相关内容文档获取 微…

机器学习周报第46周

目录 摘要Abstract一、文献阅读1.1 摘要1.2 研究背景1.3 论文方法1.4 模块分析1.5 网络规格1.6 高效的端到端对象检测1.7 mobile former模块代码 目录 摘要Abstract一、文献阅读1.1 摘要1.2 研究背景1.3 论文方法1.4 模块分析1.5 网络规格1.6 高效的端到端对象检测1.7 mobile f…

可以用来制作硬模空心耳机壳的胶粘剂有哪些种类?

可以用来制作硬模空心耳机壳的胶粘剂有哪些种类&#xff1f; 制作耳机壳的胶粘剂有很多种类&#xff0c;常见的有环氧树脂胶水、UV树脂胶、快干胶、热熔胶等。 这些胶粘剂都有不同的特点和适用场景&#xff0c;可以根据自己的需求选择合适的类型。 例如&#xff1a; 环氧树脂…

九、BGP路由属性和选路

目录 一、属性分类 1.1、公认属性 1.2、可选属性 二、选路原则 0、丢弃不可达 取值越大越优 1、Preferred-Value 2、Local_Preference 取值越小越优 3、路由优先级 4、AS_Path 5、Origin 6、MED 7、路由来源 8、Next_Hop的IGP度量值 BGP路由等价负载分担&#…

springboot景区寄存管理系统(源码+sql+论文报告)

针对传统人工行李寄存效率低和安全性不足等问题&#xff0c;设计并实现了一种由网页控制器组成的智能行李寄存系统。首先能够实现行李的寄存管理和行李柜管理以及记录查询和通知公告以及管理员等灵活控制菜单显示权限。经过研究和测试结果显示&#xff0c;该行李寄存系统实现了…