论文理解与笔记【CVPR_2022.6】Region-Aware Face Swapping

news2024/11/20 19:27:54

论文理解与笔记【CVPR_2022】Region-Aware Face Swapping

  • 论文的缩写全拼:
  • 一、贡献
  • 二、介绍
  • 三、提出问题,也是论文解决的问题
  • 四、具体实现方案
  • 五、实验
  • 六、最终感想和总结

在这里插入图片描述
论文地址:传送门或者传送门2
先看看效果:
在这里插入图片描述

论文的缩写全拼:

Local Facial Region-Aware (FRA)
局部面部区域感知
Global Source Feature-Adaptive (SFA)
全局资源特征自适应
Face Mask Predictor (FMP)
面部掩盖预测器
Region-Aware Identity Tokenizer (RAT)
区域感知身份标记器
Region-Aware Identity Projector (RAP)
区域感知身份投影仪

一、贡献

higher quality, better identity-consistency, and fewer artifacts.
此文章换脸比SOTA有更高的质量、更好的身份一致性和更少的伪影。
有关SOTA的介绍查看:SOTA的介绍

主要三个贡献:

  1. We propose a novel Region-Aware Face Swapping (RAFSwap) network, which consists of a novel FRA branch to augment local identity-relevant features by introducing the Transformer to effectively model misaligned cross-scale semantic interaction,and a novel SFA branch to further complement global identity-relevant cues for generating identity-consistent swapped faces.
    我们提出了一种新颖的区域感知人脸交换 (RAFSwap) 网络,该网络由一个新颖的FRA分支组成,通过引入转换器来有效地建模未对齐的跨尺度语义交互,从而增强本地身份相关特征,以及一个新颖的SFA分支,以进一步补充全局身份相关的提示,以生成身份一致的交换面孔。
  2. We propose a FMP module incorporated with Style-GAN2 to predict identity-relevant soft facial masks in an unsupervised manner that is more practical.
    我们提出了一个与StyleGAN2结合的FMP模块,以更实用的无监督方式预测与身份相关的软面膜。
  3. Abundant experiments qualitatively and quantitatively demonstrate the superiority of our method for generating more identity-consistent high-resolution swapped faces over SOTA methods.
    大量的实验定性和定量地证明了我们的方法在生成更多同一性一致的高分辨率交换面方面优于SOTA方法。

二、介绍

Face swapping aims at transferring the identity of the source identity to the target identity while keeping the identity-irrelevant attributes of the target face unchanged.
人脸交换旨在将源身份的身份转换为目标身份,同时保持目标人脸与身份无关的属性不变。
一个好的换脸图片应该是满足两个条件:

  1. 能够精确的获取原图片的身份相关的信息,细节的如嘴唇、鼻子、眉毛和眼睛(FRA),全局一些的如皮肤纹理,面部成分的相对距离(SFA)(身份无关的信息不要,如背景和遮挡background and occlusions,光线分布以及发型,刘海以及白头发)
  2. 能够保留目标图片身份无关的信息(FMP)(如背景和遮挡,光线)

三、提出问题,也是论文解决的问题

  • 1.How to maintain identity consistency with the source identity, including local and global
    facial details.
    如何保持与源身份的身份一致性,包括本地和全局面部细节。
    几乎所有当前的方法仅在全局特征表示上执行特征交互,而不建模与身份相关的局部区域,例如嘴唇、鼻子、眉毛和眼睛,这将限制模型表达身份一致性的能力。

  • 2.How to generate high-resolution swapped faces while keeping the identity-irrelevant details consistent with the target face under the GAN inversion framework, e.g., background and occlusions.
    如何在 GAN 反转框架下生成高分辨率交换人脸,同时保持与目标人脸无关的身份无关细节,例如背景和遮挡。
    最近的工作利用 StyleGAN2作为强大的解码器,但未能保持目标面部与身份无关的属性的一致性。

  • 近期相关工作的问题:
    However, the identity vector produced by the face recognition network is naturally not well-disentangled,which inevitably includes some identity-irrelevant information of the source face, e.g., background, light distribution,and hairstyle.
    然而,人脸识别网络产生的身份向量自然没有很好的解开,其中不可避免地包含一些与源人脸身份无关的信息,例如背景、光线分布和发型。
    (就是将与源人脸身份无关的信息如背景、光线分布和发型生成到结果图像之中去了。)

  • 导致的结果:
    This wrong information will be further injected into the target feature in a global manner via AdaIN,
    resulting in low-quality generation results.
    这些错误信息会进一步通过 AdaIN 以全局方式注入到目标特征中,导致生成结果质量低下。
    (不能很好的保留原始图像的身份信息)

  • 论文采取的解决方案:
    To better preserve the identity consistency of the generated face,we explicitly model the local facial features besides global representation to perform feature interaction more finely,which also excludes the influence of the identity-irrelevant area of the source face at the same time.
    为了更好地保持生成人脸的身份一致性,我们除了全局表示之外,还对局部面部特征进行了显式建模,以更精细地执行特征交互,这也同时排除了源人脸的身份无关区域的影响。

  • 更具体的方案

  1. local Facial Region-Aware (FRA) branch to model identity-relevant feature interaction between source and target faces, which employs a Region-Aware Identity Tokenizer (RAT), transformer layers [31], and a Region-Aware Identity Projector (RAP) to realize misaligned cross-scale semantic interaction, i.e., lips, nose, brows, and eyes.
    (用FRA并采用RAT,transformer layers和RAP来完成嘴唇、鼻子、眉毛和眼睛的交互。)
  2. global Source Feature-Adaptive (SFA) branch to complement global identity-relevant cues, e.g., skin wrinkle, for more identity-consistent results.
    (用SFA补充全局的身份相关细节,如皮肤纹理)
  3. we design a Face Mask Predictor(FMP) to predict identity-relevant soft facial mask in an un-
    supervised manner, i.e., without using specific mask supervision.
    FMP incorporated with StyleGAN2 is pro-posed to preserve the background and occlusions of the target unsupervisedly.
    (FMP用于保留目标图片的身份无关信息如背景和遮挡)

四、具体实现方案

先看图片:
在这里插入图片描述
有四个部分:

  • 3.1. Facial Region-Aware Branch
    1.Region-Aware Identity Tokenizer.
    2.Transformer Layers.
    3.Region-Aware Identity Projector.
  • 3.2. Source Feature-Adaptive Branch
  • 3.3. Face Mask Predictor
  • 3.4. Objective Functio
    Identity Loss.
    Reconstruction Loss.
    Perceptual Loss.
    最终是三个损失函数的综合。

五、实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

六、最终感想和总结

  1. 没有开源的代码,复现不了;
  2. 优化思路是值得借鉴的,图像质量是否变好,与原图片的身份一致性的优化以及目标图片与身份无关的特征保留的是否很好;
  3. 如作者所言,还可以将工作运用到化妆的转移工作(makeup transfer),即将优化的思路运用到不同的领域;
  4. 善于发现先前工作的不足和问题所在,进而找出优化的方法和思路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/273.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【单片机毕业设计】【mcuclub-jj-003】基于单片机的八层电梯的设计

最近设计了一个项目基于单片机的八层电梯系统,与大家分享一下: 一、基本介绍 项目名:八层电梯 项目编号:mcuclub-jj-003 单片机类型:STC89C52、STM32F103C8T6 功能简介: 1、通过3*4矩阵键盘实现电梯内部…

【Linux修炼】5.vim详解

每一个不曾起舞的日子,都是对生命的辜负。 Linux-yum&vim工具的使用本节目标1. Linux 软件包管理器 yum1.1 什么是软件包1.2 关于rzsz1.3 查看软件包1.4 如何安装软件1.5 如何卸载软件2. Linux编辑器-vim的使用(重点)2.1 什么是vim&#…

C++内存管理

1.C内存分布 学习C内存分布之前,先小试牛刀一下。 int globalVar 1; static int staticGlobalVar 1; void Test() {static int staticVar 1;int localVar 1;int num1[10] { 1, 2, 3, 4 };char char2[] "abcd";const char* pChar3 "abcd&quo…

webpack--》webpack底层深入讲解,从初识到精通,真正实现从0到1的过程

目录 webpack webpack的基本使用 安装 配置 修改自定义打包的入口与出口 优化js或图片的存放路径 配置webpack中符号的使用 webpack中相关插件安装 webpack-dev-server html-webpack-plugin clean-webpack-plugin webpack中的loader 打包处理css文件 打包处理les…

TPM分析笔记(十二)TPM PCR操作

目录一、PCR初始化(Initializing PCR)二、PCR的扩展(Extend of a PCR)2.1 其他PCR命令三、使用PCR Banks进行扩展(Using Extend with PCR Banks)四、事件记录(Recording Events)五、…

Java递归实现树形结构的两种方式

目录0、引言1、数据准备2、类型转化3、递归实现方法3.1、Java7及以下纯Java递归实现3.2、Java8及以上借助lamda表达式实现0、引言 在开发的过程中,很多业务场景需要一个树形结构的结果集进行前端展示,也可以理解为是一个无限父子结构,常见的…

【老师见打系列】:我只是写了一个自动回复讨论的脚本~

文章目录🌟好久不见⛳️实现过程🌴老操作了兄弟们~🐢一步拿捏讨论💖美图结束语专栏Python零基础入门篇💥Python网络蜘蛛💥Python数据分析Django基础入门宝典💥小玩意儿💥Web前端学习…

2022海德堡桂冠论坛(HLF)见闻录

今年9月下旬,我前往德国参加了第九届海德堡桂冠论坛。因疫情原因停摆两年后,海德堡桂冠论坛再次以线下形式举办,会场热闹非凡,作为计算机与数学界的社交盛宴当之无愧。 海德堡桂冠论坛(Heidelberg Laureate Forum, HLF…

IGV-GSAman |「功能基因组时代」的高效率科研工具

写在前面 今天周末,转眼10月份只剩一周。万万没想到,一个月下去,我还是花了不少时间在完善「GSAman」。至于为什么本来「两个小时」就干完的事情,可以干成「22天」?到底还是我对前面的版本,不太满意。当然…

Attack Lab

Attack Lab 从CMU官网下载完所需实验包后,内有官方文档以及.tar压缩包,使用tar -xvf targetk.tar解压后,得到如下文件 The fifiles in targetk include: README.txt: A fifile describing the contents of the directory ctarget: An execut…

web自动化测试框架

本文介绍web自动化测试框架 ●Base:用来对Selenium API进行二次封装。 对Selenium API进行二次封装的目的是简化一些复杂的操作,但是千万不要为了封装而封装。 封装好后,其他页面类可以集成basepage,调用这些方法。 from sele…

【iOS】—— 仿写知乎日报第一周总结

目录知乎日报第一周完成情况遇到的问题:1.线程问题:2.SDWebImage加载图片3.实现无限刷新界面4.点击主界面cell进入后的界面知乎日报第一周完成情况 在这周开始了仿写知乎日报的任务,在第一周里,我完成了主界面,以及滚…

新人入手mac折腾过程中遇到的解决方案

本文将长期更新,以记录个人的使用。 终端美化 …还没有美化完,不过推荐看这篇文章Mac终端美化指南 homebrew homebrew是Mac OS X上的强大的包管理工具,可以高效管理各种软件包,官方说法是:The missing package mana…

ArcGIS:如何新建图层组并添加数据、切换数据视图和布局视图、修改符号系统?

目录 01 如何新建图层组? 02 如何在图层组中添加数据 03 如何切换数据视图和布局视图 03 如何修改符号系统? 3.1 如何快捷的修改一下符号样式? 3.2 如何修改符号系统的色带 3.2.1 色带视图的取消 3.3 修改符号系统中的标注显示 3.4 如…

大气湍流退化图像复原技术研究及DSP实现

目录 第一章 绪论 1 1.1 研究背景 1 1.2 国内外研究现状 1 1.3 本文的研究内容 5 1.4 本文的组织结构 5 第二章 大气湍流退化图像复原技术 7 2.1 图像退化及复原数学模型概述 7 2.1.1 图像退化的数学模型 7 2.1.2 图像复原的数学模型 8 2.2 大气湍流退化图像概述 9 2.2.1 大气…

插件内存分析

rtspsrc 1. 当pipleline为rtspsrc加其他插件时,如果让其他插件卡主会发生什么事情呢?以rtspsrcfakesink为例(gst-launch-1.0.exe rtspsrc locationrtsp://xxx ! fakesink),修改fakesink的代码,让render中…

基于SSM的图书馆阅览室预约管理系统,高质量论文范例,可直接参考使用,附送源码、数据库脚本

目录 1.项目技术栈 2.适合对象 3.适合课题 4.项目功能概述 4.1 项目功能汇总 4.2 项目功能介绍 5. 高质量论文范例 6. 毕业设计撰写视频教程 6.部分运行截图 1.项目技术栈 前端必学三个基础,"HTML、CSS、JS",基本每个B/S架构项目都要…

C++【搜索二叉树】

目录 一、什么是搜索二叉树 二、搜索二叉树如何删除数据 删除的是叶子结点的情况 删除的结点下面仅有一个子节点(托孤)(要删除的结点只有一个孩子) 替换法删除 (要删除的结点有两个个孩子) 三、写一…

腾讯前辈熬夜肝了一个月整理的《Linux内核学习笔记》,啃完受益匪浅不走弯路

小编热衷于收集整理资源,记录踩坑到爬坑的过程。希望能把自己所学,实际工作中使用的技术、学习方法、心得及踩过的一些坑,记录下来。也希望想做Linux内核高级工程师的你一样,通过我的分享可以少走一些弯路,可以形成一套…

【数据结构】常见七大排序总结

目录 一、插入排序:直接插入排序【稳定排序方法】 二、插入排序:希尔排序【不稳定排序方法】 三、选择排序:直接选择排序【不稳定排序方法】 四、选择排序:堆排序【不稳定排序方法】 五、交换排序:冒泡排序【稳定…