GAN反演+老照片修复

news2024/11/29 10:36:54

在这里插入图片描述
关于老照片修复~~~~~上图为运行腾讯ARC的模型之后的效果图

其使用的模型,GFP-GAN,Towards Real-World Blind Face Restoration with Generative Facial Prior,理解记录如下:

Abstract:

In this work, we propose GFP-GAN that leverages rich and diverse priors encapsulated in a pretrained face GAN for blind face restoration.
提出了GFP-GAN,利用丰富多样的先验,将其封装在一个预训练的人脸中,用于模糊人脸修复。

This Generative Facial Prior (GFP) is incorporated into the face restoration process via spatial feature transform layers, which allow our method to achieve a good balance of realness and fidelity.
这种生成性面部先验(GFP)通过空间特征转换层被纳入面部修复过程,这使得我们的方法在真实性和保真度之间取得了良好的平衡。

Thanks to the powerful generative facial prior and delicate designs, our GFP-GAN couldjointly restore facial details and enhance colors with just a single forward pass, while GAN inversion methods require image-specific optimization at inference.
得益于强大的生成性面部先验和精细的设计,GFP-GAN可以通过一次前向传递来联合恢复面部细节和增强颜色,而GAN反演方法需要在推理时对图像进行特定的优化。

Introduction

StyleGAN 等,这些人脸GANs,能够生成具有高度可变性的忠实人脸,从而提供丰富多样的先验, 如几何学、面部纹理和颜色,使得联合恢复面部细节和增强颜色成为可能;

然而,将这种生成性先验因素纳入修复过程是具有挑战性的。

以前 通常使用 GAN inversion


关于GAN反演:

给定一张灰度图像,如何利用预训练好的GAN恢复它的颜色呢?一个自然的想法是在GAN的图像空间寻找一张灰度化后与目标图片一致的图片,由于GAN倾向于输出自然的图片,因此找到的这张图会有自然的颜色。

上述方案要求用GAN的生成器G准确重建一张目标图片。针对该任务,传统的做法是优化生成器输入的隐向量z,又称作GAN inversion。

预训练GAN通常能够生成非常逼真和多样的图像,通过反演找到与特定输入图像对应的潜在代码,我们可以利用GAN的生成先验来执行各种任务,如图像编辑、风格迁移或图像超分辨率等。

用GAN模型近似表征自然图像分布,在恢复图像时,对于失真图,要恢复它,其实就是要在GAN表征的自然图分布中找到一个跟失真图最相似的图。

即,如果我们要复原图像A,则可以训练GAN网络,使其生成一个跟图像A的GroundTruth相似度很高很高的图像,该生成图像即为我们修复后的图像;

在这里插入图片描述
如上图,找相似图的过程是:

比如想复原失去色彩的图像 φ(x),其中 x 指原图Ground Truth,φ 指退化函数,如失去色彩、加噪声……

首先,由GAN生成近似的自然图像 G(z; θ),z 是服从高斯分布的随机向量;

然后对近似自然图 G(z; θ) 进行退化操作 φ,退化结果是 φ(G(z; θ));

那么我们选择一个跟要复原图像 φ(x) 最相似的退化图 φ(G(z; θ)),那退化前的近似自然图G(z; θ)自然可以近似 x。

一般来说,目标函数通常包含两个部分:一是判别器对于生成样本的评价结果;二是输入样本与生成样本之间的差异度量;


此文作者表示,GAN Inversion 尽管有视觉上的真实输出,但是因为低维潜在代码不足以指导准确的修复,通常产生低保真度的图像。

GFP-GAN 网络模型如下:
在这里插入图片描述

It consists of a degradation removal module (U-Net) and a pretrained face GAN as facial prior (such as StyleGAN2).
GFP-GAN包括一个退化消除模块,和一个预训练的面部GAN作为面部先验。

They are bridged by a latent code mapping and several Channel-Split Spatial Feature Transform(CS-SFT) layers.
它们通过一个直接的潜在代码映射和几个通道分割空间特征变换(CS-SFT)层以粗到细的方式连接起来。

Specifically, the degradation removal module is designed to remove complicated degradation, and extract two kinds of features, i.e.

  1. latent features F l a t e n t F_{latent} Flatent to map the input image to the closest latent code in StyleGAN2,
  2. multi-resolution spatial features F s p a t i a l F_{spatial} Fspatial for modulating the StyleGAN2 features.

在这里插入图片描述

A pre-trained face GAN captures a distribution over faces in its leaned weights of convolutions, namely, generative prior.
一个预训练过的人脸GAN在其倾斜的卷积权重中捕捉到了人脸的分布,即生成性先验。

We leverage such pretrained face GANs to provide diverse and rich facial details for our task.
我们利用这种预训练的人脸GANs为我们的任务提供多样化和丰富的面部细节。

A typical way of deploying generative priors is to map the input image to its closest latent codes Z, and then generate the corresponding output by a pretrained GAN.
部署生成式先验的典型方法是将输入图像映射到其最接近的潜在代码Z,然后通过预训练的GAN生成相应的输出。

However, these methods usually require time-consuming iterative optimization for preserving fidelity.
然而,这些方法通常需要耗费时间的迭代优化来保持保真度。

Instead of producing a final image directly, we generate intermediate convolutional features F G A N F_{GAN} FGAN of the closest face, as it contains more details and could be further modulated by input features for better fidelity (see Sec. 3.4).
我们没有直接生成最终图像,而是生成最接近的人脸的中间卷积特征 F G A N F_{GAN} FGAN,因为它包含更多的细节,可以通过输入特征进一步调制以获得更好的保真度。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


关于 modulate

StyleGAN2 通过使用一种称为“风格调制”(style modulation)的技术来改进图像生成过程。

在这种技术中,生成器网络的不同层接收来自一个或多个“风格代码”(style codes)的输入,这些代码控制生成图像的各种属性,如颜色、纹理和形状。

将多分辨率空间特征集成到 StyleGAN2 的风格调制过程中,这可以通过将 F s p a t i a l F_{spatial} Fspatial 与 StyleGAN2 生成器网络中的相应特征图相结合来实现,从而在空间域中调制风格代码的影响。

这种方法的潜在好处是,它可以允许生成器在生成图像时考虑更多的空间上下文信息。通过在不同空间尺度上引入额外的特征,生成器可以生成更真实、更复杂的图像,这些图像在细节和结构上更加接近真实世界的图像。


GFP-GAN 四大损失:

  1. reconstruction loss: constraints the outputs y ^ \hat{y} y^ close to the ground-truth y y y,

  2. adversarial loss for restoring realistic textures,

  3. proposed facial component loss to further enhance facial details,
    带有局部判别器的面部成分损失,以进一步增强面部细节的感知性;

  4. identity preserving loss.
    身份保护损失,来进一步提高保真度;

参考链接:

  1. https://github.com/TencentARC/GFPGAN
  2. paper: Towards Real-World Blind Face Restoration with Generative Facial Prior
  3. paper: Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation
  4. https://zhuanlan.zhihu.com/p/270932356
  5. https://arc.tencent.com/zh/ai-demos/faceRestoration
  6. https://zhuanlan.zhihu.com/p/609795548

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1603229.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

专业143总分428学硕第一东南大学920专业基础综合考研经验电子信息与通信工程,海洋工程,电路系统,鲁汶,真题,大纲,参考书。

24考研基本已经尘埃落定,总归要为回忆留下点什么。回想起这一年的备考之路,至今仍觉得时间过得很快,有些感到恍惚,似乎不能接受。但是仔细思考一下,这一年经历了很多,走过很多弯路也取得一些阶段性的小成功…

React【Day2】

React表单控制 受控绑定 概念:使用React组件的状态(useState)控制表单的状态 双向绑定 MVVM 报错记录: 错误代码: import { useState } from "react";const App () > {const [value, setValue] useS…

使用Android studio,安卓手机编译安装yolov8部署ncnn,频繁出现编译错误

从编译开始就开始出现错误,解决步骤: 1.降低graddle版本,7.2-bin --->>> 降低为 6.1.1-all #distributionUrlhttps\://services.gradle.org/distributions/gradle-7.2-bin.zip distributionUrlhttps\://services.gradle.org/di…

2024年五一杯数学建模B题思路分析

文章目录 1 赛题思路2 比赛日期和时间3 组织机构4 建模常见问题类型4.1 分类问题4.2 优化问题4.3 预测问题4.4 评价问题 5 建模资料 1 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 2 比赛日期和时间 报名截止时间:2024…

工业自动化,3D视觉技术3C薄片自动化上料

随着制造业的快速发展,3C行业对薄片类零件的上料需求日益增长。传统的上料方式往往依赖于人工操作,效率低下且存在误差。为了解决这一问题,3D视觉技术应运而生,为3C薄片自动化上料提供了强大的技术支持。本文将探讨3D视觉技术如何…

「GO基础」起源与演进

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「stormsha的主页」…

分类算法——文章分类(五)

文章分类计算 计算结果 P(C|Chinese,Chinese,Chinese,Tokyo,Japan)-->P(Chinese, Chinese, Chinese, Tokyo, Japan|C) * P(C)/P(Chinese, Chinese, Chinese, Tokyo, Japan) P(Chinese|C)5/8 P(Tokyo|C) 0 P(Japan|C) 0思考:我们计算出来某个概率为0,…

HarmonyOS开发实例:【分布式数据服务】

介绍 分布式数据服务(Distributed Data Service,DDS)为应用程序提供不同设备间数据分布式的能力。通过调用分布式数据接口,应用程序将数据保存到分布式数据库中。通过结合帐号、应用和分布式数据服务对属于不同的应用的数据进行隔离,保证不同…

利用CNN-Bigru-Attention模型输电线路故障诊断(Python代码,TensorFlow框架,)

效果视频:利用CNN-Bigru-Attention模型输电线路故障诊断(Python代码,TensorFlow框架,压缩包带有数据集和代码,解压缩可直接运行)_哔哩哔哩_bilibili 售后包免费远程协助运行(用向日葵或者todesk软件协助) …

如何将低分辨率的视频变高清,使用AI工具分辨率画质增强至1080P、4K或者8K(附工具)

环境: Topaz Video AI 5.0 问题描述: 如何将低分辨率的视频变高清,使用AI工具分辨率画质增强至1080P、4K或者8K 原视频 增强1080P 解决方案: 1.打开软件,导入要处理的视频(工具在本文最后附上&#xf…

特步赞助可能“惹乱子”,北京半马进入官方调查阶段

北京半马风波的发酵超乎想象,从4月14日事件发生到现在,舆论已经从对赛事本身的质疑,上升到一些其他的层面。 从最新的信息来看,北京体育局、北京半马组委会表态称事情还在调查,舆论则大多倾向于“特步幕后操盘、外籍选…

UE5 C++ 使用TimeLine时间轴实现开关门

一.添加门头文件 和 声明 #include "Components/TimelineComponent.h" #include"Components/BoxComponent.h" UPROPERTY(EditAnywhere,BlueprintReadWrite,Category "MyCurve")UCurveFloat* MyCurveFloat;UPROPERTY(EditAnywhere, BlueprintR…

生成人工智能体:人类行为的交互式模拟论文与源码架构解析(1)——场景故事介绍

生成NPC为交互应用程序创建逼真的人类行为模拟。在这项工作中,我们通过将二十五个NPC放置在一个沙盒环境中(类似于The Sims,模拟人生),展示了生成NPC的能力。用户可以观察和干预NPC的日常计划、分享新闻、建立关系以及…

分布式光纤测温解决方案

安科瑞电气股份有限公司 祁洁 15000363176 一、方案介绍 分布式光纤测温(DTS)集光电信号检测、计算机技术等为一体,具有实时监测、测温精度高、测量距离长、可精确定位、采用光纤作为传感器和传输介质,具有抗电磁干扰、本征防…

微服务分布式缓存:无法反序列化 Cannot deserialize;

问题描述 在拆分SpringBoot项目搭建微服务的过程中,需要配置分布式缓存,对redis进行配置,配置完成后,在启动Knife4j文档界面时报错,发现是redis无法反序列化的问题,但是报错中所指出的类com.jhin.jhinoj.m…

gazebo中vins-fusion在仿真小车上的部署

软件要求:Ubuntu 20.04 ros的noetic版本,我是在虚拟机vitrualbox上运行的 这几天在学ROS,跟着赵虚左老师过了一遍之后,感觉还是有很多不懂的地方,xtdrone上仿真跟着文档走了一遍,好像没学到什么东西&#…

go语言context

context在服务端编程基本都贯穿所有, Context 是请求的上下文信息。对于RPC Server来说,一般每接收一个新的请求,会产生一个新的Context,在进行内部的函数调用的时候,通过传递Context,可以让不同的函数、协…

如何安装MacOS的虚拟机?mac安装虚拟机的步骤 虚拟机安装MacOS VMware Fusion和Parallels Desktop19

要在Mac上运行MacOS的虚拟机,常用的方法是使用虚拟化软件如VMware Fusion或Parallels Desktop。 以下是安装MacOS的虚拟机的主要步骤: 1. 检查系统要求:确定您的Mac硬件和操作系统满足安装要求。您需要一台具备足够性能的Mac,并…

通过Bedrock Access Gateway解决方案快速访问Amazon Bedrock的多种大语言模型

Bedrock Access Gateway(BAG)解决方案提供了开箱即用、兼容 OpenAI 的代理功能,帮助用户轻松无缝地从 OpenAI 迁移到 Amazon Bedrock。 1. 概述 亚马逊云科技的 Amazon Bedrock 服务支持一系列领先的基础模型,为客户提供多种选择…

【函数式接口使用✈️✈️】通过具体的例子实现函数结合策略模式的使用

目录 前言 一、核心函数式接口 1. Consumer 2. Supplier 3. Function,> 二、场景模拟 1.面向对象设计 2. 策略接口实现(以 Function 接口作为策略) 三、对比 前言 在 Java 8 中引入了Stream API 新特性,这使得函数式编程风格进…