DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration

news2025/2/26 2:32:05

DR2: Diffusion-based Robust Degradation Remover for Blind Face Restoration (Paper reading)

Zhixin Wang, Shanghai Jiao Tong University, CH, CVPR2023, Cited:0, Code, Paper

1. 前言

在这里插入图片描述
传统的盲脸部修复通常使用预定义的退化模型来合成降质的低质量数据进行训练,而实际世界中可能出现更复杂的情况。假设的退化模型与实际情况之间的差距会影响修复效果,输出结果中经常出现伪影。然而,为了覆盖实际情况,将每种类型的退化都包含在训练数据中是昂贵且不可行的。为了解决这个鲁棒性问题,我们提出了基于扩散的鲁棒退化去除器(DR2),首先将退化图像转化为粗糙但退化不变的预测,然后利用增强模块将粗糙预测恢复为高质量图像。通过利用表现良好的去噪扩散概率模型,我们的DR2将输入图像扩散到带有高斯噪声的噪声状态,各种类型的退化转化为高斯噪声,然后通过迭代去噪步骤捕捉语义信息。因此,DR2对常见的退化(例如模糊、调整大小、噪声和压缩)具有鲁棒性,并且与不同设计的增强模块兼容。在各种设置下的实验证明,我们的框架在严重退化的合成和实际世界数据集上优于最先进的方法。

2. 整体思想

ILVR的采样效果一般,本文算是对其方法的改进。先说结果,我测试感觉结果非常一般,创新型也一般,Git上没人关注,不知道为什么能发CVPR,运气运气。整体思想就是控制去噪的步数做个截断,然后对估计出的图像(很平滑)使用一个增强网络增强。

3. 方法

整体盲脸部修复框架DR2E由基于扩散的鲁棒退化去除器(DR2)和增强模块(E)组成。在第一阶段中,DR2将退化图像转化为粗糙、平滑和视觉上清晰的中间结果,这些结果属于一个退化不变的分布(图1中的第4列)。在第二阶段中,退化不变的图像通过增强模块进一步处理,以获得高质量的细节。通过这种设计,增强模块与各种修复方法的设计兼容,以寻求最佳的修复质量,确保我们的DR2E既具有强大的鲁棒性又具有高质量。第一阶段为了从降至 y y y中获得估计图像 x ^ 0 \hat x_0 x^0,并在第二阶段对估计的图像增强,目标是最大化以下似然:
p ψ , ϕ = ∫ p ψ ( x ∣ x ^ 0 ) p ϕ ( x ^ 0 ∣ y ) d x ^ 0 = E x ^ 0 ∼ p ϕ ( x ^ 0 ∣ y ) [ p ψ ( x ∣ x ^ 0 ) ] (1) \begin{aligned} p_{\psi,\phi}&=\int p_{\psi} (x|\hat x_0)p_\phi(\hat x_0|y)d \hat x_0 \tag{1} \\ &=\mathbb{E}_{\hat x_0 \sim p_\phi(\hat x_0|y)}[p_\psi(x|\hat x_0)] \end{aligned} pψ,ϕ=pψ(xx^0)pϕ(x^0y)dx^0=Ex^0pϕ(x^0y)[pψ(xx^0)](1)
其中, p ϕ ( x ^ 0 ∣ y ) p_\phi(\hat x_0|y) pϕ(x^0y)对应着复原模型, p ψ ( x ∣ x ^ 0 ) p_\psi(x|\hat x_0) pψ(xx^0)对应着增强模块。对于第一阶段,我们提出了一个重要的假设,并提出了一种基于扩散的方法来消除退化,而不是直接学习从 y y y x x x的映射(通常涉及预定义的退化模型 z z z)。

3.1 基于扩散的降质移除

假设:扩散过程中,存在一个中间步 τ \tau τ,且 t > τ t>\tau t>τ,那么存在 q ( x t ∣ x ) q(x_t|x) q(xtx) q ( y t ∣ y ) q(y_t|y) q(yty)在低频部分是接近的,此外,存在 ω > τ \omega > \tau ω>τ使得 q ( x ω ∣ x ) ≈ q ( x ω ∣ x ) q(x_\omega|x)\approx q(x_\omega|x) q(xωx)q(xωx),这个假设的意思的,你前向过程加入了噪声破坏了图像的频率成分,而噪声图同样也是,在视觉上对某些频率部分是难以分辨的,但是这个假设不够强,只有在噪声足够大的时候才可以。根据这个假设我们可以获得:
p ϕ ( x ^ 0 ∣ y ) = ∫ p ( x ^ 0 ∣ x τ ) p ( x τ ∣ y ω ) p ( x ω ∣ y ) d x τ d y ω ≈ ∫ p ( x ^ 0 ∣ x τ ) p ( x τ ∣ x ω ) p ( x ω ∣ x ) d x τ d x ω \begin{aligned} p_\phi(\hat x_0|y)&=\int p_(\hat x_0|x_\tau)p(x_\tau|y_\omega)p(x_\omega|y)d x_\tau dy_\omega \\ & \approx \int p_(\hat x_0|x_\tau)p(x_\tau|x_\omega)p(x_\omega|x)d x_\tau dx_\omega \end{aligned} pϕ(x^0y)=p(x^0xτ)p(xτyω)p(xωy)dxτdyωp(x^0xτ)p(xτxω)p(xωx)dxτdxω

  1. ω \omega ω处初始化条件:将降质图像 y y y通过扩散模型的前向过程获得 x : = y ω x:=y_\omega x:=yω
  2. 进行一次逆扩散过程获得 x t − 1 x_{t-1} xt1,其中( τ + 1 ≤ t ≤ ω \tau+1 \le t \le \omega τ+1tω),同时对降质图像 y y y进行一次前向过程采样得到 y t − 1 y_{t-1} yt1。根据假设,我们替换 x t − 1 x_{t-1} xt1的低频部分为 y t − 1 y_{t-1} yt1。和ILVR一样。
  3. 在第 τ \tau τ步截断输出:当 t t t逐渐变小时,噪声强度变得温和且 q ( x t ∣ x ) q(x_t|x) q(xtx) q ( y t ∣ y ) q(y_t|y) q(yty)之间的举例会逐渐变大,因此去噪过程需要在 t t t足够小的时候进行阶段。我们直接在第 τ \tau τ步估计出 x 0 x_0 x0

3.2 图像增强

对于DR2的输出,恢复高质量的细节只需要训练增强模块 p ψ ( x ∣ x ^ 0 ) p_\psi(x|\hat x_0) pψ(xx^0)。在这里,我们不假设这个模块的具体方法或架构。任何可以训练成将低质量图像映射到高质量图像的神经网络都可以插入我们的框架中。并且利用所提出的损失函数对增强模块进行独立训练。

4. 实验

实施DR2和增强模块在FFHQ数据集上独立训练,该数据集包含70000张高质量人脸图像。我们将ILVR提出的预训练DDPM用于我们的DR2。我们选择SPARNetHD和VQFR作为增强模块的两种替代架构。

4.1 指标和可视化对比

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/561140.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CodeForces.1810B.糖果.[中等][ifelse选择][注意输出格式]

题目描述: 解题思路: 题目解读: 初始状态只有一个糖果,即x1,给定想要获得的总糖果数y。 只能进行两种操作,分别是做2x-1和2x1。给出从 x1 到 目标数字 y 的操作步数和具体步骤。 示例1 从1到2&#xff…

2023最全CTF入门指南(建议收藏)

目录 一、CTF简介 二、CTF竞赛模式 三、CTF各大题型简介 四、CTF学习路线 4.1、初期 1、htmlcssjs(2-3天) 2、apachephp (4-5天) 3、mysql (2-3天) 4、python (2-3天) 5、burpsuite (…

防火墙——iptables防火墙(四表五链、防火墙配置方法、匹配规则详解)

iptables防火墙 一、Linux包过滤防火墙1、Linux防火墙概述2、netfilter3、iptables4、netfilter/iptables关系 二、四表五链1、表链作用2、四表3、五链4、数据包到达防火墙时,规则表之间的优先顺序5、规则链之间的匹配顺序 三、iptables的安装四、iptables防火墙的配…

chatgpt赋能Python-python_nornir

Python Nornir - 让网络自动化更高效 随着网络技术的发展和网络设备的不断增多,网络自动化成为了现代网络管理的必备技能。然而,手动编写和执行网络任务的方式不仅费时费力,也容易出错和难以维护。 Python Nornir 是一个开源的网络自动化框…

Android 事件分发机制

Android 事件分发机制 概述事件分发过程的主要方法: ViewView 事件的分发 dispatchTouchEventView 事件的处理(消费)onTouchEvent: ViewGroupViewGroup 事件的分发 dispatchTouchEvent 概述 这里的事件指的是 View 对手势的响应&…

chatgpt赋能Python-python_pe

Python PE(Python Performance Engineering)介绍 Python PE(Python Performance Engineering)是Python编程的一个方面,旨在提高Python程序的性能和效率。PE的目标是优化Python程序的执行时间、内存占用和资源消耗&…

chatgpt赋能Python-python_nargs

Python nargs 介绍 在 Python 中,nargs 是使用 argparse 模块中用于定义命令行参数的选项之一。通过使用 nargs,我们可以为每个参数指定一个特定的值。它可以接受以下几种不同的值: ‘?’:表示该参数可以有零个或一个值。‘*’…

Vulkan Tutorial 3 图形管线基础

目录 0 管线 8 着色器 9 固定功能 10 渲染通道 结论 0 管线 我们将设置一个图形管道,并将其配置为绘制我们的第一个三角形。图形管道是将网格的顶点和纹理一直带到渲染目标中的像素的操作序列。 带有绿色的阶段被称为固定功能阶段。这些阶段允许你使用参数来…

Spark大数据处理讲课笔记---Spark RDD典型案例

零、本节学习目标 利用RDD计算总分与平均分利用RDD统计每日新增用户利用RDD实现分组排行榜 一、利用RDD计算总分与平均分 (一)提出任务 针对成绩表,计算每个学生总分和平均分 (二)实现思路 读取成绩文件&#xff…

springboot之banner

Springboot的Banner 1、banner的作用2、使用banner的方式2.1、默认banner(不设置任何banner)2.2、自定义banner(自定义类实现org.springframework.boot.Banner)2.3、默认banner文件(classpath:banner.txt/banner.gif/banner.jpg/banner.png)2.4、自定义b…

支付宝SDK接口调试- cpolar内网穿透工具实现公网地址调试

文章目录 1.测试环境2.本地配置3. 内网穿透3.1 下载安装cpolar内网穿透3.2 创建隧道 4. 测试公网访问5. 配置固定二级子域名5.1 保留一个二级子域名5.2 配置二级子域名 6. 使用固定二级子域名进行访问 转发自cpolar内网穿透的文章:Java支付宝沙箱环境支付&#xff0…

Linux——iptables防火墙

iptables防火墙 一.Linux包过滤防火墙概述1.iptables概述2.netfilter/iptables关系 二、四表五链1.四表五链的关系2.四表3.五链 三、匹配顺序1.数据包到达防火墙的匹配流程2.规则链之间的匹配顺序3.规则链内的匹配顺序 四、iptables 防火墙的配置方法1.iptables 命令行配置方法…

前端随机抽奖效果

功能描述 开始随机、标签收取、重置布局、标签收取后添加标记、删除标记、复原标记、重置布局 可以通过此功能实现随机点名、抽奖功能 效果截图 实现所用技术 vscode编写工具&#xff0c;html、css、jquery 以下为效果代码 <!DOCTYPE html> <html> <head&g…

JavaScript实现通过语句输出当前星期的代码

以下为实现通过语句输出当前星期的程序代码和运行截图 目录 前言 一、通过语句输出当前星期 1.1 运行流程及思想 1.2 代码段 1.3 JavaScript语句代码 1.4 运行截图 前言 1.若有选择&#xff0c;您可以在目录里进行快速查找&#xff1b; 2.本博文代码可以根据题目要求实…

跟我看 Microsoft Build 2023

又是一年一度的 Microsoft Build 了&#xff0c;你有和我一样熬夜看了吗&#xff1f;如果没有&#xff0c;那么你就错过了一场精彩的技术盛宴。本次的 Microsoft Build &#xff0c;有非常多的干货&#xff0c;围绕打造 Copilot 应用展开。我会将基于 Data AI 比较重要的内容列…

chatgpt赋能Python-python_nonzero

Python的nonzero函数 - 了解它的作用和实际应用 在Python编程语言中&#xff0c;有一个非常有用的函数叫做nonzero()&#xff0c;该函数通常被使用来检测列表、元组、数组和字典等数据结构中的非零值。本文将详细介绍nonzero()函数的特性和实际应用场景。 了解nonzero函数的作…

17.plantUML画类图的语法、组合关系和聚合关系之间的区别

文章目录 plantUML画类图的语法组合关系和聚合关系之间的区别依赖关系和关联关系的区别一个类图语法示例 plantUML画类图的语法 泛化关系就是继承关系 语法解释&#xff1a;<|-- 表示组合&#xff0c;<|-表示继承 表示 public&#xff0c; #表示protect - 表示 private…

chatgpt赋能Python-python_owl

Python Owl: 一个优秀的Python工具库&#xff0c;优化你的SEO体验 如果你是一个SEO专家&#xff0c;你肯定会知道Python Owl这个工具库是什么。如果你还不知道&#xff0c;那么你来对地方了。Python Owl是一个强大的Python工具库&#xff0c;能够帮助你优化你的SEO体验&#x…

对讲机怎么提高通话距离?

对讲机的理论通讯距离一般都比较远&#xff0c;只不过在实际的应用当中会受到多方面的影响&#xff0c;比如建筑物、树林、山体等。那么我们该怎么提高对讲机的通话距离呢&#xff1f;下面河南宝蓝小编就为大家分析下。 一、提高发射功率&#xff1a; 基本上所有的对讲机都有…

【数据结构】树和二叉树和基本介绍、树的基本术语和表示、二叉树的性质和储存结构

文章目录 1.树的基本概念和介绍1.1树的概念1.2树的基本术语1.3树的使用1.4树的表示1.4.1图形表示1.4.2代码表示 2.二叉树的基本概念和介绍2.1二叉树的介绍2.2二叉树的性质2.3二叉树的储存结构2.3.1顺序储存结构2.3.2链式存储结构 1.树的基本概念和介绍 1.1树的概念 在以前的学…