Denoising Diffusion Restoration Models论文解读

news2025/2/25 19:58:24

论文要点

恢复的线性逆问题可以使用预训练的DDPM完成:1. 将降质矩阵使用SVD,得到分解矩阵;2. 使用分解矩阵将图像投影到降质类型间共享的谱空间;3. 谱空间中执行DDPM。

评价

同Track的方法同样很多,比如后续的DDNM、DiffPIR等。这些方法比较有趣,但依赖于确定性的降质过程,并且性能往往受限。

总结

图像恢复中许多有趣的任务可以归结为线性逆问题。最近解决这些问题的一系列方法使用随机算法,从给定测量值的自然图像的后验分布中取样。然而,有效的解决方案通常需要特定问题的监督训练来建立后验模型,而非特定问题的无监督方法通常依赖于低效的迭代方法。这项工作通过引入去噪扩散恢复模型(DDRM)来解决这些问题,DDRM是一种有效的、无监督的后验抽样方法。由变分推理驱动,DDRM利用预训练的去噪扩散生成模型来解决任何线性逆问题。我们演示了DDRM在多个图像数据集上的通用性,用于超分辨率、去模糊、修补和在不同量的测量噪声下着色。DDRM在不同的ImageNet数据集上的重建质量、感知质量和运行时间方面优于目前领先的无监督方法,比最接近的竞争对手快5倍。DDRM也很好地概括了观察到的ImageNet训练集分布的自然图像。

这是否是一个新的问题?

是的,这个问题是新的。在传统的图像修复方法中,通常需要先识别图像中的损坏位置,再进行修复。而在这篇论文中提出的方法可以直接从高维损坏信号中恢复图像,并且不需要先前识别损坏位置。因此,这个问题可以被称为高维图像修复的新问题。

这篇文章要验证一个什么学科假设?

这篇文章要验证一个什么学科假设,即在没有训练数据的情况下,使用无监督方法可以成功解决监督学习中的推理任务。具体来说,作者提出了一种基于无监督推理的方法,可以在没有训练数据的情况下解决监督学习中的推理任务。

这篇论文有什么贡献?

这篇论文提出了一种新的恢复方法,即基于多项式梯度的扩充模型,用于解决图像处理问题。该方法在图像翻译、去噪、超分辨率等方面都取得了非常好的效果。此外,该方法还通过引入一个新的跨模态的参数,可以在不需要使用原始测试数据的情况下进行恢复。

用于定量评估的数据集是什么?代码有没有开源?

用于定量评估的数据集是ImageNet,其中包括50万张标准图像和60万张训练图像。代码可以在github上找到,并且是开源的。

论文中的实验是如何设计的?

论文中的实验设计包括在ImageNet数据集上评估了DDGM、DGP、REDS、SNIPS和其他基于扩展性方法的方法的性能,以及在其他图像数据集上进行了验证。实验结果表明,DDGM在图像修补、超分辨率和去补噪声等方面都取得了非常好的性能。同时,论文还评估了其他方法的性能和计算复杂度,以及阐述了DDGM的计算细节和优化方法。

DDRM算法概要

  1. Variational objective for DDRM over a specific inverse problem

注意,原始的DDPM是这样的:

实际操作时,DDRM从一个需要恢复的图开始,最终得到一张恢复好的图;原始的DDPM是从噪声开始,最终得到一张“干净”的图。

2. Specific forms of DDRM: use pre-trained unconditional and class-conditional diffusion models

更新策略:

通过推导,作者证明了使用同样的扩散模型(没有反问题的限定),将更新项换成上式7和8,修改H和SVD矩阵即可。

  1. Compute and memory efficient algorithms

  • 只选取前T’步用来训练

  • 因为H矩阵有一些数学特性,可以用来压缩空间复杂度到O(n)

实验及效果展示

超分

结果过于平滑。

去模糊

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2306008.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于SpringBoot的校园消费点评管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

【NLP 38、激活函数 ④ GELU激活函数】

别盲目,别着急,慢慢走,没事的 —— 25.2.24 一、定义与数学表达式 GELU(Gaussian Error Linear Unit,高斯误差线性单元)是一种结合概率分布的非线性激活函数,其核心思想是通过输入值服从标准正…

QT:paintEvent、QPainter、QPaintDevice

paintEvent 介绍 在 Qt 编程中,paintEvent 是 QWidget 类中的一个非常重要的虚函数,用于处理绘图事件。当一个 QWidget 或其派生类的实例需要进行重绘操作时,Qt 会自动调用该控件的 paintEvent 函数。 触发时机 窗口首次显示:当…

OpenHarmony-4.基于dayu800 GPIO 实践(2)

基于dayu800 GPIO 进行开发 1.DAYU800开发板硬件接口 LicheePi 4A 板载 2x10pin 插针,其中有 16 个原生 IO,包括 6 个普通 IO,3 对串口,一个 SPI。TH1520 SOC 具有4个GPIO bank,每个bank最大有32个IO:  …

HTML项目一键打包工具:HTML2EXE 最新版

HTML2EXE 工具可以一键打包生成EXE可执行文件。可以打包任意HTML项目或者是一个网址为单个EXE文件,直接打开即可运行。支持KRPano全景VR项目、WebGL游戏项目、视频播放、,课件打包、网址打包等。 下载地址: 最新版HTML2EXE首次发布下载地址 一、功能特点…

BGP配置华为——路径优选验证

实验拓扑 实验要求 实现通过修改AS-Path属性来影响路径选择实现通过修改Local_Preference属性来影响路径选择实现通过修改MED属性来影响路径选择实现通过修改preferred-value属性来影响路径选择 实验配置与效果 1.改名与IP配置 2.as300配置OSPF R3已经学到R2和R4的路由 3.…

深度学习基础--ResNet网络的讲解,ResNet50的复现(pytorch)以及用复现的ResNet50做鸟类图像分类

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 前言 如果说最经典的神经网络,ResNet肯定是一个,这篇文章是本人学习ResNet的学习笔记,并且用pytorch复现了ResNet50&…

TMDS视频编解码算法

因为使用的是DDR进行传输,即双倍频率采样,故时钟只用是并行数据数据的5倍,而不是10倍。 TMDS算法流程: 视频编码TMDS算法流程实现: timescale 1 ps / 1ps //DVI编码通常用于视频传输,将并行数据转换为适合…

深度解析SmartGBD助力Android音视频数据接入GB28181平台

在当今数字化时代,视频监控与音视频通信技术在各行各业的应用愈发广泛。GB28181协议作为中国国家标准,为视频监控设备的互联互通提供了规范,但在实际应用中,许多Android终端设备并不具备国标音视频能力,这限制了其在相…

前端兼容处理接口返回的文件流或json数据

参考文档:JavaScript | MDN 参考链接:Blob格式转json格式,拿到后端返回的json数据_blob转json-CSDN博客 参考链接:https://juejin.cn/post/7117939029567340557 场景:导入上传文件,导入成功,…

Java基础常见的面试题(易错!!)

面试题一:为什么 Java 不支持多继承 Java 不支持多继承主要是为避免 “菱形继承问题”(又称 “钻石问题”),即一个子类从多个父类继承到同名方法或属性时,编译器无法确定该调用哪个父类的成员。同时,多继承…

DPVS-2:单臂负载均衡测试

上一篇编译安装了DPVS,这一篇开启DPVS的负载均衡测试 : 单臂 FULL NAT模式 拓扑-单臂 单臂模式 DPVS 单独物理机 CLINET,和两个RS都是另一个物理机的虚拟机,它们网卡都绑定在一个桥上br0 , 二层互通。 启动DPVS …

Classic Control Theory | 12 Real Poles or Zeros (第12课笔记-中文版)

笔记链接:https://m.tb.cn/h.Tt876SW?tkQaITejKxnFLhttps://m.tb.cn/h.Tt876SW?tkQaITejKxnFL

Kubernetes开发环境minikube | 开发部署MySQL单节点应用

minikube是一个主要用于开发与测试Kubernetes应用的运行环境 本文主要描述在minikube运行环境中部署MySQL单节点应用 minikube start --force kubectl get nodes 如上所示,启动minikube单节点运行环境 minikube ssh docker pull 如上所示,从MySQL官…

安装可视化jar包部署平台JarManage

一、下载 下载地址:JarManage 发行版 - Gitee.com 🚒 下载 最新发行版 下载zip的里面linux和windows版本都有 二、运行 上传到服务器,解压进入目录 🚚 执行java -jar jarmanage-depoly.jar 命令运行 java -jar jarmanage-dep…

基于数据可视化+SpringBoot+安卓端的数字化OA公司管理平台设计和实现

博主介绍:硕士研究生,专注于信息化技术领域开发与管理,会使用java、标准c/c等开发语言,以及毕业项目实战✌ 从事基于java BS架构、CS架构、c/c 编程工作近16年,拥有近12年的管理工作经验,拥有较丰富的技术架…

输入搜索、分组展示选项、下拉选取,全局跳转页,el-select 实现 —— 后端数据处理代码,抛砖引玉展思路

详细前端代码写于上一篇:输入搜索、分组展示选项、下拉选取,el-select 实现:即输入关键字检索,返回分组选项,选取跳转到相应内容页 —— VUE项目-全局模糊检索 【效果图】:分组展示选项 >【去界面操作体…

性能巅峰对决:Rust vs C++ —— 速度、安全与权衡的艺术

??关注,带你探索Java的奥秘!?? ??超萌技术攻略,轻松晋级编程高手!?? ??技术宝库已备好,就等你来挖掘!?? ??订阅,智趣学习不孤单!?? ??即刻启航,编…

unity学习53:UI的子容器:面板panel

目录 1 UI的最底层容器:canvas 1.1 UI的最底层容器:canvas 1.2 UI的合理结构 2 UI的子容器:面板panel 2.1 创建panel 2.2 面板的本质: image ,就是一个透明的图片,1个空容器 3 面板的属性 4 面板的…

4-知识图谱的抽取与构建-4_2实体识别与分类

🌟 知识图谱的实体识别与分类🔥 🔍 什么是实体识别与分类? 实体识别(Entity Recognition)是从文本中提取出具体的事物,如人名、地名、组织名等。分类(Entity Classification&#x…