95、Image Restoration with Mean-Reverting Stochastic Differential Equations

news2024/11/26 23:25:32

简介

主页:https://github.com/Algolzw/image-restoration-sde

扩散模型终于在去噪、超分辨率等应用了。

这是一种基于随机微分方程的通用图像恢复方法,关键结构包括均值还原SDE,该SDE将高质量图像转换为具有固定高斯噪声的平均状态的降级对应图像,通过模拟相应的逆时SDE,可以在不依赖任何特定任务的先验知识的情况下恢复低质量图像的原点,所提出的均值回归SDE具有封闭形式的解决方案,允许计算真实时间相关分数并使用神经网络学习它

贡献点

  • 提出了一种通用的图像恢复方法,使用均值恢复SDE直接模拟图像退化过程。公式有一个封闭形式的解决方案,使能够计算地面真值与时间相关的分数函数,并训练神经网络来估计它。
  • 提出了一个简单的替代损失函数来训练神经网络,基于最大化逆时间轨迹的可能性。与普通分数匹配目标相比,损失被证明可以稳定训练并持续提高图像恢复性能。
  • 通过将其应用于六种不同的图像恢复任务来证明提出的方法的一般适用性:图像去除、去模糊、去噪、超分辨率、上漆和去雾。
  • 在图像去噪、去模糊和去噪的定量比较中实现了极具竞争力的恢复性能,在两个去噪数据集上达到了新的水平。

实现流程

背景知识-SDE

前向过程
在这里插入图片描述
𝑓和𝑔分别为drift函数和dispersion函数,𝑤为标准Wiener过程, x ( 0 ) ∈ R d x(0)\in R^d x(0)Rd为初始条件
逆向过程
在这里插入图片描述
w ^ \hat{w} w^为逆时Wiener过程, p t ( x ) p_t(x) pt(x)为x(t)在𝑡时刻的边际概率密度函数。 ∇ x l o g p t ( x ) \nabla_x log p_t(x) xlogpt(x)

方法

在这里插入图片描述
使用均值回归SDE d x = θ t ( μ − x ) d t + σ t dx=\theta_t(\mu-x)dt+\sigma_t dx=θt(μx)dt+σt进行图像恢复。SDE模型通过向低质量图像的带噪版本的扩散,来模拟从高质量图像的 x ( 0 ) x(0) x(0)到低质量图像的 μ + ϵ \mu+\epsilon μ+ϵ的退化过程。通过模拟相应的逆时SDE,可以恢复高质量的图像。

核心思想是将均值恢复SDE与神经网络训练的最大似然目标相结合

分数函数定义为:
在这里插入图片描述
其中 θ t \theta_t θt σ t \sigma_t σt是时间相关的正参数,分别表征平均回归和随机波动的速度

为了进行图像退化,分别让 x ( 0 ) x(0) x(0) μ \mu μ为地面真实高质量(HQ)图像和其退化的低质量(LQ)对应图像。

为了使的SDE(3)具有封闭形式的解,设置 σ t 2 / θ t = 2 λ 2 \sigma^2_t / \theta_t = 2\lambda^2 σt2/θt=2λ2,其中 λ 2 \lambda^2 λ2为平稳方差。

假设任意时刻t都满足 σ t 2 / θ t = 2 λ 2 \sigma_t^2/\theta_t = 2\lambda^2 σt2/θt=2λ2,给定任意时刻 x(s),其中s<t,有
在这里插入图片描述
其中 θ ˉ s : t : = ∫ s t θ z d z \bar{\theta}_{s:t} := \int^t_s\theta_zdz θˉs:t:=stθzdz是已知的,过度内核 p ( x ( t ) ∣ x ( s ) ) = N ( x ( t ) ∣ m s : t ( x ( s ) ) , v s : t ) p(x(t)|x(s)) = N(x(t)|m_{s:t}(x(s)),v_{s:t}) p(x(t)x(s))=N(x(t)ms:t(x(s)),vs:t)是高斯分布,均值 m s : t m_{s:t} ms:t 方差 v s : t v_{s:t} vs:t表示为
在这里插入图片描述
任意时刻的边缘分布
在这里插入图片描述
当t-> ∞ \infty ,均值 m t m_t mt收敛于低质量图像 μ \mu μ,方差 v t v_t vt收敛于平稳方差 λ 2 \lambda^2 λ2

前向SDE(3)将高质量图像扩散为高斯噪声固定的低质量图像

反向SDE可以推导为:
在这里插入图片描述
唯一不知道的是分数函数 ∇ x l o g p t ( x ) \nabla_xlog p_t(x) xlogpt(x)

由于在训练期间可以获得地面真实高质量图像 x ( 0 ) x(0) x(0),因此可以训练神经网络来估计分数 ∇ x l o g p t ( x ) \nabla_xlog p_t(x) xlogpt(x)。具体来说,可以使用(6)来计算地面真值得分为
在这里插入图片描述
如果使 x ( t ) = m t ( x ) + v t ϵ t x(t) = m_t(x)+\sqrt{v_t}\epsilon_t x(t)=mt(x)+vt ϵt,其中 ϵ t \epsilon_t ϵt 是标准高斯噪声 ϵ t   N ( 0 , I ) \epsilon_t ~ N(0,I) ϵt N(0,I)
在这里插入图片描述
使用一个条件时变神经网络,它将状态和时间作为输入和输出纯噪声
在这里插入图片描述
γ 1 , γ 2 , ⋯   , γ T \gamma_1,\gamma_2,\cdots,\gamma_T γ1,γ2,,γT是positive weights, { x i } i = 0 T \{x_i\}^T_{i=0} {xi}i=0T表示扩散过程的离散化

当应用于图像恢复中遇到的复杂退化时,训练往往变得不稳定,这源于试图学习给定时间的瞬时噪声。

在给定高质量图像𝑥0的情况下,试图找到最优轨迹 x 1 : T x_{1:T} x1:T,最小化似然函数 p ( x 1 : T ∣ x 0 ) p(x_{1:T}|x_0) p(x1:Tx0)
在这里插入图片描述
其中 p ( x T ∣ x 0 ) = N ( x T : m T ( x 0 ) , v T ) p(x_T|x_0) = N(x_T:m_T(x_0),v_T) p(xTx0)=N(xT:mT(x0),vT)是低质量图像
在这里插入图片描述
最小化负对数似然的最优反向状态
在这里插入图片描述
给定初始状态 x 0 x_0 x0,任意时刻状态 x i x_i xi,i>0,从 x i − > x i − 1 x_i->x_{i-1} xi>xi1的IR-SDE表示为

在这里插入图片描述
优化噪声网络,使IR-SDE反向为最优轨迹,即
在这里插入图片描述
( d x ) ϵ ˉ Φ (dx)_{\bar{\epsilon}\Phi} (dx)ϵˉΦ 表示 公式7的反向SDE,分数由噪声模型 ϵ ˉ Φ \bar{\epsilon}_\Phi ϵˉΦ得到

其中期望 ∫ 0 t σ s d w ^ ( s ) \int_0^t\sigma_sd\hat{w}(s) 0tσsdw^(s)为零,那么只需要考虑 ( d x ) ϵ ^ Φ (dx)_{\hat{\epsilon}_\Phi} (dx)ϵ^Φdirft 部分

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/513389.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么压缩png图片的大小?4个简单高效工具分享

怎么压缩png图片的大小&#xff1f;大家都知道jpg和png是目前电脑上最主流的两大图片文件格式&#xff0c;jpg图片的体积比较小&#xff0c;因为它属于有损压缩的图片格式&#xff0c;而png图片的体积相对就要大很多了&#xff0c;因为png属于无损压缩的图片格式。大家也同样知…

Redission实现分布式锁之源码解析

Redission实现分布式锁之源码解析 1、Redission实现分布式锁之源码解析1.1 分布式锁-redission功能介绍1.2 分布式锁-Redission快速入门1.3 分布式锁-redission可重入锁原理1.4 分布式锁-redission锁重试和WatchDog机制1.5 分布式锁-redission锁的MutiLock原理 1、Redission实现…

5G+工业互联网观察——应用篇

5G与工业互联网的结合是5G应用的重要领域&#xff0c;前一篇《5G工业互联网观察——政策篇》我们对5G工业互联网的相关政策进行了整理和分析&#xff0c;本篇继续从应用的角度整理目前的典型场景和重点行业&#xff0c;并进行简单的分析。 文 | 无界 全文4500字&#xff0c;预计…

原创 | 一文读懂蒙特卡洛算法

作者&#xff1a;陈之炎本文约2000字&#xff0c;建议阅读10分钟 本文介绍了蒙特卡洛算法。 蒙特卡洛算法&#xff08;Monte Carlo algorithm&#xff09;是一种基于随机采样的计算方法&#xff0c;其基本思想是通过生成随机样本&#xff0c;利用统计学原理来估计数学问题的解。…

MySQL实战之主从数据同步机制

主从同步的重要性&#xff1a; 解决数据可靠性的问题需要用到主从同步&#xff1b;解决 MySQL 服务高可用要用到主从同步&#xff1b;应对高并发的时候&#xff0c;还是要用到主从同步。 一、MySQL 主从同步流程 当客户端提交一个事务到 MySQL 的集群&#xff0c;直到客户端收…

《JavaEE初阶》Servlet

《JavaEE初阶》Servlet 文章目录 《JavaEE初阶》Servlet编写一个Servlet的helloworld1. 认识Maven并创建maven项目:2. 引入依赖:3.创建目录:4. 编写代码:5. 打包6. 部署7.验证 优化打包部署操作.常见的错误: ServletAPI:利用ajax构造请求.使用第三方工具postman构造请求HttpSer…

KDXL-A工频输电线路参数测试仪

一、简介 由我公司开发、研制的专门用于输电线路工频参数测量的高精度仪器&#xff0c;对于输电线路的一系列工频参数可进行精密的测量。 KDXL-A输电线路参数测试仪具有体积小、重量轻、测量准确度高、稳定性好、操作简便易学等优点,可取代以往利用多表法测量线路参数的方法&am…

springboot-热部署

什么是热部署 事先我创建一个springboot项目&#xff0c;引入web依赖。 当我冷启动的时候&#xff0c;日志如下&#xff1a; D:\tools\jdk-17.0.3\bin\java.exe -XX:TieredStopAtLevel1 -noverify -Dspring.output.ansi.enabledalways -Dcom.sun.management.jmxremote -Dspr…

【神经网络】tensorflow -- 期中测试试题

题目一&#xff1a;&#xff08;20分&#xff09; 请使用Matplotlib中的折线图工具&#xff0c;绘制正弦和余弦函数图像&#xff0c;其中x的取值范围是&#xff0c;效果如图1所示。 要求&#xff1a; (1)正弦图像是蓝色曲线&#xff0c;余弦图像是红色曲线&#xff0c;线条宽度…

洛谷B2097 最长平台

最长平台 题目描述 对于一个数组&#xff0c;其连续的相同段叫做一个平台&#xff0c;例如&#xff0c;在 1 1 1&#xff0c; 2 2 2&#xff0c; 2 2 2&#xff0c; 3 3 3&#xff0c; 3 3 3&#xff0c; 3 3 3&#xff0c; 4 4 4&#xff0c; 5 5 5&#xff0c; 5 5 5&…

加密解密软件VMProtect入门使用教程(四):准备项目

VMProtect是新一代软件保护实用程序。VMProtect支持德尔菲、Borland C Builder、Visual C/C、Visual Basic&#xff08;本机&#xff09;、Virtual Pascal和XCode编译器。 同时&#xff0c;VMProtect有一个内置的反汇编程序&#xff0c;可以与Windows和Mac OS X可执行文件一起…

【2023 年第三届长三角高校数学建模竞赛】B 题 长三角新能源汽车发展与双碳关系研究 新能源汽车销售相关数据160M+下载

【2023 年第三届长三角高校数学建模竞赛】B 题 长三角新能源汽车发展与双碳关系研究 新能源汽车销售相关数据160M下载 1 题目 《节能与新能源汽车技术路线图 2.0》提出至 2035 年&#xff0c;新能源汽车市场占比超过 50%&#xff0c;燃料电池汽车保有量达到 100 万辆&#xff…

想做外贸却没有头绪?来看看这篇文章

海关总署公布最新数据&#xff1a;今年前4个月&#xff0c;我国外贸进出口总值13.32万亿元&#xff0c;同比增长5.8%&#xff0c;其中出口7.67万亿元&#xff0c;同比增长10.6%&#xff1b;进口5.65万亿元&#xff0c;同比增长0.02%。月度调查显示&#xff0c;出口订单增加的企…

图解LeetCode——238. 除自身以外数组的乘积

一、题目 给你一个整数数组 nums&#xff0c;返回 数组 answer &#xff0c;其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。 题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位 整数范围内。 请不要使用除法&#xff0c;且在 O(n…

SoringBoot——pom文件:starter

先来看一看&#xff1a; 这次我们来介绍SpringBoot的pom文件的另一个好玩的地方&#xff1a;starter。 starter的中文含义是启动器&#xff0c;所以有时候我们在Maven仓库找依赖的时候&#xff0c;如果开启了自动翻译就会经常会看见一个奇怪的词叫做某某弹簧启动器&#xff0…

2023年河北沃克高位承重货架最新中标项目|中国沈阳某大型集团高位重型横梁式货架项目建设初期

【项目名称】高位重型横梁式货架项目 【承建单位】河北沃克金属制品有限公司 【合作客户】中国沈阳某大型集团 【建设时间】2023年5月上旬 【建设地域】中国沈阳地区 【项目客户需求】 本次沈阳高位重型横梁式货架项目合作的沈阳某大型集团中国变压器行业规模最大的制造企…

AIGC的发展与机遇

陈老老老板&#x1f9b8; &#x1f468;‍&#x1f4bb;本文专栏&#xff1a;赠书活动专栏&#xff08;为大家争取的福利&#xff0c;免费送书&#xff09;试一下文末赠书&#xff0c;讲一些科普类的知识 &#x1f468;‍&#x1f4bb;本文简述&#xff1a;本篇内容的引用都已征…

Protobuf: 高效数据传输的秘密武器

当涉及到网络通信和数据存储时&#xff0c;数据序列化一直都是一个重要的话题&#xff1b;特别是现在很多公司都在推行微服务&#xff0c;数据序列化更是重中之重&#xff0c;通常会选择使用 JSON 作为数据交换格式&#xff0c;且 JSON 已经成为业界的主流。但是 Google 这么大…

《理解了实现再谈网络性能》读书笔记

文章目录 内核是如何接收网络包的1.1 Linux⽹络收包总览1.2 linux 启动创建ksoftirqd进程网络子系统初始化协议栈注册网卡驱动初始化启动网卡 1.3 迎接数据的到来硬中断处理ksoftirqd 内核线程处理软中断网络协议栈处理IP协议层处理 完整流程 内核是如何接收网络包的 1.1 Linu…

使用阿里云服务器建站WordPress博客网站上线全流程

使用阿里云服务器快速搭建网站教程&#xff0c;先为云服务器安装宝塔面板&#xff0c;然后在宝塔面板上新建站点&#xff0c;阿里云服务器网以搭建WordPress网站博客为例&#xff0c;来详细说下从阿里云服务器CPU内存配置选择、Web环境、域名解析到网站上线全流程&#xff1a; …