DDPM - Denoising Diffusion Probabilistic Models 扩散模型

news2025/10/24 22:46:37

DDPM - Denoising Diffusion Probabilistic Models 扩散模型

扩散模型概述

扩散模型是在模拟图像加噪的逆向过程。也就是在实现一个去噪的过程。简单的来说就包括两个过程组成

前向的扩散过程 Forward Diffusion Process
反向扩散过程 Reverse Diffusion Process

在这里插入图片描述

下面我们对整个的加噪的过程细节进行一个简单的描述。每次加噪的比例都只占很小的一部分

在这里插入图片描述
下面的公式中我们说明了加噪的比例，

$x_{t} \text { 与 } x_{t-1} \text { 的关系 : } x_{t}=\sqrt{\beta}_{t} \times \epsilon_{t}+\sqrt{1-\beta_{t}} \times x_{t-1}$

为了方便进行表示我们可以定义：αt = 1 - βt

$x_{t}=\sqrt{1-\alpha_{t}} \epsilon_{t}+\sqrt{\alpha_{t}} x_{t-1}$

细节说明：

我们并不是在原图像上进行加噪的而是将图像 x0 像素值映射到 [-1,1] 之间。
$\frac{x}{255} \times 2-1$
生成一张尺寸相同的噪声图片，像素值服从标准正态分布

$\epsilon \sim N(0,1)$

α与β 每个时刻的 βt 都各不相同， 0 < βt < 1, 且 β1 < β2 < … < βT-1 < βT β是作为一个权重存在的
任一时刻的图像xt 都可以由原图像 x0 直接生成 (可以由含x0 的公式直接表示)

$x_{t} \text { 与 } x_{0} \text { 的关系 : } x_{t}=\sqrt{1-\bar{\alpha}_{t}} \epsilon+\sqrt{\bar{\alpha}_{t}} x_{0} \quad \alpha_{t}=1-\beta_{t} \quad \bar{\alpha}_{t}=\alpha_{t} \alpha_{t-1} \ldots \alpha_{2} \alpha_{1}$

在这里插入图片描述

我们将t时刻的值和图像输入到Denoise Model里面去。就可以得到一个输出的图像。

Denoise Model的一个最主要的部分就是其中的一个Unet网络架构。T时刻的图像 和 t时刻的值 我们将其输入到Unet网络中去，其输出就是一张噪声图像。

$\epsilon_{\theta}$

其中的theta表示的就是Unet网络中所有参数的集合。weight bias等等一些参数。

我们得到噪音图像之后将它乘以一个系数。

$\frac{1-\alpha_{t}}{\sqrt{1-\bar{\alpha}_{t}}} \boldsymbol{\epsilon}_{\theta}$

$\mathbf{x}_{t-1}=\frac{1}{\sqrt{\alpha_{t}}}\left(\mathbf{x}_{t}-\frac{1-\alpha_{t}}{\sqrt{1-\overline{\bar{\alpha}} t}} \boldsymbol{\epsilon}_{\theta}\right)+\sigma_{t} \mathbf{z}$

$\sigma^{2}=\frac{\beta_{t}\left(1-\bar{\alpha}_{t-1}\right)}{1-\bar{\alpha}_{t}}$

经过这些计算就可以得到前一时刻T-1的图像。整个过程可以用下面的一张图来进行表示。

在这里插入图片描述

这就是我们去噪的一个过程了。

训练阶段和预测阶段的示意图

论文中给出了训练阶段和预测阶段的算法描述图。

在这里插入图片描述

1: 对于训练阶段我们重复的进行执行直到模型收敛的时候算法结束。

$\mathbf{x}_{0} \sim q\left(\mathbf{x}_{0}\right)$

2：表示从我们的数据集中筛选出一张图像。其为x0

$\sim \operatorname{Uniform}(\{1, \ldots, T\})$

3: 表示从我们的均匀分布中取出一个值令其为t T=1000

$\boldsymbol{\epsilon} \sim \mathcal{N}(\mathbf{0}, \mathbf{1})$

4: 从标准的正态分布中采样出一个epsilon 这个epsilon的尺寸和原图像的尺寸要是一样的。

$\begin{array}{l} \text { Take gradient descent step on }\\ \nabla_{\theta}\left\|\boldsymbol{\epsilon}-\boldsymbol{\epsilon}_{\theta}\left(\sqrt{\bar{\alpha}_{t}} \mathbf{x}_{0}+\sqrt{1-\bar{\alpha}_{t}} \boldsymbol{\epsilon}, t\right)\right\|^{2} \end{array}$

5 : 计算epsilon和epsilon theta的均方误差作为损失函数，并通过梯度下降法去优化这个函数。

在这里插入图片描述

这个过程就类似于一个正向扩散的过程了。下面我们继续看我们这个模型的预测过程的算法流程

$\mathbf{x}_{T} \sim \mathcal{N}(\mathbf{0}, \mathbf{I})$

1：我们先从随机分布中采样出一个XT来

2 ：循环T次来执行我们的算法

$\mathbf{z} \sim \mathcal{N}(\mathbf{0}, \mathbf{I}) \text { if } t>1 \text {, else } \mathbf{z}=\mathbf{0}$

3: 根据条件在随机分布中又采样出了一个z

$\mathbf{x}_{t-1}=\frac{1}{\sqrt{\alpha_{t}}}\left(\mathbf{x}_{t}-\frac{1-\alpha_{t}}{\sqrt{1-\bar{\alpha}} t} \boldsymbol{\epsilon}_{\theta}\left(\mathbf{x}_{t}, t\right)\right)+\sigma_{t} \mathbf{z}$