[Diffusion Model 笔记]DDIM 笔记数学推导 Denoising Diffusion Implicit Models

news2026/2/13 12:09:56

核心总结

DDIM只是一个采样的算法，其训练和DDPM是一样的。
DDIM在推导采样公式时，没有用DDPM中q(xt|xt-1)的条件；
同时把一个高斯噪声可以换成随机高斯噪声和预测的噪声的加权和，其中 $\sigma_k$ 是一个超参数，控制二者的权重
采样公式如下：从任意步数k推出步数s：
$\mathbf{x}_{s}=\sqrt{\bar\alpha_s} \hat {\mathbf{x}}_{0\mid k}+ \sqrt{1-\overline{\alpha}_{s}-\sigma_{k}^{2}} \boldsymbol{\epsilon} _{\theta}+{\sigma_{k} \boldsymbol{\epsilon} }$
其中：
$\hat {\mathbf{x}}_{0\mid k}=\frac{1}{\sqrt{\bar\alpha_{k}}}(\mathbf{x}_{k}-\sqrt{1-\bar\alpha_{k}}\tilde{\mathbf{z}})$

符号定义

xT: 符合高斯分布的噪声
x0: 一个符合GT的图像，无噪声的，clean image
T: 时间步
xt: 第t步的图像，要从他推出t-1的图像。（一直推下去的话可以推出x0）
$\beta_t$ ：noise rate，关于t的固定序列，含义是每一步t要加的噪声的比例。
$\alpha_t$ ：signal rate，关于t的固定序列， $\alpha_t$ = 1- $\beta_t$ ，含义是每一步t保留的上一步图像比例。通常会被设置为 $\lim _{t \rightarrow T} \alpha_t=0$ 。具体定义是： $\mathbf{x}_t=\sqrt{\alpha_t} \mathbf{x}_{t-1}+\sqrt{1-\alpha_t} \boldsymbol{\epsilon}_{t}$
q：正向扩散：加噪声
p：逆向扩散：去噪声
$\boldsymbol{\epsilon}_t$ 或 $\mathbf{z}_t$ : xt相比xt-1加的噪声，服从标准正态分布。本文中z和epsilon混用
$\boldsymbol{\epsilon}$ ：不是t这一步的噪声，而是前面的噪声叠加后的结果，还是以服从标准正态分布
z波浪：网络预测的噪声，希望他尽可能接近真实的z
$\hat {\mathbf{x}}_{0\mid k}$ ：从k这一步估算的x0，定义为： $\hat {\mathbf{x}}_{0\mid k}=\frac{1}{\sqrt{\bar\alpha_{k}}}(\mathbf{x}_{k}-\sqrt{1-\bar\alpha_{k}}\tilde{\mathbf{z}})$

第一套，快速简单讲清采样方法

上次在DDPM中，我们是这样开头的：

略。我们考虑了t和t-1之间的关系，所以只能一步一步走。

现在我们这样想：

下式恒成立：
$q(\mathbf{x}_{s}|\mathbf{x}_{0}) =\sqrt{\bar\alpha_s} \mathbf{x}_0+\sqrt{1-\bar\alpha_s} \boldsymbol{\epsilon}$
而，其中的x0可以由任何一步k的xk来估出来：
$\mathbf{x}_{0} \approx \hat {\mathbf{x}}_{0\mid k}=\frac{1}{\sqrt{\bar\alpha_{k}}}(\mathbf{x}_{k}-\sqrt{1-\bar\alpha_{k}}\tilde{\mathbf{z}})$

带进来，同时他这个噪声 $\boldsymbol{\epsilon}$ 只是一个满足高斯分布的噪声就行，那我估出来的噪声 $\boldsymbol{\epsilon} _{\theta}$ 也满足高斯分布呀。因此可以把这个噪声换成他和我们的加权和，只要保证他们的方差之和等于原来的方差，就还是原来的分布不变：(引入了一个控制权重的参数 $\sigma_k$ )
$\begin{aligned} &q(\mathbf{x}_{s}|\mathbf{x}_{k},\mathbf{x}_{0})\\ &=\sqrt{\bar\alpha_s} \hat {\mathbf{x}}_{0\mid k}+\sqrt{1-\bar\alpha_s} \boldsymbol{\epsilon} \\ &=\sqrt{\bar\alpha_s} \hat {\mathbf{x}}_{0\mid k}+ \sqrt{1-\overline{\alpha}_{s}-\sigma_{k}^{2}} \boldsymbol{\epsilon} _{\theta}+{\sigma_{k} \boldsymbol{\epsilon} } \end{aligned}$

这得到了DDIM的采样公式：
$\mathbf{x}_{s}=\sqrt{\bar\alpha_s} \hat {\mathbf{x}}_{0\mid k}+ \sqrt{1-\overline{\alpha}_{s}-\sigma_{k}^{2}} \boldsymbol{\epsilon} _{\theta}+{\sigma_{k} \boldsymbol{\epsilon} }$