《Deep Image Blending》论文理解

论文：《Deep Image Blending》WACV 2020
链接：Deep Image Blending

本文目录

《Deep Image Blending》论文理解
论文创新点
具体实现思路
文中使用的基准方法
文章内容解析
- 使用模型整体架构
- 两阶段算法详情
- - 第1阶段
  - 第2阶段
- 损失函数的创新
- - Poisson Gradient Loss
  - Content Loss and Style Loss
  - Regularization Loss
- 实验结果
- 参考文献

论文创新点

本文提出了一种泊松混合损失，其于泊松图像混合达到了相同的目的；
文中联合优化了提出的泊松混合损失以及从深度网络计算的样式和内容损失，并通过使用L-BFGS方法来迭代更新像素重建混合区域；
文中不仅平滑了混合边界的梯度域，而且在混合区域中添加了一致的纹理；

具体实现思路

首先，使用提出的泊松梯度损失、风格损失和内容损失来合成初步的混合图像；
然后，使用初步混合图像做进一步变换，使其具有和背景目标图像更相似的样式以更好地匹配目标图像；

文中使用的基准方法

用户研究的方法

文章内容解析

使用模型整体架构

文中使用模型整体架构

第1阶段

首先，使用 $I_T$ （背景/目标图像）和 $I_S$ （内容/源图像）并使用掩码Mask来初始化一个重建图像 $I_Z$ ；
然后，使用 $I_S$ 结合Mask与 $I_Z$ 共同输入到VGG网络中，计算两者的内容损失函数；
使用 $I_T$ 与 $I_Z$ 共同输入到VGG网络中，计算两者的风格损失函数；
然后，将 $I_Z$ 与 $I_T$ 使用像素加的方式进行融合并得到的 $I_B$ ；
其次，分别对 $I_S$ 和 $I_T$ 使用拉普拉斯算子得到两张图象的散度，然后计算得到的两张GT散度与 $I_B$ 图像散度之间的散度loss（使用文中提出的泊松混合损失函数）；
通过上述过程不断优化，来得到效果更好的 $I_B$ ，其将作为后续第二阶段的输入；

第2阶段
7. 首先，将来自第1阶段的 $I_B$ 作为计算内容损失的一部分与 $I_{BR}$ （最终重建图像，来自第1阶段中的 $I_Z$ ）共同输入到VGG中，计算内容损失；
8. 然后，使用 $I_T$ 与 $I_{BR}$ 一起计算风格损失；
9. 不断重复上述过程，直到得到的 $I_{BR}$ 图像达到足够优化的程度；

两阶段算法详情

第1阶段

第2阶段

损失函数的创新

Poisson Gradient Loss

文中作者为了使得泊松融合的原始方程和自己所使用的其他约束方程能够得到较好的融合，将初始的泊松约束方程，如下：
原始泊松融合方程
其中， $\nabla=[\partial x/\partial y]$ 是梯度算子， $f$ 是混合图像方程， $f^*$ 是目标图像方程， $v$ 是矢量场， $\Omega$ 是混合区域， $\partial \Omega$ 是混合图像的边界。这种情况下，矢量场 $v$ 是直接从源图像获取的梯度场。
使用每个color channel的边界条件独立地解决这个最小化问题，以获得RGB图像。

转换后的泊松约束方程如下：
转换后的泊松方程
上式中， $\nabla$ 表示Laplace算子， $H$ 和 $W$ 分别表示图像的高度和宽度，混合图像定义为： $I_B=I_Z\bigodot M+I_T \bigodot (1-M)$ 。
上述方程工作过程为：
->首先，将 $I_Z$ 的重构像素与 $I_T$ 直接组合以构建 $I_B$ ，然后对整个 $I_B$ 使用Laplace滤波器，该滤波器考虑了 $I_T$ 的边界像素；
->然后，直接最小化 $I_B$ 、 $I_T$ 、 $I_S$ 的梯度（注意：由于 $I_T$ 的梯度与 $I_B$ 中混合区域外的梯度完全相同，因此损失基本上是在混合区域内计算的）；

Content Loss and Style Loss

两个阶段中的内容损失
其中， $\bigodot$ 表示矩阵的逐元素乘积； $L$ 表示卷积层的层数； $N_l$ 是激活中的通道数； $M_l$ 是每个通道中平坦激活值的数量；
$F_l[\cdot] \in R^{N_l \times M_l}$ 表示从 $l^{th}$ 层的深度网络 $F$ 计算的激活矩阵输出；
$G_l[\cdot]=F_l[\cdot]F_l[\cdot]^T \in R^{N_l \times M_l}$ 表示第 $l^{th}$ 层对应激活矩阵的Gram矩阵；Gram矩阵可以捕获所有channel的特征对之间的相似性关系，这编码了图像样式或纹理以及关于空间结构的零信息；
最后， $\alpha_l$ 和 $\beta_l$ 是在计算内容损失和样式损失时控制每层影响的权重。