图像去模糊是图像处理领域中的一个技术过程,旨在恢复或提高模糊图像的清晰度,减少因各种原因(如运动、焦点不准等)导致的图像模糊。图像去模糊技术对于提高图像质量,增强视觉效果,以及在诸如医疗成像、卫星图像处理等领域中的应用具有重要意义。
本文提出的方法基于自注意力机制的不对称多尺度 U-Net(AMSA-UNet),在传统单尺度 U-Net 基础上做了改进。通过引入多尺度 U 形架构,该方法能够在全局层面关注模糊区域,并在局部层面更好地恢复图像细节。此外,自注意力机制的引入使得模型可以更好地捕捉长距离依赖性信息,显著提高了去模糊的准确性,同时引入基于频域的计算方法来减少计算量。
本文提出的方法能够有效解决传统单尺度 U-Net 在图像去模糊过程中遇到的空间信息丢失问题,并克服卷积方法在捕捉长距离依赖性方面的局限性。实验结果表明,与其他八种优秀方法相比,该方法在去模糊的准确性和处理速度上都有显著的改进,使得生成的去模糊图像更为准确且视觉效果更佳。
论文作者:Yingying Wang
作者单位:Shenyang Aerospace University
论文链接:http://arxiv.org/abs/2406.09015v1
内容简介:
1)方向:图像去模糊
2)应用:图像处理领域
3)背景:传统的单尺度 U-Net 在去模糊过程中常常导致空间信息的丢失,影响了去模糊的准确性。此外,由于卷积方法在捕捉长距离依赖性方面的局限性,恢复图像的质量也会下降。
4)方法:本文提出一种基于自注意力机制的不对称多尺度 U-Net(AMSA-UNet),以改善准确性和计算复杂度。通过引入多尺度 U 形架构,网络可以在全局层面关注模糊区域,并在局部层面更好地恢复图像细节。为了克服传统卷积方法在捕捉信息长距离依赖性方面的局限性,将自注意力机制引入到骨干网络的解码器部分,显著增加了模型的感受野,使其更多关注图像的语义信息,从而产生更准确和视觉上令人满意的去模糊图像。此外,引入了基于频域的计算方法以减少计算量。
5)结果:实验结果表明,与八种优秀方法相比,所提出的方法在准确性和速度方面都取得了显著的改进。