基于多尺度分形残差注意力网络的超分辨率重建算法

news2025/7/16 15:33:31

1.引言

深度神经网络可以显著提高超分辨率的质量，但现有方法难以充分利用低分辨率尺度特征和通道信息，从而阻碍了卷积神经网络的表达能力。针对此类问题，本章提出了一种多尺度分形残差注意力网络（Multi-scale Fractal Residual Attention Network, MFRAN）。具体而言，MFRAN 由分形残差块（Fractal Residual Block, FRB）、双路增强通道注意力（Dual-Enhanced Channel Attention, DECA）和DECA构成的空洞残差注意力模块（Dilated Residual Attention Block, DRAB）等组件构成。其中，FRB应用多尺度扩展规则，连续扩展为能够检测多尺度特征的分形结构；DRAB采用组合空洞卷积来构造特征提取模块，以学习具有更大感受野的特征表示，从而提高模型的泛化性和表达能力；DECA采用一维卷积实现跨通道信息交互，通过通道混洗增强分组之间的信息流动。最后，通过局部残差和特征融合对不同层次特征表示进行整合。通过对基准数据集的定量和定性评估表明，所提方法在定量指标和可视化结果方面优于最先进的方法。

2.网络结构

SR是一项像素级回归任务，以前的工作倾向于在单个路径上构建深度网络架构，导致尺度信息提取能力有限，网络需要有效的多尺度特征表示来准确预测细节信息。另一方面，在网络的设计中，网络的宽度与网络的深度同样重要，网络越宽对目标特征的提取能力越强，即这一层网络能学习到更加丰富的特征，比如不同方向、不同频率的纹理特征等，因此，本方法将重点从以前的深而窄的体系结构转移到深而宽的网络结构。

使用自适应选择机制代替传统注意力中的1×1卷积来指导通道选择，采用1×1卷积的方式会造成通道数量的改变，从而引起内存访问次数（Memory access times，MAC）增加，降低模型推理速度。通过该方式可以避免通道数量的改变，更好地平衡模型的速度和精度。随后，采用Sigmoid层对生成的注意力权重矩阵进行归一化，并与初始特征映射x进行按元素相乘，最后得到通道注意力

为了提高深度神经网络的训练速度，文章将输入的特征F划分为G组，每个注意力机制仅应用于特定的通道组，之后对G组特征进行聚合，聚合后再将通道数恢复到C。同时，为了实现不同通道之间的连接，通过reshape操作将C重塑为（G，C）并对其进行混洗操作，使得通道之间变成无序状态，并将其转置为（C，G）。最后，通过reshape操作将其重新塑造为C。通过这种方式，能够在通道维度上实现信息的跨组流动，并且可以提高信息表征的能力。此外，分组卷积有助于加快训练速度，进一步提高了深度神经网络的性能。