【渐进交互学习网络:轻量级:超分:工业应用】

news2025/1/24 8:41:41

Progressive Interaction-Learning Network for Lightweight Single-Image Super-Resolution in Industrial Applications

(工业应用中轻量级单幅图像超分辨率渐进交互学习网络)

近年来,基于深度学习(DL)的工业应用因其先进的性能而受到广泛关注。然而,便携式设备中有限的计算资源总是使得大DL模型不适用于工业。基于DL的单幅图像超分辨率算法由于计算量大也会遇到这个问题。此外,大多数基于卷积神经网络的轻量级方法对特征的利用不足,限制了其工业重构的能力。为了缓解这一问题,我们提出了一个进程交互学习网络(PILN),以细化不同层次的特征:在全局层次上,我们采用渐进式交互学习策略来整合时间和空间维度上的层次特征;在中间层,增强交互学习单元采用增强交互学习,显著提高重构性能;在局部层面上,采用逐像素学习提出残差单元以通过权重分布来搜索最优信息流。大量的实验表明,PILN算法优于现有的其他算法。

介绍

随着机器学习/深度学习(DL)的不断兴起,提出了广泛的基于机器学习/DL的工业应用,以在相应任务中实现更好的性能。单幅图像超分辨率(SISR)技术在监控系统、遥感、机械制造和物联网(IoT)等众多工业应用中发挥着重要作用,近年来DL大力推广。然而,大多数基于DL的SISR方法需要大量的存储和计算,这是许多工业系统所不能承受的。例如,具有高速和多个时间敏感操作要求的物联网工业应用广泛地通过小规模平台实现。因此,轻量级SISR神经网络的设计对于工业应用具有重要意义,这也是本文的研究目的。SISR是一种低层次视觉任务,旨在从低分辨率(LR)图像重建高分辨率(HR)图像。多幅HR图像可以退化为一幅LR图像,这是一个不适定问题,引起了广泛的关注。因此,研究人员提出了多种高质量图像超分辨率(SR)的方法,其中深度卷积神经网络(CNN)因其优越的性能而备受关注。为了使基于神经网络的方法能够应用于工业应用,一些轻量化方法不断被提出。为了高效地重建图像,Fu等人尝试通过多尺度知识转移来构建适合物联网(IoT)应用的轻量级结构。
虽然轻量级网络在实际应用中取得了优异的性能,但在工业应用场景中仍然受到各种限制。特别是在充分利用特征方面,直观效果主要体现在以下两个方面。
1)大多数特征提取策略只关注单个层次,而忽略了层次特征之间的相关性。例如,残差学习强调全局特征但忽略局部细节;密集连接策略扩大了不同模块之间的空间相关性,但忽略了时间关系。
2)现有的信息流策略对特征的利用效率较低,影响了精确表示的能力.以权重贡献策略为例,空间关注度(SA)只关注空间特征,而忽略了其他有效信息(如:通道或像素细节)。
为了解决轻量级SISR神经网络中的上述问题,提出了一种渐进交互学习网络(PILN)来聚合不同层次的特征。一方面,我们在不同的层次上实施不同的特征细化策略(例如,全局、中间和局部)以促进分层特征融合。具体而言,PILN通过全局的渐进交互学习策略(PILS)、中间的增强交互学习(EIS)和局部的逐像素学习(PWL)有效地提高了重建能力。另一方面,我们设计了残差单元(R-Cells)和特征提取单元(FEU)来构造增强的交互学习单元(EILUs),该交互学习单元在时间和空间两个方向上聚合特征。通过使用精细的块来形成PILN,最大限度地利用了多维特征,在保持轻量级的同时获得了相似的重建结果,增加了PILN在工业应用中的实用性。

贡献

1)我们提出了一种有效的用于SISR的PILN,它在不同的层次上细化时空特征,即:局部、中间和全局。实验结果表明,该算法在保持较少资源消耗的同时,性能优于其他SOTA算法。
2)在全局层面上,我们采用PILS来收集时间和空间方向上的特征。利用PILS,层次信息可以在多维空间中交互聚合,保证了特征的充分利用。
3)在中间层,利用EIS,多个EILU通过有效的特征聚合优化信息流。在EIS的辅助下,EILUs在SR任务中表现出了强大的表征能力。
4)在局部层次上,我们设计R-Cells和FEU以形成EILU,EILU在像素级聚合特征。实验结果表明,PILN通过自适应地对R-Cells进行权值贡献,并用FEU聚集RCells,提高了图像重建性能。

相关工作

CNN-Based Image SR

近年来,基于神经网络的结构使SR性能得到了迅速发展,并取得了优异的性能,作为先驱,超分辨率卷积神经网络(SRCNN)成功地将插值LR图像映射到具有浅三层结构的HR副本。之后,大量的方法试图通过使用不同的学习策略来深化它们的模型以提高重构性能:1)残差学习,用于缓解梯度消失问题的有效训练方法;2)密集连接策略,充分挖掘不同层次特征之间的相关性,实现强大的特征表;;3)递归学习,例如超分辨率反馈网络(SRFBN),使用深度SRFBN通过提取时间信息来提高表示能力;4)注意机制,例如,渠道关注(CA)和SA,以促进信息流动;以及5)在深度维度或时间维度上展开网络以提高重建性能。然而,现有的基于神经网络的模型参数较多,资源消耗大,不适合实际应用。
为了减少参数,已经提出了多个紧凑且有效的神经网络来释放用于匹配移动的设备的计算成本。适度信息蒸馏网络(IDN)使用基于状态的递归结构,旨在缓解参数问题,同时保持高质量的重建。同时Hui等人通过多重蒸馏发展了信息多重蒸馏网络,称之为信息多重蒸馏网络(IMDN)。然而,上述轻量级结构忽略了层次特征的使用,导致了不满意的结果。为了获得高质量的重建结果,有学者提出了性能和计算量之间的最佳折衷方案。受上述方法的启发,我们设计了基于渐进学习(PL)的研究,以构建一个有效的网络用于层次多维特征提取。

Attention Mechanism

CA注重通道的特征细化,在许多计算视觉任务中取得了优异的性能。Zhang等人将CA机制集成到SISR的残余信道注意网络中。然后,由几个二阶信道注意力组成,提出了一个二阶注意力网络,以从一个新的角度执行权重分配。虽然CA已经取得了显著的进步,但由于信息利用的不足,CA仍有其局限性。另一方面,SA的目标是在空间维度上对特征进行加权,从而帮助网络找到一个高效、可信的模型。例如,SPP-Net 使用空间金字塔池(SPP)策略来提高图像表示的质量。在SA的指导下,SPP-Net产生了固定长度的结果,并进一步应用于分类和检测任务。之后,SA的应用场景更加通用,例如:自我注意生成对抗网络在生成对抗网络上进行空间特征细化。尽管单维注意机制有了很大的改进,但仍不能适应工业应用的发展。为了充分利用不同维度的信息,Zhao等人通过混合注意策略来提高其表征能力。基于这种思路,我们提出了一种自适应学习注意机制R-Cell,它可以集中学习通道权重和空间权重,以获得更强大的SR

方法

Global Level: PILS

Description ofthe Backbone Network:

请添加图片描述

在图2中,PILN是一种轻质高效的结构,具有几个合理排列的块。主干由三个EILUs组成(即,EILU-S、EILU-M和EILU-D)进行精细特征提取(参见图3)。请添加图片描述
然后,网络的输入和输出分别用ILR和ISR表示。该公式可说明如下:
在这里插入图片描述
其中HLFE(·)、HPIL(·)和HHFE(·)分别表示低级特征提取、渐进式交互学习和高级特征提取的操作。符号Iup是ILR的上采样结果,并且“+”表示残差学习。为了更清楚地解释特征提取,我们逐步表示PILN。对于输入的ILR,通过低层特征提取HLFE(·),可以获得浅层特征FSF
请添加图片描述
然后,可以通过HPIL(·)的操作来细化FSF,HPIL(·)在全局层面采用PILS
请添加图片描述
为了更好地适应阶段学习,我们对改进的FPIL进行高层特征提取,并获得融合信息FHF
在这里插入图片描述
其中HHFE(·)表示高级特征提取的函数。最后,通过在放大的ILR和FHF之间进行残差学习,可以通过下式形成高质量画面ISR在这里插入图片描述
其中,函数Hup(·)为上采样,用于将LR插值为HR的大小。

Description ofthe PILS:

请添加图片描述
请添加图片描述
如图2所示,所提出的模型可分为三个层次:全局、中间和局部。PILS(图3)主要用于全局水平,以进行精确的图像重建。此外, E j E^j Eji是在第j阶段从第i个EILU提取的纯特征。总体PL可描述如下。

Stage 1 self-study (T = 1):

EILUS的主要任务是对浅层特征进行预处理,获得中间信息 E 1 E^1 E11,提高图像重建质量在这里插入图片描述
其中ΦEILUS(·)表示浅层特征的细化,FSF表示初始信息。

Stage 2mutual study (T = 2):

当T= 2时,我们深入地集成了一个全新的功能块EILU-M。首先,我们在EILU-S中对先前的输出E11使用自学习,这可以被视为自学习。然后,EILU-M将特征(即: E 1 E^1 E11和FSF),结合层次特征和时间相关特征,通过以下步骤完成不同模块间的交互学习
在这里插入图片描述

Stage 3 interaction study (T ≥ 3):

当T ≥ 3时,不少于3个块参与特征处理。PILS使EILU-S、EILU-M和EILU-D共同集成到结构中,以获得令人满意的结果。这一过程被称为多模块互动学习,简称互动学习在这里插入图片描述
其中ΦEILUD(·)表示可以锐化细节的图像处理函数。然后,通过FSF E 1 E^1 E11 E 2 E^2 E22(包括各阶段特征)的信息融合,得到高层特征 E 3 E^3 E33

Global feature fusion:

由于PILS仅使用三个模块,此处FPIL = E 3 E^3 E33,因此将FPIL用作HAF(·)输入。HAF(·)是特征聚合层,包含一个1 × 1卷积和一个leaky激活函数。FAF是一种聚合了层次特征的细化特征,可通过以下方式获得在这里插入图片描述
最后,我们将所有先前卷积层的特征(即, E i E^i Eii(i = 1,2,3),FAF和FSF)输入到特征细化层(ξFR[·]),得到FHF的输出:在这里插入图片描述
其中ξFR[·]是特征细化的函数。

Generalization of the PILS

一般来说,我们可以根据(11)和(12)推广上述过程。设 E j E^j Eji(i,j ∈ N *,1 ≤ i ≤ N,1 ≤ j ≤ T)表示第i个EILU在第j阶段的输出,假设有N个EILU,训练经验为T个阶段。参考上述技术,第P(1 ≤ P ≤ T)阶段的操作可以说明如下,这直接体现了PL的目的:
在这里插入图片描述
最后,我们融合每个阶段的PL结果,得到PILS的最终输出,即FHF在这里插入图片描述

Mediate Level:EIS

如前所述,PILN由多个EILU组成,EIS见图4。与PILN中的全局PL相似,EILU采用周期学习的方法来促进中间层的特征融合。特别地,为了方便起见,我们使用了四个EILU学习周期。请添加图片描述

Period 1

假设EILU的输入是Ein,我们可以获得复合特征 R 1 R^1 R11。由于只使用一个模块,因此称为自学习过程在这里插入图片描述

Period 2

与Period 1不同的是,在Period 2中增加了特征提取单元(FEU)OFEU1(·),以配合上述R-Cell进行交互学习。将 R 1 R^1 R11引入两个卷积层,完成了以交互为主的学习策略(ILS)在这里插入图片描述

Period 3

然后引入FEU2(OFEU2(·))进一步交互学习更精确的特征,得到特征 F 3 F^3 F31 F 3 F^3 F32在这里插入图片描述

Period 4

通过对Period1-3的处理,引入R-Cell 2以获得高精度特征 F 4 F^4 F42,它包含了以前的Ein F 3 F^3 F31 R 3 R^3 R32在这里插入图片描述

Feature Refinement

最后,采用残差和收敛学习,可以通过下式获得输出Eout在这里插入图片描述

Local Level: PWL

请添加图片描述

图5显示了局部级实施的PWL战略。假设输入和输出分别是Rin和Rout,则R-Cells和FEUs可以被定型如下

Residual Cell

通过像素特征提取,由下式获得浅特征FE在这里插入图片描述
其中HPixel−E(·)是像素特征提取操作(图5中的黄色方框所示)。然后发送给CA和SA模块进行权值计算,得到Fcon在这里插入图片描述
其中HCA(·)和HSA(·)是通道和SA块的函数。通过执行像素特征细化(HPixel−R(·)),纯特征FR已通过以下方式实现在这里插入图片描述
最后,应用Rin和FR之间的残差学习,我们完成了信息净化并赢得了Rout,即:在这里插入图片描述

Feature Extract Unit

由于OFEUi(·)是第i个FEU中的逐像素运算,因此,假设FEU的输入是Uin,则输出Uout可通过下式获得:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/377055.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据技术之Hive(四)分区表和分桶表、文件格式和压缩

一、分区表和分桶表1.1 分区表partitionhive中的分区就是把一张大表的数据按照业务需要分散的存储到多个目录,每个目录就称为该表的一个分区。在查询时通过where子句中的表达式选择式选择查询所需要的分区,这样的查询效率辉提高很多。1.1.1 分区表基本语…

Python 不同分辨率图像峰值信噪比[PSNR]

PNNR:全称为“Peak Signal-to-Noise Ratio”,中文直译为峰值信噪比 前言 一、定义 二、Python代码 1.自定义 2.Tensorflow 总结 前言 峰值信噪比是一种衡量图像质量的指标,描述的是最大值信号与北京噪音之间的关系。 一般来说,P…

Allegro如何删除铜皮上多余的空洞操作指导

Allegro如何删除铜皮上多余的空洞操作指导 在做PCB设计的时候,设计铜皮的时候是不希望铜皮上有多余的空洞的,设计完成前需要把多余的空洞删除,如下图 如何删除,具体操作如下 点击Shape点击Manual Void/Cavity

springboot中集成redis,二次封装成工具类

大家好,我是雄雄,欢迎关注微信公众号:** 雄雄的小课堂 ** 现在是:2023年2月28日11:01:56 前言 redis大家应该都不陌生,我们在好多场景下都会使用,最近在面试别人的时候,也会问一些关于redis的…

华为OD机试题,用 Java 解【求符合要求的结对方式】问题

最近更新的博客 华为OD机试题,用 Java 解【停车场车辆统计】问题华为OD机试题,用 Java 解【字符串变换最小字符串】问题华为OD机试题,用 Java 解【计算最大乘积】问题华为OD机试题,用 Java 解【DNA 序列】问题华为OD机试 - 组成最大数(Java) | 机试题算法思路 【2023】使…

博客系统--自动化测试

项目体验地址(账号:123,密码:123)http://120.53.20.213:8080/blog_system/login.html项目后端说明:http://t.csdn.cn/32Nnv项目码云Gitee地址:https://gitee.com/GoodManSS/project/tree/master…

【极狐 GitLab】在 web 端合并分支

一、概述 极狐GitLab是GitLab DevOps平台的中国发行版,一套完备的一站式DevOps平台,从根本上改变了开发、安全和运维团队协作和软件构建方式。极狐GitLab从构思到生产发布,帮助团队提高生产效率,将迭代周期从数周缩短至几分钟&am…

【Spring事物三千问】Spring的事务管理与MyBatis事物管理结合的原理

Spring的事务管理与MyBatis事物管理结合的原理前言正文原生的 MyBatis 的事务处理SqlSessionTransactionMyBatis 事务管理 与 Spring 事务管理的融合SpringManagedTransactionSqlSessionTemplateSqlSessionInterceptormybatis-spring 融合的原理连接获取 & 开启事务连接的关…

【Linux】理解进程地址空间

🍎作者:阿润菜菜 📖专栏:Linux系统编程 ​我们在学习C语言的时候,都学过内存区域的划分如栈、堆、代码区、数据区这些。但我们其实并不真正理解内存 — 我们之前一直说的内存是物理上的内存吗? 前言 我们…

18- TensorFlow实现CIFAR10分类 (tensorflow系列) (项目十八)

项目要点 导入cifar图片集: (train_image, train_label), (test_image, test_label) cifar.load_data() # cifar keras.datasets.cifar10图片归一化处理: train_image train_image / 255定义模型: model keras.Sequential() 输入层: model.add(layers.Conv2D(64, (3, 3…

HTML基础语法

一 前端简介构成语言说明结构HTML页面元素和内容表现CSS网页元素的外观和位置等页面样式(美化)行为JavaScript网页模型的定义和页面交互二 HTML1.简介HTML(Hyper Text Markup Language):超文本标记语言。网页结构整体&…

Kubernetes05: Pod

Kubernetes05: Pod 1、概述 1)最小部署的单元 2)K8s不会处理容器,而是Pod,Pod里边包含多个容器(一组容器的集合) 3)一个Pod中的容器共享一个网络命名空间 4) Pod是短暂存在的东西(重…

使用shiroshiro整合其他组件

什么是shiro? 一款apache公司出品的Java安全框架,主要用于设计针对应用程序的保护,使用shiro可以完成认证、授权、加密、会话管理等。保证系统稳定性、数据安全性 优势:易于使用、易于理解、兼容性强(可以与其他框架集…

SE-SSD论文阅读

摘要 本文提出了一种基于自集成单级目标检测器(SE-SSD)的室外点云三维目标检测方法。我们的重点是利用我们的公式约束开发软目标和硬目标来联合优化模型,而不引入额外的计算在推理中。具体来说,SE-SSD包含一对teacher 和student ssd,在其中我…

Mac 安装 Java 反编译工具 JD-GUI

Mac 安装 Java 反编译工具 JD-GUI JD-GUI 是一款 Java 反编译工具,可以方便的将编译好的 .class 文件反编译为 .java 源码文件,用于开发调试、源码学习等。 官网地址:http://java-decompiler.github.io Git 地址:https://github…

直播美颜sdk是什么?它是怎么让用户”变美“的?

如今,直播美颜sdk、手机摄影、短视频以及社交软件的盛行,让“拍照”成为人们日常生活中不可或缺的一部分。随着直播美颜sdk技术的不断升级,手机摄影的质量也越来越高。有统计数据显示,2018年中国智能手机用户已经达到了7亿人&…

美国最新调查显示 50% 企业已在用 ChatGPT,其中 48% 已让其代替员工,你怎么看?

美国企业开始使用ChatGPT,我认为这不是什么新闻。 如果美国的企业现在还不使用ChatGPT,那才是个大新闻。 据新闻源显示,已经使用chatGPT的企业中,48%已经让其代替员工工作。 ChatGPT的具体职责包括:客服、代码编写、招…

HTB-remote

HTB-remote信息搜集开机提权信息搜集 nmap 较为感兴趣的端口: 2180nfs 首先尝试21端口,可以看到并没有文件在ftp服务器里面,而且也无法上传文件。 80端口。 在contact里面找到了能够登录的网站。 经过简单的测试发现可能不存在sql注…

逆向、安全、工具集

0、安卓逆向环境 r0env 原味镜像介绍文章:https://mp.weixin.qq.com/s/gBdcaAx8EInRXPUGeJ5ljQ 原味镜像介绍视频:https://www.bilibili.com/video/BV1qQ4y1R7wW/ 百度盘:链接:https://pan.baidu.com/s/1anvG0Ol_qICt8u7q5_eQJw 提取码:3x2a …

【Spring源码】Spring AOP的核心概念

废话版什么是AOP关于什么是AOP,这里还是要简单介绍下AOP,Aspect Oriented Programming,面向切面编程,通过预编译和运行期间提供动态代理的方式实现程序功能的统一维护,使用AOP可以降低各个部分的耦合度,提高…