(论文调研) Multi-task的网络结构 在图像去噪问题中的应用

news2025/1/12 3:47:56

1.SNIDER: Single Noisy Image Denoising and Rectification for Improving License Plate Recognition

这是一篇用于实现端到端的车牌恢复 (LPR: License Plate Recognition) 网络, 其中使用去噪和校正网络来生成清晰的恢复图像, 以实现稳健的 LPR 性能.
在这里插入图片描述
这个网络的名称为SNIDER, 将输入图像输入 SNIDER 进行图像恢复.

  • (b,c) SNIDER由主任务 (即DSN、RSN) 和辅助任务组成, 它们将低质量数据转换为高质量数据, 用于训练DSN、RSN和辅助任务网络.
  • (d,e) LPR网络用于测试并输出LPR结果, 即识别矫正后的车牌图像中的数字.
  • DSN通过编解码网络进行降噪处理, DSN生成的图像输入到RSN中进行矫正, 输出矫正后的车牌图像. 这里采用了两步的流程.
  • 辅助任务以提取主任务两个阶段的编码器末端的Feature map作为输入, 通过两个不同的解码器分别解码获得车牌字数与二值化结果.
  • 训练数据是将真实车牌进行缩放后差值复原 (加噪), 并且调整倾斜 (15°~30°) 后获取的.

>> 多任务与降噪结合的评价

将复杂的任务分解为多个网络组合的流程进行, 综上思路中降噪->矫正->LPR预测被分为明晰的多个步骤来进行, 属于串行的多任务.
而车牌数字数量预测和二值预测都属于并行的多任务组件, 可以理解为正则化的效果. 它们不直接预测的, 而是用于辅助网络认知.
而这个过程中将降噪任务作为必不可少的串行多任务组件部分来进行, 将降噪作为复杂任务的前导学习进行.

2.Test-time Adaptation for Real Image Denoising via Meta-transfer Learning

这篇文章的目的是提高真实图像去噪性能, 在多任务网络上实现测试时适应.
学习策略分为两个阶段, 第一阶段使用元辅助学习 (meta-auxiliary learning) 对网络进行预训练, 以获得更好的元初始化 (meta initialization).
同时,我们使用元学习 (meta-learning) 对网络进行微调 (元迁移学习) 作为训练的第二阶段,以实现对真实噪声图像的测试时间适应.

主体网络的架构如下:
在这里插入图片描述
给定一个噪声图像 I n I_n In作为输入, 多任务分支网络 f θ 1 f_{\theta_1} fθ1输出预测的干净图像 I ^ c \hat{I}_c I^c和预测的噪声图像 I ^ n \hat{I}_n I^n.
通过多个跳跃连接后首先生成的图像是一个残差图像 (3通道的).
残差图像与噪声图像 I n I_n In相加, 产生预测的图像为干净图像 I ^ c \hat{I}_c I^c.
可以发现, 这个多任务的输出并非是将两个图像并列输出 (即单纯多解码器结构), 而是先输出干净图像, 并且将干净图像与残差串联构成Auxiliary Head, 再度依靠生成Auxiliary Head特定噪声图像 I ^ n \hat{I}_n I^n. 即旧输出串联构造新输出.
此外, 网络的掩模生成分支 g θ 2 g_{\theta_2} gθ2还产生掩模 M M M (存噪点图像) 来调节重建损失 L Rec L_{\text{Rec}} LRec. 重建损失 L Rec L_{\text{Rec}} LRec将会作为辅助损失 L Auc L_{\text{Auc}} LAuc的一部分来调节多任务网络 f θ 1 f_{\theta_1} fθ1.
在这里插入图片描述
网络训练的过程可以用上图概述.

  • 首先, 网络使用元辅助训练, 将网络参数 θ 1 0 \theta^0_1 θ10, θ 2 0 \theta^0_2 θ20更新为 θ 1 T \theta^T_1 θ1T, θ 2 T \theta^T_2 θ2T. 这个过程会更新多任务网络 f θ 1 f_{\theta_1} fθ1和掩模生成网络 g θ 2 g_{\theta_2} gθ2. 采用的输入是合成的 {干净-噪声} 数据对. 这个过程提供了较好的元初始化, 实现更好的泛化性, 提高网络对各种合成噪声的鲁棒性.
  • 然后, 我们使用这个预训练网络作为元迁移学习的元初始化, 这个过程通过输入真实噪声数据集将参数从 θ 1 T \theta^T_1 θ1T, θ 2 T \theta^T_2 θ2T.更新为 θ 1 M \theta^M_1 θ1M, θ 2 M \theta^M_2 θ2M. 迁移学习只会训练Primary Head 和 Auxiliary Head.
  • 利用这两个阶段的学习, 我们希望使掩模生成网络产生更好的掩模, 这将有助于多任务网络在使用掩模重建损失进行训练时能够适应各种类型的噪声 (合成的和真实的).
  • 对于未见过的数据的测试数据集, 通过使用掩蔽重建损失来调整每个图像示例上的多任务网络的参数 (即零样本元学习), 该损失可以以自监督的方式进行训练, 而无需任何真实图像.

>> 多任务与降噪结合的评价

本文从两个地方利用的多任务的思路:
首先是网络会输出两个内容以作为不同的任务对象: 即干净图像噪声图像. 并值得一提的是, 作者通过设计了Primary Head 和 Auxiliary Head将两个任务又关联起来. 通过Primary Head输出干净图像, 这个过程类似去噪学习. 之后通过Auxiliary Head进一步利用基础网络 (Network body) 的残差干净图像的拼接输入到附属网络块来学习, 得到网络认知的预测噪声图像.
其次是通过一个掩模生成网络来作为"记录员"的身份记录噪声的特点, 它本身也可以作为一个正则化的附属子任务. 只不过它并非完全无用 (指的是并不是只为了辅助主任务训练来用) , 它还可以作为自监督的重要组件之一.

3. Multitask Learning for Super-Resolution of Seismic Velocity Model

这个网络是一种基于深度学习的超分辨率 (SR) 方法来增强地震速度模型的分辨率.
虽然这篇文章并没有明确为去噪任务, 但是分辨率提升的任务实际上转变为去噪的任务.
在这里插入图片描述

  • 网络左端的"Img"是附带低频信号的速度模型, 而X-grad与Y-grad分别表示通过Sobel算子获得的图像边缘信息.
  • 编解码的中间高维部分采用了DenseNet的Dense模块, 这种模块可以避免梯度消失问题并快速获得真实的SR结果.
  • 这个结构是通过硬参数共享实现的, 即并没有通过分离的组件 (多解码器或多编码器) 或 不同的网络结构软共享连接来实现不同的任务目标, 而是将任务一并拼接到通道中进行参数共享.
  • 边界恢复是当前SR处理的难点, 这在地震速度模型的SR中尤为突出, 这就是通过sobel算子引入边缘信息的目的. 实际工作中, 这部分可以引入不同噪声参数, 从而实现特定噪声去除.

>> 多任务与降噪结合的评价

这个模型着重讨论了硬参数共享的多任务在超分辨中的可行性, 虽然并没有融合去噪任务, 但是两个任务存在相似性, 有着相互联系的基础.
可以将不同的干扰情况下的图像与低分辨率图像一并作为同通道内的数据输入到网络中, 直接让网络内部的卷积学习通道彼此之间的关联.
实际上, 硬参数共享也可以作为软参数共享多任务的一个混合的子任务, 实现混合共享.

4. Joint Image Compression and Denoising via Latent-Space Scalability

这篇文章的模型内部组件结构略有复杂, 我还没深入去解析. 但是主体思想比较清晰.
这篇文章提出了一种基于学习的图像压缩框架, 其中联合执行图像去噪压缩 (任务为两个)
图像编解码器的潜在空间以可扩展的方式组织, 使得干净的图像可以从潜在空间的子集 (基础层) 解码, 而噪声图像以更高的比率从完整的潜在空间解码.
简单来说, 如果要构建一个既可以生成去噪图像又可以重建噪声图像的基于学习的系统时, 考虑首先压缩噪声图像, 然后解码, 然后应用去噪以获得去噪后的图像, 当然, 这种思路也可以乔迁到其他主任务中, 即在解码时考虑降噪问题.
在这里插入图片描述
其中, 首先压缩噪声图像, 然后解码, 之后应用去噪以获得去噪后的图像.
模型结构如图所示, 其中细节组件暂且不论, 但是就直观来是一个双解码的网络.
各解码器专注于在前导的编码高维信息中采用服务于特定任务的组件做特定的目标.

>> 多任务与降噪结合的评价

这个模型采用了宏观意义上的双解码器多任务结构, 但是又不同于单纯的端到端双解码器网络, 在每个编解码内部又有各异的组件.
这证明了多任务的编解码思想是灵活的, 同时, 这些灵活的构造依旧可以服务于去噪任务.
间接地, 这也证明多任务的设计也是灵活的.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1067753.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

内网渗透笔记之内网基础知识

0x01 内网概述 内网也指局域网(Local Area Network,LAN)是指在某一区域内由多台计算机互联成的计算机组。一般是方圆几千米以内。局域网可以实现文件管理、应用软件共享、打印机共享、工作组内的历程安排、电子邮件和传真通信服务等功能。 内…

Maven(4)-利用intellij idea创建maven 多模块项目

本文通过一个例子来介绍利用maven来构建一个多模块的jave项目。开发工具:intellij idea。 一、项目结构 multi-module-project是主工程,里面包含两个模块(Module): web-app是应用层,用于界面展示&#xff…

基于瞬时无功功率ip-iq的谐波信号检测Simulink仿真

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

nodejs+vue快递管理服务系统elementui

电子商务改变了人们的传统经济活动中的交易方式和流通技术, 复杂的物流快递信息需要有效的进行处理,构建一个快递管理服务系统可以确保物流信息的一致性、员工登录:通过用户名和密码登录。这也间接带动了物流快递行业的高速发展。 &#xff0…

flutter开发实战-inappwebview实现flutter与Javascript方法调用

flutter开发实战-inappwebview实现flutter与Javascript方法调用 在使用inappwebview时候,需要flutter端与JS进行交互,调用相应的方法,在inappwebview中的JavaScript Handlers。 一、JavaScript Handlers 要添加JavaScript Handlers&#…

基于FPGA的图像形态学腐蚀算法实现,包括tb测试文件和MATLAB辅助验证

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 将FPGA的仿真结果导入到MATLAB,结果如下所示: 2.算法运行软件版本 vivado2019.2 matlab2022a 3.部分核心程序 timescale 1ns / 1ps…

界面组件DevExpress WinForms v23.1 - TreeList、UI模板全新升级

DevExpress WinForms拥有180组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜…

cpu的指令重排,禁用办法

上一篇博客 volatile关键字总结-CSDN博客,我们讲了两个volatile变量可以限制编译器对指令的重排,但是限制不了cpu层面的指令重排 这篇博客开始,我们演示下cpu层面的指令重排,以及如何禁止cpu层面的指令重排 实验一:复…

SpringBoot的error用全局异常去处理

记录一下使用SpringBoot2.0.5的error用全局异常去处理 在使用springboot时,当访问的http地址或者说是请求地址输错后,会返回一个页面,如下: 这是因为请求的地址不存在,默认会显示error页面 但我们实际需要一个接口&a…

lua 中文字符的判断简介

一般在工作中会遇到中文字符的判断、截断、打码等需求,之前一直没有总结,虽然网上资料也多,今天在这里简单的总结一下。 1 .UTF-8简单描述 UTF-8 是 Unicode 的实现方式之一,其对应关系(编码规则)如下表所…

计算机算法分析与设计(6)---最长公共子序列(含C++代码)

文章目录 一、知识概述1.1 最长公共子序列1.2 进行动态规划 二、例题分析2.1 例题12.2 例题2 三、代码3.1 完整代码3.2 代码探讨 一、知识概述 1.1 最长公共子序列 1. 若给定序列X{ x 1 x_1 x1​, x 2 x_2 x2​,…, x m x_m xm​}&#xff0…

三相PWM整流器滞环电流控制Simulink仿真模型

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

Tomcat 多实例

一、Tomcat 多实例 1、概念: Tomcat 多实例是指在同一台服务器上运行多个独立的 Tomcat 服务器实例。它们可以同时运行在同一台物理服务器或虚拟服务器上,但它们彼此之间是相互独立的,有各自的配置、应用程序和资源。 2、配置:…

IDEA 2023.1.3图文安装教程及下载

IDEA 2023.1 最新变化是在 IDEA 2023.1 中,对新 UI 做出了大量改进。实现了性能增强,从而更快导入 Maven,以及在打开项目时更早提供 IDE 功能。 新版本通过后台提交检查提供了简化的提交流程。 IntelliJ IDEA Ultimate 现在支持 Spring Secur…

2023-2024年华为ICT网络赛道模拟题库

2023-2024年网络赛道模拟题库上线啦,全面覆盖网络,安全,vlan考点,都是带有解析 参赛对象及要求: 参赛对象:现有华为ICT学院及未来有意愿成为华为ICT学院的本科及高职院校在校学生。 参赛要求&#xff1a…

2023年上半年软考网工选择题易错总结

1.固态硬盘的存储介质是( )。 A.光盘 B.闪存 C.软盘 D.磁盘 答案:B 解析: 光盘CD-ROM和软盘是塑料的,磁盘的介质是磁性金属圆盘(附着铝合金),固态硬盘采用的存储介质是flash(闪存…

计算机专业毕业设计项目推荐14-文档编辑平台(SpringBoot+Vue+Mysql)

文档编辑平台(SpringBootVueMysql) **介绍****各部分模块实现** 介绍 本系列(后期可能博主会统一为专栏)博文献给即将毕业的计算机专业同学们,因为博主自身本科和硕士也是科班出生,所以也比较了解计算机专业的毕业设计流程以及模式,在编写的…

简易版Pycharm(2023)+Conda开发环境配置教程

困 扰 不知道为什么,自从Pycharm更新了新的版本以后,在Pycharm中为项目工程配置Python解释器环境时,总是不能像以前那么方便的配置。 比如,当前Conda中有十个不同的开发环境,每个环境一个名称,比如&#x…

【群智能算法改进】一种改进的光学显微镜算法 IOMA算法[1]【Matlab代码#60】

文章目录 【获取资源请见文章第5节:资源获取】1. 光学显微镜算法(OMA)1.1 物镜放大倍数1.2 目镜放大倍数 2. 改进后的IOMA算法2.1 透镜成像折射方向学习 3. 部分代码展示4. 仿真结果展示5. 资源获取说明 【获取资源请见文章第5节:…

MQ - 36 云原生:业界MQ的计算存储分离的设计与实现

文章目录 导图概述什么是存算分离架构必须是存算分离架构吗实现存算分离架构的技术思考如何选择合适的存储层引擎存储层:分区存储模型的设计计算层:弹性无状态的写入业界主流存算分离架构分析RocketMQ 5.0 架构分析Pulsar 存算架构分析总结导图 概述 结合云原生、Serverless…