ZERO-SHOT:多聚焦融合

news2025/1/11 12:40:11

ZERO-SHOT MULTI-FOCUS IMAGE FUSION

(零镜头多焦点图像融合)

多聚焦图像融合 (Multi-focus image fusion (MFIF)) 是消除成像过程中产生的离焦模糊的有效方法。The difficulties in focus level estimation and the lack of real training set for supervised learning make MFIF remai a challenging task after decades of research.
我们提出了一种名为IM-Net的新颖体系结构,该体系结构由I-Net组成,用于对融合图像的深度先验进行建模,而M-Net则用于对焦点图的深度先验进行建模。在没有任何大规模训练集的情况下,我们的方法通过提取的先验信息实现了零射击学习

介绍

在成像系统中,由于深度场 (depth-of-field (DOF)) 的限制,相机焦平面外的物体会变得模糊,从而难以获得全聚焦图像,并导致图像质量大大降低。近年来,已经提出了各种多焦点图像融合 (MFIF) 算法来解决此问题。它们可以将源图像对的聚焦区域 (具有不同焦距) 在同一场景中进行组合,从而获得全聚焦高质量和信息性的聚焦图像,具有广泛的应用。

通常,MFIF方法可以分为三类: 基于变换域的方法,基于空间域的方法和基于深度学习的方法。
基于变换域的方法使用手工制作的图像分解算法将原始图像转换为变换域,以便能够更好地编码以区分清晰的几何特征,然后融合变换后的图像,最后进行逆变换以获得融合的图像。1985年,Burt等人 提出了第一个基于拉普拉斯金字塔的多尺度分解MFIF方法。之后出现了一系列基于多尺度分解的融合方法,包括基于小波变换、基于DCT等。
这些基于变换域的方法已被广泛使用,因为它们可以避免直接操纵像素引起的伪像(artifacts),但是由于对高频分量的敏感性,它们容易导致失真。通过估计二进制焦点图,然后基于获得的焦点图执行源图像对的加权和,基于空间域的方法开始引起注意。

但是这些传统的基于先验的方法以活动度量和融合规则的设计为主要任务,并提出了许多手工制作的活动度量来估计基于低级特征的清晰度,例如边缘信息或梯度信息的减少,以及像素强度或对比度的降低。
同时缺点也是:这些手工制作的功能无法准确表征图像是否聚焦。为了减轻手工先验 (手工图像分解方法或手工特征) 的依赖性,已经提出了许多基于深度学习的方法,通过这些方法可以共同优化活动度量和融合规则,以获得更好的效果。

基于深度学习的MFIF方法可以进一步分为基于监督学习的方法和基于无监督学习的方法。Liu等人提出了第一个有监督的暹罗结构(Siamese structured )CNN网络,用于MFIF在补丁级别执行分类。Guo等人提出使用全卷积网络来获得从源图像对到焦点图的端到端映射。Xiao等人设计了一个精致的监督模型,以充分利用低级和高级信息。

这些使用具有手工参数的合成数据集基于监督学习的模型可能与真正的成像过程不一致,后者需要考虑点扩散函数 (PSF) 以及物体和镜头之间的距离。-------->所以,无监督学习成为一种直接解决方案。具体来说,Prabhakar等人采用了预先训练的自动编码器来提取特征,并将原始图像映射到高维特征空间中。由于发现提取的深层特征具有良好的泛化,鲁棒性和开发潜力,因此基于这项工作进行了一些改进 。最近,一种称为MFF-GAN的无监督融合方法在联合梯度约束下进行了对抗博弈。此外Ma等人训练了一个strongly self-supervised mask generator 以直接生成binary mask,而无需任何后处理 。尽管这些基于深度学习的方法已经达到了最先进的 (SOTA) 性能,但它们中的大多数都以有监督的 (具有地面真相) 或经过训练的 (具有用于训练的大图像集) 方式工作。为了解决这种具有挑战性且较少触及的问题,人们高度期望开发一种新颖的深度神经网络,该网络可以同时以无监督和未经训练的方式工作,同时实现有希望的性能。

最近,由Ulyanov等人提出的DIP(数字图像处理)。[1] 使用精心设计的 “沙漏” 发生器来捕获低级图像统计信息,向我们展示了未经训练的网络提取的深层特征可以用作许多低级任务的图像,而无需任何训练数据。基于这项工作,Gandelsman等人 提出了基于耦合DIP的图像分解任务的通用框架,Ren等人将DIP应用于图像去模糊并取得了视觉上有利的效果。

受这些工作的启发,我们提出了一种称为IM-Net的新型MFIF网络,该网络采用两个联合子网络 (即I-Net,M-Net) 来生成融合图像和焦点图**。生成的融合图像和焦点图需要满足能够重建观察到的输入图像的约束**。IM-Net 仅使用观察到的输入多焦点图像中包含的信息来执行MFIF,这不遵循在具有一些地面真相的图像集上训练神经网络的常规范例。我们的IM-Net的主要优势在于,它可以避免劳动密集型数据收集和域转移问题,如现有的基于深度学习的方法,同时取得有希望的结果。

贡献

(i)这项工作可能是MFIF的首次zero-shot methods 之一,可以预测清晰的融合图像,而无需地面真相或图像收集。
(ii) 受DIP的启发,应用两个生成网络同时对clean fused image和焦点图的深度先验进行建模,结合了基于焦点图估计的方法可以很好地保留源图像信息的优点和基于融合图像生成的方法可以提供良好的视觉效果的优点
(iii) 将几个SOTAs与我们的方法进行了比较,以证明我们的IM-Net的有效性。

方法

MFIF可以看作是根据聚焦图Im R m × n R^{m × n} Rm×n的源图像IA R m × n × c R^{m × n × c} Rm×n×c和IB R m × n × c R^{m × n× c} Rm×n×c加权和,M和N分别表示源图像的高度和宽度,C表示源图像的通道数。为简单起见,我们只考虑两个源图像的融合,因为它可以很容易地扩展到其他情况。融合图像Ifused R m × n × c R^{m × n × c} Rm×n×c可以计算为
请添加图片描述
如上所述,许多MFIF方法都深深依赖于手工制作的先验。在本文中,我们探索了深度神经网络作为图像先验的能力,并将深度先验应用于融合多焦点图像对。受DIP 和double-DIP的启发,我们将MFIF转换为由两个生成网络组成的 “zero-shot”自我监督学习形式,可以对干clean fused image Ifused 的深度先验进行建模。和聚焦图Im满足上述等式。图1显示了我们方法的主要结构。分别从均匀分布中随机采样两个输入噪声Zi和Zm,然后通过两个基于U-Net的沙漏结构网络I-Net和M-Net,以获得融合图像和估计的焦点图Im
请添加图片描述

Network Architecture

网络架构DIP使用随机初始化的深度网络来拟合单个图像,并将提取特征作为图像的深度先验,但是图像样本的缺乏使得深度模型容易过度拟合,精心设计的沙漏网络可以大大缓解这一问题。U-Net擅长提取低级和高级信息,因此DIP采用U-Net作为其骨干。下采样模块和上采样模块之间的不对称设计可以有效地避免琐碎的解决方案,即,如果出现与IA或IB相同,而Im则出现全白或全黑,这会使算法难以优化。大量的BatchNorm层也可以使网络更好地适合高频组件。我们的im-net的网络体系结构如上图所示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/97478.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机毕业设计springboot+vue文体用品商城网站

项目介绍 在当今社会的高速发展过程中,产生的劳动力越来越大,提高人们的生活水平和质量,尤其计算机科技的进步,数据和信息以人兴化为本的目的,给人们提供优质的服务,其中网上购买商品尤其突出,使我们的购物方式发生巨大的改变。而线上购物,不仅需要在硬件上为人们提供服务网上购…

ASPICE详细介绍-3.ASPICE有多少能力等级?

目录ASPICE有多少能力等级?9 个过程属性过程属性评定过程能力等级模型ASPICE有多少能力等级? ASPICE能力等级从0级到5级共分为6个层次,必须满足前一级别才可晋级下一个级别的评估。 【0级】Incomplete,未完成。 The process is…

【YOLOv7-环境搭建】PyTorch安装后输出版本显示No module named ‘Torch’的解决方法

可能一:PyCharm环境导入错误 配置的解释器,必须为所创建的虚拟环境下的python.exe文件,别的路径下的python.exe文件不好使!! 解决方法:根据【YOLOv7-环境搭建③】PyCharm安装和环境、解释器配置文中配置解…

微信小程序自定义头部导航nav

1.封装自定义nav导航组件 // app.js App({globalData: {systeminfo: false, //系统信息headerBtnPosi: false //头部菜单高度} })// components/nav/nav.js const app getApp(); Component({properties: {vTitle: { // 标题type: String,value: ""},isSearch: {…

大厂频频裁员,0基础转行做IT是不是已经晚了

现在转行做程序员是不是已经晚了 转行不会晚,晚的是你数不清的犹豫 对于二十来岁刚毕业或者毕业没几年的人来说,经历过社会的“摧残”,面对着一眼能够望到头的工作,拿着也不太高的工资,总是会去寻求一些改变与其每天…

Ajax请求原理与数据抓取

有些时候,我们直接通过网络请求库请求网页地址时,得到的响应结果可能跟浏览器中右键查看网页源码所看到的内容不一样。例如,在抓取:https://www.feeair.com/threeCode.html (飞啊网)这个网页时,…

公司固定资产管理系统

开发工具(eclipse/idea/vscode等): 数据库(sqlite/mysql/sqlserver等): 功能模块(请用文字描述,至少200字): 模块划分:公告类型、公告信息、员工信息、仓库信息、资产类型、资产信息、供应商信 息、采购信息、盗产调拨…

(Matlab)基于蝙蝠算法实现电力系统经济调度

目录 摘要: 1.蝙蝠优化算法的基本原理: 2.蝙蝠优化算法的流程: 3.仿真实验分析: 摘要: 基于Matalb平台,构建基于蝙蝠活动行为的蝙蝠优化算法,对一个含有6个火电机组的电力系统进行优化调度…

毕业设计 ESP32在线墨水屏桌面摆件 -物联网 单片机 嵌入式

0 前言 🔥 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。 为了大家能够顺利以及最少的精力通过…

单因子分析(如何判定一个因子是否有效)

本人之前都是做期权中性策略,第一次接触这个多因子策略,和一些大私募对接学习后,才知道这里面的水(只能说各有各的道)。 先说下,何为因子策略,就是一个因子和股票的价格在一定时间内是存在一定的…

【算法数据结构专题】「线程锁算法专项」初探CLH队列锁机制原理分析

技术扩展 SMP(对称多处理器架构) SMP(Symmetric Multi-Processor),即对称多处理器结构,指服务器中多个CPU对称工作,每个CPU访问内存地址所需时间相同。其主要特征是共享,包含对CPU,内存&#…

使用Python互转pdf文档和word文档

1 前言 一日,欲将手头上的一份pdf文档转换成word文档。先试着用XX办公软件试了下,微信扫码登录后,在PDF转换界面,选中文档,点击“开始转换”,弹出提示对话框:免费的只给转换5页文档&#xff0c…

十万部冷知识:本届世界杯阿根廷会夺冠吗?

明天,世界杯的决赛“阿法大战”就开始了。而我个人是希望阿根廷夺冠的,熟悉我的人会知道,在2014巴西世界杯的64场比赛中,我曾预测对了63场,唯一一场不对的就是,那年阿根廷和德国的决赛,我当时就…

基于SSM村委会工作管理系统

开发工具(eclipse/idea/vscode等): 数据库(sqlite/mysql/sqlserver等): 功能模块(请用文字描述,至少200字): 工作人员: (1)通知管理:对日常的重要信息以及公告进行发布通知。 (2)财务管理:用于收…

【学习打卡】CAM可解释性分析-算法讲解

文章目录引言该算法能做什么直观上研究上意义上精妙之处定位特点弱监督学习特点作者简介CAM算法原理具体计算方法巧妙之处讨论全卷积神经网络池化简介池化的作用全局平均池化CAM总结SqueezeNet显著性分析的意义例1:工艺改进例2:识别鸟例3:围棋…

事业编招聘:事业单位招聘136人!可免笔试!

吉林的小伙伴看过来 2023年吉林四平事业编招聘136人 本科起报名,研究生免除笔试 报名时间:12月20日至12月24日 感兴趣的宝子们别错过了哦 为深入实施“万名大学生留平计划”,持续加大我市党政干部的专业化人才储备力度,现面向…

数据治理的数据流程整合

一、核心业务流程 在企业业务整合时,根据企业对信息化的投入,避免整合对企业业务流程影响过大,按照循序渐进的方式进行整合。 核心业务流程是企业经营、存在、发展的基础。在信息整合中,要围绕这样的业务流程整合企业的信息。在…

首看世界杯

首看世界杯,不谈技术,只聊自己的几点感受,纯属个人感想。 今年是第一次关注世界杯,本来对足球是没有什么兴趣的。如果说对足球有什么了解的话,大部分还是来自小时候的动画片“足球小将”。但是看现实中的足球比赛&…

Java项目:SSM酒吧后台管理系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 管理员角色包含以下功能: 管理员登录,桌位信息查看,查看账单,日常维护,酒水库存管理等功能。 环境需要 1.运行环境:最…

桌面壁纸实时展示粉丝数(CSDN)

最近csdn偶尔就又有几个同学关注我,觉得很有动力!于是我想能在任何时候的桌面壁纸,都能看到csdn粉丝数以及显示他们的昵称,我觉得会很有意义! 下面展示效果,(「・ω・)&…