Zero-Shot Restoration of Back-lit Images Using Deep InternalLearning

news2025/1/11 14:30:33

ABSTRACT

如何恢复背光图像仍然是一项具有挑战性的任务。该领域最先进的方法基于监督学习,因此通常仅限于特定的训练数据。在本文中,我们提出了一种用于背光图像恢复的“零样本”方案,该方案利用深度学习的力量,但不依赖于任何先前的图像示例或先前的训练。具体来说,我们在测试时训练一个小型图像特定 CNN,即 ExCNet(曝光校正网络的缩写),以估计最适合测试背光图像的“S 曲线”。一旦估计出S曲线,就可以直接恢复测试图像。 ExCNet 可以适应每个图像的不同设置。这使得我们的方法广泛适用于不同的拍摄场景和各种背光条件。对 1512 个真实背光图像进行的统计研究表明,我们的方法可以大幅优于竞争对手。据我们所知,我们的方案是第一个基于 CNN 的无监督背光图像恢复方法。为了使结果可重现,源代码可从 https://cslinzhang.github.io/ExCNet/ 获取。

1 INTRODUCTION

拍摄图像时,最令人讨厌的不良照明条件之一是背光。尽管大多数现代成像传感器可以根据拍摄目标的光照条件自动调整相关硬件参数(如光圈、快门速度和电子增益[24]),但在大多数逆光条件下仍然无法获得满意的结果案例。解决这个问题的一种可能方法是使用 HDR(高动态范围)成像技术 [5]。然而,HDR只能用于逆光下的图像采集,无法帮助恢复现有的劣质逆光图像。

在这项工作中,我们研究了背光图像恢复问题,并引入了一种“零样本”方案,即 ExCNet(曝光校正网络的缩写)。 “零样本”是指 ExCNet 不需要事先训练。 ExCNet 是一种专门设计的 CNN(卷积神经网络),可以直接估计给定背光图像的最佳拟合 S 曲线 [2, 28]。通过其S曲线,可以相应地恢复背光图像。在图 1 中,我们展示了 4 个典型的背光图像以及 ExCNet 的恢复结果。可以看出,所提出的方法对于恢复质量较差的背光图像具有很强的能力。

1.1 Related Work

实际上,可以探索传统的图像增强方法[8,13,19,21,30]来增强背光图像,但在大多数情况下其效果相当有限。还有一些专门为恢复背光图像而设计的启发式方法。在[22]中,Safonov 提出了一种基于对比度拉伸和初始图像亮度的 alpha 混合以及反射率估计的方法。在[25]中,Tsai和Yeh首先通过简单的亮度通道阈值检测背光区域,然后线性拉伸检测到的背光区域。李等人[15]通过引入四叉树生长和引导过滤来完善Tsai和Yeh的想法[11]。在[12]中,Im等人的方法首先使用暗通道先验[10]提取曝光不足的区域,然后执行空间自适应对比度增强。在[28]中,Yuan和Sun通过基于区域的区域级最佳曝光评估来估计图像特定的S曲线。他们将最佳区域估计表述为图标记问题,并通过强力搜索策略来解决它。后来,作者将他们的工作扩展到纠正曝光不良的视频序列 [6]。

背光图像恢复方法的另一个分支是基于机器学习理论。在[4]中,戴尔等人首先建立了一个包含100万张图像的数据库。给定要恢复的输入图像,他们的系统执行视觉搜索以查找数据库中最接近的图像;这些图像定义了输入的视觉上下文,可以进一步利用它来实例化恢复操作。在[14]中,Kang等人构建了一个数据库,其中存储描述训练图像的特征向量以及增强参数的向量。给定测试图像,然后在数据库中搜索最佳匹配图像,并使用相应的增强参数来执行增强。遵循 Kang 等人的想法 [14],Bychkovsky 等人[1] 构建了一个包含 5000 个示例输入输出图像对的数据集,可用于学习全局色调调整。在[16]中,Li和Wu提出了一种两阶段管道,它对背光和前光区域执行对象引导分割,然后进行空间自适应色调映射。

1.2 Our Motivations and Contributions

我们发现使用机器学习工具来解决背光图像恢复问题是最近的趋势,也是一个有前途的方向。然而,应该注意的是,该领域现有的解决方案[1,3,4,14,16,27]都是基于监督学习框架,因此它们的性能高度依赖于训练数据集。事实上,对于背光图像恢复问题,如何收集足够有效的训练数据本身就是一项具有挑战性的任务。因此,这些基于监督学习的方案通常在满足训练条件的测试图像上表现良好;相反,一旦这些条件不满足,它们的性能就会显着恶化。这促使我们思考:是否可以从逆光图像中学习曝光校正模型来恢复自身?如果“是”,学习的模型将是特定于图像的,并且该方法本身可以适应未见过图像的不同设置。实际上,仅从测试图像本身学习恢复模型的想法在图像超分辨率领域已被证明是可行的[23]。在[23]中,Shocher 等人提出了一种超分辨率模型,这是一种特定于图像的 CNN,仅在从低分辨率测试图像中提取的内部示例上进行训练。在处理现实世界的低分辨率图像时,Shocher 等人的方法大大优于其竞争对手。

因此,在本文中,受 Shocher 等人在超分辨率领域工作成功的启发,提出了一种用于背光图像恢复的“零样本”方案。 “零样本”一词是从识别领域借用的,这里用来强调我们的方法不需要事先的图像示例或事先的训练。我们的主要贡献总结如下。

(1)我们方法的核心是一个专门设计的CNN,即ExCNet(曝光校正网络)。给定测试背光图像 I,ExCNet 可以在有限的迭代时间内估计最适合 I 的参数“S 曲线”。凭借它的S曲线,I可以直接恢复。据我们所知,我们的工作是第一个自动校正图像曝光的无监督学习框架。它可以轻松应用于不同曝光级别下各种内容的图像。

(2)在设计ExCNet时,一个关键问题是如何设计一个可以评估图像曝光不良程度的损失函数。为此,在MRF(马尔可夫随机场)[17]公式的推动下,我们设计了一种基于块的损失函数,该函数倾向于最大化所有块的可见性,同时保持相邻块之间的相对差异。实验表明,设计的损失函数可以指导ExCNet获得高视觉质量的恢复结果。当多种竞争方法的结果呈现在他们面前时,人们更倾向于选择我们方法的输出。

(3)由于ExCNet的CNN结构,我们的方法可以学习图像与其最佳“S曲线”参数之间的映射关系。因此,随着处理图像的增加,ExCNet在面对未见过的图像时需要更少的迭代次数来收敛到优化曲线。此外,在处理视频流时,后续帧的校正可以由先前帧的参数来指导,这不会导致像[28]那样的明显的闪烁伪影,并且计算成本相对较低。

2 S-CURVE

大多数摄影师经常使用S形非线性曲线,即S曲线,通过照片编辑软件手动调整照片中阴影/中调/高光区域的曝光度[2]。 S 曲线可以将输入电平映射到所需的输出电平。典型的S曲线图如图2所示。图的横轴代表原始图像值,纵轴代表新的调整值。调整图像时,图表的右上区域代表高光,左下区域代表阴影。

正如[28]中所建议的,S曲线可以简单地用两个参数来参数化,即阴影量 \phi _{s}和高光量 \phi _{h} ,因此它可以表示为:

3 EXCNET: AN UNSUPERVISED CNN-BASED APPROACH TO ESTIMATE THE S-CURVE

这里详细介绍了我们提出的背光图像恢复方法 ExCNet。 ExCNet实际上是一个CNN,旨在从输入图像I的亮度通道I_{l}估计最佳S曲线。利用估计的S曲线,可以相应地恢复I。 ExCNet的结构如图3所示。为了更好地理解它,ExCNet的每次训练迭代在概念上可以被认为有两个阶段,使用中间S曲线调整I_{l}并导出损失。这两个阶段的详细内容将在 3.1 和3.2节给出。实施细节将在3.3给出。

3.1 Adjusting I_{l} Using the Intermediate S-curve

3.2 Deriving the Loss

3.3 Implementation Details

ExCNet 可以被认为是一种无监督学习方法。也就是说,在处理一些图像后,ExCNet可以逐步学习捕获图像色调信息的能力。当处理即将到来的图像时,这种预先训练的 ExCNet 的收敛速度比随机初始化的对应图像快得多。因此,在我们的实现中,我们准备了 50 张背光图像并使用 ExCNet 来估计它们的最佳 S 曲线。最终权重被保存并用于随后处理新图像时初始化 ExCNet。

4 BACK-LIT IMAGE RESTORATION USING EXCNET

值得一提的是,我们在实现中还考虑了细节保留。我们首先使用引导滤波器[11]将每个输入图像分离为基础层和细节层,然后使用估计的S曲线来调整基础层。最后,我们采用韦伯对比度[26]来融合细节层和调整后的基础层。

我们的硬件平台是一个配备 3.0GHZ Intel Core i7-5960X CPU 和 Nvidia Titan X GPU 卡的工作站。该方法使用Python和TensorFlow实现。我们的方法处理一张 4032 × 3024 图像大约需要 1.0 秒。

5 EXPERIMENTAL RESULTS

6 CONCLUSION

背光图像修复具有重要的实际意义,但尚未得到很好的解决。本文提出了一种“零样本”背光图像恢复方案,该方案利用深度学习的力量,无需依赖任何外部示例或事先训练。这是通过一个小型的特定于图像的 CNN(即 ExCNet)实现的,它通过最小化在中间恢复结果上定义的基于块的损失函数来指导恢复进度。所提出的方案简洁而强大。它非常稳健,因此可以在不同类型的照明条件下产生令人满意的结果。综合进行了主观和客观评估,以证实所提出的方法相对于其他主流竞争对手的优越性。据我们所知,这是第一个基于 CNN 的无监督背光图像恢复方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1234279.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从大模型到内容生成,初窥门径的AI新次元

视频云AI进化新纪元。 最近Gartner发布2024年十大战略技术趋势,AI显然成为其背后共同的主题。全民化的生成式人工智能、AI增强开发、智能应用......我们正在进入一个AI新纪元。 从ChatGPT的横空出世,到开发者大会的惊艳亮相,OpenAI以一己之力…

JVM--Java虚拟机

0. java代码的执行过程 了解Java虚拟机(JVM)首先需要了解一下一段Java代码的具体执行过程。 Java代码的具体执行过程如下: 执行 javac 命令编译源代码为字节码执行 java 命令,二进制字节码通过解释器翻译为机器码 创建 JVM&…

《QT从基础到进阶·三十五》QT插件实现侧边工具栏tabBar

tabBar是用QT插件实现的一个dll,对于插件的使用可以参考文章: 《QT从基础到进阶三十三》QT插件开发QtPlugin 源码放在文章末尾 该功能类似侧边工具栏,可以在该标签栏上添加自己开发的界面,实现代码如下: 1、所有功能…

【大数据分布并行处理】实验测试(一)

文章目录 测试任务1测试任务2测试任务3 测试任务1 使用HDFS相关命令完成下列四个操作(20分) 操作1:在HDFS根目录创建以自己名字命名的目录,并查看是否创建成功(5分)。 提示:截图包括&#xff…

目标检测 详解SSD原理,数据处理与复现

原理详解 前言 今天我们要读的这篇VGGNet(《Very Deep Convolutional Networks For Large-Scale Image Recognition》),就是在AlexNet基础上对深度对网络性能的影响做了进一步的探索。它是ImageNet 2014年亚军,相比于AlexNet&am…

智能车入门补充篇——电感值处理、转向控制与巡线

冒泡法 冒泡法是一种简单的排序算法,它重复地遍历要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。遍历数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。冒泡排序的时间复杂度为O(n^…

电脑上可以写便签的软件哪些界面比较可爱且好用?

电脑上可以安装使用的便签类软件比较多,在选择使用电脑便签软件时,很多人对便签的外观界面还是比较在意的,一个好看的便签界面在一方面可以引起大家的注意,另一方面可以增加电脑桌面背景和便签类软件的协调性。 电脑便签软件通常…

Web测试中文件上传测试

总体情况 1、功能实现: (1)文件类型正确、大小合适 (2)文件类型正确,大小不合适 (3)文件类型错误,大小合适 (4)文件类型和大小都合适&#x…

引迈-JNPF低代码项目技术栈介绍

从 2014 开始研发低代码前端渲染,到 2018 年开始研发后端低代码数据模型,发布了JNPF开发平台。 谨以此文针对 JNPF-JAVA-Cloud微服务 进行相关技术栈展示: 1. 项目前后端分离 前端采用Vue.js,这是一种流行的前端JavaScript框架&a…

风丘远程试验管理平台TFM 支持“一键式“数据管理和监控

随着信息技术的高速发展,企业对远程试验实时监控与数据管理的需求日益增强。而利用远程试验信息协同技术,可突破部门与地域的限制,并把试验现场的车辆状态信息、试验数据和分析结果实时传输给数据分析部门和设计部门等,从而缩短时…

SQL的连接join

一、连接说明 union、intersect等集合运算,它的特征是以 “行” 为单位进行操作,通俗点说,就是进行这些集合运算,会导致记录行数的增减,使用union会增加记录行数,使用 intersect 或 expect 会减少行记录&a…

印刷企业数字工厂管理系统建设方案

随着科技的飞速发展,传统印刷企业正面临着前所未有的挑战。产能短缺、质量控制不足、成本控制不力以及服务质量不高等问题成为了制约企业发展的瓶颈。为了解决这些问题,印刷企业需要积极拥抱数字化转型,构建数字工厂管理系统。 一、印刷企业数…

Figma 是什么软件?为什么能被Adobe收购

很多人一定早就听说过Figma的名字了。看到很多设计同行推荐,用了很久,疯狂的安利朋友用。是什么让这么多设计师放弃了FigmaSketch的魅力?下面的内容将详细分享一些与Figma相关的知识点,并介绍这个经常听到但不熟悉的工具。 Figma…

nacos鉴权报invalid username or password

操作 你得检查一下nacos的配置的数据库有没有缺少表,可以在下图找到nacos的官方的配置库: 然后注意到这个SQL文件的最后的两行,这两行就是插入默认的nacos的登录密码的,如果你设置了对应的配置的文件其实也是没有用的最后他还是…

最小最大表示法超详细讲解

文章目录 前言循环同构串最小表示法暴力解法暴力解法的可优化之处最小表示法的代码实现 最大表示法 前言 最小/最大表示法是用来找出字符串的最小/最大字典序的循环同构串的方法,其求解算法可以达到O(N),过程很像KMP算法的next数组推导过程,都…

k8s-pod管理 3

pod是可以创建和管理k8s 计算的最小可部署单元,一个pod 代表着集群中运行的一个进程,每个pod 都有一个唯一的ip pod包裹了容器 下载测试镜像 创建自主式的pod 查看创建的pod的详情信息 删除pod 创建控制器 副本过多,需要进行负载均衡减轻节点…

uniapp中实现圆形进度条的方式有哪些?

前言 在uniapp开发小程序或者apk时,页面需要用到一个圆形进度条(带文字和百分比的),自己也自定义过一个,但是有一点小问题,咱先展示如何引入插件市场的在介绍自定义的!一共四种,但是你需要考虑自…

G管螺纹尺寸对照表

G管螺纹尺寸对照表 NPT 是 National (American) Pipe Thread 的缩写,属于美国标准的 60 度锥管螺纹,用于北美地区.国家标准可查阅 GB/T12716-1991 PT 是 Pipe Thread 的缩写,是 55 度密封圆锥管螺纹,属惠氏螺纹家族&a…

视频剪辑技巧:如何高效地将多个视频合并成一个新视频

在视频制作过程中,将多个视频合并成一个新视频是一个常见的操作。这涉及到将多个片段组合在一起,或者将不同的视频素材进行混剪。无论是制作一部完整的影片,还是为社交媒体提供短视频,都要掌握如何高效地将多个视频合并。现在一起…

广州华锐互动:3D模拟体验火箭发射过程有什么教育意义?

3D虚拟还原火箭发射过程在教育领域有着深远的意义。它能够为学生提供直观、生动的体验,帮助他们更好地理解和掌握相关知识,激发他们对科技的兴趣和探索欲望。 首先,3D虚拟还原火箭发射过程可以帮助学生更好地理解和掌握航天科技知识。在火箭发…