ECCV 2024前沿科技速递:GLARE-基于生成潜在特征的码本检索点亮低光世界,低光环境也能拍出明亮大片!

news2024/9/22 1:26:00

在计算机视觉与图像处理领域,低光照条件下的图像增强一直是一个极具挑战性的难题。暗淡的光线不仅限制了图像的细节表现,还常常引入噪声和失真,极大地影响了图像的质量和可用性。然而,随着ECCV 2024(欧洲计算机视觉会议)的盛大召开,一项名为GLARE的创新技术横空出世,为低光图像增强带来了前所未有的突破。

GLARE是一种新型的基于生成式隐层特征的码本检索的低光照增强网络,大量实验证明GLARE在多个基准数据集和真实数据上的卓越性能,以及GLARE在低光照目标检测任务中的有效性进一步验证了其在高层次视觉应用中的适用性。

(a)在LOL数据集上眩光显著优于SOTA方法。

(b)GLARE可以在LOL(上)和真实世界(下)图像上生成吸引人的结果。

相关链接

论文地址:https://arxiv.org/pdf/2407.12431

代码地址:https://github.com/LowLevelAI/GLARE

论文阅读

GLARE:通过基于生成潜在特征的码本检索进行低光图像增强

摘要

大多数现有的低光图像增强 (LLIE) 方法要么直接将低光 (LL) 映射到正常光 (NL) 图像,要么使用语义或照明图作为指导。然而,LLIE 的病态性质和从受损输入中进行语义检索的难度限制了这些方法,尤其是在极低光照条件下。

为了解决这个问题,我们通过基于生成性潜在特征的码本检索 (GLARE) 提出了一种新的 LLIE 网络,其中使用矢量量化 (VQ) 策略从未退化的 NL 图像中得出码本先验。更重要的是,我们开发了一个生成性可逆潜在正则化流 (I-LNF) 模块来将 LL 特征分布与 NL 潜在表示对齐,从而保证码本中的正确代码检索。此外,我们还设计了一种新颖的自适应特征转换 (AFT) 模块,该模块具有可供用户调整的功能,包括自适应混合块 (AMB) 和双解码器架构,可进一步提高保真度,同时保留码本先验提供的真实细节。

大量实验证实了 GLARE 在各种基准数据集和真实数据上的卓越性能。它作为低光物体检测任务中的预处理工具的有效性进一步验证了 GLARE 适用于高级视觉应用。

方法

除了引入外部 NL 码本来指导低光到正常光 (LL-NL) 映射之外,我们工作的创新之处还在于独特的可逆潜在归一化流 (I-LNF) 和自适应特征变换 (AFT) 模块,它们旨在最大限度地发挥 NL 码本先验的潜力并生成高保真度的真实结果。方法概览上图所示,训练可分为三个阶段。

  • 在第一阶段,我们在数千张清晰的 NL 图像上对 VQGAN 进行预训练,以构建全面的 VQ 码本。

  • 在第二阶段,利用 LL-NL 对训练 I-LNF 模块,实现 LL 和 NL 特征之间的分布变换。

  • 在第三阶段,使用包含固定 NL 解码器 (NLD)、自适应混合块 (AMB) 和多尺度融合解码器 (MFD) 的 AFT 模块来增强细粒度细节,同时保持码本带来的自然度。

效果

LOL、LOL-v2-real、LOL-v2-synthetic、SDSD-indoor和SDSD-outdoor数据集的定量比较。与目前的SOTA方法相比,我们的GLARE实现了卓越的性能。

基于LOL数据集的视觉比较。我们的方法可以有效地增强可见性,并产生具有视觉吸引力的结果。

llo-v2-real(上)和llo-v2-synthetic(下)数据集的视觉比较。以前的方法遭受严重的色彩失真或细节不足,而我们的眩光表现良好,没有这些问题。

对真实世界数据集的定量比较。这些结果可以从原始论文中获得,也可以使用其最佳LOL权重进行测试。↓:值越小表示质量越好。

对未配对的真实数据集进行跨数据集评估的可视化结果。这四幅图像分别来自DICM、LIME、MEF和NPE。我们的眩光产生更令人愉快的结果,没有噪音或伪影。

AFT对lol的目视消融结果。我们的带有AFT模块的眩光能够生成具有改进的边缘敏锐度和轮廓清晰度的结果,以及更丰富的细节纹理。

消融实验

ExDark数据集上基于增强的低光目标检测视觉对比与检测结果以往的增强方法在使用预处理模块进行对象检测时,都会遇到对象丢失的问题。相比之下,利用我们的眩光增强的图像使YOLO-v3能够以高置信度健壮地检测目标,并且我们增强的图像具有更好的视觉质量。

结论

针对低光照增强-LLIE,提出了一种名为 GLARE 的新方法。鉴于 LLIE 的不适定性所导致的不确定性和模糊性,我们利用使用 VQGAN 从清晰且曝光良好的图像中获得的正常光照码本来指导 LL-NL 映射。为了更好地挖掘码本先验的潜力,采用可逆潜在归一化流来生成与 NL 潜在表示对齐的 LL 特征,以最大化码向量在码本中正确匹配的概率。最后,引入具有双解码器架构的 AFT 模块,灵活地将信息提供给解码过程,从而进一步提高增强结果的保真度,同时保持感知质量。大量实验表明,我们的 GLARE 在 5 个配对数据集和 4 个真实世界数据集上的表现明显优于当前的 SOTA 方法。在低光物体检测方面的卓越性能使我们的 GLARE 成为高级视觉任务中的有效预处理工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1964873.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

form表单按钮根据编辑/只读状态显示和隐藏

1. 场景阐述: form表单自定义按钮,在编辑模式显示,在只读模式隐藏 2. 效果: 这里的保存按钮是自定义按钮,在编辑状态的时候显示,非编辑状态下隐藏 3. 解决方案: 如下所示,只需要在按钮中添加odoo自带class类oe_edit_only即可 <header><button type"object"…

桌面管理利器:2024年度待办事项工具评选

国内外主流的10款待办事项桌面工具对比&#xff1a;PingCode、Worktile、滴答清单、番茄ToDo、Teambition、Tower、有道云笔记、TickTick、Any.do、Trello。 在忙碌的工作日中&#xff0c;管理日常任务和待办事项常常让人感到不胜其烦。选择合适的待办事项桌面工具&#xff0c;…

【Python实战因果推断】67_图因果模型2

目录 Are Consultants Worth It? Crash Course in Graphical Models Chains Are Consultants Worth It? 为了展示有向无环图(DAG)的力量&#xff0c;让我们考虑一个更有趣但处理因素并未随机化的情况。假设你是某公司的经理&#xff0c;正在考虑是否聘请顶级咨询顾问。你…

[数据结构] AVL树 模拟实现AVL树

标题&#xff1a;[数据结构] AVL树 && 模拟实现AVL树 水墨不写bug 正文开始&#xff1a; 目录 &#xff08;一&#xff09;普通二叉搜索树的痛点 &#xff08;二&#xff09;AVL树简介 &#xff08;1&#xff09;AVL树的概念 &#xff08;三&#xff09;AVL树的…

LeetCode面试150——189轮转数组

题目难度&#xff1a;中等 默认优化目标&#xff1a;最小化平均时间复杂度。 Python默认为Python3。 目录 1 题目描述 2 题目解析 3 算法原理及程序实现 3.1 暴力求解 3.2 循环链表 3.3 环状替代 3.4 数组翻转 4 题目难度 参考文献 1 题目描述 给定一个整数数组 nu…

运维.Linux.bash学习笔记.数组及其使用

运维专题 Bash Shell数组及其使用 此笔记当前仍在修改和编写。 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite&#xff1a;http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:http…

基于N32L406+Freertos+letter_shell终端开源库移植

移植教程 这里首先感谢作者的开源 https://gitee.com/zhang-ge/letter-shell) [Letter shell 3.0 全新出发 | Letter (nevermindzzt.github.io)](https://nevermindzzt.github.io/2020/01/19/Letter shell 3.0全新出发/) 1.复制代码 将litter_shell文件夹中的所有文件复制到…

本地使用Git同步、配合Gitee同步至仓库并下拉到本地(亲手调试,全能跑通)

这几天在公司&#xff0c;同事都在使用Gitee上传项目&#xff0c;进行同步&#xff0c;我也进行了简单学习了解了一下版本控制软件Git&#xff0c;挺不错的&#xff0c;故写个笔记记录一下。 本篇博文主要涉及的内容&#xff1a; 1&#xff0c;本地写代码&#xff0c;通过Git同…

软件测试_接口测试面试题

接口测试是软件测试中的重要环节&#xff0c;它主要验证系统不同模块之间的通信和数据交互是否正常。在软件开发过程中&#xff0c;各个模块之间的接口是实现功能的关键要素&#xff0c;因此对接口进行全面而准确的测试是确保系统稳定性和可靠性的关键步骤。 接口测试的核心目…

树上dp学习总结2

今天也是侥幸刷了两道树上dp的问题&#xff0c;第一个还算简单&#xff0c;但是第二个真的可以说是我碰到的蓝题之首&#xff0c;做了一个晚上我只能留下了不争气的口水&#xff08;太饿了&#xff0c;该吃夜宵了&#xff09; P1131 [ZJOI2007] 时态同步 思路&#xff1a;一开…

RK3568笔记四十九:W25Q64驱动开发(硬件SPI1)

若该文为原创文章&#xff0c;转载请注明原文出处。 一、SPI介绍 串行外设接口 (Serial Peripheral interface) 简称 SPI&#xff0c;是一种高速的&#xff0c;全双工&#xff0c;同步的通信总线&#xff0c;并 且在芯片的管脚上只占用四根线&#xff0c;节约了芯片的管脚。 …

Word如何设置表格内容的中文和英文字体

1、选中需要设置的表格内容。 2、CtrlD&#xff0c;分别设置中文和英文字体&#xff0c;点确定即可。 提升自己最好的方法就是改变坏习惯&#xff0c;改变坏习惯最好的方法找习惯替代它。坏习惯不改&#xff0c;你永远受到限制&#xff0c;只能原地踏步。To do list&#xf…

爬取指定的天气网站数据

目 录 一、引言 &#xff08;一&#xff09;项目背景 &#xff08;二&#xff09;目标与意义 二、数据获取与处理 &#xff08;一&#xff09;使用的库和模块 &#xff08;二&#xff09;获取天气信息的函数 &#xff08;三&#xff09;数据预处理 三、数据分析…

python np.max怎么用

python np.max的用法&#xff1a; 语法&#xff1a;np.max&#xff1a;(a, axisNone, outNone, keepdimsFalse) 求序列的最值&#xff1b; 最少接收一个参数&#xff1b; axis&#xff1a;默认为列向&#xff08;也即 axis0&#xff09;&#xff0c;axis 1 时为行方向的最…

SQL labs-SQL注入(七,sqlmap对于post传参方式的注入,2)

本文仅作为学习参考使用&#xff0c;本文作者对任何使用本文进行渗透攻击破坏不负任何责任。参考&#xff1a;SQL注入之Header注入_sqlmap header注入-CSDN博客 序言&#xff1a; 本文主要讲解基于SQL labs靶场&#xff0c;sqlmap工具进行的post传参方式的SQL注入&#xff0c…

如何利用大语言模型进行半监督医学图像分割?这篇文章给出了答案

PS&#xff1a;写在前面&#xff0c;近期感谢很多小伙伴关注到我写的论文解读&#xff0c;我也会持续更新吖~同时希望大家多多支持本人的公主号~ 想了解更多医学图像论文资料请移步公主&#x1f478;号哦~~~后期将持续更新&#xff01;&#xff01; 关注我&#xff0c;让我们一…

大模型时代,编程已成为当代大中专学生的必备技能,如何选择编程语言的一些建议

目录 一、具体建议 1. 确定学习目标 &#xff08;1&#xff09;兴趣驱动 &#xff08;2&#xff09;职业规划 2. 评估市场需求 &#xff08;1&#xff09;行业趋势 &#xff08;2&#xff09;就业前景 3. 考虑应用领域 4. 学习资源 &#xff08;1&#xff09;查看官方文档…

idea 常用的快捷键大全 建议收藏!!

IDEA 一款非常优秀的开发工具&#xff0c;本篇博客总结一些在 IDEA 中常用的快捷键&#xff0c;旨在提高开发效率。点击File --> Settings --> keymap便可进入看到 IDEA 提供的快捷键&#xff0c;我们也可以搜索和自定义所有快捷键。下面给出的是IDEA常用操作归纳。 1、…

RK3568平台(触摸篇)串口触摸屏

一.什么是串口屏 串口屏&#xff0c;可组态方式二次开发的智能串口控制显示屏&#xff0c;是指带有串口通信的TFT彩色液晶屏显示控制模组。利用显示屏显示相关数据&#xff0c;通过触摸屏、按键、鼠标等输入单元写入参数或者输入操作指令&#xff0c;进而实现用户与机器进行信…