reference based image enhancement 论文调研

news2024/11/27 8:29:57

Enhance Images as You Like with Unpaired Learning

在这里插入图片描述

  • 这是IJCAI 2021的文章
  • 文章提出一个条件GAN模型,用reference image作为条件,可以在unpaired images上训练暗图增强模型,使得增强结果根据reference image来调节色调亮度和对比度。训练的监督分为四部分,一个是以输入图片为条件时GAN生成的必须是输入图片,一个是增强结果和输入图片的空间相关性,一个是增强结果和参考图片的全局色调相关性,一个是GAN损失。
  • 网络结构图如下图所示,部分模块的名称没有统一。上面的self-Mod就是PSM,cond-Mod就是CCM。PSM就是Unet跳跃连接的结合方式,加了一些归一化的trick,而CCM就是用提取到的条件向量来改变特征图。
    在这里插入图片描述
    在这里插入图片描述
  • CCM用的公式如下,这个modulation code经过两层全连接后,预测出4个向量,对x进行操作,产生最后输出的m(x):
    在这里插入图片描述
  • 方法给出的实验结果如下:
    在这里插入图片描述
    在这里插入图片描述
  • 参数量是8915727。指标的实验结果文章声称是选不同的reference image进行测试,统计其PSNR的平均值和最小值得到的,但没有说明reference image的来源。
  • 总体来看,网络结构有点复杂,应用也没有进一步挖掘。

Exemplar‑guided low‑light image enhancement

在这里插入图片描述

  • 这是中科院4区期刊 Multimeia systems的一篇2022的论文,提出了一种用reference image来引导增强的方法,并且造了一个数据集,其实就是把LOL这样的成对图片,将GT进行一定的旋转/scale/padding操作,作为与GT不同的reference image,来引导暗图增强。结构如下图所示:
    在这里插入图片描述
  • 这里的AFS是类似注意力的机制
  • 实验结果如下图所示:
    在这里插入图片描述
  • 其实是一篇水文,读起来太折磨了,错漏百出

Enhancement by Your Aesthetic: An Intelligible Unsupervised Personalized Enhancer for Low-Light Images

在这里插入图片描述

  • 这是ACMMM2022的一篇文章。文章提出了一种基于reference image的增强方法。如下图所示:
    在这里插入图片描述
  • 方法将图片分解为L和R分量,提取refernece image的L分量的直方图来指导L分量的增强,提取input image和reference image的R分量的色度图的直方图和色饱和度图的直方图,计算input image 和reference image的这些直方图之间的相似度,作为全连接层的输入,预测系数来对R分量的增强网络的特征进行recale和bias,如下所示,其中miu和sigma是特征图自身的均值方差,可以看作是instance norm,而gamma和beta则是来自相似度的指导值
    在这里插入图片描述
  • 损失上,为了使得增强结果和ref image有相似性,添加了增强结果和ref image 的R分量的hue 和 saturation的直方图的L1损失
  • 下面的denoiseNet就是用了LLFlow中的方法对noise map进行估计,然后用上面一样的方法去算noise map的直方图的相似度,denoise 模块不是本次调研重点,就不展开了。
  • 实验结果如下,其中reference是从LOL FIiveK和ExDark随机选的(这就很奇怪了,为什么要在exdark里选reference image),然后取的是五折的平均结果
    在这里插入图片描述
  • 此外,提供了可调节色调、噪声水平、亮度、色饱和度的参数(其实就是把输入网络的相似度的那个值进行调整)

在这里插入图片描述

  • 总结:采用了基于直方图相似度进行reference的idea,并提供了基于相似度的可调节参数。随机reference的实验不太合理,psnr也不太高,没有验证与reference image的相似性的指标结果。采用了但分解和调制的方法进行的编辑。

StarEnhancer: Learning Real-Time and Style-Aware Image Enhancement

在这里插入图片描述

  • 这是ICCV 2021的论文。文章提出首先训练一个style classifier,然后去掉后面的分类层,用网络来提取style code,然后用一个全连接层把style code映射为网络中归一化层所用的参数,从而相似风格的图片有相似的style code,从而能产生面向不同风格聚类的各种各样的增强结果。
    在这里插入图片描述
    给出了在fivek上的实验结果,生成测试图片的时候用的是平均的style code(不过没说清楚是在什么数据集上的平均):
    在这里插入图片描述
  • 感觉很多实验细节没有完全交代。总体看还是像personalized image enhancement,不过可以给定一张用户喜好的图片,提取其style code,用于进行enhancement,并不是很强调reference image。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/969088.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis事务为什么不支持回滚

Redis事务中过程中的错误分类两类: 在exec执行之前的错误,这种错误通常是指令错误,比如指令语法错误、内存不足等... --> 在开始事务后,传输指令时,遇到这种错误,Redis会给出Error错误提示,…

【多线程案例】定时器应用及实现

文章目录 1. 定时器是什么?2. 定时器的应用3. 自己实现定时器 1. 定时器是什么? 定时器就类似生活中的闹钟,它是软件开发中的一个重要组件。当有些线程我们并不希望它立刻执行,这个时候我们就可以使用定时器,规定线程在…

苹果iPhone15系列不再使用皮革保护壳?“FineWoven“官方认证替代

根据9月3日的报道,苹果即将推出的iPhone 15系列将不再使用皮革保护壳,取而代之的将是一种名为"FineWoven"的新材料编织工艺保护壳。 这种保护壳将有十种颜色可供选择,包括黑色、桑葚色、灰褐色、常绿色、太平洋蓝色、紫藤色、古白色…

Elasticsearch安装,Springboot整合Elasticsearch详细教程

Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎,能够实现近乎实时的搜索。 Elasticsearch官网https://www.elastic.co/cn/ 目录 第一步:下载Elasticsearch 下载7.6.2版本 下载其他版本 第二步:安装Elasticsearch 第三…

【Spring+SpringMVC+Mybatis】SSM框架的整合、思想、工作原理和优缺点的略微讲解

🚀欢迎来到本文🚀 🍉个人简介:陈童学哦,目前学习C/C、算法、Python、Java等方向,一个正在慢慢前行的普通人。 🏀系列专栏:陈童学的日记 💡其他专栏:CSTL&…

Redis布隆过滤器原理

其实布隆过滤器本质上要解决的问题,就是防止很多没有意义的、恶意的请求穿透Redis(因为Redis中没有数据)直接打入到DB。它是Redis中的一个modules,其实可以理解为一个插件,用来拓展实现额外的功能。 可以简单理解布隆…

2.(Python数模)(优化模型一)线性规划问题

Python解决线性规划问题 参考了以下博文 https://blog.csdn.net/m0_46692607/article/details/126784109?spm1001.2014.3001.5506 目标是解决以下的线性规划,程序计算出目标函数的最大值,并在最大值下取得的x1x2x3对应值。 源代码如下: …

Android studio 实现生成二维码和扫描二维码

效果图 build.gradle(:app)添加依赖 dependencies {implementation com.google.zxing:core:3.3.3implementation com.journeyapps:zxing-android-embedded:3.6.0implementation com.google.zxing:javase:3.0.0 }Manifests.xml <uses-permission android:name"android…

SceneXplain 图片叙事升级:如何让图片听得到

‍SceneXplain 是一个由多模态 AI 驱动的产品服务&#xff0c;它不仅 提供一流的图像和视频标注解决方案&#xff0c;还具备卓越的多模态视觉问答能力&#xff0c;为用户解锁视觉内容的全新维度。 在《图像描述算法排位赛》中&#xff0c;我们探讨了图像描述&#xff08;Image …

DSSM实战中文文本匹配任务

引言 本文我们通过DSSM模型来完成中文文本匹配任务&#xff0c;其中包含了文本匹配任务的一般套路&#xff0c;后续只需要修改实现的模型。 数据准备 数据准备包括 构建词表(Vocabulary)构建数据集(Dataset) 本次用的是LCQMC通用领域问题匹配数据集&#xff0c;它已经分好…

利用 GNU Radio + HackRF 做 FM 收音机

比特的打包与解包 GNU Radio 系列教程&#xff08;四&#xff09;&#xff0d;&#xff0d; 比特的打包与解包_哔哩哔哩_bilibili SDR 教程 —— 利用 GNU Radio HackRF 做 FM 收音机_哔哩哔哩_bilibili

Nginx+keepalived实现高可用项目实战

一、环境搭建 此次项目准备四台虚拟机&#xff1a; 防火墙关闭 安装好nginx&#xff08;一台master,一台back&#xff0c;两台Web服务器&#xff09; ip:(根据自己的进行搭建) 192.168.85.128(master) 192.168.85.129(back) 192.168.85.132(web1) 192.168.85.133(web2)…

排序算法问题

给你一个整数数组 nums&#xff0c;请你将该数组升序排列。 示例 1&#xff1a; 输入&#xff1a;nums [5,2,3,1] 输出&#xff1a;[1,2,3,5] 示例 2&#xff1a; 输入&#xff1a;nums [5,1,1,2,0,0] 输出&#xff1a;[0,0,1,1,2,5] 代码如下&#xff1a; 1.插入排序(简…

Python 中轻松实现串口通信

迷途小书童的 Note 读完需要 3分钟 速读仅需 1 分钟 1 简介 pyserial 是一个 Python 库&#xff0c;它可以让您轻松地与串行端口进行通信。它支持多种操作系统&#xff0c;包括 Windows、Linux 和 macOS。pyserial 模块非常易于使用&#xff0c;并且提供了许多有用的功能。 2 实…

数学建模--二次规划型的求解的Python实现

目录 1.算法流程简介 2.算法核心代码 3.算法效果展示 1.算法流程简介 #二次规划模型 #二次规划我们需要用到函数:Cvxopt.solvers.qp(P,q,G,h,A,b) #首先解决二次规划问题和解决线性规划问题的流程差不多 """ 求解思路如下: 1.针对给定的代求式,转化成标准式…

8.(Python数模)(预测模型一)马尔科夫链预测

Python实现马尔科夫链预测 马尔科夫链原理 马尔科夫链是一种进行预测的方法&#xff0c;常用于系统未来时刻情况只和现在有关&#xff0c;而与过去无关。 用下面这个例子来讲述马尔科夫链。 如何预测下一时刻计算机发生故障的概率&#xff1f; 当前状态只存在0&#xff08;故…

数学建模--最短路径算法的Python实现

目录 1.算法流程简介 2.算法核心代码 3.算法效果展示 1.算法流程简介 #最短路径算法 #针对有向图的最短路径问题,我们有很多的算法能解决. """ 目前主流算法如下所示: Dijkstra算法:Dijkstra算法是一种单源最短路径算法,用于计算从起点到其它所有节点的最短…

VIRTIO-BLK代码分析(0)概述

也无风雨也无晴。- 苏轼&#xff08;宋&#xff09; 接下来介绍VIRTIO相关内容。首先从VIRTIO-BLK开始分析&#xff0c;VIRTIO-BLK各部分交互图如下所示&#xff1a; 这里包含以下几个部分&#xff1a; Guest UserSpace&#xff1a;虚拟机用户空间&#xff0c;如虚拟机中运行f…

Unity中Shader的混合模式Blend

文章目录 前言一、混合的作用就是实现各种半透明效果二、混合操作三、在 Shader 中暴露两个属性 来调节 混合的效果 前言 Unity中Shader的混合模式Blend 一、混合的作用就是实现各种半透明效果 这里用PS里的混合作为例子 没选择混合效果前&#xff0c;显示的效果是这样 选择…