image adaptive 3dlut based on deep learning

news2024/10/5 16:24:04

文章目录

    • image adaptive 3dlut based on deep learning
      • 1. Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time
      • 2. CLUT-Net: Learning Adaptively Compressed Representations of 3DLUTs for Lightweight Image Enhancement
        • 2.1 3dlut分析
        • 2.2 具体方法
        • 2.3 主要原理
        • 2.4 实验结果
      • 3. 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement
      • 4. RSFNet A White-Box Image Retouching Approach using Region-Specific Color Filters
        • 4.1 选择10个图像处理方法(或者叫做filter)
        • 4.2 预测每个filter的参数
      • 5. Flexible Piecewise Curves Estimation for Photo Enhancement
        • 5.1 什么是PNG curve
        • 5.2 网络结构
        • 5.3 Spatial-Adaptive Confidence Map Fusion
      • 6. Neural Color Operators for Sequential Image Retouching
        • 6.1 NOP (neural color operators)
        • 6.2 strength predictor就是一个小网络预测 三个 NOP 的强度。
      • 7. AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement
      • 8. SepLUT: Separable Image-adaptive Lookup Tables for Real-time Image Enhancement

image adaptive 3dlut based on deep learning

1. Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time

在这里插入图片描述

图像输入一个卷积网络输出3个weight,
初始化3个3dlut

weight 和 3dlut 合成为一个,然后三线性插值得到 pred, 与target建立损失。

2. CLUT-Net: Learning Adaptively Compressed Representations of 3DLUTs for Lightweight Image Enhancement

2.1 3dlut分析

Given a specific color channel 𝑐 where 𝑐 ∈ {𝑟, 𝑔, 𝑏} and the other two channels denoted by 𝑥
and 𝑦, we find that the output value 3Dlut(𝑐) is strongly correlated to the input value of channel 𝑐 while weakly correlated to the input values 𝑥𝑖𝑛, 𝑦𝑖𝑛 of channel 𝑥 and 𝑦, respectively.

意思是R 通道的3Dlut 与R相关性更大, 与GB通道相关性小
G 通道的3Dlut 与R相关性更大, 与RB通道相关性小
B 通道的3Dlut 与R相关性更大, 与RG通道相关性小

因此,对于R通道的3Dlut, 原本是 17 * 17 * 17 个节点, 作者替换为 S * W
请添加图片描述

2.2 具体方法

主要是 矩阵分解的思想, 然后再重建
重建:
在这里插入图片描述

由两个矩阵 Ms, Mw, 压缩后的Clut 重建为原始 3dlut

2.3 主要原理

在这里插入图片描述

主要是对3dlut进行压缩处理,降低参数量,提高效率。

首先同样是 学习得到 weight 和 basis Cluts。
然后还有两个矩阵需要学习得到。一共这三个模块

其中bisis Cluts和两个矩阵 Ms, Mw在推理阶段是不变化的。

2.4 实验结果

FiveK: PSNR, SSIM, deltaE 三种评价标准
在这里插入图片描述

3. 4D LUT: Learnable Context-Aware 4D Lookup Table for Image Enhancement

在这里插入图片描述

4D lut: 输入r,g,b,context 输出r,g,b
增加一个图像内容context map : achieve content-dependent image enhancement
在这里插入图片描述

原理和3dlut类似, 框架如下很容易明白:

学习 weight, bisis 4dluts, context map

本来生成的3dlut就是image-adaptive,因为weight是每个图像都不同的。 这篇论文又多一个维度说是content map, 这样效果就有提升?

作者实验确实有提升,而且context map越大的地方相比3dlut提升越好:
在这里插入图片描述

4. RSFNet A White-Box Image Retouching Approach using Region-Specific Color Filters

4.1 选择10个图像处理方法(或者叫做filter)

We select 10 commonly used retouching filters from traditional tools(e.g., Davinci Resolve)
to represent adjustment manipulations, including contrast,
saturation, hue, temperature, shadows, midtones, highlights
and shift.

4.2 预测每个filter的参数

比如 亮度 ±, 饱和度±

在这里插入图片描述

h-map 预测 K 个 map
h-arg 为每个map 预测 N 个filter的参数

然后每个map,N个filter 调整后,得到 K 个 image
K个image 加权融合,再shift得到最终的output

在这里插入图片描述

5. Flexible Piecewise Curves Estimation for Photo Enhancement

5.1 什么是PNG curve

在这里插入图片描述

就是一个分段函数,每一段都是非线性的。

一个PNG curve可以有 knot节点,和非线性的参数 得到。
然后就得到了一个1D lut曲线。

其实有点麻烦,直接预测1D lut就可以呀。

5.2 网络结构

主要原理如下:
在这里插入图片描述

其中MT net: 预测 knot , parameter, 这两个构成 global look up table

然后还有 confidence map, 用于local adjust
在这里插入图片描述

5.3 Spatial-Adaptive Confidence Map Fusion

3个global 调整后的图像,与 3个confidence map 加权就是 final output

在这里插入图片描述

6. Neural Color Operators for Sequential Image Retouching

和 RSFNet A White-Box Image Retouching Approach using Region-Specific Color Filters
思想类似,方法不同。

6.1 NOP (neural color operators)

这里是 利用NOP模仿 传统图像操作方法,文中模仿的是 black clipping, exposure, and vibrance in Lightroom.
通过优化的方法模仿:首先制作 三种方法的图像,然后训练:
在这里插入图片描述

模仿后NOP就有了,其实是初始化,后面训练的时候仍然会被更新。

6.2 strength predictor就是一个小网络预测 三个 NOP 的强度。

最终训练和网络架构如下:
在这里插入图片描述

7. AdaInt: Learning Adaptive Intervals for 3D Lookup Tables on Real-time Image Enhancement

用一张图说一下它的原理:
相比与之前的3dlut, 多了一个 position 预测, 就是以前的3dlut都是均匀的坐标分布,这里分别为RGB三个通道预测 采样的坐标位置。

原因是啥呢? 因为一个图像可能只覆盖一小部分3dlut, 浪费了很多信息。 而通过non-uniform 3dlut可以更精细的处理图像。

在这里插入图片描述

8. SepLUT: Separable Image-adaptive Lookup Tables for Real-time Image Enhancement

这个相比与3dlut 多了 r,g,b 的1D lut.

在这里插入图片描述

代码中 1dlut和 3dlut的表示相比于Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time 更简单优秀, 3dlut直接利用fc的weight来表示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/514926.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

平安大视野解读主动健康:以运动改变生命轨迹,以名医权益为健康保驾护航

“每个人都会老,这不可避免,但是能不能老的迟一点?让我们能够活到一百岁还能够运动,不需要别人照顾,这是最大的成功;而科学运动是最关键的方式。”5月6日,在平安私人银行联合平安健康举办的“平…

Echarts使用本地JSON文件加载不出图表的解决方法以及Jquery访问本地JSON文件跨域的解决方法

前言 最近需要做一个大屏展示,需要用原生html5cssjs来写,所以去学了一下echarts的使用。在使用的过程中难免碰到许多BUG,百度那是必不可少的,可是这些人写的牛头不对马嘴,简直是标题党一大堆,令我作呕&…

使用pytest和allure框架实现自动化测试报告优化

目录 -x出现一条测试用例失败就退出测试 生成测试报告json pytest: 需要安装pytest和pytest-html(生成html测试报告) pip install pytest 和 pip install pytest-html 命名规则 Pytest单元测试中的类名和方法名必须是以test开头,执行中只能找到test开头…

DeepLab v1

SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS 基于深度卷积网络和全连通CRFS的语义图像分割 ABSTRACT 深度卷积神经网络(DCNNs)最近在高级视觉任务中表现出了最新的性能,如图像分类和物体检测。这…

Docker | docker安装MySQL

知识目录 一、前言二、安装Docker镜像2.1 什么是docker2.2 为什么安装docker2.3 安装docker 三、Docker安装MySQL3.1 常用docker命令3.2 docker安装MySQL 四、结语 一、前言 大家好!这篇文章主要讲解 如何在Centos7中安装Docker以及Docker安装MySQL:5.7.42 。 ✨本…

深度学习模型复杂度评估(时间复杂度、空间复杂度)

目录 1、两个指标 2、复杂度对模型的影响 1、两个指标 时间复杂度和空间复杂度是衡量一个算法的两个重要指标,用于表示算法的最差状态所需的时间增长量和所需辅助空间. 在深度学习神经网络模型中我们也通过: 计算量/FLOPS(时间复杂度)即…

VS Code 常用插件推荐

VS Code 常用插件推荐 1. Chinese (Simplified) (简体中文) Language Pack for Visual Studio Code 适用于 VS Code 的中文(简体)语言包 2. Auto Rename Tag 自动关闭标签,写 html 标签的时候可以重命名标签名。 现在 vscode 已经内置了&…

大项目内训 2023.5.11

目录 分别介绍一下消息处理相关的MQ、WebSocket、分布式事务 介绍一下异步消息传输 如何配置websocket ​编辑 oatpp是什么? cinatra是什么? 我们教育最大的缺失, 是缺乏阅读、写作和逻辑训练 佳作推荐 分别介绍一下消息处理相关的MQ、WebSocket、…

CTF-PWN学习-为缺少指导的同学而生

很抱歉,博主也是个PWN的入门者。PWN的入门不可能是无痛的。能做到的只是减少一点初学者的痛苦。这篇博客会长期维护,也会越来越好。后期还可能会在B站出视频(博主社恐,要迈出这一步可能需要好长时间)。 PWN是个啥&…

QT + OpenGL + FFmpeg写的一个全景视频播放器

临时被分配了一个任务 写一个C版本的全景视频播放器 网上搜了搜 基于前辈的基础上 写的差不多了 测试视频源是用ffmpeg拉RTSP的流 最终是要嵌入到别的一个视频播放器模块 所以解码这块我不用太关注 只要实现渲染就可以了 效果如下 左边的窗口用于输入视频源 以及显示…

dtb展开成device_node

dtb展开成device_node 文章目录 dtb展开成device_node设备树是如何传递给内核的?设备树相关结构体举例of操作函数与查找节点有关的 OF 函数1、of_find_node_by_name 函数2、of_find_node_by_type 函数3、of_find_compatible_node 函数4、of_find_matching_node_and_…

5个PPT素材、模板网站,免费下载,赶紧马住了~

推荐几个可以免费下载PPT素材的网站,建议收藏! 1、菜鸟图库 https://www.sucai999.com/search/ppt/0_0_0_1.html?vNTYwNDUx 菜鸟图库网有非常丰富的免费素材,像设计类、办公类、自媒体类等素材都很丰富。PPT模板种类很多,全部都…

Unity 坐标系

一、左手坐标系与右手坐标系 常见的三维软件都采用笛卡尔坐标系,也就是常见的xyz轴坐标系。笛卡尔坐标系可以是左手坐标系也可以是右手坐标系,如下图所示 两种坐标系是镜像对称的。而Unity采用左手系,且xyz轴的默认方向与图中的左手系完全一…

Java【网络编程1】什么是 TCP/IP 五层模型? 数据传输的封装和分用?

文章目录 前言一、网络协议分层二、数据的网络传输1, 封装2, 分用3, 实际情况 总结 前言 📕各位读者好, 我是小陈, 这是我的个人主页 📗小陈还在持续努力学习编程, 努力通过博客输出所学知识 📘如果本篇对你有帮助, 烦请点赞关注支持一波, 感…

Python+Selenium入门级自动化测试脚本编写

一、安装Selenium 安装selenium有三种方式,主要有python下的pip命令安装或者是直接下载安装包进行安装本地文件夹以及直接用pycharm直接安装相应的selenium版本。推荐使用pycharm直接配置安装相应selenium版本(此办法比pip更好用,且不用担心报…

大数据 | (六)Hadoop集群启停脚本

知识目录 一、前言二、Hadoop集群启停脚本2.1 启停脚本及其背景2.2 使用方法 三、jps脚本四、关机脚本五、结语 一、前言 hello,大家好!这篇文章是我在使用Hadoop集群时使用到的启停脚本的详细内容与感想,希望能帮助到大家! 本篇…

【ENVI】SEBS模型计算蒸散发

详细内容请关注微信公众号:夫也的笔记 #01. ENVI软件SEBS插件介绍 ENVI是利用一种能够提供完整图像处理的功能强大的结构性程序设计语言,ENVI的运行需要IDL的支持,IDL可以为数据的交互式分析和可视化提供一个计算环境,在IDL开发环…

【数据库】SQL Server2022安装教程

大家好,我是雷工! 最近需要安装SQLServer数据库,此次安装的是sql_server_2022_developer版本,以下记录安装及配置过程。大家可以参考指正。 一、安装SQL Server步骤: 1、官网下载 SQL Server 2022 Developer。 2、打…

【逆向】PE文件解析

文章目录 PE文件DOS头部PE/NT头解析区段头/区块表解析数据目录表(存放在某个区段)1. 导出表2. 导入表3. 重定位表 PE文件 PE文件:PE文件是在windows平台可执行的文件。包括:.exe(可执行程序),.…

20230511干掉CV1826的buildroot系统的串口用户名和密码root

20230511干掉CV1826的buildroot系统的串口用户名和密码root 2023/5/11 11:56 https://blog.csdn.net/u011342132/article/details/126116391 buildroot跳过密码登录 1、全新原始编译: rootrootrootroot-X99-Turbo:~$ rootrootrootroot-X99-Turbo:~$ cd smartpen/ r…