【HDR】Deep high dynamic range imaging of dynamic scenes

news2024/12/23 13:11:58

文章目录

  • 一、贡献
  • 二、数据集构建
  • 三、算法框架
    • 3.1 对齐模块
    • 3.2 合成模块
    • 3.3 损失函数
  • 四、实验

一、贡献

Paper: Deep high dynamic range imaging of dynamic scenes
Code:https://github.com/TH3CHARLie/deep-high-dynamic-range

  • 首次提出使用机器学习方法从一组包围曝光的LDR图像中重建HDR图像
  • 构建了第一个适合于学习HDR重建的数据集,并详细介绍了构建方法

二、数据集构建

  • 数据采集:
    ① 人物静止,拍摄三张不同曝光下的LDR图像,按照曝光时间依次为短帧、中间帧和长帧,用于合成ground truth;
    ② 人物运动,再拍摄与①中曝光时间相同的三张LDR图像,并将中间帧替换为静止场景的中间帧,作为运动场景的参考帧。
    在这里插入图片描述
  • ground truth合成方法
    借鉴经典的Devebec合成算法,使用三角形函数计算三张LDR图像的权重(结合图和公式理解)。简单解释一下,短帧只用参考帧中像素值大于0.5的部分,越接近1权重越大;长帧只用参考帧中小于0.5的部分,越接近0权重越大;参考帧中越接近0.5权重越大,越接近0和1权重越小。
    在这里插入图片描述
    在这里插入图片描述
    得到权重 α j \alpha_j αj后,使用下式合成ground truth:
    在这里插入图片描述
  • 数据扩充
    采用颜色通道交换、几何变换的方式对数据进行增强,然后以20的步长将图像裁剪为多个40×40的patch。

三、算法框架

在这里插入图片描述
算法的两个关键模块为:①对齐模块;②合成模块。

3.1 对齐模块

对齐模块是采用光流法将短帧、长帧与参考帧对齐。输入为原始的短帧、参考帧和长帧,输出为与参考帧对齐后的短帧、长帧以及原始的参考帧。

由于光流法需要亮度恒定才能取得好的效果,所以在对齐短帧和参考帧之前需要将短帧的亮度提高到与参考帧一致,同理,在对齐长帧与参考帧时要将参考帧的亮度提高到与长帧一致。(为什么都是将亮度提高呢?因为如果图像中存在过曝区域,那么降低亮度也还是过曝区域,恢复不了过曝区的信息)

以短帧与参考帧的对齐为例,将短帧乘上参考帧与短帧的曝光比,即可将短帧的亮度提高到与参考帧一致(有个前提是短帧和参考帧都为RAW域)

3.2 合成模块

合成模块的输入为对齐后的三张LDR图像以及对应的在HDR域的图像,一共6张图像,18个通道。

为什么要使用LDR域加上HDR域的图像作为输入呢?按照作者在文中的说法,原因如下:
在合成HDR时,需要评估LDR的质量,再根据其质量进行组合,例如传统方法采用像素权重的方式进行组合,其中像素权重就相当于质量评估的分数。对于网络合成,需要同时输入LDR域图像和HDR域图像,其中:
① 由于曝光时间不同,LDR域的图像可用于检测噪声和饱和区域
② 由于亮度基本一致,HDR域的图像有助于检测不对齐
结合以上两点,从而在最大程度上确保噪声、过曝和位移区域在合成HDR过程中没有贡献,或者贡献很小。

文中提出了3种合成模型:

  • 端到端,直接输出HDR图像
  • 预测权重图,再与原始LDR图像进行加权平均计算得到最终的HDR图像
  • 预测权重图和完善后的LDR图像,对两者进行加权平均得到HDR图像
    在这里插入图片描述
    三种模型的网络结构一致,区别在于输出通道数。
    在这里插入图片描述

3.3 损失函数

对于image to image任务,通常情况下损失函数为网络输出与GT的L1或L2距离。由于HDR图像通常在色调映射后显示,所以作者采用的loss为经过色调映射后的网络输出与GT的L2距离。最简单的tonemapping为gamma变换,但是其在0处不可微,因此文中采用了u-law:

在这里插入图片描述
文中对比了两种损失函数的测试结果,直接以HDR与GT的L2距离作为损失函数会导致tonemmaping后的HDR中存在颜色偏差、暗区有伪影和噪声等现象。
在这里插入图片描述

四、实验

网络预测的权重图符合直觉,短帧的权重图在亮区有较大的值,长帧的权重图在暗区有较大的值。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/23549.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Pdfjs使用

pdfjs使用一、下载二、Springboot引入pdfjs三、利用PDFJS预览pdf文件并加水印四、后端将pdf添加水印参看链接一、下载 pdfjs官方地址 二、Springboot引入pdfjs 针对于pdfjs方面有用的只是pdf这个包下面和viewer.html这个html页面viewer.html是我们用来展示pdf的页面不需要改但…

高压功率放大器在超声悬浮中的应用研究

高压功率放大器的叫法对于不同的人来说是完全不同的,有人叫功率放大器,也有人叫电压放大器,但它们都是指同一个电子测量仪器设备,主要是指内部能够拥有电压和功率放大电路,可以把微弱的外部信号进行放大输出的放大器。…

在华为云 OSC 上快速部署 EMQX MQTT 集群

EMQX Kubernetes Operator 是 EMQ 发布的一个封装、部署和管理工具,也是一个特定的应用控制器,方便 DevOps 人员在 Kubernetes 上编排 EMQX MQTT 消息服务集群,管理其生命周期。 华为云原生基础设施(云容器引擎 CCE、容器镜像服务…

索引数据结构千千万 , 为什么B+Tree独领风骚

索引的由来 大数据时代谁掌握了数据就是掌握了流量,就是掌握的号召力。面对浩瀚的数据如何存储并非难事, 难点在于如何在大数据面前查询依旧快如闪电! 这时候索引就产生了,索引的产生主要还是借鉴于图书管理员书签的功能。在大数…

谷歌、微软、Meta?谁才是 Python 最大的金主?

你知道维护 Python 这个大规模的开源项目,每年需要多少资金吗? 答案是:约 200 万美元! PSF(Python 软件基金会)在 2022 年 6 月发布了 2021 的年度报告,其中披露了以下这份支出明细(…

大家介绍一篇学生选课系统的设计与实现

项目描述 临近学期结束,还是毕业设计,你还在做java程序网络编程,期末作业,老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。这里根据疫情当下,你想解决的问…

若依框架字典配置以及使用(结合vue和emelent)

一:字典数据创建(我们公司是后端做的,前端不用管) 1.首先新建要指定的默认角色 (1)必须用管理员账号登录才能看到角色管理 (2)具体怎写,可以参考已有的数据&#xff08…

低代码平台中的“模型驱动”与“表单驱动”有何区别?

低代码定义: 低代码是近几年比较火的一种应用程序快速开发方式,它能帮助用户在开发软件的过程中大幅减少手工编码量,并通过可视化组件加速应用程序的高效交付。(低代码的定义来自Forrester报告,被认为是低代码一词的起…

坐标的变换

在QPainter可以使用以下函数变换坐标: QPainter::scale()缩放坐标系统QPainter::rotate()顺时针旋转QPainter::translate()平移QPainter::shear()围绕原点来扭曲坐标系统…

[附源码]java毕业设计小超市进销存管理系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

fmllr--学习笔记

预备知识: 说话人自适应技术是利用特定说话人数据对说话人无关(Speaker Independent,SI)的码本进行改造,其目的是得到说话人自适应(SPeaker Adapted, SA)的码本来提升识别性能。在某个说话人的训练数据足够多的时候,针对当前说话人数据采用传…

m基于3GPP-LTE通信网络的认知家庭网络Cognitive-femtocell性能matlab仿真

目录 1.算法概述 2.仿真效果预览 3.MATLAB部分代码预览 4.完整MATLAB程序 1.算法概述 本系统所涉及到的几个主要模块,具体有如下几个模块: A. Simulation Flow:仿真流程 B. Initialization:初始化 C. Mobility Model&…

【每日两题】day 01 组队竞赛 删除公共字符

链接:组队竞赛__牛客网 (nowcoder.com) 解题思路 该题目就是求所有队员水平的数组中的尽可能大的水平之和 因为每个队伍都是三个人,平均水平值肯定是排序后水平中间的值 import java.util.*;public class Main {public static void main(String[] ar…

VisualDrag低代码拖拽模板

目录背景技术&文档二开优化方案1. 优化侧边栏2. 优化图片插入3. 新增可插入画布的组件4. 解决组件鼠标默认事件冲突的问题数据保存对接&页面生成预览保存对接生成预览源码下载背景 接到一个需求做一个拖拽模板低代码生成界面(如上图)&#xff0c…

项目交付过程中,进度失控的原因有哪些?

在项目交付过程中,会出现项目交付的进度与计划有较大的偏差,导致这种偏差的原因往往是多种多样的,一般常见的引起进度延期的原因有哪些? 1、计划不清晰 项目开始前必须有个计划,工作思路必须事前理清。 项目经理最…

springboot+ssm大学生家教课程订购平台的设计与实现

制作一个大学生家教平台的设计与实现是非常必要的。本网站是借鉴其他人的开发基础上,用MySQL数据库和JSP定制了大学生家教平台的设计与实现。系统前台实现了用户注册、登录、学习课程、家教准则、通知公告、双减政策等功能,并且还可以修改密码、个人信息…

windows10复制文件需要管理员权限,复制需要管理员权限怎么办

在Windows10操作系统的电脑中,很多用户都遇到这样的问题:windows10复制文件需要管理员权限,很多用户都不知道该怎么解决这个问题。在本文中,我们写出了详细的解决方法,让你可以轻松复制文件,并且也修复了需…

SpringBoot中任务是什么/Quartz和SpringTask在Spring Boot中怎么使用/SpringBoot怎么给用户发邮件

写在前面: 继续记录自己的SpringBoot学习之旅,这次是SpringBoot应用相关知识学习记录。若看不懂则建议先看前几篇博客,详细代码可在我的Gitee仓库SpringBoot克隆下载学习使用! 3.5.2 任务 3.5.2.1 简述 定时任务是企业应用中常…

多种BCN点击试剂:1426827-79-3,endo BCN-PEG4-COOH,1841134-72-2

双环[6,1,0]壬炔 (BCN) (环丙烷环辛炔)可以通过无铜的点击化学与叠氮化物标记的分子或生物分子反应生成稳定的三氮唑连接。同样其可以和多种不同的基团进行连接,包括acid,NHS ester,amine等。西安凯新生物科技有限公司…

Oracle SQL执行计划操作(7)——排序相关操作

7. 排序相关操作 该类操作和SQL语句执行计划中的排序操作相关。根据不同的具体SQL语句及其他相关因素,如下各操作可能会出现于相关SQL语句的执行计划。 1)BUFFER SORT 在会话服务进程内存中对某个行源数据进行排序或其他相关操作,该操作最…