Low-Light Image Enhancement via Stage-Transformer-Guided Network 论文阅读笔记

news2025/1/10 16:15:45

在这里插入图片描述

  • 这是TCSVT 2023年的一篇暗图增强的论文

  • 文章的核心思想是,暗图有多种降质因素,单一stage的model难以实现多降质因素的去除,因此需要一个multi-stage的model,文章中设置了4个stage。同时提出了用预设query向量来代表不同的降质因素,对原图提取的key 和value进行注意力的方法。

  • 网络结构如下图所示:
    在这里插入图片描述

  • 首先是预处理模块,用了孔洞卷积来提取多尺度特征图

  • 接着multi-stage部分是堆叠重复结构组成,每个结构由双支路(两个尺度,下采样至1/2)残差结构核HVSA模块组成。

  • HVSA模块如下图所示,他把特征图1x1卷积后按通道平均分为horizontal和vertical,horizontal按行切分,每行是一个token,vertical按列切分。然后按行/列进行自注意力计算,再原样拼回去1x1卷积产生HVSA的输出(作为残差特征加回 X i X_i Xi)。但这里的尺度有点奇怪,全文也没有提到这里有下采样的操作,一方面每个stage的双支路是不同分辨率,他是怎么加和到一起的,另一方面不同stage输出的结果的shape来看是一直在下采样的,不知道是不是patch merging操作没有写出来,得看代码。
    在这里插入图片描述

  • decoder则用预设的degradation token来作为query进行多头注意力机制,然后卷积并上采样成原图,这里同样也没有写很多细节,比如怎么上采样的以及多头注意力对图片是按pixel来算token还是按patch,按patch又是按多大的patch,统统没有说。

  • 损失函数则是三个损失的加权和,分别是MSE损失,vgg的perceptual损失和计算预测结果和GT的直方图来算直方图之间的L2损失。

  • 在LOL上训练并比较了LOL上面的结果:
    在这里插入图片描述

  • 这篇工作很多细节没有呈现,但是用预设的vector作为degradation query的idea还是蛮有意思的,也是第一个个人感觉把transformer和暗图增强这个任务的特殊性有结合的方法,其他的地方感觉有很多改进空间,预设vector作为degradation也有很多改进空间,感觉像是个比较除草的工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/752033.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Kubernetes 组件介绍

Kubernetes 组件 部署完 Kubernetes,便拥有了一个完整的集群 一组工作机器,称为节点, 会运行容器化应用程序。每个集群至少有一个工作节点 工作节点会托管 Pod ,而 Pod 就是作为应用负载的组件。 控制平面管理集群中的工作节点…

【JAVA8】Stream\Comparator

Stream Reduction, 给N个数值,求出其总和/最大值/最小值/均值这一类的操作,称为Reduction Option Optional类是一个可以为null的容器对象。如果值存在则isPresent()方法会返回true,调用get()方法会返回该对象。 Optional 类的引入很好的解…

<网络>UPD协议详解

UDP协议详解 网络传输的实质UDP协议端格式UDP的特点面向数据报UDP的缓冲区UDP使用注意事项基于UDP的应用层协议 网络传输的实质 在网络中,我们通过调用系统函数send/recv/write/read使用套接字来进行主机之间的网络通信,那么是不是我们在调用这几个函数…

vue3使用provideinject实现祖孙组件通讯

vue3使用provide&inject实现祖孙组件通讯 之前在使用vue2时,写过一篇博客记录父子组件的数据通讯 简单来说,父传子通过自定义属性,子传父通过自定义事件,兄弟间通过事件总线。也有更直观的vuex实现任意组件之间的数据通讯&a…

掘金量化—Python SDK文档—2.策略程序架构

目录 Python SDK文档 2.策略程序架构 2.1掘金策略程序初始化 2.2行情事件处理函数 2.3交易事件处理函数 2.4其他事件处理函数 2.5策略入口 Python SDK文档 2.策略程序架构 2.1掘金策略程序初始化 通过init 函数初始化策略,策略启动即会自动执行。在 init 函数中可以&#x…

数据结构与算法——什么是线性表(线性存储结构)

我们知道,具有“一对一”逻辑关系的数据,最佳的存储方式是使用线性表。那么,什么是线性表呢? 线性表,全名为线性存储结构。使用线性表存储数据的方式可以这样理解,即“把所有数据用一根线儿串起来&#xf…

【Unity面试篇】Unity 面试题总结甄选 |Unity基础篇 | ❤️持续更新❤️

2.2 前言 关于Unity面试题相关的所有知识点:🐱‍🏍2023年Unity面试题大全,共十万字面试题总结【收藏一篇足够面试,持续更新】为了方便大家可以重点复习某个模块,所以将各方面的知识点进行了拆分并更新整理…

swin-transformer

面向视觉任务的transfomer Vision Transformer(ViT)在视觉任务中的局限性 需求数据量巨大 CNN中是图像整体输入,并且经过多年的演变,发展出了多个不同的优化策略。从而在学习时能够在一定先验知识的前提下拟合数据。 而transformer是将图像切割成若干较小…

精彩回放 | AI驱动下的流程挖掘如何提升企业决策和运营效率?

流程挖掘是一种从事件日志中发现、监控和优化实际业务流程的技术。在AI的驱动下,流程挖掘能进行更深层次的自动化和智能化处理,从而帮助企业更准确地了解和优化业务流程,提高决策的精确度和运营的效率。然而,AI驱动的流程挖掘在实…

FPGA——pwm呼吸灯

文章目录 一、实验环境二、实验任务三、实验过程3.1 verilog代码3.2 引脚配置 四、仿真4.1 仿真代码4.2 仿真结果 五、实验结果六、总结 一、实验环境 quartus 18.1 modelsim vscode Cyclone IV开发板 二、实验任务 呼吸灯是指灯光在微电脑的控制之下完成由亮到暗的逐渐变化…

便捷查物流教程

当下寄递物品早已成为常态,而如何快速进行物流信息查询,成为收寄人所关心的问题。在回答这个问题之前,首先我们要知道,物流信息查询,有哪些方法? 1、官网单号查询 知道快递公司和单号的情况下,…

目标检测——目标检测概述

目录 目标检测常用的开源数据集PASCAL VOC数据集MS COCO数据集 常用的评价指标IOU(交并比)mAP(Mean Average Precision) NMS(非极大值抑制)目标检测方法分类 目标检测 常用的开源数据集 PASCAL VOC数据集 …

遭遇勒索攻击,日本名古屋港停摆两天!

日前,中央社东京报道一则勒索软件讯息。日本名古屋港的货柜码头遭受勒索病毒攻击后发生系统故障,系统数据已被加密,无法装卸货柜,造成港内5处货柜码头全数停摆长达两天,造成了巨额损失。 名古屋港是日本汽车产业聚集的…

ArcGIS如何制作横版图例

如果你经常制图,肯定使用过插入图例这个功能,默认情况下,插入的图例是竖着的,在某些情况下,如果需要横着的图例是否可以实现呢,答案是肯定的,这里为大家介绍一下ArcGIS如何制作横版图例&#xf…

DC电源模块输出电压的关键参数详细说明

BOSHIDA DC电源模块输出电压的关键参数详细说明 DC电源模块是一种直流电源设备,广泛应用于各种电子设备的供电系统中。DC电源模块的输出电压是其中一个非常关键的参数,对于电子设备的性能和稳定性都有着重要的影响。以下将详细描述DC电源模块输出电压的…

状态模式:实现对象状态的封装和切换

状态模式是一种行为设计模式,它允许对象在内部状态改变时改变其行为。该模式将对象的行为封装在不同的状态类中,使得对象可以根据其内部状态的改变而改变行为,从而实现了状态和行为的解耦。 结构和参与者 状态模式包含以下几个关键角色&…

什么是RPC并实现一个简单的RPC

1. 基本的RPC模型 主要介绍RPC是什么,基本的RPC代码,RPC与REST的区别,gRPC的使用 1.1 基本概念 RPC(Remote Procedure Call)远程过程调用,简单的理解是一个节点请求另一个节点提供的服务本地过程调用&am…

【仲裁器】轮询仲裁round-robin,rr

起因:在多主单从的设计中,当多个源端同时发起传输请求时,需要仲裁器根据优先级来判断响应哪一个源端。轮询仲裁:各个源端优先级相同,当其同时发起请求时,依次进行响应。 电路图 代码 module rr_arb(input…

ACREL-5000能耗管理系统在某机场的应用 安科瑞 许敏

摘要:大型公共建筑总面积不足城镇建筑总面积的4%,但总能耗却占全国城镇总耗电量的22%,大型公共建筑单位面积年耗电量达到70~300KWh,为普通居民住宅的10~20倍。公共建筑是节能大户和节能重点,做好…

【HarmonyOS】ArkTS学习之基于TextTimer的简易计时器

【关键字】 ArkTS、计时器、TextTimer 【介绍】 TextTimer是ArkTS提供的通过文本显示计时信息并控制其计时器状态的组件。今天就给大家展示一个基于TextTimer的简易计时器的实现吧。在使用之前我们要先了解它的用法: TextTimer(options?: { isCountDown?: boolean…