AODNet

news2024/11/25 0:40:54

【20231117】读研期间没有对阅读的文章进行总结,没想到毕业反而有了机会。即日起会对阅读过的文章要点进行梳理记录,希望这一习惯能够坚持下去。
学术的角度:看论文要学习作者如何逻辑严谨的自证
落地的角度:只用看以下六点,创新点是什么、设计思路是什么、用了什么数据、达成什么效果(比前人好多少)、有没有代码、能否复现

ICCV2017、微软亚研院、有代码

Li B, Peng X, Wang Z, et al. Aod-net: All-in-one dehazing network[C]//Proceedings of the IEEE international conference on computer vision. 2017: 4770-4778.
GitHub - weberwcwei/AODnet-by-pytorch: Image Dehaze, Pytorch, An All-in-One Network for Dehazing, AOD-Net

GitHub - walsvid/AOD-Net-PyTorch: Pytorch implementation of AOD-Net : All-in-One Network for Dehazing - ICCV2017

1、Abstract

BR:摘要真的提炼了文章最最最核心的要点,看懂它等于看懂文章 90% 的内容。

  1. reformulate atmospheric scattering model
  2. directly generates the clean image through a light-weight CNN

2、Introduction

BR:以往方式的不足是什么,作者最大的创新是什么。

  1. However, the estimation is not always accurate, and some common pre-processing such as guildfiltering or softmatting will further distort the hazy image generation process [8], causing sub-optimal restoration performance. Moreover, the non-joint estimation of two critical parameters, transmission matrix and atmospheric light,may further amplify the error when applied together.
  2. the major novelty of AOD-Net as the first to optimize the end-to-end pipeline from hazy images to clean images, rather than an intermediate parameter estimation step.

2.1 It is trained on synthesized hazy images, and tested on both synthetic and real natural images.——用的合成有雾图像做训练,论文实验数据和项目落地能一样吗、差距到底会有多大?

2.2 用的评价指标:PSNR、SSIM、视觉效果

2.3 As a lightweight model, AOD-Net has achieved a fast processing speed, costing as low as 0.026 second to process one 480 × 640 image with a single GPU——什么 GPU,26ms 是落地可以接受的速度吗?落地时延的要求是多少?TBD

3、Related Work

BR:通常不需要看这部分内容,记录是因为要做传统方法和深度学习方法的梳理总结。

3.1 传统方法去雾

  1. [23] 通过最大化局部对比度来消除雾霾。
  2. [6] 提出了一种通过估算景物反照率的物理真值方法。
  3. DCP [8],[24] 发现了有效暗信道先验(DCP) 来更可靠地计算传输矩阵。
  4. BCCR [12] 进一步加强了边界约束和上下文正则化,以获得更清晰的恢复图像。
  5. ATM [22] 提出一种自动恢复大气光的加速方法。
  6. CAP [32] 开发了一种颜色衰减先验,并对朦胧图像建立了场景深度的线性模型,然后以监督的方式学习模型参数。

3.2 深度学习方法去雾

  1. [17] MSCNN 多尺度CNN,首先生成一个粗尺度的传输矩阵,然后对其进行细化
  2. [3] 提出了一种可训练的端到端介质传输估计模型,称为DehazeNet。它以模糊图像为输入,输出其传输矩阵结合经验规则估计的全球大气光,通过大气散射模型恢复无雾图像。

上述方案的特点
基于一个认知:要想从有雾图中恢复干净的图片,准确估计介质传输图是关键。(环境光单独计算)
不足:尽管思路是直观且有物理基础的,该方法不直接测量或最小化重建畸变产生次优的图像恢复质量可能性增大,因为每个单独估计步骤中的误差将累积并可能相互放大。

3.3 AODNet

  1. 本文的 AOD-Net 直接输出去雾干净的图像,没有任何中间步骤估计参数。与 [3] 从模糊图像到传输矩阵的端到端学习不同,AOD-Net的完全端到端构建弥合了有雾图像和干净图像之间的最终目标差距

上述方案的特点
基于一个认知:物理模型可以用一种“端到端”的方式来表述,所有的参数都可以用一个统一的模型来估计。

4、Method

BR:放几组公式说明作者的设计思路。坦白说,从我的思维逻辑这些公式包括思路说明更像是实验验证可行后找的解释。实验确实在证明方法的有效性,但写文章更像是一种“自圆其说”,逻辑严谨的自证。

在这里插入图片描述

在这里插入图片描述
BR:作者将求解过程转变为求 K(x) 的过程

在这里插入图片描述

  1. Since K (x) is dependent on I (x), we then aim to build an input-adaptive deep model, and train the model by minimizing the reconstruction errors between its output J (x) and the ground truth clean image I(x).
  2. To justify why jointly learning t(x) and A in one is important, we compare the two solutions in experiments (see Section 4 for the synthetic settings). As observed in Figure 3, the baseline tends to overestimate A and cause overexposure visual effects.
  3. AOD-Net clearly produces more realistic lighting conditions and structural details, since the joint estimation of 1/t(x) and A enables them to mutually refine each other. In addition, the inaccurate estimate of other hyperparameters (e.g., the gamma correction), can also be compromised and compensated in the all-in-one formulation.

Results

客观数据对比

the subjective visual quality??

dataset

the indoor NYU2 Depth Database [21]

the Middlebury stereo database [19, 18, 9]

Thinking

  1. 作者在related work中,段落前黑体标注重点,这非常友好!
  2. 不用看他说的天花乱坠的概念。你就看它提不提供代码,不提供的话不用深入看它怎么实现的,留个印象即可。
  3. 看用的数据集和评价指标!!
  4. 我无法用图二主观判断得出本文方法好的依据。

1、传统的去雾方法+实现原理+优缺点+性能指标

读图环节

看图说话,描述每幅图作者试图在论证什么。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1219946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Oracle OCM考试(史上最详细的介绍,需要19c OCP的证书)

Oracle 19c OCM考试和之前版本的OCM考试差不多,对于考生来说最大的难点是题量大,每场3小时,一共4场,敲键盘敲得手抽筋。姚远老师(v:dataace)的很多Oracle OCP学员都对19c OCM考试很有兴趣,这里给…

企业数字化转型的好处?_光点科技

企业数字化转型是当今商业世界中一个至关重要的议题。数字化转型不仅仅意味着采用新技术,而是涉及到企业在文化、运营和客户体验方面的根本变革。那么,企业数字化转型的好处是什么呢? 1.数字化转型可以显著提高企业的运营效率。 通过自动化流…

8.jib-maven-plugin构建springboot项目镜像,docker部署配置

目录 1.构建、推送镜像 1.1 执行脚本 2.2 pom.xml配置 ​2.部署镜像服务 2.1 执行脚本 2.2 compose文件 3.docker stack常用命令 介绍:使用goole jib插件构建镜像,docker stack启动部署服务; 通过执行两个脚本既可以实现构建镜像、部…

前端对用户名密码加密处理,后端解密

一. 正常表单提交如图&#xff0c;可以看见输入的用户名密码等 二. 使用crypto-js.min.js进行前端加密处理 js资源地址链接&#xff1a;https://pan.baidu.com/s/1kfQZ1SzP6DUz50D–g_ziQ 提取码&#xff1a;1234 前端代码 <script type"text/javascript" src&q…

2023年亚太杯数学建模思路 - 复盘:校园消费行为分析

文章目录 0 赛题思路1 赛题背景2 分析目标3 数据说明4 数据预处理5 数据分析5.1 食堂就餐行为分析5.2 学生消费行为分析 建模资料 0 赛题思路 &#xff08;赛题出来以后第一时间在CSDN分享&#xff09; https://blog.csdn.net/dc_sinor?typeblog 1 赛题背景 校园一卡通是集…

2023年09月 Scratch(一级)真题解析#中国电子学会#全国青少年软件编程等级考试

Scratch等级考试(1~4级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 下列哪项内容是不可以修改的?( ) A:角色名称 B:造型名称 C:舞台名称 D:背景名称 答案:C 第2题 要给“古诗朗诵”作品录制配音,可以使用下列哪个按钮?( ) A: B: C:…

LLM建模了什么,为什么需要RAG

LLM近期研究是井喷式产出&#xff0c;如此多的文章该处何处下手&#xff0c;他们到底又在介绍些什么、解决什么问题呢&#xff1f;“为学日增&#xff0c;为道日损”&#xff0c;我们该如何从如此多的论文中找到可以“损之又损以至于无”的更本质道或者说是这个方向的核心模型。…

ElementUI及ElementUI Plus Axure RP高保真交互元件库及模板库

基于ElementUI2.0及ElementUI Plus3.0二次创作的ElementUI 元件库。2个版本的原型图内容会有所不同&#xff0c;ElementUI Plus3.0的交互更加丰富和高级。你可以同时使用这两个版本。 不仅包含Element UI 2.0版&#xff0c;还包含Element Plus 3版本。Element 2版支持Axure 8&…

解析 Python requests 库 POST 请求中的参数顺序问题

在这篇文章中&#xff0c;我们将探讨一个用户在使用Python的requests库进行POST请求时遇到的问题&#xff0c;即参数顺序的不一致。用户通过Fiddler进行网络抓包&#xff0c;发现请求体中的参数顺序与他设置的顺序不符。我们将深入了解POST请求的工作原理&#xff0c;并提供解决…

css继承属性

在css中&#xff0c;继承是指的是给父元素设置一些属性&#xff0c;后代元素会自动拥有这些属性 关于继承属性&#xff0c;可以分成&#xff1a; 字体系列属性文本系列属性元素可见性表格布局属性列表属性引用光标属性 继承中比较特殊的几点&#xff1a; a 标签的字体颜色不…

HTTP HTTPS 独特的魅力

目录 HTTP协议 HTTP协议的工作过程 首行 请求头&#xff08;header&#xff09; HOST Content-Length​编辑 User-Agent&#xff08;简称UA&#xff09; Referer Cookie 空行 正文&#xff08;body&#xff09; HTTP响应详解 状态码 报文格式 HTTP响应格式 如何…

将ECharts图表插入到Word文档中

文章目录 在后端调用JS代码准备ECharts库生成Word文档项目地址库封装本文示例 EChartsGen_DocTemplateTool_Sample 如何通过ECharts在后台生成图片&#xff0c;然后插入到Word文档中&#xff1f; 首先要解决一个问题&#xff1a;总所周知&#xff0c;ECharts是前端的一个图表库…

asp.net实验室设备管理系统VS开发sqlserver数据库web结构c#编程计算机网页源码项目

一、源码特点 asp.net实验室设备管理系统 是一套完善的web设计管理系统&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 asp.net实验室设备管理系统1 二、功能介绍 本系统使用Microsoft Visual Studio 2019为开发工具&#xff0c;SQL …

国鑫受邀出席2023松山湖软件和信息服务业高质量发展大会

为推动粤港澳大湾区的软件和先进制造产业的融合发展&#xff0c;“2023松山湖软件和信息服务业高质量发展大会”于今日在松山湖畔隆重举办&#xff0c;会议以“推动软件和制造业深度融合发展&#xff0c;打造软件和信息服务业集聚高地”为主题&#xff0c;聚焦工业软件应用、智…

解析CAD图纸出现乱码的原因及解决方法

解析CAD图纸出现乱码的原因及解决方法 CAD&#xff08;计算机辅助设计&#xff09;是现代工程设计中不可或缺的工具&#xff0c;它能够帮助工程师们高效地完成复杂的设计任务。然而&#xff0c;有时在使用CAD软件过程中&#xff0c;可能会遇到图纸出现乱码的问题&#xff0c;影…

【python零基础入门学习】python进阶篇之数据库连接-PyMysql-全都是干货-一起来学习吧!!!

本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》&#xff1a;python零基础入门学习 《python运维脚本》&#xff1a; python运维脚本实践 《shell》&#xff1a;shell学习 《terraform》持续更新中&#xff1a;terraform_Aws学习零基础入门到最佳实战 《k8…

解决因跨域导致使用a标签下载文件download属性失效无法自定义命名的问题

问题背景&#xff1a; 在使用a标签下载文件时&#xff0c;download属性可以更改下载的文件名。 // 下载a.exe,并采用默认命名 <a href"/images/a.exe" download>点击下载</a>// 将a.exe改名为b.exe下载 <a href"/images/a.exe" download&…

什么是日志分析?为什么IT管理员需要日志分析?

在现在大数据时代&#xff0c;大量的数据被生成和记录&#xff0c;无论是企业还是个人&#xff0c;都在不断产生各种日志。日志记录了系统、应用程序、网络等多个领域的活动和事件信息&#xff0c;它们对于解决问题、监控和优化系统、还原事件等都非常重要。而这些海量的日志数…

粉够荣获淘宝联盟理事会常务理事,共绘联盟生态新篇章

淘宝联盟区域理事会于2021年成立&#xff0c;首届成立成都、广州、武汉&#xff0c;服务近2000个领军淘宝客企业&#xff0c;作为区域生态与官方交流重要枢纽&#xff0c;理事会举办近百场交流分享会&#xff0c;带动淘客跨域跨业态交流成长。 2023年9月7日第二届淘宝联盟理事…

操作系统 day11(进程调度时机、切换、调度方式)

进程调度的时机 这里的主动放弃指的是—内中断&#xff08;异常、例外&#xff09;&#xff0c;中断信号来自CPU内部。而被动放弃指的是—外中断&#xff08;中断&#xff09;&#xff0c;中断信号来自CPU外部 如果该进程还没退出临界区&#xff08;还没解锁&#xff09;就进行…