自动驾驶之夜间检测调研

news2024/12/29 8:43:08

1. ExDark

第一个 公开 特定的提供 natural low-light images for object的数据集

7363张 low-light images,
12 classes

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VK2Wz60U-1670641306011)(:/bbcf37f6b5974f919c036fd4eee77238)]

Low-light image enhancement:

  • IVC database. general image enhancement而非特指low-light. 黑夜是人工合成的,可以找到原图像
  • See-in-the-Dark dataset (SID): 5094个短曝光(low-light)图像对应到424张长曝光图像(bright)
  • LOw light paired dataset (LOL): 500对图像

都含有一对图!!!
但是 SID和LOL都不能展示真实的夜晚灯光环境.
为了保证图像能对应上,使用特定相机并且不含有动态目标(例如cars,people等).

Low-light denoising
是low-light enhancement的一个子集, 但是这些图都是人工合成的,加入Poisson或者Gaussian噪声到合成的黑夜图像中.

Low-light surveillance
热相机和红外相机一般在夜晚监控中使用. 主要集中在人脸识别、行人检测。
数据集有OTCVBS,LSI和LDHF.

ExDark数据集

对low-light condition进行细划分, 例如一天中的黄昏(twilight)还是夜晚(nighttime),位置(indoor,outdoor)、光源可见度、光源类型(太阳、人造光).

  • 12类别: Bicycle, Boat, Bottle, Bus, Car, Cat, Chair, Cup, Dog, Motorbike, People, and Table.

  • 数据收集:网上下载,关键词(dark, low-light,nighttime); 公开数据集(PADCAL VOC, ImageNet和COCO);电影中提取;手动拍摄

  • 标注: 手动标注
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H5f7eTZ3-1670641306012)(:/313977abd4c0435f9edab51919a1b6ee)]

  • 十种灯光类型:

    • Low: 光线最暗,几乎看不清细节
    • Ambient: 灯光weak, 光源没有捕捉进来
    • Object: 目标较亮但是周围环境很暗,光源没有捕捉进来
    • Single: 只能看到一个光源
    • Weak: multiple visible但是weak光源
    • Strong:multiple visible但是相对亮的光源
    • Screen: 户内图像,可见亮的屏幕
    • Window: 户内图像,以窗户为亮光源.
    • Shadow:户外图像,户外光源,目标在阴影处
    • Twilight:户外,黄昏. 黎明到太阳升起; 微暗到太阳落下.
      在这里插入图片描述
      在这里插入图片描述

2. 增强 Survey

  • 传统方法:

    • Histogram Equalization-based methods
    • Retinex model-based methods: 例如将一张图解耦为一个reflection部分和一个illumination部分, reflection部分即为增强的结果.
      缺点: 多光源时会丢失细节和颜色;噪声被忽略了;找到这样一个prior或regularization比较困难;运行时间长.
  • DL方法:更高精度、更加鲁棒、速度更好

    • 方法包括:监督学习、强化学习、无监督学习、Zero-shot learning和半监督学习.
      在这里插入图片描述

学习策略

  • 监督学习:分为end-to-end, deep
    Retinex-based 和realistic data-driven methods.
    • end-to-end: LLNet, MBLLEN,EEMEFN,LPNet,DSLR,

    • Retinex-based: 利用物理可解释的Retinex理论.
      将illuminance部分和reflectance部分分开增强. 例如Retinex-Net,lightweight LightenNet,而DeepUPE学习从Image到illumination的映射;KinD,KinD++

    • 数据集: SID, DIV(视频),SMOID(视频),SIDGAN(视频)

  • 强化学习:DeepExposure,即首先根据曝光切分为sub-image, 局部曝光是强化学习学到的,奖惩函数类似于对抗学习. 再将局部曝光修整图像,获取不同曝光下的图像.
  • 无监督学习: 有监督的学习受限于泛化能力. 无监督学习EnligthenGAN,采用一个attention-guided U-Net作为生成器,使用global-local discriminators来使得增强结果跟自然光线相似.
  • Zero-Shot Learning:直接从test data中学习增强,例如ExCNet, 首先拟合测试集一个最优的S曲线,然后根据S曲线,使用Guided filter划分为base layer和datail layer, 根据S曲线调整base layer,最后使用Weber contrast来融合detailed layer和调整后的base layer.;还有RRDNet,将图像分为illumination, reflectance和noise; RetinexDIP使用NN进行Retinex分解,然后增强low-light image; Zero-DCE/zero-DCE++将光线增强视为一个image-specific curve estimation,输入一个low-light图像输出一个伪high-order曲线.
  • Semi-Supervised Learning:DRBN,首先恢复一个linear band representation,以监督的方式,然后通过无监督学习到的linear transformation进行增强.

网络技巧

  • 网络结构: 常见U-Net, pyramid network和multi-stage network.
  • Deep Model和Retinex Theory结合.
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

  • 损失函数:

    • Reconstruction Loss(重构损失): L2倾向于乘法较大的错误,但是对较小错误容忍度高;L1损失保留颜色和luminance较好但是忽略了局部结构;SSIM保留了结构和纹理
    • Perceptual Loss: 和gt在feature map空间中的相似度. 特征提取网络为从一个在ImageNet训练的VGG16.
    • Smoothness Loss:移除结果中的噪音或保留相邻像素点的关系
    • 对抗损失:生成的图被辨别的损失
    • Exposure Loss: 不需要匹配的图,直接衡量曝光度的损失
    • 训练集:
      在这里插入图片描述

    LOL: 500对 低光照和正常光照的图
    SCIE: 589个户内/户外的场景,每个场景有3-18个不同曝光的图,因此有4413个多曝光的图. 选取589张高质量的图.分辨率在3000x2000和6000x4000
    MIT-Adobe FiveK: 5000张图
    SID:5094张短曝光的图,每个有个对应的长曝光的图
    VE-LOL:2500对,1000对是合成的,1500对是真实的
    DRV:202个原始的视频,每个对应一段长曝光的gt. 16-18fps/ 3672x5496
    SMOID:179对序列,每个200帧

    • 测试集:
      BBD-100K:视频,10000个视频,使用在晚上拍的用来做测试集
      ExDARK:
      DARK FACE: 6,000张晚上拍的人脸
  • 作者提出新的数据集: LLIV-Phone,120视频,45,148个图像,18张手机类型,

在这里插入图片描述
在这里插入图片描述

结果展示

方法对比
在这里插入图片描述

在1080ti上测速,输入1200x900x3,32张求平均
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6lRd3DNk-1670641306018)(:/d7085b61dec34013978b36ba3901ac3c)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QIwAr9Gl-1670641306019)(:/caa512055ab945799c41474832a3724e)]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/77071.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何创建Spring项目以及如何使用?

目录: 1.创建Spring项目 2.将对象存储在Spring中 3.从Spring中取出对象 4.使用对象 5.总结 Spring 就是⼀个包含了众多⼯具⽅法的 IoC 容器,它具备两个最基本的功能: 将对象存储到容器(Spring)中;从容器…

Web大学生网页作业成品——美食餐饮网站设计与实现(HTML+CSS+JavaScript)

👨‍🎓静态网站的编写主要是用HTML DIVCSS JS等来完成页面的排版设计👩‍🎓,常用的网页设计软件有Dreamweaver、EditPlus、HBuilderX、VScode 、Webstorm、Animate等等,用的最多的还是DW,当然不同软件写出的…

java SpringMVC 之 表现层与前端数据传输 SSM整合 异步处理前后台处理联调 拦截器

SSM整合 项目结构配置搭建 pom的依赖&#xff1a; <dependencies><dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>3.8.1</version><scope>test</scope></dependency><de…

如何使用 Python 实现彩票自由(双色球)

福彩双色球也是购买次数最多的彩种之一&#xff0c;相比大乐透&#xff0c;双色球更容易中小奖 下面将介绍 Python 实习双色球彩票自由的流程 1. 随机一注 福彩双色球一注同样包含 7 个数字&#xff0c;包含 6 个红球和 1 个篮球 其中 红球是从 1 - 33 中选择 6 个不同的数…

【Keras+计算机视觉+Tensorflow】生成对抗神经网络中DCGAN、CycleGAN网络的讲解(图文解释 超详细)

觉得有帮助麻烦点赞关注收藏~~~ 一、生成对抗网络简介 生成对抗网络(GANs&#xff0c;Generative Adversarial Nets),由Ian Goodfellow在2014年提出的,是当今计算机科学中最有趣的概念之一。GAN最早提出是为了弥补真实数据的不足&#xff0c;生成高质量的人工数据。GAN的主要思…

数据宝藏“淘金热”,腾讯云大数据愿做“卖铲人”

‍‍数据智能产业创新服务媒体——聚焦数智 改变商业大数据产业作为数字化时代的基础设施之一&#xff0c;正在成为新时代经济发展的重要动能之一。11月30日&#xff0c;在2022腾讯全球数字生态大会大数据专场上&#xff0c;腾讯云大数据重磅发布了两款具有高频应用场景的产品…

晶品特装科创板上市:市值68亿 主打地面无人装备研发与产销

雷递网 雷建平 12月9日北京晶品特装科技股份有限公司&#xff08;简称&#xff1a;“晶品特装”&#xff0c;证券代码&#xff1a;688084&#xff09;昨日在科创板上市。晶品特装本次发行1900万股&#xff0c;发行价为60.98元&#xff0c;募资总额11.59亿元。晶品特装昨日收盘价…

R语言从经济时间序列中用HP滤波器,小波滤波和经验模态分解等提取周期性成分分析

经济时间序列的分析通常需要提取其周期性成分。最近我们被客户要求撰写关于经济时间序列的研究报告&#xff0c;包括一些图形和统计输出。这篇文章介绍了一些方法&#xff0c;可用于将时间序列分解为它们的不同部分。它基于《宏观经济学手册》中Stock和Watson&#xff08;1999&…

TypeScript和JavaScript的区别,全面解读超详细(二)

了解基础篇&#xff1a;请跳转 3.4.3 TS的编译 点击跳转 TypeScript和JavaScript的区别,全面解读超详细 我们知道.js的文件可以直接在浏览器中运行的&#xff0c;而.ts或者.tsx却不行&#xff0c;所以我们在运行TS项目时需要编译成浏览器引擎可以识别的JS语言。同时为了提高编…

体验最近火爆的ChatGPT

体验最近火爆的ChatGPT演示前言体验1. 回答问题2. 写方案、写作3. 写代码4. 各种古怪刁钻问题回答国内用户如何注册ChatGPT账号并在线体验如果不能在官网体验&#xff0c;可以在我的网站上体验演示 体验最近火爆的ChatGPT 前言 前几天OpenAI公布了ChatGPT算是火爆朋友圈&…

基于Java+Swing+mysql图书管理系统

基于JavaSwingmysql图书管理系统一、系统介绍二、功能展示1.用户登陆2.系统主页3.图书查询4.图书添加5.图书修改6.图书删除7.办理借书8.办理还书9.历史查询10.用户查询、删除&#xff08;管理员&#xff09;三、数据库四、其它1.其他系统实现一、系统介绍 该系统实现了 用户: …

基于多目标灰狼算法的冷热电联供型微网低碳经济调度附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

天翼物联获2022年移动物联网“先进企业”

近日&#xff0c;由工信部指导、中国信通院等单位主办的“首届移动物联网大会”在无锡圆满落幕。天翼物联获2022年移动物联网“先进企业”奖。 今年&#xff0c;我国移动物联网终端用户16.98亿户&#xff0c;超越移动电话16.78亿用户数&#xff0c;正式进入“物超人”时代&…

C++-变量

目录定义变量使用变量全局变量与局部变量作用域和生存期存储类typedefconst符号常量C11的变量初始化列表定义变量 1、存储类 类型名 变量名<初值表达式> 2、存储类 auto,register,static,extern 3、类型名 数据类型&#xff0c;自己定义的或系统存在的 4、变量名 用户自…

[carla] carla-ros-bridge 修改信号灯行为。

本教程适用于采用编译下载安装方式安装carla-ros-bridge 的用户。 1.修改信号灯 1.1 修改原理 我们要通过API过滤出所有绿灯的actor信息&#xff0c;然后修改他们的状态为常绿。 查阅API网站可知traffic_light具有set_state&#xff08;self,state&#xff09;方法 https:/…

说一说刚拿下BIRTV推荐的中国8K摄像机新品

“从边缘走向中心&#xff0c;从跟随逐渐引领&#xff0c;变化已经在发生。” —————————————————————————————————————————— 2022年发生了很多事情&#xff0c;但有一件事&#xff0c;无可比拟&#xff0c;那就是冬奥。 2022北京…

ADI Blackfin DSP处理器-BF533的开发详解16:KEY按键的实现(含源代码)

硬件准备 ADSP-EDU-BF533&#xff1a;BF533开发板 AD-HP530ICE&#xff1a;ADI DSP仿真器 软件准备 Visual DSP软件 硬件链接 实现原理 ADSP-EDU-BF53x 开发板上的按键连接到了 CPLD&#xff0c;通过 CPLD 将按键信号与 EBIU 总线和中断管脚 PF0 连接&#xff0c;并将中断…

Python做曲线拟合(一元多项式拟合及任意函数拟合)

目录 1. 一元多项式拟合 使用方法 np.polyfit&#xff08;x, y, deg&#xff09; 2. 任意函数拟合 使用 curve_fit() 方法 实例&#xff1a; &#xff08;1&#xff09;初始化 x 和 y 数据集 &#xff08;2&#xff09;建立自定义函数 &#xff08;3&#xff09;使用自…

数字滤波算法 在数字信号处理应用中使用微控制器

提示&#xff1a;数字滤波算法 在数字信号处理应用中使用微控制器 文章目录1.介绍1.1. 关键点2. 数字FIR滤波器2.1. 数字滤波器算法2.1.1. IIR滤波器算法2.1.2. FIR滤波器算法2.2. C8051F12x和C8051F36x的FIR算法实现2.2.1. 实施优化2.2.2. FIR滤波器示例2.3. 运行FIR演示2.3.1…

ML.NET 奇异谱分析(SSA Singular spectrum analysis)预测实践

一、奇异谱分析(Singular Spectrum Analysis, SSA) 简介 奇异谱分析(Singular Spectrum Analysis, SSA)是一种处理非线性时间序列数据的方法&#xff0c;通过对所要研究的时间序列的轨迹矩阵进行分解、重构等操作&#xff0c;提取出时间序列中的不同成分序列(长期趋势&#xff…