史上最全事件相机DVS/Event-based Camera的介绍和分析综述文章

news2024/11/26 12:13:19

史上最全事件相机DVS/Event-based Camera的介绍和分析

    • 1. DVS 的一些介绍
    • 2. 基于事件的视觉传感器发展现状与趋势
    • 3. 事件相机的动态范围:
      • 信噪比
      • 动态范围DR
      • 结论
    • 4. 新型相机DVS/Event-based camera的发展及应用
      • 应用点
      • 传统相机的缺点
      • 事件相机的优点
    • 5. 事件相机在无人驾驶中的应用
      • Event-based Camera in Autonomous Driving
      • 技术层面的挑战
      • 工程层面挑战
    • 6. 相关资源/论文

最近本人在看一些事件相机的论文和研究。下面将看的基础内容整理一下,先是一些基本的event camera原理和发展的介绍,后面介绍算法。欢迎讨论!

1. DVS 的一些介绍

模拟生物视网膜特性的仿生相机——事件相机DVS(Dynamic Vision Sensor),该相机具有更宽的动态范围,输出较传统相机而言更稀疏、更快。一种快匹配自适应光流算法和完全通过FPGA完成的基于DVS相机的硬件实现与其功耗和计算速度方面的优势,最后介绍了该项研究在自动驾驶领域的广阔应用前景。

2. 基于事件的视觉传感器发展现状与趋势

目前被广泛应用的事件相机可大致分成3类:动态视觉传感器(DVS)、基于异步时间的图像传感器(ATIS)、动态主动像素视觉传感器(DAVIS,Dynamic and Active Pixel Vision Sensor)。DVS是最基本的也是最先发展的一种事件相机。ATIS像素结构分成两个部分(A和B),包含两个感光器,能够在提供事件信息的同时还能提供一定灰度信息的需求。DAVIS相机将DVS相机和传统的有源像素传感器(APS)相机结合起来,能够同时输出场景事件和灰度信息。

3. 事件相机的动态范围:

事件相机具有高动态范围,相对于传统相机一般只有70dB,事件相机能够达到140dB或更高。

信噪比

Signal to Noise Ratio (SNR),描述传感器所产生的信号与噪声的强度,计算方法是看计算电压还是功率。对于电压信噪比计算,公式为:SNR=10*log(S/N)。其中log为log10,单位是dB。如果噪声是2mV,电压是3V,则信噪比是31.7dB。
log(3000/2)=3.17
对于图像计算来说,一般找一个“精准的”相机拍摄一个基准,再和需要计算的图像进行比较。但基准一般难找,另一种常用的方式是,多次拍摄同一个信号后“求平均值和标准差的比值”。
然而140dB并不是指“信噪比”,但确实和信噪比有关。

动态范围DR

动态范围,Dynamic Range (DR),指“传感器能够分辨的最强的信号和最弱的信号的比值”,计算公式是20log(S/N)。比如说某个电压传感器最高能够测到3V,最小能够测量2mv,则DR是63.4dB。
那么DR和SNR有什么关系么?有关系,SNR和DR的下限有关。如果SNR较差,意味着噪声相对较强,则DR的下界会高,导致DR较小。但SNR和DR的上界无关,DR的上界可以理解为“饱和”的情况。事件相机所说的140dB指的是这个“动态范围”。

结论

140dB指的是动态范围DR,而不是信噪比SNR;

若想真正达到“高动态范围HDR”,必然会有大量的噪声。厂商基本上没有说在动态范围内某个值时噪声怎么样。可以这样理解140dB:“我能够看到很多,但不一定看得清”;

实际使用时,应该结合具体任务,判断特定场景/参数/算法下,能够检测的动态范围。
Source: 事件相机的“140dB”指的到底是什么?

4. 新型相机DVS/Event-based camera的发展及应用

神经拟态视觉传感器使用基于事件驱动的方式来捕捉场景中的动态变化。与传统相机不同,神经拟态视觉传感器没有 “帧” 的概念。当现实场景中发生变化时,神经拟态视觉传感器会产生一些像素级的输出(即事件),一个事件具体包括(t, x, y, p),这里的 x, y 为事件在2D空间的像素坐标,t为事件的时间戳,p为事件的极性。事件的极性代表场景的亮度变化: 上升(positive) or 下降 (negative)。神经拟态视觉传感器对数据存储和计算资源的需求非常小,并且其具有非常低的延迟,可以达到微秒级!!!传统相机在固定频率下产生一系列帧图片,其关键问题是在相邻俩帧之间会丢失掉很多关键信息,并且传统相机在内存,能量损耗以及延迟方面需求过大,这直接导致了很多算法的实时性非常低。以深度学习为例,为了实现目标检测等环境感知任务,不得不利用昂贵的硬件(GPUs)平台为其提供算力支撑。所以神经拟态视觉传感器的研究还是有一定前景的。

  • 工作原理分析
    工作原理分析
    事件相机的工作原理是对于每个像素的光照对数的变化,根据每个像素的变化,若当前像素的亮度信息变化超过阈值C且为增大,则记为on,若为减小,则记为off事件。对于图中的位置信息设 X = ( x , y ) T X=(x,y)^T X=(x,y)T ,其中 X X X为2维向量,事件可以抽象为3D的函数 E = l o g I ( X , t ) E=logI(X,t) E=logI(X,t) ,或者4D函数 E = l o g I ( X , t , p ) E=log I(X,t,p) E=logI(X,t,p) 其中 p = 1 p=1 p=1 表示ON 信号, p = − 1 p=−1 p=1 表示OFF信号, p p p代表事件的极性(Polarity)。

  • 事件输出Demo
    在这里插入图片描述

应用点

特征跟踪、SLAM、捕猎机器人,包括物联网(超低功耗监控和智慧城市)、自动驾驶(车辆测距、SLAM和乘员监控)、机器人技术(场景理解与定位)、工业视觉(过程监控和基础设施检测)等。

参考文献:https://www.sohu.com/a/300758196_100007727

传统相机的缺点

帧率低、运动模糊、动态范围低。
传统相机,无论是CMOS传感器,还是CCD传感器,亦或是RGBD相机,都有一个参数:帧率。它们是以恒定的频率拍摄获取图像。这样,即使帧率能够达到1KHz,那也具有1ms的延时。所以传统相机存在一定的延迟问题。
除此之外,传统相机需要通过一定时间的曝光,使感光器件积累一定的光子,那么在曝光时间之内如果物体在高速运动,则会产生模糊,这也是传统相机的一个问题。
另外,传统相机的动态范围较低,具体表现为在光线极差或者亮度极高时,相机获取的信息有限。
以上三点,是由于相机自身硬件的限制,即使高性能相机能够一定程度减小这些问题,但由于相机原理,这些问题无法避免。这些问题极大地限制了一些应用场景。而事件相机完全不存在这些问题。

这意味着有大量的冗余信息和大量不必要的计算需要,导致大的带宽。

事件相机的优点

低延迟、高动态范围、数据量小、极低功耗。
由于事件相机的成像原理,我们可以发现只要亮度一有变化就会输出,且仅输出变化的数据占用了很小的带宽,同时由于事件相机更擅长捕捉亮度变化,所以在较暗和强光场景下也能输出有效数据。事件相机具有低延迟(<𝟏𝝁𝒔)、高动态范围(𝟏𝟒𝟎𝒅𝑩)、极低功耗(𝟏𝒎𝑾)等特性。

相较于传统相机,事件相机是基于神经形态视觉,其基本理念是受生物系统工作方式的启发,检测场景动态的变化,而不是连续分析整个场景。这意味着让单个像素决定它们是否看到了相关的东西。与固定频率的系统采集相比,这种基于事件的方法可以节省大量的功耗,并减少延迟。

Mobile robot systems need to quickly understand rapid motion in dynamic environments, e.g., Forests, Kitchens, Roads.
However, current sensor based-solutions are not suited for the energy and computational needs of micro mobile robot systems. Like active sensors: IR Depth Camera, LIDAR, Radar. Whereas, DVS has low latency sensing and energy consumption are attractive for mobile robot collision avoidance.

5. 事件相机在无人驾驶中的应用

Event-based Camera in Autonomous Driving

在自动驾驶发展的历程中,视觉算法的应用已经成为不可或缺的一部分。但当前的视觉算法仍然存在着一些局限性:一方面,相机容易受到光线明暗突变、逆光等影响;另一方面,相机在运行时,产生的数据量非常大,因而对算力的要求特别高。

如今,市场上出现一种新型相机传感器,或可以有效解决上述这些痛点,那就是事件相机。事件相机具备极快的响应速度、减少无效信息、带宽小、降低算力和功耗、高动态范围等优势可以帮助自动驾驶车辆降低信息处理的复杂度、提高车辆的行驶安全,并能够在极亮或者极暗环境下正常工作。事件相机是相比于传统的帧相机而言的:帧相机是以固定帧率输出一帧一帧的图片,并最终组成视频流;而事件相机只记录亮度变化的像素点。

  1. 高动态范围

通俗点说,高动态范围指的是相机在极端光强变化下也能保持图像的清晰度。帧相机的动态范围通常只能达到60dB,而事件相机的动态范围能达到120dB,甚至会更高。高动态范围可以帮助事件相机在光线极暗、曝光过度、光线突变等情况下,依然能够保持有效的工作,为自动驾驶增添了一份安全冗余。

工作原理:当对应像素坐标点的光强变化量超过了预先设定的阈值时,事件相机就会以微秒级分辨率标记时间戳,并输出异步事件流。所有像素是异步的,不是同步的输出。

  1. 与传统相机的差异
  • 感光机制不同

  • 读出机制不同:帧相机的读出电路是行列扫描的方式,是一种矩阵数据整体读出的形式,在像素坐标轴上记录像素点的RGB信息;而事件相机是通过AER的编码方式,仅将事件以时间戳和坐标的数据形式,按照事件产生的先后顺序异步传出。

  • 电路设计不同

  1. 产品类型
  • DVS(动态视觉传感器)

    优势:电路设计简单,像素面积小。

    挑战:纯事件数据的可视化程度较低,无法提供精细化的图像。

  • ATIS(基于异步时间的图像传感器)

    优势:能提供灰度信息,功耗相对DAVIS较低。在启动后,由于直接发放了一次脉冲,可以直接获取到相机前方的所有灰度信息,然后根据运动区域内,将在产生的脉冲信号上不断更新相应灰度信息。

    挑战:不适用在环境亮度变化不频繁的场景。比如在高速运动场景下,由于光强测量结果是在脉冲信号产生后的一段时间内的平均光强,所以存在事件与灰度信息重构更新不匹配的情况。

  • DAVIS(动态和有源像素视觉传感器)

    优势:DAVIS与ATIS一样,也可以提供灰度信息;同时,DAVIS由于共用一个感光器,像素面积相对ATIS更小。

    挑战:APS电路的采样速度远不如DVS电路,导致二者无法做到精准同步。再者,APS电路在高速场景下存在拖影现象。

产业链中的不同之处主要是在图像传感器芯片、算法软件,比如更适合事件相机的芯片是类脑芯片、更适合的算法则是脉冲神经网络。

下图给出各类事件相机的对比。
各种事件相机的对比

技术层面的挑战

(1)无法识别具体目标物

帧相机输出的是帧图像,并且已拥有了成熟的应用和标定数据库;而事件相机只能给出比较原始的数据信息,比如目标物的外部轮廓,并且也没有一个自己独立的数据库来匹配这些轮廓信息。

(2)缺少适合的芯片和算法

当前事件相机使用的是原来帧相机的一整套架构体系(比如所使用的芯片类型、算法模型等),但基于帧图像的架构并不能完全处理好事件流,而现有的大部分事件相机产品只是做了简单的架构平移。第一,较适合事件相机的芯片将会是类脑芯片。第二,较适合事件相机的算法为脉冲神经网络。

工程层面挑战

(1)阈值设定难度高

阈值大小的设定是决定事件相机是否能在自动驾驶中用好的关键一步,这需要大量场景数据的积累、算法的优化、设备运行时动态地调整阈值。

(2)数据处理效率低

(3) 与其它传感器融合的挑战

由于事件相机无法单独提供深层次的数据,比如测距、测速、表面具体颜色等,只能获取到物体的轮廓,所以单纯地使用一个事件相机是无法给到自动驾驶车辆足够的冗余安全,与其他传感器的融合才是更好的感知方案。在与其它传感器融合时,需要把事件流与其它传感器的信号进行同步匹配。

以事件相机与激光雷达的融合为例,事件相机与激光雷达都有帧的概念,激光雷达也是以某一恒定帧率发射点云。若想要把这两个传感器同步起来,就需要做到两个方面:一方面,时间戳的一一对应;另一方面,需要在做好标定的基础上,将事件相机的像素点云映射到激光雷达的点云上。

6. 相关资源/论文

1. CVPR 2021 Workshop on Event-based Vision

2. Event-based Vision Resources

3. 国内事件相机研究团队

4. 一文谈谈事件相机在自动驾驶领域的应用前景

中文论文资料:

  1. 基于事件相机的连续光流估计
  2. 基于事件相机的合成孔径成像
  3. 基于事件相机的定位与建图算法: 综述
  4. 基于事件相机的机器人感知与控制综述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/86221.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[技巧]还在使用RDP远程windows?OpenSSH远程win10操作系统!

文章目录前言一、Win10开启OpenSSH服务1.1 查看本机是否安装了openssh1.2 下载openssh1.3 查看ssh是否安装1.4 安装openssh服务端1.5 启动openssh服务1.6 查看openssh服务是否启动正常二、开始远程2.1 在目标机器上查看用户名2.2 使用ssh命令远程三、常见问题3.1 ssh命令登陆提…

C# 接口

一 接口 接口&#xff08;interface&#xff09;实际上是一个约定。 如&#xff1a;ICloneable,IComparable; 接口是抽象成员的集合&#xff1b; ICIonable含有方法clone(); IComparable含有方法compare(); 接口是一个引用类型&#xff0c;比抽象类更抽象。 帮助实现多重继承…

配置本地Git从Gitlab上拉取项目

配置本地Git从Gitlab上拉取项目 安装git&#xff1a; https://git-scm.com/downloads git官网下载安装包&#xff0c;安装时一路next即可 ①配置用户名&#xff0c;邮箱 创建一个文件夹&#xff0c;任意位置即可鼠标右键选择&#xff0c;git bash here配置提交人姓名、邮箱 g…

一起学习用Verilog在FPGA上实现CNN----(二)卷积层设计

1 打开Vivado工程 Vivado工程文件如图&#xff1a; 打开Vivado软件&#xff0c;打开工程&#xff0c;如图&#xff1a; 自动升级到当前版本&#xff0c;如图&#xff1a; 暂时选择现有开发板的型号&#xff0c;如图&#xff1a; 出现一条警告性信息&#xff0c;暂时先不管&…

2023年第五届人工智能与机器学习国际会议(FAIML 2023)

2023年第五届人工智能与机器学习国际会议(FAIML 2023) 重要信息 会议网址&#xff1a;www.faiml.org 会议时间&#xff1a;2023年4月14-16日 召开地点&#xff1a;中国北京 截稿时间&#xff1a;2023年3月15日 录用通知&#xff1a;投稿后2周内 收录检索&#xff1a;EI,S…

差分进化算法在图像处理中的应用研究(Matlab代码实现)

目录 &#x1f4a5;1 概述 &#x1f4da;2 运行结果 &#x1f389;3 参考文献 &#x1f468;‍&#x1f4bb;4 Matlab代码 &#x1f4a5;1 概述 本文为Storn和Price制定的著名差分进化计算智能算法的实现。该算法使用Otsu准则作为适应度函数&#xff0c;可用于使用多个阈值…

为什么球的表面积不能用周长积分而体积可以用面积积分?

问题描述&#xff1a; 将面积从最底下一层层叠到最上面可以得到球体积的正确公式 但是将周长从最底下一层层叠到最上面会得到错误结果&#xff0c;错误结果的几何意义是什么&#xff1f;以及是在什么地方积错了&#xff1f; 解答一&#xff1a; 首先&#xff0c; ∫−RR2πR2…

计算机研究生就业方向之去央企(国企)信息化部门

我一直跟学生们说你考计算机的研究生之前一定要想好你想干什么&#xff0c;如果你只是转码&#xff0c;那么你不一定要考研&#xff0c;至少以下几个职位研究生是没有啥优势的&#xff1a; 1&#xff0c;软件测试工程师&#xff08;培训一下就行&#xff09; 2&#xff0c;前…

C语言:星期一问题

题目需求 整个20世纪&#xff08;1901年1月1日至2000年12月31日之间&#xff09;&#xff0c;一共有多少个星期一&#xff1f; (不要告诉我你不知道今天是星期几哈) 请用一段程序实现了这一功能。 算法思路 判断1901年1月1日到2000年12月31的每一天是星期几&#xff0c;如果是星…

前端开发:JS中关于正则表达式的使用汇总

前言 在前端开发过程中&#xff0c;关于正则表达式的使用也是必备技能&#xff0c;尤其是在实际业务需求的时候&#xff0c;需要处理一些不能按照正常语句操作的逻辑&#xff0c;如前端开发中的字符匹配、参数处理等都需要正则表达式来匹配截取处理。虽然正则表达式在程序开发中…

01-18-spark-入门简介-部署入门

01-spark-入门简介&#xff1a; Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。 一次性数据计算&#xff1a;框架在处理数据的时候&#xff0c;从存储设备中读取数据&#xff0c;进行逻辑操作&#xff0c;然后将结果存储到介质中。 Hadoop 的 MR 框架和 S…

直播技术分享:千万级直播系统后端架构设计的方方面面

1、引言 本文以TFBOYS“日光旅行”七周年这场直播演唱会为案例&#xff0c;为你分享大型直播系统后端架构设计的方方面面&#xff0c;包括&#xff1a;基本架构、稳定性保障、安全性障、监控报警、应急预案等技术范畴。 案例中的这次演唱会采用了在线实时互动及演唱会现场的多…

【能效管理】关于某项目配套渗滤液工程电能管理系统的设计和应用

摘要&#xff1a; 介绍老港综合填埋场二期配套渗滤液工程电能管理系统&#xff0c;采用智能电力仪表采集配电现场的各种电参量。系统采用现场就地组网的方式&#xff0c;组网后通过现场总线通讯并远传至后台&#xff0c;通过Acrel-3000电能管理系统实现配电回路用电的实时监控…

服开与编排,老兵新传

前段时间&#xff0c;有同学问&#xff1a;编排与服开是什么关系&#xff1f;现在运营商都建设编排系统&#xff0c;那是不是服务开通以后就退出 OSS 舞台了&#xff1f;为什么会出现编排&#xff1f;这些问题对于行业老兵来说感慨万千&#xff0c;而对于新兵来说就要通过追溯其…

深度学习炼丹-超参数设定和网络训练

前言网络层内在参数 使用 3x3 卷积使用 cbr 组合尝试不同的权重初始化方法 图片尺寸与数据增强batch size 设定 背景知识batch size 定义选择合适大小的 batch size学习率和 batch size 关系 学习率参数设定 背景知识什么是学习率如何设置学习率 优化器选择 优化器定义如何选择…

中国制造构建全球产业链,是关于价值链的创新

经过20天激战&#xff0c;世界杯最终四强全部出炉。 与此同时&#xff0c;绿茵场外的品牌营销大战也即将步入终章。据伦敦数据分析咨询公司GlobalData表示&#xff0c;中国赞助商对卡塔尔世界杯总赞助金额为13.95亿美元&#xff0c;蝉联赞助金额榜单的首位。一时间&#xff0c…

一、Docker简介与安装

1、Docker是什么&#xff1f;为什么会出现Docker 假定您在开发一个购物商城&#xff0c;您使用的是一台笔记本电脑而且您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。此外&#xff0c;您的…

中国新闻周刊专访:大数据时代,普通人的信息安全如何保证?

技术是一个放大器 本质应该更好地服务人们的生产生活 近年来&#xff0c;随着大数据运用的日益频繁&#xff0c;技术日益成熟&#xff0c;隐私数据的泄露已到了触目惊心的状态。据不完全统计&#xff0c;2022年以来隐私数据泄露的各类案例多达数百万起&#xff0c;受隐私数据泄…

P4 PyTorch Broadcasting

前言&#xff1a; 维度变换 目录&#xff1a; Broadcasting 流程 broadcasting-able code参考: 课时24 Broadcasting-1_哔哩哔哩_bilibili 一 Broadcasting 流程 分三步&#xff1a; i broadcasting 从最后一个维度开始,进行维度对齐 ii 最前面插入一个维度 iii 最后对…

【测绘程序设计】——地形图图幅号计算

为便于地形图测制、管理和使用,各种比例尺地形图通常需要按规定的大小进行统一分幅,并进行系统的编号。地形图的分幅可分为两大类:一是按经纬度进行分幅,称为梯形分幅法,一般用于国家基本比例尺系列的地形图;二是按平面直角坐标进行分幅,称为矩形分幅法,一般用于大比例…