【雷达数据集】RADDet: 面向动态道路使用者的基于距离-方位-多普勒的雷达目标检测【附链接】

news2024/11/24 20:33:30

微信公众号:EW Frontier
关注可了解更多的雷达、通信、人工智能相关代码。问题或建议,请公众号留言;
如果你觉得EW Frontier对你有帮助,欢迎加入我的知识星球或面包多,更多代码等你来学
知识星球:https://wx.zsxq.com/dweb2/index/group/15552518881412
面包多:https://mbd.pub/o/author-a2mYl2tsbA==/work

QQ交流群:554073254

主要内容


概述

近年来,基于深度学习的目标检测算法在图像领域得到了广泛的探索。在雷达领域,尽管目标检测已经获得了一定程度的普及,但很难找到不同研究之间的系统比较。这是由于几个原因。首先,在相关研究中看到了各种输入和输出格式,例如面向概率的目标检测、深度雷达检测器和基于 CNN 的道路使用者检测。其次,没有合适的公共数据集可以作为该领域研究的基准。因此,研究人员选择构建自己的数据集。在大多数雷达研究中可以找到的一个常见点是它们只针对动态目标,因为对动态目标的检测比静态目标更丰富。
在本文中,我们介绍了一种新的数据集,并提出了一种新的动态道路使用者目标检测模型。我们的贡献如下:

  • 介绍了一种新的数据集,其中包含 RAD 表示形式的雷达数据,并为各种对象类别提供了相应的注释。该数据集可在 Google Drive 上找到。

  • 提出了一种在 RAD 数据的所有维度上以笛卡尔形式生成真实标签的自动注释方法。

  • 提出了一种新的雷达目标检测模型。我们的模型采用了基于 ResNet 的 backbone 。主干网的最终形式是在对雷达数据进行深度学习模型的系统探索后实现的。受 YOLO Head 的启发,我们提出了一种新的双检测头,其中 3D 检测头用于 RAD 数据,2D 检测头用于笛卡尔坐标数据


基于距离-方位-多普勒的雷达数据集


用于数据收集的传感器包括一台德州仪器 (TI) AWR1843-BOOST 雷达和一对来自 The Imaging Source 的 DFK 33UX273 立体相机。下图显示了我们的传感器设置。

两种传感器的配置均如表 I 和表 II 所示。由于我们可以将虚拟天线的数量视为发射器和接收器的数量的组合,因此模数转换器 (ADC) 数据的大小可以计算为 (256, 8, 64)。由于雷达仰角的分辨率有限,我们选择只考虑来自它的二维鸟瞰信息。


对于数据同步,时间戳被手动添加到雷达输出中,以便与摄像机同步。实施是使用机器人操作系统 (ROS) 进行的。我们还在数据采集期间重新校准了两个传感器的记录时间戳。

传感器校准是通过自制的三面体角反射器实现的,如上图所示。为了使角反射器易于相机识别,其正面安装了彩色三角形泡沫板。从立体相机帧到雷达帧的投影矩阵是根据 Calibration 计算的。

用于调频连续波 (FMCW) 雷达的传统数字信号处理 (DSP) 分为两个步骤。首先,对接收到的模数转换器 (ADC) 信号的每个维度执行快速傅里叶变换 (FFT)。此步骤的主要输出是距离-方位-多普勒 (RAD) 频谱。其次,采用恒定虚警率 (CFAR) 过滤掉噪声信号。有两种主要的 CFAR 算法,即 Cell-Averaging CFAR (CA-CFAR) 和 Order-Statistic (OS-CFAR)。OS-CFAR 由于其高质量的输出通常更适合学术用途,而 CA-CFAR 由于速度而经常在工业中使用。此步骤的输出通常转换为笛卡尔坐标,并以点云的形式呈现,这是各种应用基于集群的雷达数据分析的基础。在我们的数据集中,雷达数据预处理采用 2D OS-CFAR 算法。

在 2D OS-CFAR 的距离多普勒 (RD) 输出上,由于多普勒轴上的速度相干性,可以很容易地检测到刚体,例如车辆。对于人类,Deep Radar Detector 表明,不同身体部位的不同运动可能会导致 RD 光谱上的不同输出模式。然而,当雷达的距离分辨率达到一定水平时,几乎无法观察到人体运动的复杂性。因此,它们也可以被视为刚体。一个例子如下图所示。出现在 RD 光谱上的刚体的一个特性是,尽管物体和雷达之间存在角度差异,但它们通常以线性模式呈现。因此,通过连接 RD 光谱上的离散模式,我们成功地丰富了传统 2D OS-CFAR 的检测率。


在这项研究中,我们使用立体视觉进行地面实况标记。整个过程可以描述如下。首先,使用 OpenCV 实现立体深度估计以生成视差图。然后,将 Mask-RCNN 用于立体图像,并将预测掩码与类别预测一起应用于相应的视差图。最后,使用三角测量,生成具有预测类别的实例级点云输出。

最后,可以通过匹配雷达实例和上面获得的立体实例来生成数据集。我们的数据集可在 Google Drive 上找到。


RADDet


最先进的基于图像的对象检测算法由 3 个部分组成,一个主干、一个颈部和一个检测头(YOLOv4、FCOS、Focal Loss)。受此启发,我们基于广泛使用的 ResNet 构建了我们的骨干网络。在图像域中,neck 层用于提取多个级别的输出,以处理对象的比例变化。然而,与图像不同的是,距离会因几何图形而改变物体的大小,而雷达则揭示了物体的真实比例。因此,我们的研究中不考虑多分辨率颈部层。最后,我们提出了一种基于知名的基于锚点的算法 YOLO 的新型双检测头。下图显示了我们提议的架构的数据流。


3D 头部将特征图处理成 [16, 16, 4 * num_of_anchors * (7 + num_of_classes)],其中 7 代表对象性和 3D 框信息。3D 框信息由 3D 中心点 [x, y, z] 和大小 [w, h, d] 组成。2D 检测头由两部分组成;一个坐标转换层,用于将特征图从极坐标表示转换为笛卡尔形式,以及一个经典的 YOLO Head。


测试


为了直观地检查模型的性能,我们通过测试集运行了模型,并将预测框与真实框进行了比较。下图显示了一些可视化示例。我们真诚地希望这项研究和数据集能够弥合基于图像的目标检测和基于雷达的目标检测之间的差距,并激发更多自主雷达算法的开发。

数据集网址:需梯子

https://drive.google.com/drive/folders/1v-AF873jP8p6waChF3pSSqz6HXOOZgkC

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2194855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

美客多测评系统:批量注册买家号的新利器

美客多(MercadoLibre)测评系统作为一种在跨境电商领域广泛应用的策略,其核心在于通过批量注册并管理买家账号,模拟真实用户的购物行为,以提升产品的销量、评价数量和店铺权重。以下是对美客多测评系统中批量注册买家号…

HCIE《网络括谱图》

企业园区网 终端>接入>汇聚>核心>出口区(防火墙)>互联网

大数据新视界 --大数据大厂之TeZ 大数据计算框架实战:高效处理大规模数据

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

stm32学习笔记-RTC实时时钟

文章目录 一、RTC基础知识1.1 RTC简介1.2 RTC的晶振 二、stm32的RTC2.1 RTC和后备寄存器2.2 stm32 RTC结构框图及特性 三、stm32 RTC编程2.1 RTC初始化2.2 RTC控制程序 一、RTC基础知识 1.1 RTC简介 实时时钟的缩写是RTC(Real_Time Clock)。RTC 是集成电路,通常称…

第十三篇——虚数:虚构这个工具有什么用?

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么? 四、总结五、升华 一、背景介绍 认知一下就拉起来了;没有的东西,构建出来&#xf…

如何使用Flair.ai实现模特换装效果

在数字化时代,科技让我们实现了许多过去无法想象的功能。Flair.ai就是这样一个神奇的工具,它可以帮助你轻松实现模特换装效果。以下是详细步骤,教你如何使用Flair.ai来实现这一过程。 第一步:访问Flair.ai网站 首先,…

10.3 Linux_进程_创建守护进程

守护进程创建方法 守护进程是什么: 守护进程又叫精灵进程,是一个生存期较长的进程,通常独立于控制终端并且周期性的执行某种任务或等待处理某些发生的事件。它是一个在后台运行的孤儿进程,这使得守护进程不受终端的信息影响&…

【算法笔记】二分算法原理的深度剖析

【算法笔记】二分算法原理的深度剖析 🔥个人主页:大白的编程日记 🔥专栏:算法笔记 文章目录 【算法笔记】二分算法原理的深度剖析前言一.二分查找1.1题目1.2朴素二分1.3细节问题1.4代码实现1.5朴素模版总结 二.在排序数组中查找…

用Arduino单片机制作一个简单的音乐播放器

Arduino单片机上有多个数字IO针脚,可以输出数字信号,用于驱动发声器件,从而让它发出想要的声音。蜂鸣器是一种常见的发声器件,通电后可以发出声音。因此,单片机可以通过数字输出控制蜂鸣器发出指定的声音。另外&#x…

视频色彩变幻剪辑:批量剪辑工具大揭秘

在视频剪辑领域,将视频画面添加一些色彩是一项常见需求。幸运的是,市面上存在多款批量剪辑工具,能够轻松实现这一剪辑,提升视频品质与观感。像视频剪辑高手一次可剪辑多个视频素材。易操作。一起来试试。 1打开“视频剪辑高手”软…

【时间之外】昔日销售大佬今求职难

目录 国庆结束 中年危机下的家庭缩影:昔日销售大佬今求职难 生存智慧之三大人生策略 国庆结束 今天是国庆节的最后一天假期了。 7天的大调休,搞得人非常疲惫,想想接下来还有5天的工作日,就觉得这个调休实在是烦人。 中年危机…

企业为什么需要MES系统?

企业为什么需要MES系统? 提高生产效率: MES系统能够实时采集生产现场的数据,并根据这些数据对生产计划进行动态调整,最大化设备利用率和产能。通过优化生产流程,减少生产中的非增值时间,提高整体生产效率。…

史上最强传奇资源编辑器

支持:WIL WIS WZL PAK(GOM GEE V8 LEG) 批量修改密码、全格式转换、文件归类、资源优化、坐标调整辅助、GIF动画生成、衣服武器合成一体 资料地址:史上最强传奇资源编辑器 - 工具软件程序 - 51开发者联盟 - 51SF.CC

C语言文件操作(下)(28)

文章目录 前言一、文件的打开和关闭打开打开模式相对路径和绝对路径 关闭 二、文件操作正确流程三、文件顺序读写函数fopenfclosefputcfgetcfputsfgetsfprintffscanfsprintfsscanffwritefread 四、文件随机读写函数fseekftellrewind 五、文件读取结束时候的判断feofferror具体例…

关于持续输出内容的思路分享及分析

一、核心内容 (一)亦仁的分享 来自V先生的小密圈,提出做垂直领域内容持续输出的思路。很多大 v 不敢开小密圈是担心内容持续输出问题。掌握一套方法论应用于无数场景,就有无数案例和素材。列举 10 个铜山:装修风格点…

浏览器前端向后端提供服务

WEB后端向浏览器前端提供服务是最常见的场景,前端向后端的接口发起GET或者POST请求,后端收到请求后执行服务器端任务进行处理,完成后向前端发送响应。 那浏览器前端向后端提供服务是什么鬼? 说来话长,长话短说。我在人…

每日OJ题_牛客_组队竞赛_贪心_C++_Java

目录 牛客_组队竞赛_贪心 题目解析 C代码1 C代码2 Java代码 牛客_组队竞赛_贪心 组队竞赛_牛客笔试题_牛客网 (nowcoder.com) 描述: 牛牛举办了一次编程比赛,参加比赛的有3*n个选手,每个选手都有一个水平值a_i.现在要将这些选手进行组队,一共组成n个…

C语言 assert 函数 - C语言零基础入门教程

目录 一.assert 函数简介二.assert 函数使用三.assert 函数用法总结与注意事项四.猜你喜欢 零基础 C/C 学习路线推荐 : C/C 学习目录 >> C 语言基础入门 一.assert 函数简介 对于断言,相信大家都不陌生,大多数编程语言也都有断言这一特性。简单地讲…

力扣题11~15

题11(中等): 思路: 这种题目第一眼就是双循环,但是肯定不行滴,o(n^2)这种肯定超时,很难接受。 所以要另辟蹊径,我们先用俩指针(标志位)在最左端和最右端&am…

20241007给荣品RD-RK3588-AHD开发板刷Rockchip原厂的Buildroot是使用ADB

20241007给荣品RD-RK3588-AHD开发板刷Rockchip原厂的Buildroot是使用ADB 2024/10/7 17:35 缘起:由于荣品RD-RK3588-AHD开发板使用的是9针的USB-A口,没有使用EVB4默认的type C口。 因此需要拿掉fusb302的驱动/DTS配置部分。 同时,为了简单起见…