经典文献阅读之--DEviLOG(使用合成数据和真实世界数据的数据驱动占用网格映射基于Transformer的BEV方案量产方案)

news2025/3/1 11:06:39

Tip: 如果你在进行深度学习、自动驾驶、模型推理、微调或AI绘画出图等任务,并且需要GPU资源,可以考虑使用UCloud云计算旗下的Compshare的GPU算力云平台。他们提供高性价比的4090 GPU,按时收费每卡2.6元,月卡只需要1.7元每小时,并附带200G的免费磁盘空间。通过链接注册并联系客服,可以获得20元代金券(相当于6-7H的免费GPU资源)。欢迎大家体验一下~

0. 简介

在自动驾驶汽车(AV)的感知任务中,数据驱动的方法往往优于传统方法。这促使我们开发了一种基于数据的方法来从激光雷达测量中计算占用网格地图(OGM)。我们的方法扩展了之前的工作,使得估计的环境表示现在包含一个额外的层,用于标记被动态物体占据的单元格。早期的解决方案只能区分自由和占用的单元格。障碍物是否可以移动的信息对于规划AV的行为非常重要。《Data-Driven Occupancy Grid Mapping using Synthetic and Real-World Data*》提出了两种生成训练数据的方法。一种方法扩展了我们以前关于使用合成训练数据的工作,以便生成具有上述三种单元状态的OGM。另一种方法使用nuScenes[1]数据集的手动注释创建训练数据。我们在未见过的真实世界数据上对两个模型的性能进行定量分析。相关代码可以在Github中找到。

1. 主要贡献

  1. 本研究进一步发展了我们先前的方法,该方法能够预测具有“空闲”、“静态占用”和“动态占用”三种单元状态的占据网格图(OGMs)。
  2. 我们在真实世界的nuScenes数据集[1]上进行了定量性能分析。本文比较了在合成数据上训练的模型与基于数据集手工注解生成标签训练的模型的性能。
  3. 我们通过将这两种方法应用于我们的研究车辆之一,检验了它们对新传感器配置的适应能力。因此,我们提出了一种方法学,通过使用真实世界的数据集来发现仿真中的盲点,并提高在合成数据上训练得到的模型对真实世界测量数据的领域适应性。
  4. 通过开源我们的基准测试和评估算法,我们鼓励其他研究者与我们的方法进行比较,以促进该领域的发展。

2. 数据驱动的占据网格图绘制

我们将占据网格图绘制视为一个监督学习问题,并介绍了我们的神经网络架构以及生成训练数据的两种方法。一种方法使用仿真生成的合成数据,另一种方法使用手工注解数据集生成的标签。

2.1 网络架构

我们的网络架构基于PointPillars[28],该架构在激光雷达点云的目标检测中表现良好。我们使用相同的特征编码层和适配版本的CNN主干网络。预测头部被我们的证据预测头[6]替换,该预测头在本工作中扩展到三层,以包含可能的单元状态 A ∈ Θ A ∈ Θ AΘ的证据。该模型使用Sensoy等人[22]提出的期望均方误差损失函数进行训练。

在这里插入图片描述

这个信念质量 b A ∈ [ 0 , 1 ] b_A \in [0, 1] bA[0,1] 被用于我们网络预测的证据占据栅格图(OGM)中。


2.2 来自模拟的合成训练数据

正如文献[6]中所述,我们使用VTD [26]在城市3D环境中创建模拟场景,包括静态障碍物(如交通灯、长凳、电线杆)以及动态对象(如行人、自行车、车辆)从大型车辆类型目录中选取。模拟的自我车辆(ego vehicle)在大小和类型上与用于记录测试数据集的车辆相似,并使用车辆动力学模型来实现,例如,在加速或转弯时的真实滚动和俯仰角。它配备了一个虚拟的激光雷达传感器,其位置与真实车辆相似。激光束通过在900个水平方向上的32个垂直层上使用光线投射来模拟,类似于真实传感器。第二个虚拟的激光雷达传感器具有相同的位置和视场,但使用3000个而不是32个垂直层来创建更密集的激光雷达点云。这些合成点云包含了关于反射源材料的信息,这被解释为对包含反射点及其周围单元格在标签OGM中占据状态的证据。与我们之前的方法[6]不同,只有在合法可行驶材料(如沥青、道路标记)上的反射贡献了一个信念质量 b ( F ) = 0.1 b(F)=0.1 b(F)=0.1,而所有在非可行驶材料(如人行道、建筑物)上的反射贡献了 m ( O s ) = 0.1 m(O_s)=0.1 m(Os)=0.1。通过使用德姆斯特组合规则(Dempster’s Rule of Combination)结合分配给一个单元格的所有信念质量,由于影响一个单元格的激光雷达射线密度降低,创建的栅格图中的不确定性随着从传感器的距离增加而增加。除此之外,所有被动态对象覆盖的单元格被分配了一个信念质量 m ( O d ) = 1 ∣ C ∣ ∑ c m c ( O s ) m(O_d)=\frac{1}{|C|}\sum_c m_c(O_s) m(Od)=C1cmc(Os),其中 C = { c i } C=\{c_i\} C={ci}是被对象占据的单元格集合。然而,不能从输入数据中推断出的信息不应该包含在标签中。因此,只有被至少20个模拟激光束击中的对象才被处理。图2a展示了这样一个训练样本。

在这里插入图片描述

图 2:训练样本是通过仿真和来自nuScenes数据集[1]生成的。一个样本由激光雷达点云(灰色)和一个占据栅格图(OGM)组成,其中绿色表示空闲的信念质量,红色表示静态占据,蓝色表示动态占据的单元格。

2.3 来自注释的训练数据

…详情请参照古月居

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1917864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【中项第三版】系统集成项目管理工程师 | 第 11 章 规划过程组② | 11.3 - 11.5

前言 第 11 章对应的内容选择题和案例分析都会进行考查,这一章节属于10大管理的内容,学习要以教材为准。本章上午题分值预计在15分。 目录 11.3 收集需求 11.3.1 主要输入 11.3.2 主要工具与技术 11.3.3 主要输出 11.4 定义范围 11.4.1 主要输入…

Hi3861 OpenHarmony嵌入式应用入门--HTTPD

httpd 是 Apache HTTP Server 的守护进程名称,Apache HTTP Server 是一种广泛使用的开源网页服务器软件。 本项目是从LwIP中抽取的HTTP服务器代码; Hi3861 SDK中已经包含了一份预编译的lwip,但没有开启HTTP服务器功能(静态库无法…

C# 解析省份、城市、区域 json文件

一、json文件内容如下,(小程序里好像有用到...): 二、读取包含省份城市区域的json文件,并整理成想要的结果: string path Server.MapPath("/js"); string file System.IO.Path.Combine(path, "数据.…

Hi3861 OpenHarmony嵌入式应用入门--华为 IoTDA 设备接入

华为云物联网平台(IoT 设备接入云服务)提供海量设备的接入和管理能力,可以将自己的 IoT 设备 联接到华为云,支撑设备数据采集上云和云端下发命令给设备进行远程控制,配合华为云物联网平台的服 务实现设备与设备之间的控…

MySQL的约束键多表查询

约束 概念 概念:约束是作用于表中字段上的规则,用于限制存储在表中的数据。目的:保证数据中数据的正确、有效性和完整性。 外键约束 概念 ​ 外键用来让两张表的数据之间建立连接,从而保证数据的一致性和完整性。 注意&#x…

钉钉扫码登录第三方

钉钉文档 实现登录第三方网站 - 钉钉开放平台 (dingtalk.com) html页面 将html放在 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><title>登录</title>// jquery<script src"http://code.jqu…

PHP趣味测评微信小程序开发搭建趣味测评流量主变现系统

趣味测评微信小程序&#xff1a;开发搭建&#xff0c;乐在其中&#x1f389; &#x1f31f;【开篇&#xff1a;探索趣味测评的魅力】&#x1f31f; 你是否厌倦了千篇一律的问卷调查&#xff1f;想要来点不一样的互动体验&#xff1f;那么&#xff0c;趣味测评微信小程序绝对是…

为什么大多数过来人还是建议你考一本HCIE

HCIE认证是华为推出的高级网络工程师认证。 然而&#xff0c;对于是否值得考取HCIE&#xff0c;许多人有不同的看法。 有些人质疑它的价值&#xff0c;但也有很多过来人强烈推荐。 今天探讨一番。为什么尽管有质疑声&#xff0c;许多经验丰富的老网工还是建议你考一本HCIE。 01…

自动清理群晖nas中的.TMP文件

公司某个部门需要使用群晖nas共享盘&#xff0c;对人员的相关权限有要求&#xff0c;部分人员对于某个文件夹&#xff0c;以及里面的文件不能有删除权限&#xff0c;在用户被剥夺了删除权限后&#xff0c;造成了一个问题&#xff0c;那就是这些没有删除权限的人员&#xff0c;在…

精益创业方法论在创业实践中的应用:以乔布斯视角探索创新与变革的艺术——张驰咨询

史蒂夫乔布斯以其非凡的愿景、不懈的迭代精神与对产品极致的追求&#xff0c;成为无数创业者心中的灯塔。本文将借鉴乔布斯的创新思维与精益创业方法论相结合&#xff0c;构建一套融合理论与实践的深度框架&#xff0c;旨在指导创业者在不确定的市场环境中高效探索、快速验证并…

jvm 07 GC算法,内存池,对象内存分配

01 垃圾判断算法 1.1引用计数算法 最简单的垃圾判断算法。在对象中添加一个属性用于标记对象被引用的次数&#xff0c;每多一个其他对象引用&#xff0c;计数1&#xff0c; 当引用失效时&#xff0c;计数-1&#xff0c;如果计数0&#xff0c;表示没有其他对象引用&#xff0c;…

Springboot 设置个性化banner

在 Spring Boot 中自定义 banner 的方法有几种&#xff0c;可以通过以下步骤来实现&#xff1a; 1、使用文本文件作为 banner 在 src/main/resources 目录下创建一个名为 banner.txt 的文件。 编辑这个文件&#xff0c;输入想要显示的文本。确保文本中包含换行符和空格…

【排序 - 插入排序 和 希尔排序】

插入排序&#xff08;Insertion Sort&#xff09;是一种简单直观的排序算法&#xff0c;它的工作原理是逐步构建有序序列。在排序过程中&#xff0c;它将未排序的元素逐个插入到已排序的部分中&#xff0c;从而在每次插入时扩展已排序序列的长度。 原理介绍 插入排序的基本思…

mindspore打卡20天之Shufflenet图像分类

ShuffleNet图像分类 当前案例不支持在GPU设备上静态图模式运行&#xff0c;其他模式运行皆支持。 ShuffleNet网络介绍 ShuffleNetV1是旷视科技提出的一种计算高效的CNN模型&#xff0c;和MobileNet, SqueezeNet等一样主要应用在移动端&#xff0c;所以模型的设计目标就是利用有…

浅谈后置处理器之边界提取器

浅谈后置处理器之边界提取器 边界提取器&#xff08;Boundary Extractor&#xff09;作为一种常用的后置处理器&#xff0c;主要用于从服务器响应中提取特定内容&#xff0c;这些内容可以是文本、变量或cookies等&#xff0c;以便于后续请求中重用。本文档将详细介绍如何在JMe…

高阶面试-dubbo的学习

SPI机制 SPI&#xff0c;service provider interface&#xff0c;服务发现机制&#xff0c;其实就是把接口实现类的全限定名配置在文件里面&#xff0c;然后通过加载器ServiceLoader去读取配置加载实现类&#xff0c;比如说数据库驱动&#xff0c;我们把mysql的jar包放到项目的…

人员定位系统可以用在哪些方面?为什么这么受欢迎?

人员定位系统大家都不陌生&#xff0c;它也随着科技的发展变得越来越高端、功能也越来越完善了。从一开始的对讲机沟通到后来的蓝牙定位等等&#xff0c;定位系统的精准度越来越高不说&#xff0c;续航能力也越来也强&#xff0c;以往比较单一和迷你的汽车定位产品都能达到一年…

《故障复盘 · 记一次事务用法错误导致的大量锁表问题》

&#x1f4e2; 大家好&#xff0c;我是 【战神刘玉栋】&#xff0c;有10多年的研发经验&#xff0c;致力于前后端技术栈的知识沉淀和传播。 &#x1f497; &#x1f33b; CSDN入驻不久&#xff0c;希望大家多多支持&#xff0c;后续会继续提升文章质量&#xff0c;绝不滥竽充数…

VS2019使用C#写窗体程序技巧(1)

1、打开串口 private void button1_Click(object sender, EventArgs e){myPort cmb1.Text;mybaud Convert.ToInt32(cmb2.Text, 10);databit 8;parity Parity.None;stopBit StopBits.One;textBox9.Text "2";try{sp new SerialPort(myPort, mybaud, parity, dat…

蓝卓创始人褚健:工业互联网平台技术赋能中小企业数字化转型的实施路径

工业4.0是由工业软件驱动的工业革命&#xff0c;与传统厚重的工业软件不同&#xff0c;supOS就好比嵌入工厂的“安卓系统”。如果把一个工厂当作一台手机&#xff0c;因为有安卓或苹果开放的操作系统&#xff0c;吸引了全世界聪明的人开发了大量APP供人们使用&#xff0c;手机才…