BEV的多传感器融合方案

news2024/10/7 6:42:51

在这里插入图片描述

多模态融合

      • 早期融合(Early Fusion)
      • 晚期融合(Late Fusion)
      • 深度融合(Deep Fusion)
    • BEVFusion - MIT
    • BEVFusion - 阿里&北大
    • UniTR

在这里插入图片描述

感知技术中相机和雷达数据融合方法的概述,这些方法分别是早期融合(Early Fusion)、晚期融合(Late Fusion)和深度融合(Deep Fusion)。

早期融合(Early Fusion)

早期融合指的是在感知层面将来自相机和雷达的原始数据进行融合。

优点

  • 互补性利用:能够充分利用相机(提供丰富的视觉信息和颜色细节)和雷达(提供准确的距离和速度信息)的互补优势。
  • 提高鲁棒性和可靠性:通过综合不同源的信息,可以增强感知系统对各种环境条件的适应能力和可靠性。

缺点

  • 数据异构性问题:相机和雷达数据在形式、尺度和精度上存在差异,需要复杂的预处理和校准过程。
  • 计算效率要求高:融合原始数据通常需要高计算负担,对算力有较高要求。

晚期融合(Late Fusion)

晚期融合是指在决策层面将来自相机和雷达的感知结果进行融合。

优点

  • 计算复杂度低:因为融合发生在较高层面,通常处理的数据量小,减轻了计算负担。
  • 灵活性高:便于集成多种感知策略和算法,提高系统的灵活性。

缺点

  • 互补性利用不足:在决策层融合可能无法充分发挥相机和雷达数据的互补优势。
  • 可能降低鲁棒性和可靠性:由于较晚利用融合信息,可能无法有效应对某些复杂或未预见的情况。

深度融合(Deep Fusion)

深度融合是在特征层或决策层将相机和雷达数据或其特征进行融合。

优点

  • 充分利用互补性:结合了早期和晚期融合的优点,能够更充分地利用相机和雷达的互补优势。
  • 鲁棒性和可靠性提高:通过在更深层面综合信息,能够提高系统对各种环境条件的适应能力。
  • 计算效率的平衡:既能利用深度学习等方法提取有效特征,也能控制计算复杂度。

缺点

  • 数据异构性问题:同早期融合,需要解决不同数据源之间的差异问题。
  • 融合算法的鲁棒性要求:需要开发能够适应多种情况和异常的高鲁棒性融合算法。
方案融合阶段优点缺点
Early Fusion感知层充分利用互补优势,提高鲁棒性数据异构,计算复杂度高
Late Fusion决策层降低计算复杂度,提高灵活性无法充分利用互补优势,降低鲁棒性
Deep Fusion特征层或决策层充分利用互补优势,提高鲁棒性,降低计算复杂度数据异构,鲁棒性待提高

BEVFusion - MIT

在这里插入图片描述
论文解读:

https://zhuanlan.zhihu.com/p/521821929

论文复现:

https://blog.csdn.net/h904798869/article/details/132210022

BEVFusion - 阿里&北大

在这里插入图片描述

UniTR

在这里插入图片描述
在简单的话来说,UniTR是一个先进的技术,它通过使用一种特别的方法来处理来自多种传感器的信息,这对于自动驾驶系统来说非常重要。通常情况下,自动驾驶系统需要处理来自不同传感器(如摄像头、雷达和激光雷达等)的信息来理解周围环境。但是,每种传感器捕获的信息类型不同,处理这些不同类型的信息通常需要大量的计算资源,并且很难实现传感器之间的有效合作。

UniTR改变了这种方式,它使用一种统一的方法来处理所有不同的传感器信息,这意味着它可以同时学习和理解不同传感器提供的数据,而不需要对每种数据进行单独的处理。这是通过一种叫做“Transformer 编码器”的智能算法实现的,它可以处理不同的数据类型并找出它们之间的关系。

此外,UniTR还提出了一种新的方式来整合这些不同的传感器数据,这种方式不仅考虑了2D图像中的细节,也利用了3D数据中的空间信息。这样做可以让系统更好地理解周围的世界,例如,更准确地检测和识别物体和障碍物。

代码复习:

https://zhuanlan.zhihu.com/p/672153815

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1563925.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[原创] MOS管选型

一、选型背景 MOS管是常用元器件之一,学校出来后,很多人都对BJT感兴趣和熟悉,对MOS的熟悉度相对BJT要少一些,即使工作了两三年,对MOS的理解也还是不多,下面通过对MOS管的一些参数解读,加深对MO…

第二届安徽省中小学科技竞赛经验交流会暨NOC省赛解读会在肥顺利举办

阳春三月,喜泰开来。3月30日,第二届安徽省中小学科技竞赛经验交流会暨NOC省赛解读会在合肥顺利举办!本次会议由安徽省人工智能学会主办,赛哆哆承办,会议吸引了近两百名来自全省的中小学教师和科技培训教师,…

【浅尝C++】STL第三弹=>list常用接口使用示例/list底层结构探索/list模拟实现代码详解

🏠专栏介绍:浅尝C专栏是用于记录C语法基础、STL及内存剖析等。 🎯每日格言:每日努力一点点,技术变化看得见。 文章目录 list介绍list常用接口使用示例构造类函数迭代器属性与元素获取增删改操作 list底层结构探索list模…

【保姆级讲解下Docker容器】

🌈个人主页:程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

CTK插件框架学习-信号槽(05)

CTK插件框架学习-事件监听(04)https://mp.csdn.net/mp_blog/creation/editor/137171155 一、主要流程 信号发送者告诉服务要发送的信号信号发送者发送信号信号接收者告诉服务当触发某个订阅的主题时通知槽函数信号接收者处理槽函数信号槽参数类型必须为(const ctk…

Keepalived+MySQL简单搭建实现数据库高可用

需求:想要实现当MySQL服务挂了之后,能够自动切换到另一台,不对当前服务造成过多影响。查找了很多实现数据库高可用方案,比较常见的有MHA(至少三台,一主多从)、开源数据库中间件(Myca…

推箱子_java源码_50张地图_带背景音乐

一. 演示视频 推箱子_java源码_50张地图_带背景音乐 二. 实现步骤 完整项目获取 https://githubs.xyz/y23.html 部分截图 map地图实现 00000000000000000000 00000000000000000000 00000000000000000000 00000000000000000000 00000000000000000000 00000000000000000000 00…

golang和Java的简单介绍和对比

一、golang 1、Golang简介 Golang,也称为Go,是由Google公司在2009年推出的开源编程语言,由罗伯特格瑞史莫(Rob Pike)、肯汤普逊(Ken Thompson)、罗勃派克(Robert Griesemer)等人设计。Go语言的目标是在保持简单高效的编程模型的同时&#xf…

NumPy创建ndarray数组大揭秘

1.使用 np.array() 创建 使用 np.array() 由 python list 创建 n np.array(list) 注意 numpy 默认 ndarray 的所有元素的类型是相同的 如果传进来的列表中包含不同的类型,则统一为同一类型,优先级:str > float > int ndarray 的常…

自动驾驶中基于Transformer的传感器融合:研究综述

自动驾驶中基于Transformer的传感器融合:研究综述 论文链接:https://arxiv.org/pdf/2302.11481.pdf 调研链接:https://github.com/ApoorvRoboticist/Transformers-Sensor-Fusion 附赠自动驾驶学习资料和量产经验:链接 摘要 本…

【论文笔记】Text2QR

论文:Text2QR: Harmonizing Aesthetic Customization and Scanning Robustness for Text-Guided QR Code Generation Abstract 二维码通常包含很多信息但看起来并不美观。stable diffusion的出现让平衡扫描鲁棒性和美观变为可能。 为了保证美观二维码的稳定生成&a…

【PowerDesigner】PGSQL反向工程过程已中断

问题 反向工程过程已中断,原因是某些字符无法通过ANSI–>UTF-16转换进行映射。pg导入sql时报错,一查询是power designer 反向工程过程已中断,某些字符无法通过ANSI–>UTF-16转换进行映射(会导致数据丢失) 处理 注…

获取用户位置数据,IP定位离线库助您洞悉消费者需求

获取用户位置数据是现代互联网应用中非常重要的一环。通过获取用户的位置数据,可以了解用户所在的地理位置,从而更好地为用户提供个性化的服务和推荐。而IP归属地离线库就是一种非常有用的工具,可以帮助企业准确地获取用户的位置信息。 IP归…

Linux系统编程--管道

1、管道(一) 1.1、什么是管道 例如:ls | wc -w这条命令,ls是一个进程,把结果通过|管道输出到wc这个进程中,所以管道本质上是一个内核缓冲区 1.2、管道限制 1.3、匿名管道pipe 1.4、创建管道后示意图 管道…

E-SOP电子指导书系统在日用品生产中的作用

在当今高速发展的日用品生产行业中,E-SOP 电子指导书系统正发挥着越来越重要的作用。它以其独特的优势,为日用品生产带来了许多积极的影响。 1、E-SOP 电子指导书系统提高了生产效率。 在传统的生产方式中,工人往往需要查阅纸质指导书&#…

vue+springboot实现文件上传

①后端springboot创建controller FileController: package com.example.springboot.controller;import cn.hutool.core.io.FileUtil; import com.example.springboot.common.AuthAccess; import com.example.springboot.common.Result; import org.springframework.beans.fact…

【电源专题】电池不均衡的影响与原因

在使用多节电池设计产品时,大家都知道如果多节电池不均衡会影响电池寿命与充电安全。特别是在充电末端与放电末端时表现较为明显。 电池不均衡的影响 那么为什么会影响安全与寿命呢?其原因如下: 如果电池不均衡时,相当于木桶的短板效应。一方面没法充满,充电时电压高的那一…

YOLOv8结合SCI低光照图像增强算法!让夜晚目标无处遁形!【含端到端推理脚本】

这里的"SCI"代表的并不是论文等级,而是论文采用的方法 — “自校准光照学习” ~ 左侧为SCI模型增强后图片的检测效果,右侧为原始v8n检测效果 这篇文章的主要内容是通过使用SCI模型和YOLOv8进行算法联调,最终实现了如上所示的效果:在增强图像可见度的同时,对图像…

2024最新软件测试【测试理论+ python 编程 】面试题(内附答案)

一、测试理论 3.1 你们原来项目的测试流程是怎么样的? 我们的测试流程主要有三个阶段:需求了解分析、测试准备、测试执行。 1、需求了解分析阶段 我们的 SE 会把需求文档给我们自己先去了解一到两天这样,之后我们会有一个需求澄清会议, …

教你一文搞懂cookie

cookie 1、cookie是什么? cookie的中文翻译是曲奇,小甜饼的意思。cookie其实就是一些数据信息,类型为“小型文本文件”,存储于电脑上的文本文件中。 2、cookie有什么用? Cookie主要用于维持用户会话、个性化服务、…