A Survey and Framework of Cooperative Perception 论文阅读

news2025/1/12 16:12:35

论文链接

  • A Survey and Framework of Cooperative Perception: From Heterogeneous Singleton to Hierarchical Cooperation

0. Abstract

  • 首次提出统一的 CP(Cooperative Percepetion) 框架
  • 回顾了基于不同类型传感器的 CP 系统与分类
  • 对节点结构,传感模态和融合方法进行回顾
  • 提出了一个分层的 CP 框架,回顾现有的数据集和模拟器

1. Intro

目前的 CP 主要关注于自我车辆,对于可扩展的通用型 CP 框架仍然缺失。

从三个方面阐述

  • 节点结构
  • 传感器模态
  • 融合方案

同时提出了分层的 CP 框架


2. 架构与分类

SAE J3216 将 CDA 级别定义为五类,包括

  • 无协作自动化
  • A 类:状态共享
  • B 类:意图共享
  • C 类:协议寻求
  • D 类:规定性

2.1 架构

CP 过程的四个典型阶段:信息收集,边缘处理,云计算,消息分发

信息收集
安装在车辆或路边基础设施上的高分辨率传感器感知环境和收集交通信息,并通过通信集线器将收集到的数据传输到边缘服务器进行进一步处理

边缘处理
考虑到使用有限的带宽传输大量的原始数据(如点云数据)可能会导致不可接受的时间延迟(特别是在一些安全关键的场景中),从传感器收集的信息可能会在车辆或基础设施上的边缘服务器上处理。

对于单个的 感知结点(PN) 而言,处理感知数据主要由六个步骤:

  • 预处理:处理原始数据,为特定传感器的感知模块提供现成的格式
  • 特征提取:通过 DNN 或统计方法为后续的任务提取特征
  • 多传感器融合:单个 PN 使用多个传感器时,应该使用多传感器融合算法
  • 检测与跟踪:生成对象检测和跟踪结果,用于展示某些道路使用者的位置,姿态等
  • 原始数据记录:记录带有时间戳的原始传感数据过后期任务判断
  • 结果记录:记录语义感知数据和时间戳以供后期分析

对于不同的 PN,在 CP 系统中的任务也不同,如对于车辆感知结点(V-PN)而言,边缘处理主要用于本身,对于基础设施感知结点(I-PN)而言,其边缘处理是提高固定位置的姿态感知。

云计算
云计算充当多个PN的融合中心。来自异质PN的信息将通过不同的通信方式传输到云端,采用不同的融合方案进行数据融合,这取决于PN和云端之间要共享的数据类型。

对于异构的 PN 有三种类型的感知数据:

  • 原始信息:RGB 图像,点云信息等
  • 特征信息:通过神经网络或统计方法提取的隐藏特征,用于在高维空间中表示原始数据
  • 结果数据:包含2D/3D位置、大小、旋转等语义感知信息

由于带宽限制,结果数据是最常用的感知数据

信息分发
感知信息主要通过两种方式进行传递:1. 没有连接:TMC 等; 2. 有连接:访问定制信息
协同信息合一支持混合交通环境中更为复杂的协同操作

2.2 分类

CP 系统的三个关键方面:

  • 节点的多重性
  • 传感器模态
  • 融合方案

根据节点的多样性和传感器模态可进行以下分类:

  • 单点单模 CP(SS-CP):通过基础设施到所有设备(I2X)或车辆到所有设备(V2X)通信共享来自单模态传感器的感知数据
  • 多点单模 CP(MS-CP):通过I2X和/或V2X通信共享来自单模态多传感器的感知数据
  • 单点多模 CP(SM-CP):通过I2X或V2X通信共享多模态传感器感知数据
  • 多点多模 CP(MM-CP):通过I2X和/或V2X通信共享多模态传感器感知的感知数据


3. 节点结构

将节点定义为能够进行感知和通信的感知节点(PN),作为构建CP系统的基本单元,从节点结构的角度对CP进行讨论。

3.1 I-PN based CP (V2I)

Camera-based I-PN

  • 利用路边摄像机提出了一种基于卷积神经网络(CNN)的行人检测和定位方法
  • 基于单目相机的三维车辆检测方法
  • 车辆实时检测、跟踪和速度估计的监控系统
  • 基于深度学习的、通过路边摄像机自动检测路边停车位的方法
  • 利用多深度摄像机提出了一种协同的三维物体检测模型

LiDAR-based I-PN

  • 经典的PCD探测与跟踪流程:背景滤波,聚类,分类,跟踪
  • 基于学习的模型来处理激光雷达数据是另一种主要方法
3.2 Vehicle Nodes(V2V)
  • 车间的协同感知源于无人机的研究,如基于分布式和集中式的 CP 框架
  • 对于道路车辆:通过V2V通信将接收到的传感器数据关联起来
  • Kim等人实现了一种综合自动驾驶系统(ADS),该系统可以提供超越领先车辆遮挡的自我车辆信息
  • Cooper 和 F-Cooper
  • 进一步考虑通信的局限性,设计了“特征提取-压缩-解压-目标检测”流程
  • 基于特征共享的CP模型。空间定位和特征生成需要车辆相对于自车的姿态信息
3.3 Heterogeneous PN-based CP(V2X)
  • 该方向的研究目前较少
  • 通过 V 与 I 之间的合作
    • 通过PCD生成3D物体检测结果
    • 特征数据通过V2X通信共享
    • 提出一种基于多PN特征融合的网格特征方法
  • V2X-ViT:应用共享权重的 CNN 进行特征提取,车辆的姿态信息被传输到周围车辆和基础设施进行原始数据对齐
3.4 总结
  • V-PN:更具有自我效率
  • I-PN:更适合拓展合作
  • 同构 PN:扩展感知范围
  • 异构 PN:通过补充不同传感器配置,实现更好的 FOV

4. 传感器模态

4.1 配置与性能

目前的主流 ADS 设备是摄像头,LiDAR,雷达。对于路旁的传感器设置有典型的位置:信号臂和路灯柱,且对其最低的高度要求。每种传感器在不同的用例中都有自己的功能和优势:

  • 相机:高分辨率,但对于三维位置和速度测量来说不佳
  • 激光雷达:高精度3D感知,可适应环境变化。但价格相对较高,而且数据稀疏
  • 雷达:测量速度,但不太适合区分物体
  • 热成像相机:获取热信息,为照明变化提供弹性
  • 鱼眼相机:360度全视场(FOV)检测,但需要高精度的校准矩阵来解释失真
  • 环路:测量交通量和速度,安装和维护成本高
4.2 单传感器感知

基于单传感器的目标感知系统:

  • 从传感器收集的数据首先被预处理,以减少噪音,过滤不相关的数据,并为下游模块正确地重新格式化。
  • 应用特征提取,通过数学模型(如果基于传统方法)计算预定义的特征,或通过神经网络(如果基于深度学习)生成隐藏的特征
  • 感知模块生成目标检测和跟踪结果,送入后处理模块,以进一步清理感知输出(例如,过滤重叠的边界框和分数低于阈值的预测)。

4.3 多传感器感知

由于不同传感器的互补性,与基于单传感器的感知系统相比,基于多传感器的感知系统有可能通过传感器融合达到更好的目标检测和跟踪性能。
本节讨论了三种流行的基于高分辨率传感器的多传感器感知方案,即相机+相机,相机+激光雷达,以及激光雷达+激光雷达。

4.4 总结

摄像头擅长捕捉视觉信息,LiDAR在收集三维信息方面非常出色。在一个互补的计划中同时利用这些传感器的优势被认为是提高监控系统感知精度的一个有希望的解决方案。


5. 融合方案

从传感器融合的阶段来看,多传感器感知系统可以分为三类:

  • 早期融合–在预处理阶段融合原始数据
  • 深度融合–在特征提取阶段融合特征
  • 晚期融合–在后处理阶段融合感知结果
5.1 早期融合

与其他的 PN 之间共享原始数据,扩大了感知范围并同时提高精度。但对于原始数据的质量十分敏感。同时需要较大的通信带宽来传输大量的原始数据。在当前的通信能力之下,大规模的 V2V 项目利用早期融合是不可行的。

5.2 后期融合

融合独立的感知结果,对于误差校准和不同步的问题的包容度要远高于早期融合。

5.3 深度融合(中期融合)

使用提取的特征进行融合。目前深度融合仍处于起步阶段,需要后续的工作

5.4 总结

早期融合仅需要将多源数据对齐到统一坐标系中的校准,但需要较大的通信带宽来传输数据。后期融合主要关注如何合并多个感知管道生成的建议,思路简单,但准确性有限。由于其低通信要求和高精度的能力,深度融合正在迅速成为CP的一种可变革的解决方案。


6. 分层协同感知框架(HPC)

当前 CP 系统的三个主要问题:

  • 异构性:CP系统要结合智能汽车和智能基础设施的优势,赋能感知的全面性
  • 可扩展性:CP系统需要能够扩展到不同规模的合作层面,如交叉口层面、走廊层面、交通网络层面
  • 动态性:CP系统需要能够与车辆感知节点动态配合

本文的 HCP 框架主要针对路口场景,分为三个层次:交叉口级别;走廊级别以及网络级别

交叉口级别: V-PN 通信共享与车载数据处理,I-PN 感知结果作为辅助数据
走廊级别: 基于多个基础设施来扩展感知,核心是 I-PN。基于 I2I 的通信,共享原始数据和特征级数据
网络级别: 感知整个流量网络的对象级流量状况,使用后期融合策略


7. 数据集与模拟器

7.1 数据集
  • KITTI: 最受欢迎的数据集之一,由用于移动机器人和自动驾驶的各种传感器模式记录的数小时交通场景组成
  • NuScenes: 第一个搭载全自动车辆传感器套件的数据集:6 个摄像头、5 个雷达和 1 个 LiDAR,全部具有全 360 度视野
  • Waymo Open Dataset: 大规模、高质量、多样化的数据集,包含在一系列城市和郊区地理地形中捕获的 1150 个场景

2021年,Deng等人发布了BAAI-VANJEE路边数据集。支持互联自动车辆高速公路技术数据集由路边数据采集平台采集的LiDAR数据和RGB图像组成,包含2500帧LiDAR数据和5000帧RGB图像,其中包括12类物体、74K 3D物体注释和105K 2D物体注释

2022 年之前,没有可用的开源协作感知数据集来处理现实世界的数据

7.2 模拟器
  • CARLA: 一款用于自动驾驶的开源模拟器,支持灵活的传感器套件规格和环境条件
  • SVL: 一种用于驾驶自动化的高保真模拟器,它提供端到端和全栈模拟,可与多个开源自动驾驶堆栈(例如 Autoware 和 Apollo)连接
  • MavLink: 可以高频运行以进行实时硬件在环 (HIL) 仿真,并支持流行的协议

8. 讨论

8.1 现状与挑战
  • 异质性的感知单体:由于路边的传感器有更灵活的位置和姿势来获取数据,协同感知的一个典型方式是将信息从基础设施一侧传输给道路使用者。由于感知单体的异质性,最近只有少数研究考虑了车辆节点和路边设施节点之间的合作。
  • 传感器系统:在大多数研究中,摄像头和激光雷达传感器是分开工作的。另一方面,尽管路边设施在协同感知中起着关键作用,但目前基于路边传感器的感知方法在大多数情况下是直接应用一般的感知方法。主要挑战之一是路边数据采集和注释,以促进基于路边设施的感知系统的深度学习研究。
  • 融合策略的通用性:不同的融合方案有其特定的优势和劣势
8.2 未来趋势
  • 异质合作
    车辆与路边设施的合作是解决许多现有交通相关问题的一个有希望的方案。车辆-路边设施协同感知可以利用车辆(作为具有轻量级处理能力的移动感知节点)和基础设施(作为固定节点但具有强大的处理/存储单元)的能力来实现更好的性能。
  • 多模式的合作
    基于多传感器的感知系统有可能通过利用互补的传感器数据与适当的融合技术来提高感知性能。在照相机和LiDAR传感器的范围内,目前多模态传感器融合的发展主要是针对一个单一agent上配备的多个传感器的一般目标感知。 针对多个感知节点的特定多模态传感器融合仍是一个空白领域,然而,这也是提高整个系统感知精度的重要途径。
  • 可扩展的合作
    一些协同感知方法主要是为了在周围节点的协助下增强自车的感知能力,要求周围节点根据自车的元数据来调整它们分享的数据,当涉及众多车辆,这可能会导致可扩展性问题。基于路边设施的感知系统在传感器设备方面更加灵活,具有高计算边缘处理器、大数据存储和宽通信带宽。通过只在车辆上部署轻量级的车载计算模块,如特征图提取,实现基于局部深度融合的协同感知,或从基于路边设施的高性能节点检索感知结果,以实现更广泛的感知,这将变得更加经济有效。

9. 总结

  • 提出了架构和分类法,以说明协同感知系统的基本组成部分和核心内容。
  • 从节点结构、传感器模式和融合方案三个方面详细介绍了协同感知方法,并进行了文献复盘。
  • 提出的分层合作感知框架分别从交叉口、走廊和网络等不同层面进行分析。
  • 简要回顾了用于实现合作感知的现有数据集和模拟器,以确定其差距。
  • 讨论了当前的问题和未来的趋势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1071251.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CCF CSP认证 历年题目自练Day25

题目 试题编号: 201403-3 试题名称: 命令行选项 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述   请你写一个命令行分析程序,用以分析给定的命令行里包含哪些选项。每个命令行由若干个字符串组成,它们之间…

解决远程git服务器路径改变导致本地无法push的问题

解决远程git服务器路径改变导致本地无法push的问题 (1)第一步:查看git配置 git config -l(2)第二步:删除远程git地址 git remote remove origin(3)第三步:再次查看git配…

JUC第十九讲:Java线程池实现原理及其在美团业务中的实践

JUC第十九讲:Java线程池实现原理及其在美团业务中的实践 随着计算机行业的飞速发展,摩尔定律逐渐失效,多核CPU成为主流。使用多线程并行计算逐渐成为开发人员提升服务器性能的基本武器。J.U.C提供的线程池ThreadPoolExecutor类,帮…

Vue中如何进行图像识别与人脸对比(如百度AI、腾讯AI)

Vue中的图像识别与人脸对比 在现代Web应用程序中,图像识别和人脸对比技术越来越受欢迎。它们可以用于各种用途,如人脸识别门禁系统、图像分类和验证等。百度AI和腾讯AI是两个流行的人工智能平台,它们提供了强大的图像识别和人脸对比API。本文…

【threejs】基本编程概念及海岛模型展示逻辑

采用three封装模式完成的海岛动画&#xff08;点击这里查看&#xff09; 直接上代码吧 <template><div class"scene"><video id"videoContainer" style"position:absolute;top:0px;left:0px;z-index:100;visibility: hidden"&g…

37.普利姆(Prim)算法

从一个问题开始 “要想富&#xff0c;先修路”&#xff0c;郝乡长最近为了德胜乡修路的事情愁白了头。 得胜乡有A、B、C、D、E、F、G七个村子&#xff0c;现在需要修路把7个村庄连通&#xff0c;但是又想要耗费的公路建材最少&#xff08;修建公路的总里程最短&#xff09;&…

强烈推荐这5款功能强大的小软件

​ 今日的栽种&#xff0c;明日的果实&#xff0c;今天继续分享五个功能强大的小软件。 1.文本编辑——IDM UltraEdit ​ IDM UltraEdit是一款功能强大的文本编辑器&#xff0c;它支持多种编程语言和文件格式&#xff0c;可以处理大型文件&#xff0c;进行代码折叠&#xff0…

IDEA插件版本升级和兼容新版本idea

1.关于IDEA插件的版本设置问题 打开jetbrains插件市场&#xff0c;随意打开一个插件详情页面的Versions菜单&#xff0c;我们可以看见一个插件包不同时期发布的不同版本&#xff08;Versions&#xff09;&#xff0c;并且每个版本包含了可兼容IDEA或PyCharm的版本范围&#xf…

文件智能管理将文件统一保存在某个指定文件夹中

日常工作中经常会整理文件到指定的文件夹&#xff0c;少的时候用鼠标拖拖&#xff0c;多了就很麻烦了&#xff0c;手动操作很容易出现漏洞&#xff0c;会漏个某文件没有移动进去或出现重复移动同一个文件等&#xff0c;移动文件这种工作很枯燥可以交给文件批量改名高手软件&…

Excel宏管理库存清单

1. 开启宏: - 打开 Excel - 选择 “文件” > “选项” > “自定义功能区” > “开发工具” &#xff0c;将其添加到功能区。 - 返回Excel界面&#xff0c;点击 “开发工具” 选项卡。 2.准备你的库存清单&#xff1a; - 在一个新的工作表中创建你的库存清单。…

【QT入门1】

目录 1.创建工程时基类的选择 2.第一个QT程序 3.创建一个按钮 4.对象树简单理解 5.信号和槽 5.1自定义信号槽 5.2信号连接信号 5.3信号函数和槽函数的注意事项 5.4配合lambda表达式 1.创建工程时基类的选择 在创建工程时会被要求选择一个基类&#xff1a; 这里有三个…

【Java】语法特性篇

语法特性篇 Java对象的比较 1. 对象比较的问题 Java中引用类型的变量不能直接按照 > 或者 < 方式进行比较。那为什么可以比较&#xff1f; 因为&#xff1a;对于用户实现自定义类型&#xff0c;都默认继承自Object类&#xff0c;而Object类中提供了equal方法&#xf…

Kafka实战案例

kafka系统的生成&#xff0c;自顶向下 1. kafaka发送消息 1.1 是最初始外部调用kafaka的地方1.6 是最初调用kafaka的函数。中间是对kafaka的构建 1.1 向Kafka发送一条发布视频的message 在videoHandler的发布视频逻辑中&#xff0c;向Kafka发送一条发布视频的mq&#xff0c…

Ubuntu 22.04 安装系统 手动分区 针对只有一块硬盘 lvm 单独分出/home

自动安装的信息 参考自动安装时产生的分区信息 rootyeqiang-MS-7B23:~# fdisk /dev/sdb -l Disk /dev/sdb&#xff1a;894.25 GiB&#xff0c;960197124096 字节&#xff0c;1875385008 个扇区 Disk model: INTEL SSDSC2KB96 单元&#xff1a;扇区 / 1 * 512 512 字节 扇区大…

基于Springboot实现论坛管理系统项目演示【项目源码+论文说明】分享

基于Springboot实现论坛管理系统演示 摘要 在社会快速发展的影响下&#xff0c;论坛管理系统继续发展&#xff0c;使论坛管理系统的管理和运营比过去十年更加信息化。依照这一现实为基础&#xff0c;设计一个快捷而又方便的网上论坛管理系统是一项十分重要并且有价值的事情。对…

排序(order by)

MySQL从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129334507?spm1001.2014.3001.5502 语法格式: select */列名 from 表名 order by 列名1 asc/desc, 列名2 asc/desc; 说明&#xff1a; 排序的目的&#xff1a;改变查询结果的返回顺序…

学习笔记(css穿透、vue-cookie、拦截器、vuex、导航守卫、token/Cookie、正则校验)

目录 一、记录 1、CSS穿透 2、输入框是否提示输入 3、插槽 #slot 4、v-deep深入改掉属性值 二、vue-cookie 1、官方文档 2、使用 三、拦截器 1、请求拦截器 2、响应拦截器 四、vuex对信息存取改 五、路由导航守卫 1、登录思路 2、设置白名单 六、Token与Cookie…

vue3 集成 tailwindcss

tailwindcss 介绍 Tailwind CSS 是一个流行的前端框架&#xff0c;用于构建现代、响应式的网页和 Web 应用程序。它的设计理念是提供一组可复用的简单、低级别的 CSS 类&#xff0c;这些类可以直接应用到 HTML 元素上&#xff0c;从而加速开发过程并提高样式一致性。 主要特点…

【数据结构与算法】二叉树的实现以及二叉排序数的实现

目录 通过数组实现二叉树 通过链表实现二叉树 排序二叉树的实现 通过数组实现二叉树 该实现方式只能用于完全二叉树&#xff0c;因为如果是普通二叉数的话&#xff0c;数组中会出现空隙&#xff0c;会导致空间的利用率会降低。 实现思路&#xff1a; 因为假设一个父节点的…

原码反码补码移码的介绍和计算

1.原码 原码的定义&#xff1a;十进制数据的二进制表示形式就是原码。 &#xff08;1&#xff09;原码的最左边那位是符号位&#xff0c;其他位为数据位&#xff0c;符号位是0则为正数&#xff0c;符号位是1则为负数。 &#xff08;2&#xff09;一个byte有8bit&#xff0c;最…