Para-Lane: 首个真实世界多车道数据集,目的评估自动驾驶系统中的新型视角合成能力。

news2025/2/27 0:42:43

2025-02-22,阿里巴巴集团菜鸟自动驾驶实验室和百度研究院共同创建了一个名为 Para-Lane 的真实世界多车道数据集。该数据集目的评估自动驾驶系统中的新型视角合成(NVS)能力,通过提供大量真实世界的数据,弥补了现有合成数据集在真实性方面的不足,为自动驾驶技术的发展和仿真提供了重要支持。

一、研究背景

自动驾驶技术的发展离不开对复杂场景的精确感知和仿真测试。新型视角合成(NVS)技术在自动驾驶系统中扮演着重要角色,它不仅能够帮助训练感知模型,还能生成各种视角的传感器数据,用于闭环仿真。然而,现有的 NVS 数据集大多基于合成场景,缺乏真实世界数据的复杂性和真实性,这限制了 NVS 技术在实际应用中的性能评估和发展。

目前遇到困难和挑战:

真实世界数据采集难度大:在真实世界中,采集多车道数据需要复杂的硬件设备和精确的传感器校准,同时还要面对动态物体、光照变化等挑战。

多传感器数据对齐复杂:自动驾驶系统中涉及多种传感器(如 LiDAR、摄像头等),这些传感器的数据需要精确对齐,但现有的对齐方法在处理多模态数据时存在精度不足的问题。

缺乏真实世界多车道数据集:现有的数据集大多集中在单一路况或合成场景,缺乏真实世界多车道场景的数据,这使得 NVS 技术在跨车道场景下的性能评估变得困难。

数据集地址:Para-Lane|自动驾驶数据集|多传感器数据融合数据集

二、让我们一起来看一下Para-Lane数据集

Para-Lane 是首个真实世界多车道数据集,目的是评估自动驾驶系统中的新型视角合成能力。

Para-Lane 数据集包含 25 组关联序列,涵盖 16,000 张前视图像、64,000 张环视图像和 16,000 帧 LiDAR 数据。所有数据均经过精确标注,区分了动态物体和静态元素。数据集通过多传感器数据对齐,提供了真实世界多车道场景下的精确数据,为自动驾驶仿真和 NVS 技术评估提供了重要资源。

数据集构建:

数据集的构建采用了多阶段姿态优化机制,首先通过 LiDAR 映射构建参考坐标系下的 LiDAR 地图,然后将相机帧注册到 LiDAR 地图中,实现多模态数据的精确对齐。具体步骤包括:

LiDAR 映射:利用 RTK/INS 传感器的初始轨迹,通过离线 LiDAR odometry 和回环闭合优化,构建高精度的 LiDAR 地图。

相机帧注册:将相机帧通过粗初始化和精细优化,注册到 LiDAR 地图中,实现多模态数据的精确对齐。

数据特点:

真实世界数据:数据集来源于真实世界多车道场景,具有高度的真实性和复杂性。

多模态数据对齐:通过多阶段姿态优化,实现了 LiDAR 和相机数据的精确对齐。

精确标注:所有数据均经过精确标注,区分了动态物体和静态元素,方便后续研究和应用。

基准测试:

数据集提供了多种基准测试,包括单车道回归、相邻车道预测、第二相邻车道预测、双车道训练的相邻车道预测和夹层车道预测。基准测试使用了多种评估指标,如峰值信噪比(PSNR)、结构相似性指数(SSIM)和学习感知图像块相似性(LPIPS),以全面评估 NVS 方法的性能。

我们的工作引入了第一个真实世界的多车道数据集,用于评估最近的自动驾驶重建方法的新型视图合成能力。使用三个激光扫描仪、一个前视摄像头和四个环视摄像头的多通道轨迹扫描公共城市道路。通过 LiDAR 映射和多模态 Structure-from-Motion 技术精确对齐逐帧姿势。

我们的数据收集无人车的传感器组件和样本框,右侧鱼眼相机对称安装在左侧鱼眼的对面,后鱼眼位于背面的中心。

LiDAR 映射的定量指标。我们选择对拼接的 LiDAR 框架(以厘米为单位)的 MAE 和 RMSE 进行采样和评估。

LiDAR 地图拼接质量在彩虹中 20 厘米周期性高度斜坡(左列)和 10 厘米 cividis 颜色图中可视化,反映距离与重建网格(右列)。误差图和放大视图都反映出,与初始 RTK 轨迹(第一行)相比,这些改进的 LiDAR 帧姿势(第二行)由于帧姿势更好,实现了更薄的拼接云和更少的悬停噪声点。

姿态估计的定量指标。我们选择重投影误差(以像素为单位)作为常见的 SfM 指标 [31] 来评估相机帧之间的相干性,并选择 NID 损失 [30] 来评估相机帧和 LiDAR 映射之间的相干性。

我们的跨模态姿态优化框架中使用的因素,我们通过将彩色强度图的 alpha 混合到相应的相机帧上来可视化 LiDAR 相机的对准质量。我们建议读者参考我们的补充视频,了解我们的 LiDAR 地图和多相机帧的数据对齐质量。

使用不同泳道组合的 5 个评估轨道,用于训练(蓝色)和测试(红色)。

我们提出的 Para-Lane 数据集上不同高斯重建方法的定量结果。

不同方法和设计之间的 NVS 质量比较,有关更多序列的结果,请参阅我们的补充视频

我们提出的带有动态对象的 Para-Lane 数据集的定量结果。我们在有和没有面罩的情况下进行重建以进行消融研究。

EmerNeRF 和 PVG 在单通道测试中 NVS 质量的比较。

三、让我们一起来看一下Para-Lane 数据集应用场景

自动驾驶仿真中的视角合成测试

比如你正在开发一种新的自动驾驶算法,用于在多车道场景中进行路径规划和障碍物检测。以前,你只能使用合成数据集或单一路况数据集进行测试,这些数据集无法完全模拟真实世界中的复杂情况。然而,有了Para-Lane数据集,研究人员可以利用其真实世界多车道场景的数据,进行以下改进:

1、数据加载与对齐 你可以直接加载Para-Lane数据集中的LiDAR和相机数据,并利用其预对齐的多模态数据进行仿真测试。这避免了手动对齐数据的繁琐过程,节省了大量时间和精力。

2、真实场景下的性能评估 通过在Para-Lane数据集上测试自动驾驶算法,你可以评估算法在真实世界多车道场景中的性能。例如,你可以测试算法在不同车道视角下的障碍物检测能力,以及在复杂光照和动态物体条件下的鲁棒性。

3、优化算法性能 基于Para-Lane数据集的测试结果,你可以发现算法在真实世界场景中的不足之处,并针对性地进行优化。例如,你可以改进算法在处理动态物体时的准确性,或者优化算法在不同车道视角下的路径规划能力。

4、提升仿真测试的泛化能力 Para-Lane数据集的多车道场景和真实世界数据,你能够测试算法在各种复杂场景下的性能。这有助于提升算法的泛化能力,使其在真实驾驶环境中表现更加稳定和可靠。

Para-Lane数据集为自动驾驶仿真测试提供了真实世界多车道场景的丰富资源,极大地改善了自动驾驶算法的测试和优化过程

知识小科普:

新型视角合成(Novel View Synthesis,NVS)能力是指从新的相机角度生成与一组图像合理一致的视图的技术。具体来说,给定源图像及源姿态,以及目标姿态,NVS 能够渲染生成目标姿态对应的图片。这项技术在 3D 重建、增强现实(AR)、虚拟现实(VR)等领域有着广泛的应用。

技术原理:

NVS 的一般步骤包括:

1、三维重建:从已有视角的图像中推断出场景的三维几何信息,包括物体的形状和位置。

2、渲染:利用三维重建的信息,通过渲染技术生成新视角下的图像,考虑光照和纹理等因素

应用场景:

自动驾驶:NVS 可以帮助生成不同视角的传感器数据,用于训练和测试自动驾驶模型,特别是在模拟不同驾驶场景时非常重要。

3D 重建:通过从多个视角生成图像,NVS 可以帮助构建更加完整和精确的 3D 模型。

AR/VR:在增强现实和虚拟现实应用中,NVS 可以生成沉浸式的体验,让用户从不同角度观察虚拟场景。

医学成像:NVS 技术可以用于提高医学成像中的 X 射线新视角合成的效率,减少患者和医生的等待时间,提高诊断效率。

更多开源的数据集,请打开:遇见数据集

遇见数据集-让每个数据集都被发现,让每一次遇见都有价值。遇见数据集,领先的千万级数据集搜索引擎,实时追踪全球数据集,助力把握数据要素市场。https://www.selectdataset.com/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2306619.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[算法--前缀和] 一维前缀和

目录 1. 前缀和: 是一种对暴力求解的优化.2. 前缀和? 如何利用前面的计算结果提高效率?3. 如何预处理前缀和数组(如何让处理前缀和数组的复杂度是O(N))?接下来, 我们开启一个新的专题 -> 前缀和, 第一道是模板题, 一维前缀和 1. 前缀和: 是一种对暴力求解的优化. 前缀和…

《零基础学会!如何用 sql+Python 绘制柱状图和折线图,数据可视化一看就懂》

在数据驱动的时代,MySQL 是最常用的关系型数据库管理系统之一,广泛应用于各类数据存储和处理场景。数据分析的过程不仅仅是收集数据,还包括数据的清洗、转换、查询以及最终的报告和可视化。在本文中,我们将通过实际案例来介绍如何…

【算法系列】归并排序详解

文章目录 归并排序详解1. 基本原理1.1 分治法策略1.2 归并排序步骤1.3 图解示例 2. 时间复杂度与空间复杂度2.1 时间复杂度2.2 空间复杂度 3. 稳定性4. Java 实现示例5. 归并排序的优点与缺点5.1 优点5.2 缺点 6. 总结 归并排序详解 归并排序(Merge Sort&#xff0…

Vue的项目创建以及项目目录与组合式API

一.创建Vue 1.Vue-CLI:创建Vue的脚手架工具 2.Create-vue:是Vue官方提供的脚手架之一,底层采用官方自主研发的vite,快捷,开发方便。 3.准备工作:系统中需要安装nodejs环境,在该环境中提供npm包管理器 4.创建Vue项目的命令:npm init vuela…

【学习笔记】计算机网络(四)

第4章 网络层 文章目录 第4章 网络层4.1 网络层的几个重要概念4.1.1 网络层提供的两种服务虚电路服务(Virtual Circuit Service)数据报服务(Datagram Service) 4.1.2 网络层的两个层面 4.2 网际协议 IP - IPv44.2.1 虚拟互连网络4…

DeepSeek-R1:通过强化学习激励大语言模型的推理能力

摘要 本文介绍了我们的第一代推理模型,DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是通过大规 模强化学习(RL)训练的模型,在没有使用监督微调(SFT)这个前置步骤的情况下,展示了卓越的推…

洛谷 P8705:[蓝桥杯 2020 省 B1] 填空题之“试题 E :矩阵” ← 卡特兰数

【题目来源】 https://www.luogu.com.cn/problem/P8705 【题目描述】 把 1∼2020 放在 21010 的矩阵里。要求同一行中右边的比左边大,同一列中下边的比上边的大。一共有多少种方案? 答案很大,你只需要给出方案数除以 2020 的余数即可。 【答案提交】 …

【无标题】网络安全公钥密码体制

第一节 网络安全 概述 一、基本概念 网络安全通信所需要的基本属性“ 机密性;消息完整性;可访问性与可用性;身份认证。 二、网络安全威胁 窃听;插入;假冒;劫持;拒绝服务Dos和分布式拒绝服务…

【含开题报告+文档+PPT+源码】基于SpringBoot的进销存管理系统的设计与实现

开题报告 本文提出并研发了一款基于Spring Boot框架构建的进销存管理系统,该系统集成了全方位的企业运营管理功能,涵盖了用户登录验证、系统公告管理、员工信息与权限管理、物料全流程(采购入库、销售出库、退货处理)控制、部门组…

Linux-SaltStack配置

文章目录 SaltStack配置 🏡作者主页:点击! 🤖Linux专栏:点击! ⏰️创作时间:2025年02月24日20点51分 SaltStack配置 SaltStack 中既支持SSH协议也支持我们的一个客户端 #获取公钥(…

事务的4个特性和4个隔离级别

事务的4个特性和4个隔离级别 1. 什么是事务2. 事务的ACID特性2.1 原子性2.2 一致性2.3 持久性2.4 隔离性 3. 事务的创建4. 事务并发时出现的问题4.1 DIRTY READ 脏读4.2 NON - REPEATABLR READ 不可重复读4.3 PHANTOM READ 幻读 5. 事务的隔离级别5.1 READ UNCOMMITTED 读未提交…

对计算机中缓存的理解和使用Redis作为缓存

使用Redis作为缓存缓存例子缓存的引入 Redis缓存的实现 使用Redis作为缓存 缓存 ​什么是缓存,第一次接触这个东西是在考研学习408的时候,计算机组成原理里面学习到Cache缓存,用于降低由于内存和CPU的速度的差异带来的延迟。它是在CPU和内存…

SOME/IP-SD -- 协议英文原文讲解5

前言 SOME/IP协议越来越多的用于汽车电子行业中,关于协议详细完全的中文资料却没有,所以我将结合工作经验并对照英文原版协议做一系列的文章。基本分三大块: 1. SOME/IP协议讲解 2. SOME/IP-SD协议讲解 3. python/C举例调试讲解 5.1.2.5 S…

lowagie(itext)老版本手绘PDF,包含页码、水印、图片、复选框、复杂行列合并等。

入口类:exportPdf ​ package xcsy.qms.webapi.service;import com.alibaba.fastjson.JSONArray; import com.alibaba.fastjson.JSONObject; import com.alibaba.nacos.common.utils.StringUtils; import com.ibm.icu.text.RuleBasedNumberFormat; import com.lowa…

达梦有没有类似oerr的功能

在oracle 23ai的sqlplus中&#xff0c;直接看异常信息说明&#xff1a; 达梦没有此功能&#xff0c;但是可以造一个 cd /home/dmdba cat >err.sql<<eof set echo off set ver off set timing off set lineshow off set feedback off select * from V\$ERR_INFO wher…

实战-网安

面试感受:网安公司前端实习 今天我有幸面试了一家网络安全公司的前端开发实习岗位,整个过程让我受益匪浅,也让我对未来的职业发展有了更清晰的认识。 首先,面试官非常专业且友好,整个面试氛围轻松但不失严谨。面试一开始,面试官简单介绍了公司背景和团队文化,让我对公…

MybatisPlus-扩展功能-枚举处理器

在Mybatis里有一个叫TypeHandler的类型处理器&#xff0c;我们常见的PO当中的这些成员变量的数据类型&#xff0c;它都有对应的处理器&#xff0c;因此它就能自动实现这些Java数据类型与数据库类型的相互转换。 它里面还有一个叫EnumOrdinalTypeHandler的枚举处理器&#xff0…

力扣2454. 下一个更大元素 IV

力扣2454. 下一个更大元素 IV 题目 题目解析及思路 题目要求对于每个数&#xff0c;找到右边比它大的第二个数&#xff0c;并记录在ans数组中 如果是右边第一个大的&#xff0c;就用一个递减栈即可&#xff0c;栈顶元素如果<当前元素则弹出 第二个大数就要利用弹出的栈顶…

unity学习51:所有UI的父物体:canvas画布

目录 1 下载资源 1.1 在window / Asset store下下载一套免费的UI资源 1.2 下载&#xff0c;导入import 1.3 导入后在 project / Asset下面可以看到 2 画布canvas&#xff0c;UI的父物体 2.1 创建canvas 2.1.1 画布的下面是 event system是UI相关的事件系统 2.2 canvas…

Ollama部署与常用命令

Ollama是一款开源工具&#xff0c;其目标是简化大语言模型在本地环境的部署和使用。它支持多种流行的开源大语言模型&#xff0c;如 Llama 2、Qwen2.5等。 通过Ollama&#xff0c;用户无需具备深厚的技术背景&#xff0c;就能在普通的消费级硬件上快速搭建一个强大的语言处理环…