自动驾驶数据集的应用与思考

news2025/1/11 8:00:49

数据作为新型生产要素,是数字化、网络化、智能化的基础,是互联网时代的“石油”“煤炭”,掌握数据对于企业而言是能够持续生存和发展的不竭动力,对于需要大量数据训练自动驾驶系统的企业而言更是如此。

而随着激光雷达、毫米波雷达、摄像机、全球定位系统、惯性测量单元等关键技术上车,一辆智能网联汽车所能够收集到的数据也越发丰富。据英特尔公司预测,一辆智能网联自动驾驶汽车每运行8小时将产生4TB的数据。但面对如此纷繁杂乱的数据,“如何利用、用在何处”成了各大企业面对的问题。基于此,各大研究所开源数据集为自动驾驶发展指明应用方向。

1.发展状况

2009年英国剑桥大学研究团队发布CamVid数据集,这是第一个标注了语义信息的视频数据集,包含激光雷达、相机和IMU三类传感器设备采集到的多段路况环境信息,其中图像包含有像素级的语义标注数据,为早期自动驾驶的研究提供了重要帮助。

2012年德国卡尔斯鲁厄理工学院发布KITTI数据集,它包含的点云、图像和实时定位数据,至今仍活跃在自动驾驶相关研究的科研一线,是自动驾驶和移动机器人定位导航领域最重要的算法验证数据集之一。

随后2014年牛津大学发布Oxford RobotCar数据集,2016年独立团队发布Cityscapes数据集,2018年百度发布ApolloScape数据集,2019年本田研究所发布H3D数据集,同年安波福发布nuScenes数据集等。2020年Waymo公司开展了史上最大的自动驾驶数据集采集计划,其数据采集的时间、地点、路线范围都远超已有的数据集。

这些数据集相比于早期的CamVid与KITTI数据集,在数据容量、数据丰富度和数据质量都有了十分明显的提升。至此,自动驾驶数据集的制作,已由早期的纯科研课题,转化为需要大规模人力、物力和财力支撑的工程化、商业化课题。

图片

2.应用方向及案例

正因采集到的数据丰富而多样,在将其应用到模型训练前,需要将各类数据分类并标注,以便其理解,再通过一代一代的升级,实现自动驾驶系统的完善。从自动驾驶系统的感知、决策、执行三方面出发,采集到的数据可以分为八大应用方向:目标检测数据集、语义分割数据集、车道线检测数据集、光流数据集、立体数据集、定位与地图数据集、驾驶行为数据集、仿真数据集。以下将简要介绍其中个别数据集应用案例。

目标检测数据集:Waymo数据集

目标检测需要识别出图片中目标的类别,并定位到目标的具体位置并用矩形框标。而Waymo数据集是到目前为止最大、最多样化的数据集。相比于以往的数据集,Waymo在传感器质量和数据集大小等方面都有较大提升,场景数量是nuScenes数据集的三倍,包括1950个自动驾驶视频片段(至少20s长);以及汽车、行人、自行车、交通标志四类标签;1260万个3D框,1180万个2D框;采集范围涵盖美国加州的凤凰城、柯克兰、山景城、旧金山等地区的市中心和郊区。同时涉及各种天气条件下的驾驶数据,包括白天、黑夜、黎明、黄昏、雨天、晴天等。

图片

语义分割数据集:Cityscapes数据集

语义分割指的是把图像中的每个像素都划分到某一个类别上。Cityscapes专注于对城市街景的语义理解,包含从50个不同城市的街景中记录的各种立体视频序列,拥有5000张在城市环境中驾驶场景的图片;具有19个类别的密集像素标注,其中8个具有实例级分割;高质量的像素级注释有5000帧,另外还包括20000个弱注释帧;标注类别包括平面、建筑、自然、车辆、天空、物体、人类和空洞等。

图片

 驾驶行为数据集:JAAD数据集

JAAD是用于研究自动驾驶背景下的联合注意力的数据集。重点是行人和驾驶员在交叉路口的行为以及影响它们的因素。为此,JAAD数据集提供了有丰富注释的346个短视频片段(5-10秒长)的集合,代表了北美和东欧不同天气状况下城市驾驶的典型场景,同时为所有行人提供了带有遮挡标签的边界框,使这个数据集适用于行人检测。行为注释说明了与司机互动或需要司机注意的行人的行为,每段视频都有几个标签(天气、地点等)和固定列表中带有时间戳的行为标签,例如停止、行走、寻找等。此外,还提供每一帧的可见交通场景元素列表,如停车标志、交通信号等。

图片

3.相关思考

基于此,数据有着丰富而又广阔的应用场景,对于强化自动驾驶的感知、决策、执行系统大有裨益,能够极大地提升自动驾驶的安全性,为用户的行车安全保驾护航。但是仍面临着一些亟待解决的挑战:

一是车辆数据的归属权。当前对于车辆数据的归属权尚未明确,厂商需要自建数据集以训练自动驾驶系统,成本高昂且效率低下。同时还存在着“数据量不足”和“交通状况覆盖面狭窄”等问题。

面对海量的用户数据,智己汽车提出了解决办法,即用户通过贡献数据换取“原石”。这一方法间接承认了用户的数据权益,明确了数据、用户、企业三者之间的关系,让用户可以利用数据升级车辆软硬件、享受智享服务等。虽然实际效果还有待用户验证,以及更明确的政策层面保障还有待出台,但是这一方法或许值得借鉴。

二是如何开放更深层次的数据集。当前,行业企业的数据由于缺乏统一的格式和标准以及有效的共享协同机制,难以形成完整的数据产业生态。而且对于自动驾驶系统而言,即使开源了数据集,其所需要的数据量是庞大的,一家企业的数据往往难以支撑起复杂的交通状况,需要各企业合力共建,打造从数据采集到数据标注,再到模型训练、数据分析的完整的数据闭环。

清华大学智能产业研究院率先响应,联合北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院共同发布了DAIR-V2X,该数据集提供的示范区内真实场景下的数据,覆盖了一些复杂的交通、天气、环境等信息。该数据集开放的目的还在于支持一批车路协同数据标准的制定,从而支撑自动驾驶的模型训练和数据分析,为行业发展降本增效。虽然目前还仅限示范区小范围,但这一系统性思路值得借鉴。

三是基于生成式大模型技术的思考。尽管面临着重重挑战,但随着科技的进步,尤其是大模型的出现给数据集的发展带来了机遇,为数据集的高效利用提供了新方法。业内大模型结合的NeRF技术,不仅能够重建数据集里的场景,还支持编辑天气、路况以及主车的姿态、位置、行驶轨迹等,以数据生成数据,减少了数据的采集需求。此外,对于数据的预处理,大模型能够自动分类驾驶场景,减少人工筛选劳动,据行业观察,其精准率达90%;其在助力数据标注,提升标注效率,降低人工成本方面也被看好。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2256968.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

开源项目:轻型图像分割 unet_lite

DataBall 助力快速掌握数据集的信息和使用方式,会员享有 百种数据集,持续增加中。 需要更多数据资源和技术解决方案,知识星球: “DataBall - X 数据球(free)” -------------------------------------------------------------…

贪心算法专题(四)

目录 1. 单调递增的数字 1.1 算法原理 1.2 算法代码 2. 坏了的计算器 2.1 算法原理 2.2 算法代码 3. 合并区间 3.1 算法原理 3.2 算法代码 4. 无重叠区间 4.1 算法原理 4.2 算法代码 5. 用最少数量的箭引爆气球 5.1 算法原理 ​5.2 算法代码 1. 单调递增的数字…

【大模型系列篇】GPU资源容器化访问使用指南

在当今的高性能计算和机器学习领域,GPU(图形处理单元)因其卓越的并行计算能力而扮演着至关重要的角色。随着容器化技术如 Docker 的普及,越来越多的数据科学家和开发者选择将他们的应用和工作负载封装到 Docker 容器中&#xff0c…

【力扣】409.最长回文串

问题描述 思路解析 因为同时包含大小写字母,直接创建个ASCII表大小的桶来标记又因为是要回文子串,所以偶数个数的一定可以那么同时,对于出现奇数次数的,我没需要他们的次数-1,变为偶数,并且可以标记出现过…

Linux——管理用户和用户组

一、用户有哪些 root用户 定义:root用户是Linux系统中的最高权限用户,具有对系统所有资源的完全控制权。特性:root用户可以执行系统中的任何操作,包括修改系统配置文件、安装软件、管理系统服务等。由于其拥有最高权限&#xff0c…

SIP系列七:ICE框架(P2P通话)

我的音视频/流媒体开源项目(github) SIP系列目录 目录 一、NAT 1、NAT介绍 2、NAT类型 2.1、 完全圆锥型NAT 2.2、受限圆锥型NAT 2.3、端口受限圆锥型NAT 2.4、对称NAT 3、NAT打洞 3.1、不同一NAT下 3.2、同一NAT下 二、ICE 三、ICE中的SDP 至此&#x…

Spring Boot如何实现防盗链

一、什么是盗链 盗链是个什么操作,看一下百度给出的解释:盗链是指服务提供商自己不提供服务的内容,通过技术手段绕过其它有利益的最终用户界面(如广告),直接在自己的网站上向最终用户提供其它服务提供商的…

5.内容管理模块-课程查询

搞清楚一个项目的业务流程最直接的手段,就是找一个账号登录进去,操作一遍。 3.3设计接口 接口设计分析 post在需要提交很多参数的时候使用,并且post的安全性较高。 接口分析: po包,一般存放和数据库交互的实体类。 …

网络编程 | TCP套接字通信及编程实现经验教程

1、TCP基础铺垫 TCP/IP协议簇中包含了如TCP、UDP、IP、ICMP、ARP、HTTP等通信协议。TCP协议是TCP/IP协议簇中最为常见且重要的通信方式之一,它为互联网上的数据传输提供了可靠性和连接管理。 TCP(Transmission Control Protocol,传输控制协议…

vue3组件间传值

definProps方式 子组件&#xff1a;assignSuppliers.vue const propdefineProps({fid:String}); 父组件&#xff1a;index.vue <!-- 供应商分配 --><n-drawerwidth"800"v-model:visible"drawerSupplierConfig.visible":title"drawerSuppli…

《网络安全编程基础》之Socket编程

我的代码 server.c // server.cpp : Defines the entry point for the console application. //#include "stdafx.h" #include <Winsock2.h> #pragma comment(lib,"ws2_32.lib") //添加静态链接库文件 void main(int argc,char* argv[]) {WSADATA …

不只是请求和响应:使用Fiddler解读Cookie与状态码全指南(下)

欢迎浏览高耳机的博客 希望我们彼此都有更好的收获 感谢三连支持! 不只是请求和响应&#xff1a;使用Fiddler抓包HTTP协议全指南(上)_fiddler 获取响应脚本-CSDN博客https://blog.csdn.net/Chunfeng6yugan/article/details/144005872?spm1001.2014.3001.5501 不只是请求和响…

Linx下自动化之路:Redis安装包一键安装脚本实现无网极速部署并注册成服务

目录 简介 安装包下载 安装脚本 服务常用命令 简介 通过一键安装脚本实现 Redis 安装包的无网极速部署&#xff0c;并将其成功注册为系统服务&#xff0c;开机自启。 安装包下载 redis-7.0.8.tar.gzhttp://download.redis.io/releases/redis-7.0.8.tar.gz 安装脚本 修…

第3章.垃圾收集器与内存分配策略

概述 对象已死 引用计数法 可达性分析算法 再谈引用 生存还是死亡 回收方法区 垃圾收集算法 分代收集理论 3种垃圾收集算法 HotSpot的算法细节实现 根节点枚举 安全点 安全区域 记忆集与卡表 写屏障 并发的可达性分析 误消亡问题 经典垃圾收集器 概述 简单的一些GC CMS G1 低延…

Python 类的设计(以植物大战僵尸为例)

关于类的设计——以植物大战僵尸为例 一、设计类需满足的三要素1. 类名2. 属性和方法 二、以植物大战僵尸的为例的类的设计1. 尝试分类2. 创建对象调用类的属性和方法*【代码二】*3. 僵尸的继承 三、代码实现 一、设计类需满足的三要素 1. 类名 类名&#xff1a;某类事物的名…

如何使用WinCC DataMonitor基于Web发布浏览Excel报表文档

本文介绍使用 WinCC DataMonitor 的 "Excel Workbooks" 功能&#xff0c;通过 Excel 表格显示 WinCC 项目的过程值、归档变量值和报警归档消息。并可以通过 Web 发布浏览访问数据 1&#xff0e;WinCC DataMonitor是什么 ? DataMonitor 是 SIMATIC WinCC 工厂智能中…

【Java】—— 图书管理系统

基于往期学习的类和对象、继承、多态、抽象类和接口来完成一个控制台版本的 “图书管理系统” 在控制台界面中实现用户与程序交互 任务目标&#xff1a; 1、系统中能够表示多本图书的信息 2、提供两种用户&#xff08;普通用户&#xff0c;管理员&#xff09; 3、普通用户…

记录ubuntu22.04重启以后无法获取IP地址的问题处理方案

现象描述&#xff1a;我的虚拟机网络设置为桥接模式&#xff0c;输入ifconfig只显示127.0.0.1&#xff0c;不能连上外网。&#xff0c;且无法上网&#xff0c;用ifconfig只有如下显示&#xff1a; 1、sudo -i切换为root用户 2、输入dhclient -v 再输入ifconfig就可以看到多了…

异步操作,promise、axios

一、异步操作&#xff08;异步编程&#xff09;、同步操作 异步操作是指在编程中&#xff0c;某个任务的执行不会立即完成&#xff0c;同时不会阻塞后续代码的执行。在异步操作中&#xff0c;程序可以继续运行&#xff0c;并在异步任务完成时得到通知并处理结果。这与同步操作…

第一性原理构造医疗信创域高质量发展路径应用探析

门诊电子病历录入 摘要&#xff1a; 主要介绍了第一性原理在医疗系统开发中的应用及其重要性。阐述了第一性原理的概念及发展历程&#xff0c;并指出其在各个领域的重要性和应用价值。详细分析了第一性原理在医疗系统开发中的具体影响&#xff0c;包括对医院管理和互联网医疗的…