为自动驾驶提供高分辨率卫星图像数据,实例级标注数据集OpenSatMap

news2025/1/16 7:56:26

对于交通控制、自动驾驶等任务来说,大规模的高分辨率与更新频率的地图至关重要。现有的地图构建方法多依赖地面采集数据,这种方法的精度固然较高,但在覆盖范围、更新频率却存在限制,测绘成本也相当高昂。

相比之下,使用卫星图像构建地图显然在覆盖范围和构建效率方面具有更大优势。只是不可避免的,卫星图像数据集的分辨率与精度普遍较低,常见的 19 级卫星图像的分辨率为每像素 30 厘米,几乎无法辨认出 20 厘米宽的车道线。因此,现有的卫星图像数据集很难有效支持现代城市复杂道路结构的精细化解析和地图构建。此前,已经有一部分方法在尝试解决这一问题,比较有代表性的有 MIT 团队此前提出的 RoadTracer,它利用迭代图构造方式检测卫星影像中的路网,提高了测绘的准确率,但依然有所不足。

现有数据集的图像分辨率最高仅为 0.3 米/像素,不足以准确感知车道线,无法满足精细化需求。此外,标注不够精细、数据规模小、与自动驾驶数据集不匹配等,也是它们存在的局限。

在此背景下,中国科学院自动化研究所等机构与腾讯地图合作推出了一种名为 OpenSatMap 的细粒度、高分辨率卫星数据集,旨在解决目前基于卫星图像的地图构建过程中遇到的精度和数据量问题。

图片

OpenSatMap 数据集的演示(来源:arXiv

OpenSatMap 的数据主要通过 Google Maps 的静态 API 进行采集。团队根据各地的地理分布,选择了全球 60 座城市、19 个国家中的代表性位置,涵盖了不同的道路类型、地理特征和交通规则,共 38,000 多张 1024×1024 分辨率的卫星影像,并标注了近 45 万个实例。这使得 OpenSatMap 成为当前规模最大、覆盖最广的高分辨率卫星影像数据集之一。

并且,为了提高精度,研究团队收集了数据分辨率为 0.15 米/像素(Level-20)的图像,这是当前所有公开数据集中最高的分辨率。在部分区域无法获取 Level-20 分辨率的情况下,团队会选取 Level-19 影像(0.3 米/像素)作为补充。

在数据标注阶段,团队雇用了 50 名遥感影像标注员和 7 名质检员,采用实例级的标注方式对图像中的道路进行详细的标记。每条道路线(包括车道线、路缘线和虚拟线等)被向量化为折线(polyline)形式,以确保准确表示线条的曲率和方向。

此外,每条线条被分配了八个属性,包括颜色(如白色或黄色)、线型(如实线或虚线)、功能(如停车区域或公交车专用道)、双向属性、边界标记、遮挡情况和清晰度等。这些属性标注通过实例间属性变化(如实线转虚线、双车道变单车道等)实现不同实例的划分,从而更精准地表达复杂路况。

图片

标注示例(来源:arXiv

标注过程中还特别考虑了遮挡情况,如遮挡、分叉和多层立交桥等,确保图像细节的准确性。特别是对于遮挡情况,团队根据不同遮挡程度将其分为无遮挡、部分遮挡和完全遮挡三类标注,并制定了严格的标注规则,以保证数据集的完整性和一致性。

为了验证 OpenSatMap 在实例级线条检测任务中的有效性,研究团队开发了一个简单的基线方法,针对平均交并比(mIoU)和平均精度(AP)指标进行了评估。结果表明,实例级线条检测比传统的语义分割要困难得多。

图片

团队所采用的基线方法(来源:arXiv

在语义级别的评估中,基线模型的平均交并比表现相对较高,但在实例级检测中,AP 和 mIoU 指标的得分较低,尤其是在复杂的路况下,如线条类型变化和线条分叉合并的情况等。其原因在于,实例级检测需要识别带有精细属性的道路元素,而语义分割只涉及一些基础的类别。

虽然从视觉效果上来说,基线模型能够相对准确地预测线条实例。然而,由于一些线条细节无法精确检测(例如线条边缘的定义不清晰、线条连接处的错误分割等),导致 AP 指标相对较低。

图片

OpenSatMap19(前两行)和 OpenSatMap20(后两行)测试分割的定性结果。对于每个场景,从左到右分别是(a)输入图像、(b)实例预测、(c)去噪实例预测和(d)注释。这些结果表明,该基准本身具有较高的难度,这有助于推动更有效的端到端方法的探索。

值得一提的是,为了确保其在自动驾驶领域的实用性,OpenSatMap 还与 nuScenes 和 Argoverse 2 等主流自动驾驶数据集进行了对齐,使其能够为自动驾驶系统提供精确的地图信息,让自动驾驶算法在训练过程中可以直接利用这些卫星影像数据构建高精度的环境感知模型。

不过,由于 OpenSatMap 的数据来源于 Google Maps,而这些影像并非实时更新,这意味着其数据可能在某些地区无法反映当前的道路状况,可能会影响在快速变化的城市环境中的应用效果。

再加上部分地区的高分辨率图像缺失,以及多标注者的差异可能导致标注的不一致性。直接在 OpenSatMap 上训练自动驾驶模型可能存在一定的安全风险。因此,在将其用于自动驾驶应用时,还需要进一步验证和补充数据。

相关论文以《OpenSatMap:用于大规模地图构建的细粒度高分辨率卫星数据集》(OpenSatMap: A Fine-grained High-resolution Satellite Dataset for Large-scale Map Construction)为题发表在预印本网站 arXiv 上。

相关代码也已经在 GitHub 开源(项目地址:https://opensatmap.github.io)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2244086.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于STM32的智能语音识别饮水机系统设计

功能描述 1、给饮水机设定称呼,喊出称呼,饮水机回答:我在 2、语音进行加热功能,说:请加热,加热片运行 3、饮水机水位检测,低于阈值播报“水量少,请换水” 4、检测饮水机水温&#xf…

百度世界2024精选公开课:基于地图智能体的导航出行AI应用创新实践

11月12日,“百度世界2024”在上海世博中心举行。百度创始人、董事长兼首席执行官李彦宏发表了主题为《应用来了》的演讲。 百度地图也为大家带来了干货满满、精彩纷呈的智能体公开课,由百度地图开放平台技术架构师江畅分享《地图智能体:导航…

sourceInsight常用设置和功能汇总(不断更新)(RGB、高亮、全路径、鼠标、宏、TODO高亮)

文章目录 必开配置设置背景颜色护眼的RGB值?sourceInsight4.0中如何设置选中某个单词以后自动高亮的功能?sourceinsight中输入设置显示全路径? 常用sourceInsight4.0中文乱码怎么解决,注意事项是什么?如何绑定鼠标中键…

[JavaWeb] 尚硅谷JavaWeb课程笔记

1 Tomcat服务器 Tomcat目录结构 bin:该目录下存放的是二进制可执行文件,如果是安装版,那么这个目录下会有两个exe文件:tomcat10.exe、tomcat10w.exe,前者是在控制台下启动Tomcat,后者是弹出GUI窗口启动To…

uniapp开发微信小程序笔记2-开发静态页面(新建页面、内置组件、设置编译模式、样式、SCSS的使用)

前言:本文从新建页面、认识内置组件、设置编译模式、样式、SCSS的使用来逐步形成对微信小程序开发结构的认识 一、新建页面 pages就是放页面代码的文件夹,点击新建页面就可以自动新增页面,并且可以看到pages.json里面也会自动添加该页面的路…

Linux插件zsh(oh-my-zsh)

一、oh-my-zsh基本介绍 oh-my-zsh: https://github.com/ohmyzsh/ohmyzshhttps://github.com/ohmyzsh/ohmyzsh 注意:需要先安装zsh命令,才能安装oh-my-zsh,先测试是否安装了zsh rootserver:/opt # zsh --version zsh 5.8 (x86_6…

第7章硬件测试-7.4 专业实验

7.4 专业实验 7.4.1 EMC测试EMS的测试项目如下。1.静电放电抗扰度(ESD)2.辐射电磁场(80 MHz~1000 MHz)抗扰度(RS)3.电快速瞬变/脉冲群抗扰度4.浪涌(雷击)抗扰度5.注入电流&#xff0…

H.265流媒体播放器EasyPlayer.js H.264/H.265播放器chrome无法访问更私有的地址是什么原因

EasyPlayer.js H5播放器,是一款能够同时支持HTTP、HTTP-FLV、HLS(m3u8)、WS、WEBRTC、FMP4视频直播与视频点播等多种协议,支持H.264、H.265、AAC、G711A、MP3等多种音视频编码格式,支持MSE、WASM、WebCodec等多种解码方…

5G CPE与4G CPE的主要区别有哪些

什么是CPE? CPE是Customer Premise Equipment(客户前置设备)的缩写,也可称为Customer-side Equipment、End-user Equipment或On-premises Equipment。CPE通常指的是位于用户或客户处的网络设备或终端设备,用于连接用户…

Vue 专属状态管理库Pinia的使用与实践

目录 前言1. 什么是 Pinia?2. Pinia 的安装与基本配置2.1 安装 Pinia2.2 在 Vue 应用中配置 Pinia 3. 使用 Pinia 创建和管理状态3.1 定义一个简单的 Store3.2 在组件中使用 Store 4. Pinia 的高级功能4.1 使用 Getter 简化数据处理4.2 支持异步操作4.3 在服务端渲染…

如何基于Netty手写简单的Tomcat?

如何基于Netty手写简单的Tomcat? 我们最常用的服务器是tomcat ,我们使用tomcat 也主要作为http服务器 。 http协议是基于TCP 协议,换句话说使用socket 或者 NIO编程,只要能正确的解析http报文,然后将结果按照 http 报…

RabbitMQ教程:发布/订阅模式(Publish/Subscribe)(三)

文章目录 RabbitMQ教程:发布/订阅模式(Publish/Subscribe)(三)一、引言二、简介三、准备工作3.1 说明3.2 生成项目 四、实战4.1 交换机(Exchanges)4.2 临时队列(Temporary Queues&am…

金山云Q3调整后EBITDA率提升至9.8% 经营效率和盈利能力强劲增长

11月19日,金山云公布了2024年第三季度业绩。 季度内,公司在收入规模、盈利能力、经营现金流方面都取得了扎实的进展。财报显示,金山云Q3营收18.9亿元,同比回归两位数快速增长,达16.0%;公有云实现收入11.8亿…

Python轴承故障诊断 (19)基于Transformer-BiLSTM的创新诊断模型

往期精彩内容: Python-凯斯西储大学(CWRU)轴承数据解读与分类处理 Pytorch-LSTM轴承故障一维信号分类(一)-CSDN博客 Pytorch-CNN轴承故障一维信号分类(二)-CSDN博客 Pytorch-Transformer轴承故障一维信号分类(三)-CSDN博客 三十多个开源…

Linux 安装 jdk8

将原有的 JDK 卸载干净(可选) # 查找并显示出系统所有已安装的与 JDK 相关的 rpm 软件包名称 rpm -qa | grep jdk # 删除 jdk rpm -e --nodeps 要卸载的JDK 安装 一、方法一:yum 包管理器安装 1)检索可用包 yum search java |…

ESLint的简单使用(js,ts,vue)

一、ESLint介绍 1.为什么要用ESLint 统一团队编码规范(命名,格式等) 统一语法 减少git不必要的提交 减少低级错误 在编译时检查语法,而不是等js引擎运行时才检查 2.eslint用法 可以手动下载配置 可以通过vue脚手架创建项…

11.19机器学习_逻辑回归

十二 逻辑回归 1.概念 逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。 逻辑回归一般用于…

数据结构-树状数组专题(2)

一、前言 接上回树状数组专题&#xff08;1&#xff09;&#xff0c;这次主要介绍差分跟树状数组联动实现区间更新 二、我的模板 重新放了一遍&#xff0c;还是提一嘴&#xff0c;注意下标从0开始&#xff0c;区间左闭右开 template <typename T> struct Fenwick {in…

SAM-Med2D 训练完成后boxes_prompt没有生成mask的问题

之前对着这这篇文章去微调SAM_Med2D(windows环境),发现boxes_prompt空空如也。查找了好长时间问题SAM-Med2D 大模型学习笔记&#xff08;续&#xff09;&#xff1a;训练自己数据集_sam训练自己数据集-CSDN博客 今天在看label2image_test.json文件的时候发现了一些端倪: 官方…

从源头保障电力安全:输电线路动态增容与温度监测技术详解

在电力系统中&#xff0c;输电线路是电能传输的关键环节。然而&#xff0c;当导线温度过高时&#xff0c;会加速导线老化&#xff0c;降低绝缘性能&#xff0c;甚至引发短路、火灾等严重事故&#xff0c;对电网安全运行构成巨大威胁。近日&#xff0c;某地区因持续高温和用电负…