理想汽车提出3DRealCar:首个大规模3D真实汽车数据集

news2025/1/18 8:47:30

理想提出3DRealCar,这是第一个大规模 3D 实车数据集,包含 2500 辆在真实场景中拍摄的汽车。我们希望 3DRealCar 可以成为促进汽车相关任务的宝贵资源。

理想汽车提出3DRealCar:首个大规模3D真实汽车数据集!

我们精心策划的高质量3DRealCar数据集的特征。3DRealcar包含各种颜色、汽车类型、品牌的详细注释,甚至汽车解析图。特别是,我们的数据集包含三种汽车表面的照明条件,对现有方法提出了挑战。

3D汽车常用于自动驾驶系统、虚拟/增强现实和游戏。然而,现有的3D汽车数据集要么是合成的,要么质量较差,与高质量的真实世界3D汽车数据集存在很大差距,限制了它们在实际场景中的应用。

在本文中,我们提出了第一个大规模 3D 实车数据集,称为 3DRealCar,它具有三个独特功能。(1)高容量:2,500 辆汽车经过 3D 扫描仪的精心扫描,获得具有真实世界尺寸的汽车图像和点云;(2)高质量:每辆汽车平均在 200 个密集的高分辨率 360 度 RGB-D 视图中捕获,从而实现高保真 3D 重建;(3)高多样性:该数据集包含来自 100 多个品牌的各种汽车,在三种不同的照明条件下收集,包括反光、标准和黑暗。此外,我们为每个实例提供详细的汽车解析图,以促进汽车解析任务的研究。

此外,我们删除了背景点云,并将汽车方向标准化为统一轴,仅在没有背景和可控渲染的汽车上进行重建。我们在 3DRealCar 中的每个照明条件下使用最先进的方法对 3D 重建结果进行基准测试。大量实验表明,3DRealCar 的标准照明条件部分可用于生成大量高质量的 3D 汽车,从而改进与汽车相关的各种 2D 和 3D 任务。值得注意的是,我们的数据集让我们了解到,最近的 3D 重建方法在反射和暗光条件下重建高质量 3D 汽车时面临挑战。

相关链接

论文地址:https://arxiv.org/abs/2406.04875

项目主页:xiaobiaodu.github.io/3drealcar

分布

我们的数据集主要包含六种不同的车型。我们还统计了汽车在各种光照条件下的表现。标准条件意味着汽车光照充足,没有强烈的镜面高光。反射条件意味着汽车有镜面高光。光泽材料给最近的 3D 重建方法带来了巨大的挑战。黑暗条件意味着汽车是在地下停车场拍摄的,光照不太好。每辆车拍摄的图像数量平均为 200 张。视图数量从 50 到 400 不等。我们的数据集包含二十多种颜色,但白色和黑色仍然占据了数据集的大部分。此外,我们还展示了汽车尺寸的分布,包括长度、宽度和高度。

支持的任务

由于我们的数据集提供了 RGB-D 图像、点云、汽车解析地图和详细注释,我们可以在其中执行各种 2D 和 3D 任务。具体来说,我们提供汽车解析地图,表明我们的数据集可用于汽车检测、分割和解析任务。此外,我们捕获的 RGB-D 图像支持深度估计任务。由于我们收集了外观各异的各种车型,研究人员可以使用我们的数据集进行不同车型的领域迁移学习。对于 3D 任务,我们捕获的密集视图和点云可用于 3D 重建、3D 生成、新颖视图合成、车辆点云完成和车辆点云解析。利用重建的 3D 汽车,我们可以使用它们来模拟极端情况,以训练强大的自动驾驶感知系统。

3DRealCar数据集的分布。我们展示了汽车类型的分布,照明条件、捕获的视图、汽车颜色和汽车大小。我们尽力捕捉各种各样的汽车颜色和类型的多样性,我们的数据集。

3D 汽车解析

我们的数据集是第一个提供 3D 汽车解析注释的数据集,用于解析 3D 空间中的汽车组件。 由于我们为 3DRealCar 数据集中的每个实例提供了 2D 汽车解析图,我们可以将 2D 解析图提升到 3D,并将每个组件分割为点云和网格。这些 3D 汽车解析图的主要目的是实现对车辆结构的精确和全面分析,这对于自动驾驶、车辆设计、车辆编辑和虚拟现实模拟等应用至关重要。通过使用这些详细的 3D 解析图,开发人员和研究人员可以改进对象识别算法并增强碰撞检测系统。此外,该数据集有助于训练机器学习模型,以更好地理解汽车部件的空间关系和物理属性,从而实现更先进、更可靠的汽车技术。

论文阅读

3DRealCar:一个野外RGB-D汽车数据集360度视图

摘要

3D 汽车通常用于自动驾驶系统、虚拟/增强现实和游戏。然而,现有的 3D 汽车数据集要么是合成的,要么是低质量的,与高质量的真实世界 3D 汽车数据集存在很大差距,限制了它们在实际场景中的应用。在本文中,我们提出了第一个大规模 3D 真实汽车数据集,称为 3DRealCar,它具有三个独特的特点。

  • 高容量:2,500 辆汽车经过 3D 扫描仪的精心扫描,获得具有真实世界尺寸的汽车图像和点云;

  • 高质量:每辆汽车平均在 200 个密集的高分辨率 360 度 RGB-D 视图中捕获,从而实现高保真 3D 重建;

  • 高多样性:数据集包含来自 100 多个品牌的各种汽车,在三种不同的光照条件下收集,包括反光、标准和黑暗。

此外,我们为每个实例提供了详细的汽车解析图,以促进汽车解析任务的研究。此外,我们删除背景点云并将汽车方向标准化为统一轴,仅在没有背景和可控渲染的汽车上进行重建。我们在 3DRealCar 中的每个照明条件下使用最先进的方法对 3D 重建结果进行基准测试。大量实验表明,3DRealCar 的标准照明条件部分可用于生成大量高质量的 3D 汽车,从而改进与汽车相关的各种 2D 和 3D 任务。值得注意的是,我们的数据集让我们了解到,最近的 3D 重建方法在反射和暗光条件下重建高质量 3D 汽车时面临挑战。我们的数据集可在此处获得。

方法

数据收集和预处理。我们先绕一辆车转三圈 同时用3D扫描仪扫描汽车以获得RGB-D图像及其点云。然后我们使用Colmap和SAM获取姿态并去除背景点云。最后,我们使用经过处理数据训练的3DGS来获得3D汽车模型。

我们精心策划的高质量3DRealCar数据集的特征。3 drealcar包含 各种颜色、汽车类型、品牌的详细注释,甚至汽车解析图。特别是,我们的 数据集包含三种汽车表面的照明条件,对现有方法提出了挑战

效果展示

定性比较

近年来先进图像分割方法的定性比较。我们 从我们的图像测试集中选择输入,并评估汽车部件的容量对每种方法的理解。

可视化

新视图合成(左)和图像到3d生成(右)的可视化。我们比较最近最先进的方法的结果,Zero123-XL,Dreamcraft3D,和他们通过在我们的数据集上训练而得到的改进。

重建结果

我们利用最新最先进的 3D 重建方法 3DGS(高斯溅射)在我们的数据集中展示可视化效果。在标准照明条件下,3DGS 能够从我们的数据集中重建相对高质量的 3D 汽车。请注意,这种级别的重建质量足以用于下游任务并进行渲染。然而,在反光和黑暗条件下的结果并不理想。因此,我们的 3DRealCar 的这两个部分给最近的 3D 方法带来了两个挑战。

第一个挑战是镜面高光的重建,由于汽车的特殊性,汽车表面的材质一般都是有光泽的,也就是说汽车在阳光或者强光照射下会产生大量的镜面高光。

第二个挑战是黑暗环境下的重建。在黑暗环境下拍摄的训练图像丢失了大量重建细节。因此,如何在这两种极端光照条件下实现高质量的重建结果是对近期方法的挑战。

我们希望这些结果能够鼓励后续在恶劣条件下进行3D重建的研究。

结论

在本文中,我们提出了第一个大规模高质量 3D 实车数据集,名为3DRealCar。收集到的每辆汽车的密集高分辨率 360 度视图可用于重建高质量的3D汽车。大量实验证明了我们的3DRealCar在3D重建方面的有效性和挑战。得益于从我们的数据集和汽车零件级注释中重建的高质量3D汽车,我们的数据集可用于支持与汽车相关的各种任务。此外,基准测试结果可以作为未来研究的基线。虽然3DRealCar目前只有汽车外部视图,但我们打算在未来提供外部和内部视图,以进一步促进更完整的3D汽车的重建。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1881321.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

帝国CMS(EmpireCMS)漏洞复现

简介 《帝国网站管理系统》英文译为Empire CMS,简称Ecms,它是基于B/S结构,且功能强大而帝国CMS-logo易用的网站管理系统。 帝国CMS官网:http://www.phome.net/ 参考相关漏洞分析文章,加上更详细的渗透测试过程。 参考…

使用Pytho删除docx文档中的页眉和页脚

介绍: 在日常工作中,我们经常需要处理文档,其中包括删除或修改页眉和页脚。本文将介绍如何使用Python编程语言和wxPython模块创建一个简单的GUI应用程序,帮助我们删除docx文档中的页眉和页脚。 C:\pythoncode\new\deleteyemeiyej…

数据结构:期末考 第六次测试(总复习)

一、 单选题 (共50题,100分) 1、表长为n的顺序存储的线性表,当在任何位置上插入或删除一个元素的概率相等时,插入一个元素所需移动元素的平均个数为( D ).(2.0) A、 &am…

51单片机项目-点亮第一个LED灯

目录 新建项目选择型号添加新文件到该项目设置字体和utf-8编码二极管如何区分正负极原理:CPU通过寄存器来控制硬件电路 用P2寄存器的值控制第一个灯亮进制转换编译查看P2寄存器的地址生成HEX文件把代码下载到单片机中下载程序到单片机 新建项目 选择型号 stc是中国…

算法09 日期相关模拟算法【C++实现】

这是《C算法宝典》算法篇的第09节文章啦~ 如果你之前没有太多C基础,请点击👉专栏:C语法入门,如果你C语法基础已经炉火纯青,则可以进阶算法👉专栏:算法知识和数据结构👉专栏&#xff…

【Linux进程通信】匿名管道的常见特性、两进程间通过管道通信的情况分析

目录 一、只有血缘关系的进程之间才可以进行管道通信 二、管道只可以单向通信 三、进程间通信是会协同的-同步与互斥的 1.父子进程读写端都正常,管道为空父进程读端阻塞。 2.父子进程读写端都正常,管道满时子进程写端阻塞。 3.子进程写端关闭&…

idea集成uglifycss压缩混淆css

Uglifycss介绍 https://www.npmjs.com/package/uglifycss 命令行 $ uglifycss [options] [filename] [...] > output 选项: --max-line-len n每个字符添加一个换行符(大约); 表示无换行符,并且是默认值n0 --expand-vars扩…

计算机组成原理——锁存器和触发器

文章目录 1. SR锁存器 1.1 电路结构 1.2 电路解析 2. 带en输入的SR锁存器 2.1 ​​​​​​​电路结构 2.2 工作原理 3. ​​​​​​​带En输入的D锁存器 3.1 电路结构 3.2 工作原理 4. ​​​​​​​边沿触发的D触发器 4.1 电路结构 4.2 工作原理 1. SR锁存器 …

【Qt知识】window frame 对窗口坐标的影响

在Qt中,窗口框架(Window Frame)对Widget的尺寸计算和坐标定位有着直接的影响,这主要是因为窗口框架本身占据了一定的空间,包括标题栏、最小化/最大化/关闭按钮以及边框。这部分额外的空间在不同的应用场景下需要被考虑…

Tomcat服务部署、优化及多实例实验

一、Tomcat基础 1.Tomcat简介 Tomcat服务器是一个免费的开放源代码的Web应用服务器,Tomcat虽然和Apache或者Nginx这些Web服务器一样,具有处理HTML页面的功能,然而由于其处理静态HTML的能力远不及Apache或者Nginx,所以Tomcat通常…

Geeker-Admin:现代化的开源后台管理框架

Geeker-Admin:优雅管理,高效开发,尽在Geeker-Admin- 精选真开源,释放新价值。 概览 Geeker-Admin是一个基于Vue 3.4、TypeScript、Vite 5、Pinia和Element-Plus构建的开源后台管理框架。它为开发者提供了一套现代化、响应式的管理…

设计NOR Flash(FMSC接口)的Flashloader(MCU: stm32f4)

目录 概述 1 硬件 1.1 MCU和S29GL128P10TFI01控制电路 1.1.1 S29GL128P10TFI01 1.1.2 MCU与NOR Flash接口 1.2 STM32F4的FSMC接口 1.2.1 时序信号 1.2.2 外部存储器接口信号 2 Flash leader功能实现 2.1 框架结构介绍 2.2 S29GL128P10TFI01的Flash leader框架 2.3 N…

Camera Raw:编辑 - 混色器

Camera Raw “编辑”模块中的混色器 Color Mixer面板用于调整图像中的颜色,通过控制色相、饱和度和明亮度,可以对特定颜色进行微调,优化图像的色彩表现。 面板分为“混色器”和“点颜色”两个模式。 ◆ ◆ ◆ 使用方法与技巧 1、查看要调整…

【机器学习】Python zip 函数

目录: 什么是zip函数zip的基本使用zip与列表、字典的结合zip的长度匹配规则实际应用 1. 什么是zip函数 zip函数在Python中用于将多个可迭代对象(如列表、元组、字符串等)打包成一个元组的列表,其中每个元组包含的是原始对象中的…

邀请函 | 极限科技全新搜索引擎 INFINI Pizza 亮相 2024 可信数据库发展大会!

过去一年,在全球 AI 浪潮和国家数据局成立的推动下,数据库产业变革不断、热闹非凡。2024 年,站在中国数字经济产业升级和数据要素市场化建设的时代交汇点上,“2024 可信数据库发展大会” 将于 2024 年 7 月 16-17 日在北京悠唐皇冠…

使用vite官网和vue3官网分别都可以创建vue3项目

问: npm init vitelatest 和 npm create vuelatest创建的vue3项目有什么区别? 回答: npm init vitelatest 和 npm create vuelatest 分别是使用 Vite 和 Vue CLI 工具创建 Vue 项目的两种方式,它们之间有几个主要区别: 1. **构建工具:** …

WIFI模组ESP-12F 规格书分享

一、 产品概述 ESP-12F 是由安信可科技开发的 Wi-Fi 模块,该模块核心处理器 ESP8266 在较小尺 寸封装中集成了业界领先的 Tensilica L106 超低功耗 32 位微型 MCU,带有 16 位精 简模式,主频支持 80 MHz 和 160 MHz,支持 RTOS&…

【PB案例学习笔记】-25制作一个带底图的MDI窗口

写在前面 这是PB案例学习笔记系列文章的第25篇,该系列文章适合具有一定PB基础的读者。 通过一个个由浅入深的编程实战案例学习,提高编程技巧,以保证小伙伴们能应付公司的各种开发需求。 文章中设计到的源码,小凡都上传到了gite…

什么是未授权访问漏洞?Hadoop Redis靶场实战——Vulfocus服务攻防

什么是未授权访问漏洞?Hadoop & Redis靶场实战——Vulfocus服务攻防 一、介绍 未授权访问,也称为未经授权的访问或非法访问,是指在没有得到适当权限或授权的情况下,个人或系统访问了网络、计算机、数据库、文件、应用程序或…

C语言 | Leetcode C语言题解之第205题同构字符串

题目&#xff1a; 题解&#xff1a; struct HashTable {char key;char val;UT_hash_handle hh; };bool isIsomorphic(char* s, char* t) {struct HashTable* s2t NULL;struct HashTable* t2s NULL;int len strlen(s);for (int i 0; i < len; i) {char x s[i], y t[i]…