自动驾驶高效预训练--降低落地成本的新思路(ReSimAD)

news2025/1/22 15:50:54

自动驾驶高效预训练--降低落地成本的新思路

  • 1. 引言
    • 定义高效预训练
  • 2. ReSimAD
    • 2.1引言
    • 2.2 主要贡献
      • 1.发布大规模ReSimAD数据
        • 2.ReSimAD pipeline
    • 2.3 实验

  • 上海人工智能实验室

1. 引言

高效的预训练,是大模型的第一步

大模型的两种能力

  • 海量数据分布–未知场景泛化:
    • 带有差异性的语料库,因此对未知场景的泛化能力强
  • 涌现能力(Emergent Ability):
    • 不同与大模型的基础任务(文字接龙) ,经过instruction-tuning的模型会表现出很强的涌现能力,如:In-Context Learning(ICL), Chain-of-Thought(CoT)能力
    • 视觉领域:SegGPT

为什么3D场景下没有形成通用感知大模型(3D点云)

  • 相比于2D/语言场景,3D场景之间感知模型的迁移难
    • 实验表明在不同Domain(不同相机/采集地/天气)下性能下降很明显
      在这里插入图片描述
  • 相比于2D/语言场景,3D场景之间数据集的复用难
    • 类别定义不一样:
      • waymo用地面的车当作一个类别
    • 采集环境不一样

定义高效预训练

高效3D预训练–降低模型对3D数据依赖的新思路

高效预训练的特点:

  • 提升基线模型的Capacity
    • 1.Capacity模型训到收敛,通过调参没办法提升,但是通过上游提升精度,这样的模型的Capacity理解为提升了
    • 2.更快的收敛速度
    • 3.更少的数据需求
      • Zero-shot Setting --ReSimAD
      • Label-efficiency Setting --SPOT

Real-to-Sim:

利用好了源域知识,可以做到zero-shot目标域感知

  • 源域重建,目标域仿真

如果预训练的方式正确,海量数据预训练可以提升模型本身的Capacity

达到上游预训练数据增加,会不断提升下游预训练后的任务指标提升

2. ReSimAD

采用源域重建+目标域仿真

  • https://arxiv.org/pdf/2309.05527.pdf
  • https://github.com/PJLab-ADG/3DTrans/blob/master/README.md

2.1引言

域迁移的三个范式:

  • 1.CARLA仿真:代价低,多样性差
    • 没有真实的背景数据
  • 2.厂商采集新设备数据,新标注/无标签学习:代价高,多样性强
  • 3.原域数据的背景加入CARLA:代价低,多样性强
    • 也就是这篇论文的方法

2.2 主要贡献

1.发布大规模ReSimAD数据

https://github.com/PJLab-ADG/3DTrans/blob/master/README.md

  • 重建waymo的背景后,分别方针KITTI、NuScenes、ONCE等传感器setting去采集,达到28k帧

  • 不同数据集的车辆不变尺寸(长宽高)不一样,对应做一下映射匹配
    在这里插入图片描述

  • 大规模ReSimAD数据集下载地址:https://openxlab.org.cn/datasets?lang=zh-CN

2.ReSimAD pipeline
  • 重建方法:基于相机的重建、基于雷达的重建(区别:输入传感器的数据不一样)
    • 因为用全量waymo数据集做重建,环境(阴天、雨天)影响相机比较大 ,所以采用基于雷达重建的方式
  • 多帧拼接:对运动物体做动态补偿
    • 运动物体分刚体和非刚体,非刚体比较难
  • 纯lidar的大场景重建
    • 对比了柏松重建、VDBFusion重建、纯lidar的重建 ,最终采用纯lidar的重建

主体部分

在这里插入图片描述

Point-to-Mesh Reconstrucrion模块

  • 静态背景纯lidar隐式重建、动态物体显式重建混合式

Mesh-to-Point Simulation模块——获得跨域的点云数据

  • PCSim

2.3 实验

ReSimAD对比的基线模型:

  • CARLA-default:Zero-shot方法,前景、背景都是CARLA仿真
  • Sensor-like:Zero-shot方法,仿真目标场景的传感器(第二套采集装备),产生仿真样本,但是背景信息是CARLA-Default的
  • ST3D:属于UDA方法,其假设模型可以接触到目标域的样本(真实样本),但是是无标注

在这里插入图片描述
比CARLA更加真实

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1165148.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL TIMESTAMPDIFF函数的使用场景

TIMESTAMPDIFF函数在MySQL中用于计算两个日期或时间之间的差异,并以指定的单位返回结果。这个函数特别适用于需要计算时间差或者对日期和时间进行操作的场景。 以下是一些TIMESTAMPDIFF函数的使用场景示例: 源表employees 计算两个日期之间的天数差异&a…

【LeetCode刷题-链表】--82.删除排序链表中的重复元素II

82.删除排序链表中的重复元素II 由于链表是排好序的,所以只需要对其进行一次遍历即可,比较相邻节点对应的值 /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}* ListNode(…

Unity3D与iOS的交互 简单版开箱即用

本文适合的情况如下: Unity客户端人员 与 IOS端研发人员合作的情况 目录 From U3D to iOS 实现原理 1.unity工程目录创建2个文件 NativeCallProxy.m、NativeCallProxy.h 并且放到Unity工程目录Plugins/iOS/unity_ios_plus目录下 2.创建C#调用脚本 定义对应.mm脚…

STM32:I²C通信原理概要

一、IIC通信原理 IIC通信和串口通信有一定的相似之处,都有一根共地线和两根数据线。但是传递外部信息,串口有两根数据线可以进行双向通信,也就是全双工通信。而在IIC通信下,其中一条数据线是用于提供同步时钟脉冲的时钟线(SCL)&am…

k8s系列文章一:安装指南

# 临时关闭分区 swapoff -a 前言 k8s是docker的升级版,可用于docker集群配置管理微服务 一、更新ubuntu系统版本 sudo apt update sudo apt upgrade二、添加GPG密钥(阿里源) 尽管我不知道gpg是个什么东西,反正跟着做就完了 curl https://mirrors.a…

PostgreSQL 进阶 - 模式匹配,过滤敏感数据,数据清理

1. 模式匹配 SELECT phone_number FROM customers;使用正则表达式替换所有非数字字符 这样可以清理和标准化电话号码数据,去除任何非数字字符,只保留数字 UPDATE customers SET phone_number REGEXP_REPLACE(phone_number, [^0-9], , g) WHERE phone…

NProgress顶部进度条的用法

大家打开一个网页的时候,会看到一个进度条,然后加载完成后进度条就消失了。这个呢,就是一个第三方的进度条库,叫做nprogress. 1.首先安装nprogress(咱直接用npm安装了) : npm install --save nprogress 2.然后在 router/index.j…

高德Go生态建设与研发实践

序 高德在构建Go生态演化过程中,已经实现了QPS从0到峰值千万的飞跃,本篇文章主要介绍在此过程中积累的一些技术决策及性能优化和重构经验。阅读本文读者会有以下3点收获: 1.高德Go生态发展历程及现状分析 2.高德云原生Serverless落地情况&…

MobaXterm使用VNC远程显示和控制ubuntu桌面

目录 1 在ubuntu中安装vnc 2 设置ubuntu远程连接 3 MobaXterm中连接ubuntu的vnc 1 在ubuntu中安装vnc 参考:Ubuntu18.04~Ubuntu22.04安装并配置VNC_ubuntu安装vnc-CSDN博客 大体流程就是在ubuntu中安装vnc,设置密码,然后配置服务&#x…

Android开发适不适合做车载开发?

众所周知,今年的互联网行业就业率并不是很好,像“开猿截流,公司倒闭”等事件时有发生,感觉市场对于人才的需求量降低了,给原本不景气的Android 开发行业增添了不少的难度。 随着新能源汽车行业的脱颖而出,…

网络安全策略制定和执行: 提供制定全面的网络安全策略的步骤和指南,以确保组织的整体安全性。

网络安全一直是IT领域的一个关键挑战。随着威胁的不断演变和增强,制定和执行全面的网络安全策略变得至关重要。本文将为您提供一系列步骤和指南,帮助您确保组织的整体安全性。 第一章:明确安全需求和目标 在开始制定网络安全策略之前&#…

数据抽取+dataworks的使用+ADB的应用

一,大数据处理之数据抽取 1,什么是数据抽取 在大数据领域中,数据抽取是指从原始数据源中提取所需的数据子集或特定数据项的过程, 数据抽取是数据预处理的重要步骤,它为后续的数据分析和建模提供了基础。 2&#xff…

Win10强制卸载更新补丁的三种方法

在Win10电脑中用户发现更新补丁出现问题了,想通过卸载补丁来解决问题。但是,许多新手用户对于强制卸载Win10系统的更新补丁的方法不是很了解,那么下面小编就给大家介绍关于Win10电脑内强制卸载更新补丁的简单方法吧。 方法一:通过…

MongoDB系例全教程

一、系列文章目录 一、MongoDB安装教程—官方原版 二、MongoDB 使用教程(配置、管理、监控)_linux mongodb 监控 三、MongoDB 基于角色的访问控制 四、MongoDB用户管理 五、MongoDB基础知识详解 六、MongoDB—Indexs 七、MongoDB事务详解 八、MongoDB分片教程 九、Mo…

Docker的安装、基础命令与项目部署

文章目录 前言一、docker安装与MySQL部署1.Linux环境下docker的安装(1)基于CentOS7(2)基于Ubuntu 二、docker基础1.常见命令(1)快速创建一个mysql容器(MySQL得一键安装)。&#xff0…

【ubuntu】搭建lamp架构

一、准备工作 1、更新源 apt-get updateapt #就是一个管理包的工具,理解为centos中的yum update #表示让apt执行更新的操作,更新的内容为软件列表。#为什么要更新软件列表? 就时本地会隔断时间进行同步镜像站的资源包,但是我…

如何滴水不漏的学完C语言?

如何滴水不漏的学完C语言? 学习C语言需要掌握的知识点确实非常广泛。如果你觉得学校教学中所涉及的内容有所欠缺,可以有很多其他方式进行补充学习。最近很多小伙伴找我,说想要一些C语言资料,然后我根据自己从业十年经验&#xff…

GPT引发智能AI时代潮流

最近GPT概念爆火,许多行业开始竞相发展AI ,工作就业也将面临跳转,目前测试就业形势就分为了两大类,一类是测试行业如功能、性能、自动化综合性人才就业技能需求,另一类便是AI测试行业的需求普遍增长,原本由…

使用IO完成端口实现简单回显服务器

说明 使用IO完成端口实现简单回显服务器,因为是测试用的,所以代码很粗糙。 提醒 使用的是ReadFile、WriteFile来实现Overlapped IO,正式场合应该用WSARecv、WSASend,原因:来自《Windows网络编程技术》 8.2.5节 在这里…

葡萄酒中的酒精含量是多少?

当你喝完一杯加利福尼亚赤霞珠和你的朋友在一个周五的晚上出游,你不禁会注意到,这只玻璃杯能让你感觉有点不同于你前几个周末喝的意大利灰皮诺葡萄酒。出于好奇,你查看了一下ABV,发现这个数字高达14.5%!难怪&#xff0…