MARS: An Instance-aware, Modular and Realistic Simulator for Autonomous Driving

news2025/1/13 17:05:56

● MARS: An Instance-aware, Modular and Realistic Simulator for Autonomous Driving(基于神经辐射场的自动驾驶仿真器)
● https://github.com/OPEN-AIR-SUN/mars
● https://arxiv.org/pdf/2307.15058.pdf
● https://mp.weixin.qq.com/s/6Ion_DZGJwzs8JOoWMMbPw

1. 摘要

  • 逼真的传感器仿真解决剩余corner case
  • 3个工作
    • 1.实例意识。作者的仿真器用独立的网络分别仿真前台实例和后台环境,以便可以分别控制实例的静态(例如大小和外观)和动态(例如轨迹)属性
    • 2.模块化。作者的仿真器允许在不同的现代NeRF相关主干、采样策略、输入模式等之间灵活切换。希望这种模块化设计能促进给予NeRF的自动驾驶方针的学术进步和工业部署
    • 3.现实。作者的仿真器设置了新的最先进的照片现实主义的结果给出了最佳的模块选择。

2. Nerf最新进展

2.1. Nerf:将场景表达为3D空间的场

  • (https://arxiv.org/pdf/2003.08934.pdf)

  • 基本思想:3维空间,3D点都向外发射,并且具有一定的体积,可以阻挡其他方向的射线传播
    在这里插入图片描述

  • 将位置和观察角度 ( x , y , z , θ , ϕ ) (x,y,z,\theta,\phi) (x,y,z,θ,ϕ)转化为 ( R , G , B , δ ) (R,G,B,\delta) (R,G,B,δ),RGB和反射率

  • 渲染出每个点的Color(RGB)+Density(阻挡能力),用渲染的颜色和原图颜色做loss
    在这里插入图片描述

  • Blend weights:通过前面所有不透明度的积分得到当前点的积分

  • 体渲染:将所有点从近到远排列到一块,利用Blend weights和积分得到当前点的渲染颜色

  • 真实实现Nerf不用积分,计算量大

  • Nerf缺点:

    • 训练慢:需要2~3天,渲染图要几十秒
    • 渲染结果几何比较差
    • 基于静态场景的假设,不适用动态场景(本文主要解决的问题)

2.2. 续改进论文:

  • instant ngp:https://nvlabs.github.io/instant-ngp/ https://github.com/NVlabs/instant-ngp

    • 主要思想:不需要复杂的网络建模,只需要体素网格;大部分区域空洞,引入哈希表存储信息
    • 达到分割级的训练和实时渲染
  • TenoRF:https://github.com/apchenstu/TensoRF

    • 主要思想:场景稀疏,所以用张量分解方法分解体素(4维),分解低质的tensors,每个compoment可以看作一个vector-matrix
  • SDF:Signed Distance Field

    • 解决Nerf几何不准的问题:计算空间点到最近表面的距离,在表面内SDF<0,表面外面SDF>0
      在这里插入图片描述
  • NeuS:https://arxiv.org/pdf/2106.10689.pdf

    • 主要思想:Nerf和SDF不能天然结合起来

2. 主要内容

本文主要解决“基于静态场景的假设,不适用动态场景”的问题

2.1. 之前的工作

  • Deformation-based NeRFs
    • 主要思想:显示建模帧与帧之间点的位移变化
    • 原始论文:
      • 在人体比较复杂的场景,上图方法其实效果并不好在这里插入图片描述
      • Vid2Avatar:https://github.com/MoyGcc/vid2avatar(数字人领域)
  • Modeling Implicit 4D Volume
    • 主要思想:隐式建模4D空间(加上time的4维空间),通过将一个点投影到6个平面上完成
    • Fridovich:https://openaccess.thecvf.com/content/CVPR2023/papers/Fridovich-Keil_K-Planes_Explicit_Radiance_Fields_in_Space_Time_and_Appearance_CVPR_2023_paper.pdf
      • 主要思想:任意两个维度可以组成一个平面,这样就可以重建整个空间
        在这里插入图片描述

2.2. 本文内容:

  • 之前工作在刚体运动的场景比较复杂了,因为通过刚体运动就可以建立

2.3. 其他内容

  • 4D标注:
    • object pose不准,会导致渲染的时候出现汽车跳动的问题
      • 原因:现有的3D目标检测标注不准
        • 1.单目标注的不具有尺度度量(真实世界尺度)
        • 2.不用来做重建,不考虑帧间的一致性
    • 通过mask(车)做仿真
  • 行人和车辆的交换:现在还没考虑分刚体的行人仿真
  • 没有考虑shadow和weather的变化
  • 物理仿真(物理方程)
  • KITTI 10G显存就行了
  • 在waymo数据上做的:标注框不是很准,但是直行还行,转弯不行
    • nuscenes数据集:camera pose /object pose都不是很准,试验很多次效果不好

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1056579.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

flink处理函数--副输出功能

背景 在flink中&#xff0c;如果你想要访问记录的处理时间或者事件时间&#xff0c;注册定时器&#xff0c;或者是将记录输出到多个输出流中&#xff0c;你都需要处理函数的帮助&#xff0c;本文就来通过一个例子来讲解下副输出 副输出 本文还是基于streaming-with-flink这本…

解决SpringBoot Configuration Annotation Processor not configured

版权声明 本文原创作者&#xff1a;谷哥的小弟作者博客地址&#xff1a;http://blog.csdn.net/lfdfhl 问题描述 在使用ConfigurationProperties注解和EnableConfigurationProperties注解时&#xff0c;IDEA报错&#xff1a;SpringBoot Configuration Annotation Processor no…

【chainlit】使用chainlit部署chatgpt

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

微服务架构改造案例

最后一个部分&#xff0c;结合我们自己的财务共享平台项目进行了微服务架构改造案例分析。 对于改造前的应用&#xff0c;实际上存在四个方面的问题。 其一是关于高可用性方面的&#xff0c;即传统的单体应用我们在进行数据库水平扩展的时候已经很难扩展&#xff0c;已经出现…

XShell远程连接Ubuntu

环境 系统&#xff1a;Ubuntu 18.04.6 LTS IP&#xff1a;192.168.1.4 ps:查看ubuntu版本 lsb_release -a 查看ubuntu的ip地址 Ubuntu系统准备工作 root权限 打开ubuntu系统后&#xff0c;打开终端&#xff0c;切换为root权限&#xff1a;su root 如果出现su root认证失…

管理经济学基本概念(五):一些基本术语

1、理性-行动者范式 使经济学家行动一致的东西就是采用理性-行动者范式来预判人的行为。简单地说&#xff0c;这个范式认为人们的行动式理性的、优化的和自利的。 2、税后净营业利润 税后经营净利润(NOPAT)是指将公司不包括利息收支的营业利润扣除实付所得税税金之后的数额加…

Acwing 907. 区间覆盖

Acwing 907. 区间覆盖 知识点题目描述思路讲解代码展示 知识点 贪心 题目描述 思路讲解 代码展示 #include <iostream> #include <algorithm>using namespace std;const int N 100010;int n;struct Range {int l, r;bool operator < (const Range &W) …

【day11.02】网络编程脑图

大小端存储&#xff1a; ip地址划分&#xff1a;

MySQL 锁分类和详细介绍

锁是计算机协调多个进程或线程并发访问某一资源的机制&#xff0c;在数据库中&#xff0c;除传统的计算资源&#xff08;CPU、RAM、I/O&#xff09;的争用以外&#xff0c;数据也是一种供许多用户共享的资源&#xff0c;锁机制是保证数据一致性和并发性的重要手段&#xff0c;它…

软件设计模式系列之二十二——状态模式

1 模式的定义 状态模式是一种行为型设计模式&#xff0c;它允许对象在内部状态发生改变时改变其行为&#xff0c;使得对象的行为看起来像是改变了其类。状态模式将对象的状态抽象成一个独立的类&#xff0c;让对象在不同状态下具有不同的行为&#xff0c;而且可以在运行时切换…

做一个优秀的博士生,时间的付出是必要条件

&#xff0a;图片来自管理学季刊 时间的付出 所有成功的科学家一定具有的共同点&#xff0c;就是他们必须付出大量的时间和心血。这是一条真理。实际上&#xff0c;无论社会上哪一种职业&#xff0c;要想成为本行业中的佼佼者&#xff0c;都必须付出比常人多的时间。有时&…

【知识点随笔分析 | 第六篇】HTTP/1.1,HTTP/2和HTTP/3的区别

前言&#xff1a; 当今互联网已成为人们生活的重要组成部分&#xff0c;而HTTP协议&#xff08;Hypertext Transfer Protocol&#xff09;是支持Web通信的基础。随着Web技术的发展和互联网应用的不断增多&#xff0c;HTTP也在不断演进。本文旨在介绍HTTP的演变过程中的三个重要…

【Godot4.1】Godot实现闪烁效果(Godot使用定时器实现定时触发的效果)

文章目录 准备工作创建Sprite2D创建Timer节点 编写脚本完整代码运行效果 准备工作 如果你希望配置C#编写脚本&#xff0c;可以查看如下教程&#xff1a; Godot配置C#语言编写脚本 创建Sprite2D 首先弄一个用于显示的Sprite2D&#xff0c;右键单击任意节点&#xff0c;然后选…

Transformer在小目标检测上的应用

本篇文章是博主在AI、无人机、强化学习等领域学习时&#xff0c;用于个人学习、研究或者欣赏使用&#xff0c;并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记&#xff0c;若有不当和侵权之处&#xff0c;指出后将会立即改正&#xff0c;还望谅解。文章分类在AI学…

mysql双主互从通过KeepAlived虚拟IP实现高可用

mysql双主互从通过KeepAlived虚拟IP实现高可用 在mysql 双主互从的基础上&#xff0c; 架构图&#xff1a; Keepalived有两个主要的功能&#xff1a; 提供虚拟IP&#xff0c;实现双机热备通过LVS&#xff0c;实现负载均衡 安装 # 安装 yum -y install keepalived # 卸载 …

反向输出一个三位数

系列文章目录 进阶的卡莎C++_睡觉觉觉得的博客-CSDN博客数1的个数_睡觉觉觉得的博客-CSDN博客双精度浮点数的输入输出_睡觉觉觉得的博客-CSDN博客足球联赛积分_睡觉觉觉得的博客-CSDN博客大减价(一级)_睡觉觉觉得的博客-CSDN博客小写字母的判断_睡觉觉觉得的博客-CSDN博客纸币(…

手把手教你完成(Java)师生信息管理系统

手把手教你完成&#xff08;Java&#xff09;师生信息管理系统 对阶段一学到的知识进行应用&#xff0c;完成练手小项目。同时&#xff0c;也可以当做学校的课设来做。项目已上传 CSDN &#xff0c;可以按需下载。 一、成果展示 添加学生&#xff08;查看学生&#xff09; 删除…

计算机毕业设计 基于SSM的宿舍管理系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

【C进阶】指针笔试题解析

做题之前我们再来回顾一下 对于数组名的理解&#xff1a;除了以下两种情况&#xff0c;数组名表示的都是数组首元素的地址 &#xff08;1&#xff09;sizeof&#xff08;数组名&#xff09;&#xff1a;这里的数组名表示整个数组 &#xff08;2&#xff09;&&#xff08;数…

关掉在vscode使用copilot时的提示音

1. 按照图示的操作File --> Preferences --> Settings 2. 搜索框输入关键字Sound&#xff0c;因为是要关掉声音&#xff0c;所以找有关声音的设置 3. 找到如下图所示的选项 Audio Cues:Line Has Inline Suggetion,将其设置为Off 这样&#xff0c;就可以关掉suggest code时…