端到端自动驾驶的基础概念

端到端自动驾驶的基础概念

news2024/12/22 20:45:20

欢迎大家关注我的B站：

偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频 (bilibili.com)

目录

1.端到端自动驾驶的定义

1.1特斯拉FSD

1.2端到端架构演进

1.3大模型

1.4世界模型

1.5纯视觉传感器

2.落地的挑战

1.端到端自动驾驶的定义

端到端自动驾驶也就是end-to-end autonomous driving（下面用端到端代替）的早期定义是“从传感器输入到控制输出的单一神经网络模型”，现阶段端到端的定义是“感知信息无损传递，自动驾驶系统的全局优化”

1.1特斯拉FSD

虽然在特斯拉FSD宣布切换至端到端技术架构后，国内智能驾驶公司也纷纷推出各种端到端智驾系统，但是技术主义者往往会认为这并不是真正的端到端，其实这些争议也来源于对于端到端的定义不清晰。

1.2端到端架构演进

第一阶段：感知端到端。通过多传感器融合的数据输入，最后表征成BEV范式，已经是目前非常常见的感知方案。
第二阶段：决策规划端到端。预测到决策到规划都是通过深度学习，集成到一个神经网络中去训练学习。虽然都是神经网络但是每个模型的训练优化局限在模块内部，传递会有信息损失。
第三阶段：模块化端到端。这一阶段主要是感知和决策规划之间不再是人类理解的结果，而是特征向量，也就是两个模块不能独立训练，而支持跨模块的梯度传导。
第四阶段：One Model。这时候网络的内部也不再有明确的划分。

1.3大模型

端到端不等同于大模型，大模型更关注模型的参数量以及智能涌现能力，而端到端强调结构上的梯度可传导以及全局优化。所以大模型为端到端提供了很好的可选方案，但是端到端并非必然用大模型实现。

自动驾驶目前的大模型由于车端算力以及实时性的影响，很难达到NLP领域的标准，只是比自动驾驶感知领域的参数量大的多而已。但是LLM仍旧是为了智驾的趋势，因为其强大的推理能力和可解释性有望解决决策规划领域各种corner case。

1.4世界模型

世界模型是指能够学习以及揭示真实物理世界及数学定律的模型。世界模型是自动驾驶开发中数据生成器的角色，他可以源源不断生成数据，并且覆盖大量车无法采集到的极端工况，对长尾问题很有帮助，并且在线生成的成本优势很大。

世界模型自身具备理解周围环境以及交互情况，因此只需要调整或增加一些输出链路或模块就可实现端到端。但短期内制约这种方案的难点是车端算力不够，后续会考虑蒸馏或其他方式在保持对真实世界理解的能力下最大程度裁剪模型。

1.5纯视觉传感器

有些从业者认为端到端一定只能基于纯视觉，这个误解源于BEV范式成为业界主流，但是多传感器的选择和融合只是模型的输入，哪些传感器能让端到端自动驾驶效果更好并没有大量的实验去验证出来。

2.落地的挑战

技术路线：还未形成，各个企业之间存在分歧
数据：数据量、数据标注、数据质量和数据分布都是影响training的关键因素
算力：算力要求高
测试技术：行业需要新的测试验证方法论和工具链，目前有很多关于自动驾驶测试场景生成等等研究
产业：端到端需要上游工具链、芯片等产业加速进步

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1843897.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

RSA学习

RSA学习

[MRCTF2020]Easy_RSA 先来分析一下这个RSA代码的特殊性，这个不是传统的RSA,随机生成N，并保证为N%8的余数是5 zlib 用于数据压缩，但是并似乎没有用到 gen_p(): 生成随机的1024位质数p。计算np*q，并没有直接用于加密。计算F_n…

阅读更多...

返回给前端数据的封装

返回给前端数据的封装

返回格式如下： { "code": 200/400, "msg": "成功"/"失败", "total": n, "data": [ {}，{}]} 1.在common中新增Result 类，代码如下 package com.xxx0523.common; import lombo…

阅读更多...

【OpenVINO™】使用 OpenVINO™ C# 异步推理接口部署YOLOv8 ——在Intel IGPU 上速度依旧飞起！！

【OpenVINO™】使用 OpenVINO™ C# 异步推理接口部署YOLOv8 ——在Intel IGPU 上速度依旧飞起！！

OpenVINO Runtime支持同步或异步模式下的推理。Async API的主要优点是，当设备忙于推理时，应用程序可以并行执行其他任务（例如，填充输入或调度其他请求），而不是等待当前推理首先完成。当我们使用异步API时&…

阅读更多...

【React】使用Token做路由权限控制

【React】使用Token做路由权限控制

在components/AuthRoute/index.js中 import { getToken } from /utils import { Navigate } from react-router-domconst AuthRoute ({ children }) > {const isToken getToken()if (isToken) {return <>{children}</>} else {return <Navigate to"/…

阅读更多...

算法设计与分析实验4 动态规划法求扔鸡蛋问题

算法设计与分析实验4 动态规划法求扔鸡蛋问题

目录一、实验目的二、问题描述三、实验要求四、实验内容动态规划法算法描述算法伪代码描述算法复杂度分析数据测试二分优化的动态规划法算法描述二分优化： 算法伪代码算法复杂度分析数据测试单调决策优化的动态规划法算法描述算…

阅读更多...

【机器学习】与【深度学习】的前沿探索——【GPT-4】的创新应用

【机器学习】与【深度学习】的前沿探索——【GPT-4】的创新应用

gpt4o年费：一年600， 友友们，一起拼单呀，两人就是300，三个人就是200，以此类推， 我已经开通年费gpt4o，开通时长是从2024年6月20日到2025年7月16日有没有一起的呀，有需要的…

阅读更多...

vue3页面传参

vue3页面传参

一，用query传参方法： router.push({path: ‘路由地址’, query: ‘参数’}) 例子：a页面携带参数跳转到b页面并且b页面拿到a页面传递过来的参数在路由router.ts配置 a页面： <template><div >a页面</div>…

阅读更多...

Spatio-temporal Relation Modeling for Few-shot Action Recognition

Spatio-temporal Relation Modeling for Few-shot Action Recognition

标题：少样本动作识别的时空关系建模源文链接：Thatipelli_Spatio-Temporal_Relation_Modeling_for_Few-Shot_Action_Recognition_CVPR_2022_paper.pdf (thecvf.com)https://openaccess.thecvf.com/content/CVPR2022/papers/Thatipelli_Spatio-Temporal_…

阅读更多...

多目标跟踪中用到的求解线性分配问题（Linear Assignment Problem，LAP）Python

多目标跟踪中用到的求解线性分配问题（Linear Assignment Problem，LAP）Python

多目标跟踪中用到的求解线性分配问题（Linear Assignment Problem，LAP）Python flyfish 如果想看 C版本的，请点这里。线性分配问题（LAP，Linear Assignment Problem）是一个经典的优化问题&…

阅读更多...

虚拟机配置桥接模式

虚拟机配置桥接模式

背景因为要打一些awd比赛,一些扫描工具什么的,要用到kali,就想着换成一个桥接模式但是我看网上的一些文章任然没弄好,遇到了一些问题前置小问题每次点开虚拟网络编辑器的时候都没有vmnet0,但是点击更改的时候却有vmnet0 第一步: 点击更改设置第二步: 把wmnet0删掉 …

阅读更多...

AD使用快捷键

AD使用快捷键

1、如何实现元器件旋转45放置在Preferences >> PCB Editor >> General中将Rotation Step（旋转的步进值）由90改为45，这样以后每次按空格键旋转器件时旋转角度为45。 2、显示网络、隐藏网络 N 3、对齐 2、设置DRC检查选项&#xf…

阅读更多...

[17] 使用Opencv_CUDA 进行滤波操作

[17] 使用Opencv_CUDA 进行滤波操作

使用Opencv_CUDA 进行滤波操作邻域处理操作 > 滤波操作，拒绝或者允许某特定频段通过如果图像某处的灰度级变化缓慢，那么就是低频区域，如果灰度级变化剧烈，就是高频区域邻域滤波即卷积操作形态学处理：膨胀&#xf…

阅读更多...

vue小总结

vue小总结

知识总结【 1 】es6 语法总结 # let 定义变量 # const定义常量 ------块级作用域---- # var 以后尽量少用，函数作用域var 在 JavaScript 中是函数作用域或全局作用域。而 let 和 const 是块级作用域。 // 使用 var 声明全局变量 var globalVar "Im a globa…

阅读更多...

酸性设计震撼登场，让你眼前一亮！

酸性设计震撼登场，让你眼前一亮！

说起酸性（ACID），你会想到什么？”我们通常会想到酸味，酸设计的视觉魅力是通过图形、颜色、排版给人复古、迷幻、黑暗、叛逆的感觉，反复几何图形和高饱和的颜色，使设计非常时尚，非常适…

阅读更多...

linux精通 4.1

linux精通 4.1

2.1.3 http服务器实现目的 reactor应用——webserver webclient 每次上课前看大纲down code 复习： 不行啊编译给的代码报错啊给的最新的不是0430那一版就不行啊 reactor.c:(.text0x254): relocation truncated to fit: R_X86_64_PC32 against symbol begin de…

阅读更多...

Unity 材质系统优化（mesh相同，图片不同，但是可以将所有的图片合成一张图集）

Unity 材质系统优化（mesh相同，图片不同，但是可以将所有的图片合成一张图集）

今天提供一个Unity材质优化的思路，流程是这样的，模型的mesh相同只是图片不同，我想着能不能将所有的图片合成一张图集呢，于是我就试着在Blender里面开搞了，所有的mesh相同的模型，共用一个材质（图…

阅读更多...

分支结构相关

分支结构相关

1.if 语句结构： if 条件语句： 代码块小练习： 使用random.randint()函数随机生成一个1~100之间的整数，判断是否是偶数 import random n random.randint(1,100) print(n) if n % 2 0:print(str(n) "是偶数") 2.else语…

阅读更多...

Unity3d 游戏暂停(timeScale=0)引起的deltaTime关联的系列问题解决

Unity3d 游戏暂停(timeScale=0)引起的deltaTime关联的系列问题解决

问题描述游戏暂停的功能是通过设置timeScale0实现的，不过在暂停游戏的时候，需要对角色进行预览和设置，为了实现这个功能，是通过鼠标控制相机的操作，为了使相机的操作丝滑，获取鼠标操作系数乘以Time.delta…

阅读更多...

代码大模型揭秘：从下载到推理，全流程体验StarCoder

代码大模型揭秘：从下载到推理，全流程体验StarCoder

选择模型模型榜单大模型的发展日新月异，性能强劲的大模型不断涌现，可以实时关注开源大模型的榜单，选择合适自己的大模型开源大模型榜单开源代码大模型榜单模型网站目前主流的下载模型的网站就是 huggingface 全球社区，…

阅读更多...

Python - 各种计算器合集【附源码】

Python - 各种计算器合集【附源码】

计算器合集一：极简版计算器二：简易版计算器三：不简易的计算器四：还可以计算器一：极简版计算器运行效果： import tkinter as tk import tkinter.messagebox win tk.Tk() win.title("计算器")…

阅读更多...

推荐文章

最新文章