浅谈端到端,助力智能驾驶突破OR错误路线

news2024/11/17 21:41:45

目前端到端自动驾驶的定义可以简单分为狭义端到端和广义端到端。

42521baacdf64a61a9b945821b5cc426.png

 

狭义端到端:传感器数据进入神经
网络处理后,直接输出方向盘、油门、刹车等执行器的控制信号,该模式通过单一神经网络模型实现,是严格意义上的端到端。


广义端到端:广义上的端到端具有两个特点:信息无损传递;可以实现数据驱动的整体优化。从广义角度理解端到端,可以看到目前主流的方案仍有差异。主要方案包括通过神经网络模型实现感知与决策规划,不包括控制模块;感知和决策规划使用神经网络,模块之间仍有人工设计的数据接口等方式。

e798d53c41f745f0b14e9b1f7e401e1e.png
模仿学习(Imitation Learning)和强化学习(Reinforcement Learning)是当前用于训练端到端神经网络的两种主要方法。模仿学习通过逆最优控制(Inverse Optimal Control)和行为克隆(Behavior Cloning)来实现,其核心理念是让智能体通过模仿专家的行为来学习最优策略。而强化学习则是一种通过试错来学习的领域,其中奖励函数的设计是一个关键挑战。
从端到端的最终实现上,通过感知“端到端”,模块化“端到端”,再到 OneModel/单一模型“端到端”是一种相对平滑的过渡形式。而当前感知“端到端”已经是主流的感知模型,展望后续技术发展,自动驾驶算法向“端到端”收敛,有望成为行业的一大趋势。

 


不同迭代阶段之间的区别:
感知“端到端”:当前的主流感知算法路线大多数都是用神经网络模型,通过基于多传感器融合的
BEV(Bird Eye View,鸟瞰图视角)+Transformer 基本实现了感知模块的端到端,感知输出检测结果的精度及稳定性相对之前的感知方案都有比较大的提升,但在决策规划控制模块仍然以 rule-based 为主。
模块化“端到端”:与感知“端到端”相比,感知端算法没有太大变化,决策规划控制模块有望通过深度学习实现,取代原有的 rule-based 方案,从这一阶段开始,端到端的雏形逐渐形成。并且感知与决策规划控制模块之间的数据传递有望由人为定义的结果抽象为特征向量,避免数据损耗与误差累计等问题,决策规划控制模块的综合模型基于特征向量输出运动规划的结果。
One Model/单一模型“端到端”:这一阶段不再有感知、决策规划等模块的明确划分。从原始信号输入到最终规划轨迹的输出直接采用单一深度神经网络实现。One Model 可以基于强化学习(Reinforcement Learning,RL)或模仿学习(Imitation Learning,IL)的端到端模型,也可以通过世界模型这类生成式模型衍生。
受益于有效数据规模的提升,智能驾驶端到端模型有望成为高阶智能驾驶解决方案。从发展路线来看,2019 年至今 CARLA 数据集不断丰富,基于数据集完成数据泛化、增强可解释性、数据融合、基于人类定义规则的预训练。2023 年受益于数据量积累和底层数据类型的升级,充分满足大规模训练需求。通过数据规模提升和数据间关联性可读性的提升,2023 年开始模块化的端到端规划模式加速,逐步成为代表智能驾驶未来发展的主要方向。端到端大模型在最终功能表现上有更高的上限,未来受益于数据规模持续扩张和评价体系的完善,智能驾驶端到端大模型有望加速落地。

“端到端神经网络”,神经网络本来就是“端到端”的(end to end),即从原始数据可以直接到输出结果,比如从车辆周边视频数据、道路数据、车身数据等,可以直接产生下一时刻车辆操控措施。这也是神经网络区别于机器学习算法的特性之一。

所以,如果特斯拉是能把训练好的神经网络模型(可能很大、也需要较好运算能力),部署到车辆上作为操控核心(运算能力有限),那确实是新“应用”了一种技术,完全不同于以往的基于预置规则的自动驾驶策略。

4917fc7185f7450b9ce57631666064a0.png
现在开始,没有规则代码,只有神经网络。相比此前的模型通常会加入人类编写的“if else”类的规则,端到端其整个算法几乎全部采用神经网络构建,输入端为传感器感知信息,输出端为控制结果。

AI算法自己处理,最后输出驾驶决策,控制车辆。这期间无论是训练还是实操,都是靠数据驱动。数据是否完全安全可靠,算法漏洞如何弥补,都是一个问题,测不准原理提示我们要心怀敬畏,时间会检验一切。

甲辰年8月廿五 与君共勉

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2170453.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于nodejs+vue的外卖管理系统

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码 精品专栏:Java精选实战项目…

【科普知识】什么是驱控一体化伺服电机?

驱控一体化伺服电机以其高度的集成性、兼容性、便捷性以及卓越的性能表现,成为了现代工业自动化领域的一颗璀璨明珠。对于那些追求高效、精准、智能控制的行业用户而言,它无疑是一种理想的选择。 一、驱控一体化伺服电机是什么 驱控一体化伺服电机&…

代码随想录算法训练营第十一天|150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素

150. 逆波兰表达式求值 根据 逆波兰表示法,求表达式的值。 有效的运算符包括 , - , * , / 。每个运算对象可以是整数,也可以是另一个逆波兰表达式。 说明: 整数除法只保留整数部分。 给定逆波兰表达式总是有效的。换句话说&#xff0c…

建筑的抗震等级与建筑资质中哪些项目有关?

在地震多发地带,建筑物的抗震性能是保障人民生命财产安全的关键因素。抗震等级作为建筑设计中的一个重要指标,与建筑资质紧密相关。 建筑的抗震等级与建筑资质中以下项目有关: 1. 工程设计资质:抗震设计是建筑设计的重要组成部分&…

Mysql进阶——1

一.MySQL程序简介 本章介绍 MySQL 命令⾏程序以及在运⾏这些程序时指定选项的⼀般语法。 对常⽤程序进⾏详细的讲解,包括它们的选项。 MySQL安装完成通常会包含如下程序: • Linux系统程序⼀般在 /usr/bin⽬录下,可以通过命令查看&#x…

示例说明:sql语法学习

SQL(Structured Query Language,结构化查询语言)是一种用于管理关系型数据库的标准语言。学习SQL可以帮助你有效地查询、插入、更新和删除数据库中的数据。以下是SQL语法的一些基本概念和常用命令: 1. SQL基础语法 SQL关键字&am…

1-carla简介

1 引入 CARLA是一个开源的自动驾驶模拟器。它是从头开始构建的,作为一个模块化和灵活的API,可以解决自动驾驶问题中涉及的一系列任务。“CARLA”的主要目标之一是让自动驾驶研发自主化,成为用户可以轻松使用和定制的工具。为此,模…

K8S:开源容器编排平台,助力高效稳定的容器化应用管理

云计算de小白 Kubernetes(简称K8s)是一个开源容器编排平台,用于自动化部署、扩展和管理容器化应用程序。 K8S诞生于Google,基于其多年在生产环境运行容器的经验,目前已成为现代微服务架构和云原生应用的核心技术。 图…

CVE-2023-49735

前言: 最近扫描碰到了 CVE-2023-49735漏洞,但是网上一搜发现没有一个对这个漏洞研究的,那我就当个挖井人挖一下这个漏洞,首先我们要了解tiles org.apache.tiles提供了一种强大而灵活的方式来构建和管理 Java Web 应用程序的视图…

C#中的Modbus Ascii报文

C#中的Modbus Ascii报文的结构 Modbus ASCII报文结构遵循一定的规则,以确保数据的正确传输和识别。在C#中实现Modbus ASCII通信时,理解这些结构是非常重要的。以下是Modbus ASCII报文的基本结构: 起始字符:每个Modbus ASCII帧以冒…

TypeScript 设计模式之【观察者模式】

文章目录 观察者模式:构建灵活响应的事件通知系统观察者模式的奥秘观察者模式有什么利与弊?如何使用观察者模式来优化你的系统代码实现案例观察者模式的主要优点观察者模式的主要缺点观察者模式的适用场景总结 观察者模式:构建灵活响应的事件通知系统 …

Mortise AI编程智能体产品 | OPENAIGC开发者大赛企业组AI创作力奖

在第二届拯救者杯OPENAIGC开发者大赛中,涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到,我们特意开设了优秀作品报道专栏,旨在展示其独特之处和开发者的精彩故事。 无论您是技术专家还是爱好者,希望能带给…

华为 HCIP-Datacom H12-821 题库 (28)

🐣博客最下方微信公众号回复题库,领取题库和教学资源 🐤诚挚欢迎IT交流有兴趣的公众号回复交流群 🦘公众号会持续更新网络小知识😼 1.使用 NAT 技术,只可以对数据报文中的网络层信息(IP 地址&#xff09…

贴片式TF卡(SD NAND)参考设计

【MK 方德】贴片 TF 卡参考设计 一、电路设计 1、 参考电路: R1~R5 (10K-100 kΩ)是上拉电阻,当 SD NAND 处于高阻抗模式时,保护 CMD 和 DAT 线免受总线浮动。 即使主机使用 SD NAND SD 模式下的 1 位模式,主机也应通过上拉电阻…

Type-C接口桌面显示器的优势

随着科技的飞速发展,电子设备的连接性、便捷性和高效性成为了消费者关注的重点。在这个背景下,Type-C接口桌面显示器以其卓越的性能和广泛的兼容性,正逐步成为市场上的主流选择。本文将深入探讨Type-C接口桌面显示器的优势、应用场景、市场现…

【大模型-驯化】成功解决载cuda-11.8配置下搭建swift框架

【大模型-驯化】成功解决载cuda-11.8配置下搭建swift框架 本次修炼方法请往下查看 🌈 欢迎莅临我的个人主页 👈这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合,智慧小天地! 🎇 相关内容文档获取 微信公众号 &…

传奇微端黑屏不更新地图?传奇微端架设教程——GOM引擎

登录器和网站配置好后,我们进入游戏后会发现是黑屏的,更新不了地图和NPC这些,因为还没有做微端,会黑屏也是正常的。有些老G做了微端但是还是黑屏,就可能是你的微端架设出现了问题,可以参考以下教程。 gom引…

顶顶通呼叫中心中间件-机器人话术挂机后是否处理完成事件

前言 问题:机器人放音的过程中,如果用户直接挂机就会继续匹配下一个流程,如果匹配上的是放音节点,还会进行放音,那么在数据库表中就会多出一条放音记录。 解决方法 一、话术添加一个全局挂机节点 需要在话术中添加一…

多维时序 | GWO-VMD-SSA-LSTM灰狼优化变分模态分解联合麻雀优化长短期记忆网络多变量时间序列光伏功率预测(Matlab)

多维时序 | GWO-VMD-SSA-LSTM灰狼优化变分模态分解联合麻雀优化长短期记忆网络多变量时间序列光伏功率预测 目录 多维时序 | GWO-VMD-SSA-LSTM灰狼优化变分模态分解联合麻雀优化长短期记忆网络多变量时间序列光伏功率预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 …

python-4-4-编程规范2

str1 ,str2 input("请输入两个学生的姓名,用空格分开").split() print(str1) print(str2)print("hello python")name "Jim" print("His name is :",name)a "hello" b "python" print(a,b)print(&q…