一段式端到端vs两段式端到端,到底哪个好

news2024/9/22 6:20:43

在智能汽车领域,端到端自动驾驶技术正迅速成为行业焦点,不同的玩家实现路径也有差别。目前主流的端到端智驾方案有两类:一段式和两段式,针对这两种方案优缺点的讨论,也从未停止过。

“两段式”端到端和“一段式”端到端具体有哪些区别呢?

一段式端到端:

通往自动驾驶“ChatGPT”时刻的关键路径

ChatGPT输入一个文本,全面理解文本,预测下一个token。OpenAI的首席科学家做过一个比喻,你读了一本推理小说,在书的末尾要预测凶手的名字。要做到这一点,你就需要理解整部书。

一段式端到端采用的是类似ChatGPT的训练方式,2022年底,商汤及其联合实验室提出了行业首个感知决策一体化自动驾驶通用模型——UniAD,采用的就是将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型中,也就是由传感器直接输入外部环境信息,直接输出自车行驶轨迹,实现信息的无损传递,从而做出更精准的决策。相比之下,“两段式”方案信息经过感知模型过滤后,再到规控模型,损失较多,同时还会面临无法全面理解整个复杂场景、泛化能力和解决corner case的能力比较弱等问题。
 

王晓刚在2024年WAIC大会的发言

上限更高!一段式端到端,全面理解并应对复杂场景

两段式端到端模型由于网络规模小,只能解决特定简化任务,类似于动物擅长某些固定行为,比如:蜜蜂的习性就是特定的简单任务,它一直会干得很好,但是它的大脑相对很简单,无法应对复杂多变的环境。而一段式端到端模型则像人类大脑,具备更高的理解力和进化能力,能够全面理解并应对复杂场景,不断学习和进化,解决当前问题后,逐步提升至新的level,掌握新的工具并应对未曾见过的多样场景。所以,这样的模型不仅解决当前问题,还能适应未来更复杂的挑战。
 

一段式端到端,开发艰难,但正确

一段式方案要求前端处理大量视频信息,同时输出的决策信号必须极为精准,这对整个网络的训练、数据量以及Pipeline的要求极高。正如王晓刚所言,“‘一段式’方案很难,但一旦模型学出来能力会很强,这才是我们追求的自动驾驶里面的‘ChatGPT’时刻。”

实现「一段式端到端」自动驾驶方案的难度远超两段式。端到端自动驾驶技术的发展面临高昂的成本、巨大的算力资源需求、大量的高质量数据输入以及强大的模型性能支撑等挑战。商汤绝影之所以能够持续在这一领域取得突破,主要依赖于其丰沛的算力资源和高质量数据积累。商汤大装置已经布局全国一体化的智算网络,运营45,000卡GPU,总体算力规模达12,000 PFLOPS。同时,商汤绝影荣获2023年国际计算机视觉与模式识别会议(CVPR)最佳论文。在大模型的轻量化部署和持续迭代方面具备深厚的技术积累,使得绝影能够快速实现一段式端到端自动驾驶方案的车端部署并上路测试,持续引领端到端自动驾驶的前沿潮流。

给端到端装上“多模态大脑”
——DriveAGI

商汤绝影正在研发面向下一代自动驾驶技术——DriveAGI,基于多模态大模型对UniAD进行改进迭代,通过多模态大模型加持端到端方案,打造下一代自动驾驶技术。让车辆像人一样理解复杂的现实世界,洞察各类交通参与者的行为动机,快速学习各种交通规则,掌握瞬息万变的道路信息,还能向用户解释驾驶决策的推理过程。

Image

在路上遇到救护车,凭借DriveAGI的认知能力,车辆不仅能识别救护车,还能做到主动为执勤救护车让路

从模仿人类驾驶行为到不断超越人类,商汤绝影通过两大王牌——感知决策一体的「一段式端到端」自动驾驶大模型UniAD,以及多模态加持的下一代自动驾驶大模型DriveAGI,实现了由认知驱动的自动驾驶。这个智驾方案不仅适用场景更广泛、性能更高,同时也降低了应用门槛,加速智能汽车驶向AGI时代。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2054119.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

遥感之地理农业分区

在前面的文章有介绍关于中国区域进行分区研究的思路: 中国生态地理区划更新和优化 全国一米全要素分类数据集如何得到的?原文赏析! 根据不同的研究角度对中国区域进行分区,其结果只是细节不一样,大部分还是差不多的&a…

基于Django框架的图书管理系统,前台采用Bootstrap框架UI,后台EasyUI框架UI

程序开发软件:Pycharm 数据库:mysql 采用技术: Django(一个MVT框架,类似Java的SSM框架) 人生苦短,我用Python,咱们今天就来分享一个用Python语言开发的基于Django框架的图书管理系统吧。项目前台和后台界…

Python酷库之旅-第三方库Pandas(088)

目录 一、用法精讲 371、pandas.Series.sparse.density属性 371-1、语法 371-2、参数 371-3、功能 371-4、返回值 371-5、说明 371-6、用法 371-6-1、数据准备 371-6-2、代码示例 371-6-3、结果输出 372、pandas.Series.sparse.fill_value属性 372-1、语法 372-2…

麒麟系统离线安装docker

随着CentOS全面停服,国产操作系统会慢慢代替centos系统,在后续的项目中,项目部署的环境都必将是国产操作系统,本文就国产操作系统下如何离线安装docker,做下笔记分享 一、材料准备 1、国产操作系统 麒麟10,arm64v8 2、…

爱心商城系统pf

TOC springboot424爱心商城系统pf 第1章 绪论 1.1 课题背景 二十一世纪互联网的出现,改变了几千年以来人们的生活,不仅仅是生活物资的丰富,还有精神层次的丰富。在互联网诞生之前,地域位置往往是人们思想上不可跨域的鸿沟&…

k8s上部署rancher

一、什么事rancher Rancher 是一个 Kubernetes 管理工具,让你能在任何地方和任何提供商上部署和运行集群。 Rancher 可以创建来自 Kubernetes 托管服务提供商的集群,创建节点并安装 Kubernetes,或者导入在任何地方运行的现有 Kubernetes 集…

不小心把回收站的照片删了怎么办?别急,这里有找回方法

在日常的数字生活中,照片无疑是我们记录生活点滴、珍藏美好回忆的重要载体。然而,在整理电脑文件时,一个不小心就可能将珍贵的照片误删,甚至从回收站(或称为垃圾箱、废纸篓)中彻底清空,让人懊悔…

如何关闭宝塔Linux面板的公网SSL证书?

前言 在安装宝塔Linux面板时,有时会不小心开启了公网SSL证书,导致需要通过HTTPS才能访问面板,如果你希望恢复到HTTP访问,可以通过图形界面和命令行两种方式来关闭SSL证书。本文将详细介绍这两种方法,并帮助你顺利完成…

2-70 基于matlab的三维装载约束下的货物循环取货路径优化模型建立

基于matlab的三维装载约束下的货物循环取货路径优化模型建立。包含文档说明。以配送中心为原点,分派多辆同一规格的货车到n个供应商处取货,最后回到配送中心。要求充分考虑货物车厢中的三维装载位置,确保每个零部件均能成功装载,尽…

AUTOSAR实战干货:NVM模块Block属性配置全解析

AUTOSAR实战干货:NVM模块Block属性配置全解析 前言 本文思维大纲如下: 继小T之前所写到的AUTOSAR NVM模块详细文章《AUTOSAR技术干货:CP NVM介绍与实战经验分享》, 小T今天将基于NVM模块中每个Block的重要属性配置一次性讲解清楚…

第132天:内网安全-横向移动Exchange服务有账户CVE漏洞无账户口令爆破

域控环境0day.org 通过网盘分享的文件:131-0day.org内网域环境镜像文件 链接: https://pan.baidu.com/s/1rf_gHVJSNG8PEsiSr7DFSw?pwdr5jc 提取码: r5jc 给win7设置一张nat网卡,其他各个主机都设置为vm2 案例一: 域横向移动-内网服务-Exchan…

turtle库 多圈文字旋转 代码开源

对文字旋转进行了升级 声明:著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 效果:(视频要转GIF懒得弄了就截个图) 代码实现: # -*- coding: utf-8 -*- """ Creat…

基于SpringBoot的智慧校园管理系统

系统背景 在当今信息化高速发展的时代背景下,智慧校园管理系统作为教育信息化建设的重要组成部分,正逐步成为提升学校管理水平、优化教育资源配置、促进教育教学创新的关键力量。随着物联网、大数据、云计算、人工智能等先进技术的不断融合与应用&#x…

YoloV8改进策略:下采样与上采样改进|

摘要 河流冰语义分割是一项关键任务,它可以为我们提供河流监测、灾害预测和交通管理所需的信息。以往的工作主要集中在提高准确性上,但对于实际应用而言,效率也同样重要。在本文中,我们提出了一种实时且准确的河流冰语义分割网络…

如何避免电脑监控软件(避开电脑监控软件的秘诀)

电脑监控软件被广泛应用在家庭、学校和企业环境中,以实现对计算机使用情况的监督和管理。 然而,对于希望保护个人隐私或避免被不必要监控的人来说,了解如何避开这些监控软件显得尤为重要。 本文将详细介绍如何避免被电脑监控软件跟踪的方法&…

HID类的报表描述符中的USAGE MAX,USAGE MIN使用注意

发现问题由来 准备自己做一个自定义键盘,先小测试一下经典键盘的26字母,设置了从A到H。在实际传输给电脑数据中,把传送数据第一个按钮是0x04,以为输出A,谁知道居然输出D . 下面一段简单的HID报表描述符共对电脑发送4个…

《深入浅出多模态》(八)多模态经典模型:MiniGPT4

🎉AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、…

CATIA CAA 二次开发 -- 获取当前会话编辑的CATIPLMComponent

1、先获取当前激活的编辑器 CATFrmEditor* pEditor CATFrmEditor::GetCurrentEditor();if (pEditor nullptr)return S_FALSE; 关于方法【GetCurrentEditor】的解释如下图所示。 2、通过【CATPLMComponentInterfacesServices】去获取当前编辑器的根。 CATPLMComponentInterf…

UE 开发---- Ios ipa 安装包安装到IPhone手机上

由于最近 我在使用ue 开发手机软件 打包成为 Ios ipa 安装包时 安装到手机上遇到的问题 准备: 1、一部 Ios 手机 2、首先下载爱思助手爱思助手官网_苹果助手_苹果刷机助手_苹果越狱助手 (i4.cn) 我下载的Windows端 电脑连接上Ios手机时 是这样的 我们打开工…

【Qt】Qt窗口 | QDialog 对话框

文章目录 一. 对话框二. 对话框的分类1. 非模态对话框2. 模态对话框3. 混合属性对话框 三. 自定义对话框1. 代码实现2. ui文件实现 四. 内置对话框1. QMessageBox 消息对话框2. QColorDialog 颜色对话框3. QFileDialog 文件对话框4. QFontDialog 字体对话框5. QInputDialog 输入…