NVIDIA发布端到端自动驾驶框架Hydra-MDP

news2024/11/16 7:39:13

动图封面

自动驾驶是目前人工智能领域的一个主要分支,目前特斯拉的FSD确实是为数不多的大模型框架。与其说特斯拉是一个造车公司,不如说是一个人工智能大数据公司。特斯拉每天靠行驶在道路上的汽车搜集的道路数据不胜其数,而拥有海量的数据是人工智能领域成功的关键。

端到端自动驾驶的工作原理

自动驾驶汽车的开发竞赛不是短跑,而是一场永无止境的铁人三项赛,其中有三个不同但至关重要的部分组成:AI 训练、AI自动模拟和自动驾驶。每个部分都需要自己的加速计算平台,而专为这些步骤构建的全栈系统共同构成了一个强大的人工智能系统。

Hydra-MDP 提供了一个通用框架,展示了如何通过基于规则的规划器增强基于机器学习的规划。这种集成系统确保模型不仅模仿人类的驾驶行为,还遵守交通规则和安全标准,解决了传统模仿学习的局限性。Hydra-MDP 的数据驱动缩放定律证明了其稳健性和适应性。通过使用具有大量数据和 GPU 预训练基础模型,Hydra-MDP 展示了其可扩展性和持续改进的潜力。

为了实现这一点,首先在NVIDIA DGX等 AI 超级计算机上训练模型。然后使用NVIDIA Omniverse平台在NVIDIA OVX系统上运行,在模拟中对其进行测试和验证,最后进入正式的车辆系统中,NVIDIA DRIVE AGX平台通过模型实时处理传感器数据。

构建一个能够在复杂的物理世界中安全导航的自主系统极具挑战性。该系统需要全面感知和理解其周围环境,然后在几分之一秒内做出正确、安全的决策。这需要像人类一样的态势感知能力来处理潜在的危险或罕见情况。

AV 软件开发传统上基于模块化方法,具有用于对象检测和跟踪、轨迹预测以及路径规划和控制的独立组件。端到端自动驾驶系统使用统一模型接收传感器输入并生成车辆轨迹,从而简化这一过程,有助于避免过于复杂的系统,并提供更全面、数据驱动的方法来处理现实场景。

拥抱多模式和多目标规划的复杂性

一个基础教训是必须采用多模式和多目标规划。传统的端到端自动驾驶系统通常专注于单模态和单目标,限制了其在现实世界中的有效性。Hydra-MDP 集成了针对安全性、效率和舒适度等多项指标量身定制的多种轨迹。这确保了模型能够适应复杂的驾驶环境,而不仅仅是模仿人类驾驶员。

Hydra-MDP 架构

Hydra-MDP 的开发教会了NVIDIA几个重要的经验教训,这些经验教训塑造了Hydra-MDP 架构。Hydra-MDP 结合了人类和基于规则的知识提炼,创建了一个强大而多功能的自动驾驶模型。拥抱多模式和多目标规划的复杂性是自动驾驶的主要任务,不能仅仅局限于单目标,单模式的方式,而是学习人类的驾驶方式,处理多维度的数据,接受多目标规划的复杂性。

动图封面

多目标 Hydra-distillation 是一个师生多模式框架,是Hydra-MDP方法中的关键策略。通过聘用多位专业教师(包括人类和基于规则的教师),该模型学会预测符合各种基于模拟的自动驾驶轨迹。这种技术增强了模型在不同驾驶条件下的泛化能力。结合基于规则的规划器提供了一个结构化的框架,而人类教师则引入了适应性和细致的决策能力,这对于应对不可预测的情况至关重要。

传统方法通常会将感知和规划拆分为不同的、不可微分的步骤,从而丢失宝贵的信息。Hydra-MDP 的端到端架构将感知和规划无缝集成,并在整个决策过程中保持环境数据的丰富性。这种集成可实现更明智、更准确的预测。

Hydra-MDP 的感知网络以 Transfuser 基线为基础,结合了 LiDAR 和摄像头输入的功能。这种多模态融合有助于模型更好地理解和应对复杂的驾驶环境。

对整个训练数据集进行模拟可生成各种指标的真实模拟分数。然后,这些数据用于监督训练过程,使模型能够从各种模拟驾驶场景中学习。这一步强调了广泛的模拟对于弥合理论性能和实际适用性之间的差距的重要性。

Hydra-MDP采用了混合编码器和子分数集成等技术来整合模型优势。这提高了 Hydra-MDP 的稳健性,并确保最终模型能够高精度地处理各种驾驶场景。集成技术平衡了计算效率和性能,这对于实时应用至关重要。

Hydra-MDP 的开发是一个创新、实验和持续学习的过程。通过采用多模式和多目标规划、利用多目标蒸馏以及通过大量模拟数据进行改进,Hydra-MDP创建了一个性能远超现有最先进方法的模型。这些经验为 Hydra-MDP 的成功做出了贡献,并为未来自动驾驶的发展提供了宝贵的意见。

https://arxiv.org/html/2406.06978v1
https://developer.nvidia.com/
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:启示AI科技

 动画详解transformer  在线教程

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2160556.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【MWORKS专业工具箱系列教程】控制系列工具箱第三期:控制系统连接与化简

本工具箱教程以控制系统模型创建、分析与设计流程为主线,通过大量示例介绍MWORKS控制系统工具箱的功能和具体使用。共计10篇文章,上一篇主要介绍了控制系统模型转换。 同元软控:【MWORKS专业工具箱系列教程】控制系列工具箱第二期&#xff1…

脚本注入网页:XSS

跨站脚本攻击(Cross-Site Scripting,简称 XSS)是一种常见的网络安全漏洞。它是指攻击者在网页中注入恶意脚本代码,当用户访问该网页时,恶意脚本会在用户的浏览器中执行,从而导致一系列安全问题。这些问题可…

深入浅出热门AI大模型,新手到专家的必备指南《实战AI大模型》

今天,人工智能技术的快速发展和广泛应用已经引起了大众的关注和兴趣,它不仅成为技术发展的核心驱动力,更是推动着社会生活的全方位变革。特别是作为AI重要分支的深度学习,通过不断刷新的表现力已引领并定义了一场科技革命。大型深…

CTF夺旗赛经验总结及落地实践,零基础入门到精通,收藏这一篇就够了

文章来源:绿盟科技博客。 中国是科技人才资源最多的国家之一,但也是人才流失比较严重的国家。世界各国已经把加强人才建设作为抢占网络空间制高点的战略举措。在此背景下,国内外各类CTF比赛越来越多,那么怎样一方面才能准备好比赛…

MySQL之基本查询(一)(insert || select)

目录 一、表的增删查改 二、表的增加insert 三、表的读取select where 条件子句 结果排序 筛选分页结果 一、表的增删查改 我们平时在使用数据库的时候,最重要的就是需要对数据库进行各种操作。而我们对数据库的操作一般来说也就是四个操作,CRUD :…

鸿萌数据恢复:NAND 内存协议,SDR 与 DDR 之间的区别

天津鸿萌科贸发展有限公司从事数据安全服务二十余年,致力于为各领域客户提供专业的数据恢复、数据备份解决方案与服务,并针对企业面临的数据安全风险,提供专业的相关数据安全培训。 从事 NAND 数据恢复的人都知道,读取 NAND 需要使…

企业有了ELT就不需要ETL了?别被忽悠了

最近几年,ELT(Extract, Load, Transform)这个词在数据圈里挺火。有些人甚至说,有了ELT,ETL(Extract, Transform, Load)就该退出历史舞台了。作为一个干了十多年ETL的老兵,我觉得有必要说道说道。 先说说这两个概念。ETL是先把数据抽取出来,经过处理转换后再加载到目标系统。EL…

人工智能代表——无人驾驶:萝卜快跑

人工智能如何改变我们的出行:以“萝卜快跑”无人驾驶为例 随着科技的飞速发展,人工智能(AI)正以前所未有的方式渗透并改变着我们的日常生活,其中出行方式的变革尤为显著。在众多AI驱动的出行创新中,“萝卜…

OpenMV学习第一步安装IDE_2024.09.20

用360浏览器访问星瞳科技官网,一直提示访问不了。后面换了IE浏览器就可以访问。第一个坑。

2. 程序结构

在本章中,我们将开始做一些真正称得上编程的事情。我们将扩展对 JavaScript 语言的掌握,不再局限于目前所见的名词和句子片段,而是能够表达有意义的散文。 表达式和语句 在第 1 章中,我们创建了值,并应用运算符来获取…

【Python报错已解决】NameError: name ‘F‘ is not defined

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 专栏介绍 在软件开发和日常使用中,BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…

《百家姓》中排名第八却是中国人口第一大姓-王姓

王姓在《百家姓》中虽然排名第八,但根据近年来的统计数据和实际人口分布,王姓已成为中国第一大姓。以下是对王姓作为“百家姓之首”的详细解析: 一、人口数量与分布 人口数量:截至当前时间(2024年)&#x…

打破网络安全域限制:跨区域文件传输的创新解决方案

随着经济的快速发展,很多企业在异地都会建立分支机构,比如跨国企业在国外建设分公司,金融机构全国各地都有多级分支机构和网点,集团型企业会设立多家子公司等等。 跨网络安全域文件交换,是大型企业会存在的跨区域文件传…

项目记录点

MES项目点 一、项目局域网访问地址创建 host: 0.0.0.0,二、select下拉表单内容 1、默认值设置为undefined&#xff0c;placeholder才生效 <a-col :sm"24" :md"12" :xl"6"><a-form-itemname"opeCodeList":rules"[{requ…

Pinia从安装到使用

什么是Pinia 添加Pinia到vue项目 使用Pinia实现计数器案例 counter.js import {defineStore} from "pinia"; import {ref} from "vue";export const useCounterStore defineStore(coutner,()>{//定义数据&#xff08;state&#xff09;const count r…

低光照图像增强算法-图像增强(代码+教程)

这是一个使用深度学习技术进行低光照图像增强的项目。是一种旨在提高低光照条件下拍摄的图片质量的方法。该方法利用了注意力机制来指导增强过程&#xff0c;从而改善图像的整体视觉效果。 项目概述 输入: AGLLNet 接受单个RGB彩色图像作为输入&#xff0c;其尺寸为768x1152…

Miniconda 安装教程

1. Miniconda 简介 Miniconda是一个小巧而强大的Python环境管理工具,由Continuum Analytics(现已被Anaconda公司收购)创建。它为用户提供了快速、简便的Python环境创建、隔离、切换和包管理功能。核心组件有Conda包管理器和Python环境,具有轻量级、灵活性、跨平台等特点,…

【命令操作】Windonws端口被占用,查找占用端口的进程id,以及使用id杀死进程

Windonws端口被占用&#xff0c;查找占用端口的进程id,以及使用id杀死进程 Windonws端口被占用 查询端口 netstat -ano查询指定端口-获得占用端口的进程ID netstat -ano | findstr "端囗号"如查询8888端口 netstat -ano | findstr "8888"命令截图 命令…

DeiT(ICML2021):Data-efficient image Transformer,基于新型蒸馏且数据高效的ViT!

Training data-efficient image transformers & distillation through attention&#xff1a;通过注意力训练数据高效的图像转换器和蒸馏 论文地址&#xff1a; https://arxiv.org/abs/2012.12877 代码地址&#xff1a; https://github.com/facebookresearch/deit 这篇论文…

MongoDB的备份和恢复命令

一、下载 MongoDB Database Tools 官方网址&#xff1a;Download MongoDB Command Line Database Tools | MongoDB 将解压后的文件夹移动到MongoDB的bin目录下&#xff0c;同时配置mongodb-database-tools的bin目录进入环境变量。 以上有问题请参考文章&#xff1a;使用cmd命…