【大模型】人工智能大模型在自动驾驶领域的应用

news2024/11/23 23:51:58

在这里插入图片描述

随着ChatGPT的火爆,大模型受到的关注度越来越高,大模型展现出的能力令人惊叹。

  • 第一个问题:怎样的模型可以称之为大模型呢?

    • 一般来说,我们认为参数量过亿的模型都可以称之为“大模型”。而在自动驾驶领域,大模型主要有两种含义:一种是参数量过亿的模型;另一种是由多个小模型叠加在一起组成的模型,虽然参数量不过亿,但也被称为“大模型”。
  • 第二个问题:大模型的应用有什么条件?

    • 大数据和大算力是大模型应用的重要前置条件。
    • 数据方面,根据毫末智行 CEO 顾潍颢在毫末 AI DAY 上表示,训练出一个能输出高精度和准确度的自动驾驶大模型,自动驾驶测试里程数据需至少达到 1 亿公里;
    • 算力方面:超算中心成为自动驾驶厂商重要的基础设施,特斯拉Al计算中心Dojo总计使用了1.4万个英伟达的GPU 来训练AI模型,网络训练速度提升30%。国内厂商中小鹏与阿里联合出资打造自动驾驶AI智算中心“扶摇”,将自动驾驶算法的模型训练时间提速170倍。

在这里插入图片描述

1. 大模型在云端的应用

1.1 数据自动标注

  • 采用大模型预训练的方式可以实现自动标注,自动标注工具可大幅提升数据处理速度。模型的标注精度相对越高,对人的替代程度相应也越高。

  • 一般来说,大家对标注任务的期望主要包括标注过程的效率高、标注结果的精确程度高以及一致性高。效率高和精确度高都很容易理解,一致性高是指什么呢?在3D识别的BEV算法中,工程师要采用激光雷达加视觉的联合标注,需要联合处理点云和图像数据。在这种处理环节里面,工程师可能还会需要在时序层面上做一些标注,那么前后帧的结果就不能区别太大。

  • 小鹏推出的全自动标注系统将效率提升近 45,000 倍,以前 2,000 人年的标注量,现在 16.7 天可以完成。毫末智行在 AI Day 中表示毫末基于视觉自监督大模型,实现 4D Clip 的 100%自动标注,原先依靠的人工标注成本则降低 98%。
    在这里插入图片描述

  • 2018 年至今,特斯拉数据标注经历了 4 个发展阶段:1)第 1 阶段(2018 年之前):只有纯人工的 2 维的图像标注,效率较低;2)第 2 阶段(2019):人工进行3D 固定框的图像标注;3)第 3 阶段(2020):采用 BEV 空间进行标注;4)第 4 阶段(2021):首先对场景进行重建后在 4D 空间中进行标注,精度、效率都得到大幅提升。特斯拉自动标注系统可以取代 500 万小时的人工作业量,人工仅需要检查补漏。
    在这里插入图片描述

1.2 数据挖掘

  • 大模型有较强的泛化性,适合用于对长尾数据的挖掘。城市场景下道路及路况复杂(红绿灯路口)、交通参与者多(行人、低速两轮车)、场景异质性强(不同城市甚至不同路段路况差异性大),自动驾驶遇到的 Corner case 大幅提升。
    在这里插入图片描述

  • 假如采用传统的基于标签的方式来挖掘长尾场景,模型一般只能分辨已知的图像类别。2021年,OpenAI发布了CLIP模型(一种文字——图像多模态模型,可以在无监督预训练之后将文本和图像对应,从而基于文本对图片进行分类,而非只能依赖于图片的标签),我们也可以采用这样的文字-图像多模态模型,用文字描述来检索行驶过程中的图像数据。例如,‘拖着货物的工程车辆’、‘两个灯泡同时亮着的红绿灯’等长尾场景。
    在这里插入图片描述

1.3 用知识蒸馏的方式“教”小模型

  • 大模型还可以采用知识蒸馏的方式“教”小模型。

  • 何为知识蒸馏呢?用最通俗的话来解释,就是大模型先从数据中学到一些知识,或者说提取到一些信息,然后再用学到的知识“教”小模型。在实践中,可以先把需要打标签的图片给大模型学习,大模型可以给这些图片打好标签,如此一来,我们就有了标注好的图片,将这些图片拿来训练小模型,就是一种最简单的知识蒸馏方式。当然了,我们也可以采用更复杂的方式,如先用大模型从海量数据中提取特征,这些提取出来的特征可以用来训练小模型。

1.5 自动驾驶场景的重建和数据生成

  • 除了真实场景数据外,仿真场景是弥补训练大模型数据不足问题的重要解决方式。仿真场景通常由虚拟引擎构建,通过把构建的场景导出为虚拟标注数据集,并且在数据集中加入传感器噪声及增加雨雪等恶劣天气干扰因素后,可以用于感知训练数据增强,极大的丰富了训练数。
    在这里插入图片描述
    在这里插入图片描述

  • 图森中国借助近两年来迅猛发展的神经渲染(Neural Rendering)技术,试图全部从真实的路测数据中重建世界与车辆,并按需修改我们关心的其他车辆的行为。这样能够最大限度保障模型在实际部署与仿真测试之间的一致性。我们可以通过改变视角、改变光照、改变纹理材质的方法来生成各种高真实感数据,例如通过视角变化可以模拟变道、绕行、调头等各种主车行为,甚至模拟一些即将碰撞的高危险性场景数据。

  • 链接: 基于神经渲染的下一代真实感仿真

  • 生成式 AI 有望推动仿真场景大幅提升泛化能力,帮助主机厂提升仿真场景数据的应用比例,从而提高自动驾驶模型的迭代速度、缩短开发周期。当前仿真场景对实际路测中所遇到的边缘案例主要通过人工进行泛化,如量产车在影子模式下遇到某一个 corner case 并进行数据回传后,在虚拟引擎中进行场景重建,再通过人为添加要素,如增添雨雾环境、增加交通参与人数等方式对原始场景进行梯度泛化。但对场景的泛化能力依赖于工程师对于场景的理解,且存在经由手动添加元素后的场景与真实场景的拟合度不高的问题。生成式 AI有望在针对真实场景中的 corner case 进行场景泛化的过程中取代人工,可以迅速泛化出大量的、与真实世界高拟合度的虚拟场景,进而提高自动驾驶模型的迭代速度。
    在这里插入图片描述

  • 下一篇我们来讲 大模型在车端的应用

请关注博主,一起玩转人工智能及深度学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/596970.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Hibernate框架【四】——基本映射——多对一和一对多映射

系列文章目录 Hibernate框架【三】——基本映射——一对一映射 基本映射——多对一和一对多映射 系列文章目录前言一、多对一映射是什么?1.案例:现在有两个实体User实体和Group,其中多个User属于一个Group,表现出多对一的关系。①…

图解LeetCode——98. 验证二叉搜索树

一、题目 给你一个二叉树的根节点 root ,判断其是否是一个有效的二叉搜索树。 有效 二叉搜索树定义如下: 节点的左子树只包含 小于 当前节点的数。节点的右子树只包含 大于 当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。 二、示例 2.1>…

扫描出项目中未被引用的控制器接口的工具类(超级好用)

自己的项目随着不断开发迭代,越来越庞大,后台的接口也就越来越多,难免会有一些接口后来并没有使用到,但是还在代码中,权限管理的时候这部分接口是非常多余的,为了避免这个问题,本章提供了一个工…

回归测试最小化(贪心算法,帕累托支配)

回归测试最小化(贪心算法,帕累托支配) 介绍 有时我们不能只是重新运行我们的测试(例如,当我们 换界面)。 回归测试可能很昂贵: (1)一些公司通宵运行回归测试套件。 (2) 对于嵌入式系统,我们可能必须测试正在使用的软件&#xff0…

党校学员毕业自我鉴定总结样文分享

党校学员毕业自我鉴定总结样文分享1 岁月匆匆似流水,美好的研究生三年时光马上就快结束了。经过良师的悉心指导以及自己的努力奋力拚搏、自强不息,我渐渐的成为了一个能适应现代社会要求的硕士毕业生,并为做一个知识型的社会主义建设者打下坚…

Web应用技术(第十四周/END)

本次练习基于how2j和课本,初步认识Spring。 以后我每周只写一篇Web的博客,所有的作业内容会在这篇博客中持续更新。。。 一、Spring基础1.Spring概述:2.Sring组成:3.BeanFactory:4.控制反转:5.依赖注入:6.JavaBean与S…

oracle数据库sequence的作用

sequence概念及作用 sequence是用来在多用户环境下产生唯一整数的数据库对象。序列产生器顺序生成数字,它可用于自动生成主键值,并能协调多行或者多表的主键操 作。没有sequence,顺序的值只能靠编写程序来生成。先找出最近产生的值然后自增长…

零基础初学前端—新建项目

对于一个没有基础的新手来说,如何使用 vscode 新建一个前端项目,写一些html页面,并能进行运行。 需要吐下几个步骤: 新建一个文件夹在文件夹里新建一个文件,命名为 xxx.html ,例如 index.html打开 vscode …

前端:使用rollup的简单记录

目录 rollup安装 简单使用 1、命令行打包 2、配置文件打包 问题 1、报错提示:(node:23744) Warning: To load an ES module, set "type": "module" in the package.json or use the .mjs extension.(Use node --trace-warnings ... to sho…

模拟电子 | 稳压管及其应用

模拟电子 | 稳压管及其应用 稳压二极管工作在反向击穿状态时,其两端的电压是基本不变的。利用这一性质,在电路里常用于构成稳压电路。 稳压二极管构成的稳压电路,虽然稳定度不很高,输出电流也较小,但却具有简单、经济实…

IDEA(版本2020)启动错误

错误信息:在运行Java应用程序时,发现没有找到Java虚拟机(JVM),并且需要手动设置JAVA_HOME环境变量。 idea启动时的提示如下: 解决方案如下: 确认已经安装了64位JDK,并且JDK的bin目录已经被添加到了系统的环…

YOLO算法入门知识概念

1.two-stage && one-stage two-stage(两阶段):Faster-rcnn,Mask-Rcnn系列(5EPS)---多了预选环节 one-stage(单阶段):YOLO系列(速度快)---实时检测时常用2.Map指标:综合衡量控制效果 包…

Android基站定位源代码

经过几天的调研以及测试,终于解决了联通2G、移动2G、电信3G的基站定位代码。团队里面只有这些机器的制式了。下面就由我来做一个详细的讲解吧。1 相关技术内容 Google Android Api里面的TelephonyManager的管理。 联通、移动、电信不同制式在获取基站位置的代码区别…

开源赋能 普惠未来|TKEStack 诚邀您参与 2023 开放原子全球开源峰会

TKEStack 是腾讯开源的一款集强壮性和易用性于一身的企业级容器编排引擎,以极简的向导式界面为用户提供了容器应用全生命周期管理能力,帮助用户在私有云环境中快速构建 PAAS 容器云平台,并敏捷、高效地管理和发布应用程序。作为完全开放的项目…

华秋硬创 | 全国科技工作者日,致敬每一位科技创新者!

2023年5月30日是第七个“全国科技工作者日”,“全国科技工作者日”的设立旨在弘扬科学家精神,团结引导广大科技工作者厚植家国情怀、勇于创新争先。 今年,全国科技工作者日主题是“点亮精神火炬”。每一次科学探索,都始于一束心中…

ipad手写笔哪个牌子好用?便宜的ipad触控笔

在这无纸化的时代,越来越多人向往简便、快速,人们会更想有自己的能够快速完成,电容笔是出现,深受大众喜欢,随着电容笔技术的不断进步,电容笔越来越普遍,价格也越来越低,使用效果也越…

建造者模式的学习与使用以及和抽象工厂模式的区别

1、建造者模式的学习 当创建一个复杂对象时,使用建造者模式可以将对象的构建过程和表示分离开来。它允许使用相同的构建过程来创建不同的表示形式。   建造者模式的主要思想是将一个复杂对象的构建过程分解为一系列简单的步骤,并且使用一个指导者&…

14届蓝桥杯青少组省赛(中级组)C++_2023.5.14

选择题: 1、设只含根结点的二叉树高度为1,共有62个结点的完全二叉树的高度为?(C) A.4 B.5 C.6 D.7 2、C++中,bool类型的变量占用字节字数为?(A) A.1 B.2 C.3 D.4 3、该程序的输出为?(A) A.127 B.97 C.63 D.126 4、以下关于数组的说法中…

力扣-根据前序和后序遍历构造二叉树(java)

根据前序和后序遍历构造二叉树 leetcode 889 题(中等)解题思路代码演示二叉树专题 leetcode 889 题(中等) 原题链接: https://leetcode.cn/problems/construct-binary-tree-from-preorder-and-postorder-traversal/ 题…

echart实现地图展示

最近做的页面中需要展示省级地图精确到市级且悬浮到地区上时会显示一些信息 然后参考了网址: “绿色金融” - 江西省 - category-work,geo地理坐标,legend,series-map地图,series-scatter散点图,title标题,tooltip提示框,visualMap视觉映射 - makeapie echarts社区…