ChatGPT可以开车吗?分享大型语言模型在自动驾驶方面的应用案例

news2024/11/16 21:38:29
自动驾驶边缘案例需要复杂的、类似人类的推理,远远超出传统的算法和人工智能模型。而大型语言模型正在致力实现这一目标。

人工智能技术如今正在快速发展和应用,人工智能模型也是如此。拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型,在从单一模型解决许多任务方面表现出了卓越的性能。

人工智能模型也正在变得多模态。微软公司的Florence 2和OpenAI公司的GPT-4V等新的视觉模型正在扩展这些模型的应用,以整合图像、视频和声音,将大型语言模型(LLM)强大的能力应用在数百万个新的用例中。

事实证明,在模型工程领域,规模越大越好,每个应用程序都经历了类似的发展:

  • 一个任务,一个领域:针对特定用例的简单模型——用于检测道路的对象检测器,用于室内场景的深度分割模型、图像字幕模型、用于Web应用程序的聊天机器人等。
  • 一个任务,每个领域:将一个简单模型的应用扩展到许多用例中——无处不在的对象检测器(YOLO、DINO等)、各种事物的深度分割(MobileNet)、多种产品的聊天插件。
  • 每个任务,每个领域:可以应用在任何事情的大型模型,新的大型语言模型(LLM)使范式转变成为可能。例如Florence、GPT-4V、ChatGPT。
  • 每个任务,一个领域:为某一个领域优化大型模型,支持实时应用程序和更高的可靠性——例如,用于交互式搜索的GPT-3.5-Turbo,用于研究和起草法律文档的Harvey.ai,用于自动驾驶的DriveGPT。

运行在小型模型上的自动驾驶技术

自动驾驶技术仍然在小型模型上运行。虽然许多单一任务模型、专用传感器和精确的地图组合已经提供了令人印象深刻的原型,但目前的技术还没有提供支持司机日常所需的安全性或规模。

以下是阻碍自动驾驶技术发展的因素:

  • 零样本泛化。现有的模型经常在从未见过的情况下失败,通常被称为自动驾驶的“长尾”。如果没有得到充分的训练,这些模型就没有能力根据基本原则来推断下一步该做什么。迄今为止的解决方案是建立另一个专用模型。难以绘制动态场景是大多数自动驾驶系统的一个关键弱点。
  • 理解司机和行人的意图。现有的模型无法理解人类互动和意图的微妙之处,无论是车内的司机还是车外的行人或车辆。
  • 准确绘制区域地图。虽然自动驾驶车辆在地图绘制良好的区域大多可以行驶,但事实证明,精确的高清地图很难进行缩放。如果没有精确的地图,基于地图的自动驾驶车辆就不能很好地行驶。
  • 扩展到其他类型车辆。如今的自动驾驶出租车依赖于专门的传感器,昂贵的计算以及许多专用模型的组合——这是一个复杂而昂贵的技术,尚未扩展应用到其他类型的汽车。

大型语言模型和长尾问题

在所有应用程序中,模型工程师使用大型语言模型作为超级强大的开发工具来改进模型工程过程的每个方面。大型语言模型已经被证明在开发和改进模拟环境,对大量数据集进行分类、理解和标记,以及解释和调试神经网络的“黑匣子”方面非常有用。

也许大型语言模型在开发过程中的最大优势之一是能够用自然语言表达复杂的、多步骤的逻辑,通过绕过对专家代码的需求来加快开发速度。这已经被证明在复杂的问题领域非常有用,例如文本摘要或代码完成与代码库之间的复杂依赖关系。

所有这些工程工具都可以广泛地改进开发工作,包括自动驾驶,但大型语言模型最有趣和最有影响力的应用是直接针对驾驶任务本身:对复杂的场景进行推理,并规划最安全的前进路线。

自动驾驶是一个特别具有挑战性的问题,因为某些边缘情况需要复杂的、类似人类的推理,远远超出传统的算法和模型。大型语言模型在超越纯粹的相关性,展示真正的“对世界的理解”方面表现出了希望。这种新的理解水平延伸到了驾驶任务,使司机能够在不需要明确训练的情况下,以安全和自然的方式在复杂的场景中导航。

现有的模型可能会被十字路口出现的建筑工人或事故现场周围的路线所迷惑,大型语言模型已经显示出了非常熟练地推理正确路线和速度的能力。大型语言模型提供了一条解决“长尾”的新途径,即处理前所未有的情况的能力。在过去的二十年,长尾一直是自动驾驶面临的根本挑战。

大型语言模型对自主任务的限制

如今,大型语言模型对于自主应用方面仍然存在一些限制。简单地说,大型语言模型需要变得更加可靠和更快。因此需要开发解决方案,而这正是开发人员努力工作的地方。

1.延迟和实时限制

司机的关键决策必须在不到一秒钟的时间内做出,而在数据中心运行的最新大型语言模型可能需要10秒或更长时间。

解决这个问题的一个方案是采用混合云架构,它用数据中心处理为车载计算系统提供补充。另一个方案是专门构建的大型语言模型,它可以将大型模型压缩成足够小、足够快,以适应汽车的应用。人们已经看到在优化大型模型方面有了显著的改进。Mistral 7B和Llama 2 7B已证明其性能可与GPT-3.5相媲美,参数数量级更少(70亿个参数对1750亿个参数)。摩尔定律和持续的优化应该会迅速将更多的这些模型转移到边缘。

2.幻觉

大型语言模型基于相关性进行推理,但并非所有相关性在特定场景中都有效。例如,自动驾驶车辆观察到一个人站在十字路口可能意味着停止(行人)、驶离(交警)或减速(施工工人)。正相关性并不总是给出正确的答案。当模型产生不能反映现实的输出时,将其结果称为“幻觉”。

基于人类反馈的强化学习(RLHF)通过将模型与人类反馈相结合来理解这些复杂的驾驶场景,为这些问题提供了一个潜在的解决方案。随着数据质量的提高,像Llama 2 70B这样的小型模型的性能与GPT-4不相上下,参数却减少了20倍(700亿个参数对1.7万亿个参数)。

研究项目也使更好的数据质量更容易扩展。例如,OpenChat框架利用了强化学习微调(RLFT)等新技术,在提高性能的同时避免了成本高昂的人类偏好标签。

3.新的长尾

大型语言模型已经编码了“一切”,但仍然可能没有涵盖所有特定于驾驶的概念,例如在繁忙的十字路口进行导航的能力。这里的一个潜在解决方案是采用长序列的专有驾驶数据训练模型,这些数据可以将这些更详细的概念嵌入模型中。例如,Replit使用来自其用户群的专有编码数据,通过微调不断改进其代码生成工具,性能优于Code Llama 7B等大型模型。

自动驾驶的未来发展

如今,自动驾驶尚未成为主流技术,目前只有少数自动驾驶车辆能够在最复杂的城市环境安全行驶。大型模型正在改变自动驾驶模型的开发方式,最终将改变自动驾驶技术——提供必要的安全性和规模,最终将这项技术交付给司机。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1693104.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Pytorch-01 框架简介

智能框架概述 人工智能框架是一种软件工具,用于帮助开发人员构建和训练人工智能模型。这些框架提供了各种功能,如定义神经网络结构、优化算法、自动求导等,使得开发人员可以更轻松地实现各种人工智能任务。通过使用人工智能框架,…

【云原生】用 Helm 来简化 K8s 应用管理

用 Helm 来简化 K8s 应用管理 1.诞生背景2.主要功能3.相关概念4.工作原理5.架构演变6.Helm 常用命令7.推荐仓库8.Charts8.1 目录结构8.2 构建一个无状态应用模版 charts Helm 对于 Kubernetes 来说就相当于 Yum 对于 Centos 来说,如果没有 Yum 的话,我们…

SpringBoot实现邮箱验证码

自行创建一个SpringBoot项目 导入SpringBoot所需要的邮箱验证码的包 <!--邮件发送--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-mail</artifactId><version>2.6.1</version>…

LLM大模型的7种推理框架分析

LLM的7种推理框架 Hugging Face的transformers 这是一个Python库&#xff0c;可以简化本地运行LLM的过程。 Transformers的优点&#xff1a; 自动模型下载提供代码片段非常适合实验和学习 Transformers的缺点&#xff1a; 需要对ML和NLP有深入了解需要编码和配置技能 2.L…

文科论文,使用AI写作时能够提供实证数据吗?

人工智能时代&#xff0c;为了撰写论文提供思路及高效&#xff0c;利用AI撰写论文已是常态&#xff0c;可撰写文科论文通常研究中都需要实证数据&#xff0c;而AI撰写论文时能够提供这样的数据吗&#xff1f; 一、什么是实证数据 实证数据是指从研究报告、财务报表、新闻报道…

C++ wasm 使用教程

环境搭建 git clone https://github.com/emscripten-core/emsdk.gitgit pull./emsdk install latest./emsdk activate latestsource ./emsdk_env.sh./emcc -v && ./emcc c11__Thread_local.c -s WASM_WORKERS --threadprofiler --memoryprofiler -v -o test.html &…

pr视频旋转90°

1.找到视频特效“运动” 2.旋转270 3.找到“序列”---“序列设置”&#xff0c;更改画面大小 成品展示&#xff1a;

【可能是东半球最好的stm32入门教学】第1章 环境配置

在嵌入式开发中&#xff0c;外设的初始化往往不是重点。以往的标准库教程虽有助于理解和熟悉芯片的寄存器功能&#xff0c;但是对于很多初学者&#xff0c;在入门阶段就学习这些较难的知识反而减少了他们的学习兴趣。那么有没有一个软件可以用图形化的界面完成芯片的初始化&…

C++高效死锁检测——实现原理与应用(基于强连通分量)

背景 在项目使用多进程、多线程过程中&#xff0c;因争夺资源而造成一种资源竞态&#xff0c;所以需加锁处理。如下图所示&#xff0c;线程 A 想获取线程 B 的锁&#xff0c;线程 B 想获取线程 C 的锁&#xff0c;线程 C 想获取线程 D 的锁&#xff0c; 线程 D 想获取线程 A 的…

Redis优化笔记

Redis优化 一&#xff1a;Key&#xff1a; 1.1.Key的规范&#xff1a; 测试如下&#xff1a; 1.2.拒绝BigKey&#xff1a; 我们可以用&#xff1a; MEMORY USAGE name命令来看它的大小。 注意&#xff0c;这里的第二种之所以不使用Keys *&#xff0c;因为在实际生产时&#…

Python | Leetcode Python题解之第101题对称二叉树

题目&#xff1a; 题解&#xff1a; class Solution:# 在【100. 相同的树】的基础上稍加改动def isSameTree(self, p: Optional[TreeNode], q: Optional[TreeNode]) -> bool:if p is None or q is None:return p is qreturn p.val q.val and self.isSameTree(p.left, q.ri…

深度学习中的优化算法二(Pytorch 19)

一 梯度下降 尽管梯度下降&#xff08;gradient descent&#xff09;很少直接用于深度学习&#xff0c;但了解它是理解下一节 随机梯度下降算法 的关键。例如&#xff0c;由于学习率过大&#xff0c;优化问题可能会发散&#xff0c;这种现象早已在梯度下降中出现。同样地&…

Spark-RDD-常用算子(方法)详解

Spark概述 Spark-RDD概述 Spark RDD 提供了丰富的方法来对数据进行转换和操作。 对 RDD&#xff08;Resilient Distributed Dataset&#xff09;的操作可以分为两大类&#xff1a;转换算子&#xff08;Transformations&#xff09;和行动算子&#xff08;Actions&#xff09;…

Tower在深度学习中的概念,tower没有确切定义

在论文UniTS中&#xff0c;来自Havard的工作。 tower更像是针对一个task的组件 tower这个概念貌似在REC&#xff08;recommendation&#xff09;推荐系统中使用较多 deep learning - What is a tower? - Data Science Stack Exchange https://developers.google.com/machin…

C语言数据结构栈的概念及结构、栈的实现、栈的初始化、销毁栈、入栈、出栈、检查是否为空、获取栈顶元素、获取有效元素个数等的介绍

文章目录 前言栈的概念及结构栈的实现一、 栈结构创建二、 初始化结构三、销毁栈四、入栈五、出栈六、检查是否为空七、获取栈顶元素八、获取有效元素的个数九、测试 1十、测试 2总结 前言 C语言数据结构栈的概念及结构、栈的实现、栈的初始化、销毁栈、入栈、出栈、检查是否为…

查找专利渠道

官方渠道 常规检索 (cnipa.gov.cn)https://pss-system.cponline.cnipa.gov.cn/conventionalSearch 佰腾网 佰腾网 - 查专利就上佰腾网_佰腾全球专利搜索平台_商标查询平台_企业工商信息查询平台 (baiten.cn)https://www.baiten.cn/

从0开始实现一个博客系统 (SSM 实现)

相关技术 Spring Spring Boot Spring MVC MyBatis Html Css JS pom 文件我就不放出来了, 之前用的 jdk8 做的, MySQL 用的 5.7, 都有点老了, 你们自己看着配版本就好 实现功能 用户注册 - 密码加盐加密 (md5 加密)前后端用户信息存储 - 令牌技术用户登录 - (使用 拦截…

c++(三)

C&#xff08;三&#xff09; staticc语言的staticc中的staticstatic修饰的成员变量static 修饰成员函数 constc语言cconst修饰成员变量const修饰的成员函数const修饰的类对象 mutable友元普通函数作为友元类的成员函数作为友元友元类 static c语言的static C语言中static的作…

【test】Windows11下通过sshfs挂载远程服务器目录

下载安装下面三个软件&#xff1a; sshfs-win&#xff1a;https://github.com/billziss-gh/sshfs-win/releases winfsp&#xff1a;https://github.com/billziss-gh/winfsp/releases SSHFS-Win Manager&#xff1a;https://github.com/evsar3/sshfs-win-manager/releases 安装…

增强ev代码签名证书2300

代码签名证书是软件开发者们确保软件完整性和安全性的重要工具之一。在各种类型的代码签名证书中&#xff0c;增强EV代码签名证书拥有许多独特的功能而受到企业开发者的欢迎&#xff0c;今天就随SSL盾小编了解增强EV代码签名证书的申请条件以及申请流程。 1.增强型EV代码签名证…