起猛了!自动驾驶可以聊天了

news2024/11/26 2:27:01
公众号:算法一只狗

一直以来,深度学习模型对于研究者来说是一种“黑盒”模型,我们一般很难分析模型的到底学习到了什么东西,只知道它能够应用于特定的领域。

对比于自动驾驶领域来看,一个黑盒状态的模型,是很难让人放心去使用的,这是因为如果汽车出现事故后往往难以解释,且排查难度较大。因此,在自动驾驶中获得一个能够让人解释清楚的模型尤为重要。

这不,创业公司Wayve使用了LLM模型,构造出了LINGO-1模型,这是一种能够解释汽车动作的工具。它结合了视觉、语言和动作,在汽车形势过程中给出接下来的驾驶决策行为。

我们知道,目前的大模型大多利用了互联网上的数据进行训练,从而做到近似于人类的回答。这些模型已经改变了深度学习和生成式人工智能,它们现在被用来自动化许多任务,比如作为图像分类、文本到图像检索和视觉问答等任务。目前多模态的模型也是重点领域,因此Wayve把LLM模型加入到自动驾驶领域中,探索出视觉-语言-动作模型 (VLAM)。

目前,还没有研究在在自动驾驶中引入自然语言。作为一种新模态,自然语言可以帮助自动驾驶解释汽车行驶中场景的因果关系,并加快训练和实现对环境的泛化。

除了能够让LLM对驾驶模型进行解释外,它还能够在驾驶过程中与乘客进行互动,用户可以询问自动驾驶车辆正在执行的任务以及原因。

这种模型的优点在于:当突破人工智能的极限时,视觉-语言-动作模型可能会产生巨大的影响,因为语言提供了一种新的模式来增强我们解释和训练基础驾驶模型的方式。

LINGO-1针对驾驶时的解析

在构建模型中,主要收集英国各地驾驶时评论收集的图像、语言和动作数据。这种解析的评论效果,有点像一我们在驾校学习开车时,教练指导我们开车的场景,用来帮助学员如何开车。

比如会针对不同的驾驶场景,描述其开车时的状态:

  • 因前车减速或红绿灯变化
  • 改变车道以遵循路线
  • 加速到极限速度
  • 注意到其他车辆驶上道路或停在十字路口
  • 接近危险,例如环岛和让路标志
  • 停放的汽车、交通信号灯或学校
  • 其他道路使用者正在采取的行动,例如改变车道或超越停放的车辆
  • 在斑马线等待或在自行车道上从汽车后面过来的骑自行车者和行人

当这些自然语言和图像、驾驶动作在时间上同步的时候,就可以获得丰富的视觉-语言-动作数据集来训练用于不同任务的模型。

从模型架构上看,LINGO-1在各种视觉和语言数据集上训练了开源模型。它可以通过简单的提示更改来执行许多任务。这使得提问者能够向 LINGO-1 提示有关场景理解和推理场景中影响驾驶决策的主要因果因素的问题。换句话说,LINGO-1可以提供驾驶动作和推理的描述。

LINGO-1 可以生成连续的评论,解释驾驶行为背后的原因。这可以帮助我们用自然语言理解模型正在关注什么以及它在做什么。

举个例子,在在下面视频中,LINGO-1 描述了它超越一辆停放的汽车时所采取的行动。

  • LINGO-1:由于交通缓慢,我正在慢慢靠近。
  • LINGO-1:我正在超越一辆停在路边的车辆。
  • LINGO-1:我现在正在加速,因为前面的路已经畅通无阻了。

当汽车接近斑马线时:

  • LINGO-1:我保持速度;道路仍然畅通。
  • LINGO-1:我现在正在减速、制动,然后停下来。
  • LINGO-1: 剩下的停在斑马线上。
  • LINGO-1:我现在正在从停止位置加速。
  • LINGO-1:由于道路畅通,我正在加速。

在十字路口左转时:

  • LINGO-1:我保持不动,因为前车也停了下来。
  • LINGO-1:我正在加速,因为前车已经驶离。
  • LINGO-1:我正在踩刹车,准备在路口停车。
  • LINGO-1:我正在前进,因为车道畅通。
  • LINGO-1:完成左转,沿着路线行驶。

然后,该模型不仅能够解释驾驶时候的行为,也能够进行问答对话。可以向 LINGO-1 提出有关各种驾驶场景的问题,以评估模型的场景理解能力并理解其推理。

比如询问它在十字路口中需要注意什么?

它会回答说:我得注意前面的信号灯、我前面骑自行车的人和正在穿过道路的行人。

问一下现在是什么天气?会对驾驶产生什么影响? 它会说:现在是雨天,我开车时需要极其小心,因为雨天路面湿滑,能见度降低。

模型表现

LINGO-1表现与人类水平相比大约为60%准确。通过一套综合基准测试追踪LINGO-1在各种感知、推理和驾驶知识任务上的问答表现。

从图表中可以看出,近几周LINGO-1的表现有所提升,准确率几乎翻倍达到了60%的平均验证准确率。

下一步计划

提升端到端模型的AI可解释性:机器学习模型缺乏解释性常是一个共同的关切,因为其决策过程通常显得像一个黑匣子。可以通过利用语言,做到解析AI系统的作用。这种独特的对话可能增加透明度,使人们更容易理解和信任这些系统。此外,整合语言可能增强模型根据人类反馈进行适应和学习的能力,就像驾驶教练指导学员一样,纠正指导和用户反馈可以随时间改进模型的理解和决策过程。

通过更好的规划和推理来改善驾驶性能:利用LINGO的自然语言、推理和规划能力来增强我们的闭环驾驶模型。驾驶性能的两个主要因素是语言模型利用各种输入模态准确解释场景的能力以及驾驶模型在将中层推理转化为有效的低层规划方面的熟练程度。

处理新场景或长尾情况的高效学习:自然语言可以解释驾驶场景中的因果因素。通过使用一些示例并附带简短的文本描述来说明在特定情境中如何行动以及需要考虑的其他因素,可以加速学习过程。

从目前来看,要真正的把这些知识和自动驾驶联系起来还是一个不小的挑战,但Wayve为我们展示了LLM在自动驾驶的可能,确实具有实现更好、更安全自动驾驶的潜力。这可以加速学习过程,提高模型的准确性,并增强其处理多样化驾驶任务的能力。

本期的内容就到这里了,我是leo,我们下期再见~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1260129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ES 8.x开始(docker-compose安装、kibana使用、java操作)

学习文档地址 一、Docker安装 这里使用docker-compose来安装,方便后续迁移,Elasticserach和kibina一起安装。 1、创建安装目录 configdataplugins 2、配置文件 配置文件有两个,一个是ES的配置文件,一个docker-compose的配置文件 …

Java自定义一个线程池

线程池图解 线程池与主线程之间通过一个阻塞队列来平衡任务分配&#xff0c;阻塞队列中既可以满足线程等待&#xff0c;又要接收主线程的任务。 线程池实现 使用一个双向链表实现任务队列 创建任务队列 //阻塞队列 public class BlockingQueue<T> {//双线链表private …

【一周AI简讯】OpenAI奥特曼王者归来,马斯克AI模型Grok下周开放测试,ChatGPT语音对话功能向所有用户免费开放

OpenAI奥特曼王者归来&#xff0c;董事会改组 终于&#xff0c;经历大约5天的极限拉扯&#xff0c;年底AI界吃瓜大戏落下帷幕&#xff0c;奥特曼确认回归。 ChatGPT语音对话功能向所有用户免费开放 ChatGPT 语音输入最初于 9 月份推出&#xff0c;标题是“ChatGPT 现在可以看…

[Spring ~必知必会] Bean 基础常识汇总

文章目录 Bean 相关到底什么是beanFactorybeanFactory能干啥ApplicationContext是什么ApplicationContext的功能比 BeanFactory多了什么 容器的实现BeanFactory的实现ApplicationContext的实现xml 配置配置类配置 Bean 的生命周期3.1 Bean 的常见的后处理器测试代码总结 3.2 工…

【中间件】配置中心中间件intro

中间件middleware 内容管理 why use 配置中心配置中心feature配置中心develop主流配置中心Apollo浅谈 本文从理论上介绍一下服务化中服务治理系统中的配置中心的理论并浅析Apllo 配置在生产中是很关键的一个部分&#xff0c;cfeng在work中遇到几次配置问题引发的问题&#xff0…

为何要隐藏IP地址?网络上哪些行为需要隐藏IP和更换IP?

网络已经成为现代人生活的重要组成部分&#xff0c;人们在网络上交流、学习、娱乐、购物等。但是&#xff0c;在享受网络带来的便利时&#xff0c;我们也需要时刻保护自己的隐私和安全。其中&#xff0c;IP地址作为网络通信中的重要标识&#xff0c;如何隐藏以及在哪些情况下需…

电商数据采集中如何采集1688平台商品详情SKU数据

一、背景介绍 1688.com是阿里旗下国内最大的B2B批发采购平台&#xff0c;1688分销客是依托此平台的官方营销平台&#xff0c;通过此平台API接口的接入推广平台商家的商品&#xff0c;按照商品成交金额的一定比例获得佣金。可以调用1688平台上的商品详情&#xff0c;SKU数据&…

西南科技大学电路分析基础实验A1(一阶电路的设计)

目录 一、实验目的 二、实验设备 三、预习内容(如:基本原理、电路图、计算值等) 四、实验数据及结果分析(预习写必要实验步骤和表格) 1. 观测一阶电

万字解析设计模式之观察者模式、中介者模式、访问者模式

一、观察者模式 1.1概述 观察者模式是一种行为型设计模式&#xff0c;它允许一个对象&#xff08;称为主题或可观察者&#xff09;在其状态发生改变时&#xff0c;通知它的所有依赖对象&#xff08;称为观察者&#xff09;并自动更新它们。这种模式提供了一种松耦合的方式&…

什么是高性能计算岗位

最近有小伙伴咨询什么是高性能计算岗位。 1、什么是高性能计算 高性能计算&#xff0c;在很多招聘信息中也会被标注为 HPC&#xff0c;是 High Performance Computing 的缩写。 目前很多 AI 公司或者从事 AI 的部门招聘都有这个岗位需求&#xff0c;我从某聘上截取了几个有代…

VBA高级应用30例:Ribbon(功能区)的介绍

《VBA高级应用30例》&#xff08;版权10178985&#xff09;&#xff0c;是我推出的第十套教程&#xff0c;教程是专门针对高级学员在学习VBA过程中提高路途上的案例展开&#xff0c;这套教程案例与理论结合&#xff0c;紧贴“实战”&#xff0c;并做“战术总结”&#xff0c;以…

【Proteus仿真】【STM32单片机】感应水龙头设计

文章目录 一、功能简介二、软件设计三、实验现象联系作者 一、功能简介 本项目使用Proteus8仿真STM32单片机控制器&#xff0c;使用LCD1602液晶模块、HCSR04超声波等。 主要功能&#xff1a; 系统运行后&#xff0c;LCD1602显示超声波模块检测的距离&#xff0c;若检测距离小…

二十九、微服务案例完善(数据聚合、自动补全、数据同步)

目录 一、定义 二、分类 1、桶(Bucket)聚合: 2、度量(Metric&#xff09;聚合: 3、管道聚合&#xff08;Pipeline Aggregation&#xff09;&#xff1a; 4、注意&#xff1a; 参与聚合的字段类型必须是: 三、使用DSL实现聚合 聚合所必须的三要素&#xff1a; 聚合可配…

数字系列——数字经济

数字经济是全球经济未来发展方向&#xff0c;正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。都知道数字经确实很重要&#xff0c;但有些人还傻傻搞不懂数字经济到底是什么&#xff1f;小编今天就给大家捋一捋。 什么是数字经济&#xff1f; 数字经…

tabs切换,组件库framework7

IOS和安卓兼容的背景下&#xff0c; 可以使用&#xff1a;framework7.io文档 效果展示&#xff1a; 代码&#xff1a; <!-- Top Tabs --> <div class"tabs tabs-top"><div class"tab tab1 active">...</div><div class"…

高级/进阶”算法和数据结构书籍推荐

“高级/进阶”算法和数据结构书籍推荐《高级算法和数据结构》 高级算法和数据结构 为什么要选择本书 谈及为什么需要花时间学算法&#xff0c;我至少可以列举出三个很好的理由。 (1)性能&#xff1a;选择正确的算法可以显著提升应用程序的速度。仅就搜索来说&#xff0c;用二…

jQuery_07 函数的使用

在jQuery中&#xff0c;如何使用函数呢&#xff1f; 1.基本函数 函数(常用的) 其实有很多函数&#xff0c;但是我们只需要掌握常用的函数即可 1.val 操作dom对象的value val() 没有参数 获取dom数组中第一个dom对象的value值 val(value) 有参数 设置dom数组中所有dom对象的…

毫米波雷达DOA角度计算-----DBF算法

DBF算法实现程序如下&#xff1a; 输入&#xff1a; parameter 是 毫米波雷达的参数设置。 antVec 是 目标点的8个虚拟天线的非相参积累数据。 function [angle,doa_abs] dbfMethod(parameter,antVec)txAntenna parameter.txAntenna; % 发射天线 [1 1]rxAntenna para…

使用功能点估算法进行估算,5大注意事项

功能点估算法在软件项目管理中起着重要的作用&#xff0c;其有助于项目的早期估算&#xff0c;更准确地预测项目成本和进度&#xff0c;有助于更好地理解项目规模&#xff0c;并做出相应的资源分配和进度安排。如果不使用此估算方法&#xff0c;可能会导致项目范围不清晰&#…

R语言期末考试复习二

上篇文章的后续&#xff01;&#xff01;&#xff01;&#xff01; http://t.csdnimg.cn/sqvYD 1.给向量vec1设置名为"A","B","C","D","E","F","G"。 2.将矩阵mat1的行名设置为"Row1"&#…