脑洞大开!用大模型开卡车,还融了2亿美元

news2024/10/6 6:51:39

物理生成式AI驾驶平台Waabi在官网宣布获得2亿美元,本次由英伟达(NVIDIA)、沃尔沃、保时捷、Uber、Khosla等全球知名企业投资。

Waabi仅成立3年便获得4级自主驾驶权限,主要是借助了ChatGPT等生成式AI风口,将其融合在自动驾驶中突破了很多重大技术难点,将在2025年推出无人干预的全自动化运输卡车。

Waabi开发了一个端到端的大模型Copilot4D,可以模拟人类的智力、推理和驾驶习惯。相比传统的自动化驾驶方案所需要的训练数据和算力资源更少,在安全、环境侦测方面却有巨大提升,这也是全球为数不多将生成式AI与自动化驾驶相结合的案例之一。

图片

其实,Waabi起初是一家自动化驾驶平台,但看到全球生成式AI风口越刮越大并且已经进入商业化落地阶段。所以,在今年3月18日官宣与英伟达进行深度技术合作,将NVIDIA DRIVE Thor集成在自动化驾驶技术中,同时转型成为物理生成式AI驾驶平台。

NVIDIA DRIVE Thor是一个包含从底层硬件GPU、开发层SDK再到应用层辅助驾驶、自动化驾驶的全套开发平台。

其每秒可提供高达254万亿次运算,有12个外部摄像头、3个内部摄像头、9个雷达、12个超声波和1个前置激光雷达等,是全球应用最多的自动化驾驶基础开发套件之一。

NVIDIA DRIVE Thor体验地址:https://www.nvidia.com/en-us/self-driving-cars/in-vehicle-computing/

图片

Copilot4D模型简单介绍

除了借助英伟达强大的开发生态之外,Waabi与多伦多大学的研究人员联合开发了,通过离散扩散学习自动驾驶的无监督世界模型——Copilot4D。

Copilot4D是一个专为自动驾驶领域开发的大模型,其核心技术是将观察标记化,通过向量量化变分自编码器(VQVAE)将连续的传感器数据,如激光雷达点云,转换为离散的标记

这种转换不仅简化了数据表示,VQVAE也能将输入数据映射到有限的离散潜在空间中,有效地将高维、连续的数据压缩为低维、离散的表示,从而降低了模型的复杂度并使得数据可以被高效地解码和去噪。

在这些离散标记的基础上,Copilot4D采用了一种新颖的离散扩散模型来预测未来的观察结果,通过在数据中逐步引入噪声,然后学习逆向过程以去除噪声并重构数据。

图片

与传统的扩散模型相比,离散扩散模型专门针对离散数据设计,能够更加高效地处理经过标记化的数据

为了捕捉环境的动态变化,Copilot4D引入了时空变换器,基于Transformer架构在空间和时间维度上交替应用注意力机制。这种设计使得模型不仅能够理解车辆在道路上的运动模式和行人的行走路径,还能够在不同时间步骤的标记之间建立联系,生成连贯的未来环境预测

在生成过程中,Copilot4D使用了分类器自由扩散引导(Classifier-Free Diffusion Guidance, 简称CFG)技术,通过调整模型的输出分布来增强生成数据的质量和多样性。

CFG可利用过去的代理历史,例如,过去的观察和行动,来引导未来的预测,从而显著提高了环境的预测准确性和可靠性。

图片

Copilot4D在多个自动驾驶数据集上NuScenes、KITTI Odometry和Argoverse2进行了评测。在1秒内的预测中,Copilot4D相比之前最佳方法将Chamfer距离(一种衡量点云间相似度的指标)降低了65%—75%。

而在3秒预测时也降低了超过50%,整体性能非常强悍,这也是被Waabi应用在自动化卡车驾驶中的主要原因之一。

物理生成式AI

在获得巨额融资后,Waabi联合创始人兼CEO Raquel Urtasun发表了一篇长文,介绍了物理世界中的生成式AI。

她表示,近两年生成式AI取得了令人惊叹的进步,ChatGPT通过了法律专业律师考试、专业医师考试,Midjourney生成的图片可以和专业设计师相媲美,Suno生成的音乐来顶级音乐人都赞不绝口。

但这些成就都是在虚拟世界完成的,我们该如何将其引入到现实的物理世界中呢?但引入的过程并不容易,首先,物理世界对安全的要求极高,几乎不能出现半点错误,例如,在自动化驾驶卡车中如果大模型对环境的判断、预测不准确,很容易出现严重的车祸事故。

其次,移动的卡车受限于环境,无法像超级算力矩阵那样提供源源不断的算力,只能在有限的空间内来完成部署和使用,这就对模型的性能有着极高的要求。

图片

为了解决这些难题,Waabi开发了适用于物理世界的大模型,这是一种前所未有的突破。它不仅能感知这个真实的物理世界,创建可解释的安全规则,还能以人类的方式进行推理,找出最佳的驾驶解决方案。

长距离的大型卡车驾驶是一个枯燥,容易让人疲惫的职业,同时随着全球劳动力的下降,有安全经验的卡车司机正在逐年下降。

Waabi希望通过将生成式AI引入到自动化驾驶中,打造一批安全、可靠的“数字驾驶员”帮助企业解决运输链难题,同时降低劳动成本。

本文素材来源Waabi官网、Copilot4D论文,如有侵权请联系删除

END

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1857861.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI风险管理新利器:SAIF CHECK利用Meta Llama 3保障合规与安全

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

设计软件有哪些?贴图插件篇(2),渲染100邀请码1a12

这次我们继续介绍一些贴图插件。 1、Texporter Texporter是3ds Max的一个插件,用于快速导出贴图。它允许用户一次性导出多个贴图通道,如漫反射、法线、置换等,以各种格式,如TGA、BMP、JPEG等。Texporter提供了简单易用的界面和灵…

ctr/cvr预估之WideDeep模型

ctr/cvr预估之Wide&Deep模型 在探索点击率(CTR)和转化率(CVR)预估的领域中,我们始终追求的是一种既能捕获数据中的线性关系,又能发现复杂模式的模型。因子分解机(Factorization Machines, …

6.21长难句打卡

Students also benefit from learning something about coding before they get to college, where introductory computer-science classes are packed to the brim, which can drive the less-experienced or -determined students away. 1.brim v.充满 n.边缘 在上大学之前…

Nature重磅:揭开睡眠不足为什么会损害记忆力

我们的记忆力会在睡眠期间得到增强,海马体是大脑的记忆中心,而海马体尖波涟漪(sharp-wave ripple,SWR)期间觉醒体验的激活和重放被认为是记忆力得到增强的关键。睡眠不足会损害记忆力,然而,我们…

四川赤橙宏海商务信息咨询有限公司电商服务正规吗?

在数字时代的浪潮下,电商行业正以前所未有的速度蓬勃发展。而在这个风起云涌的电商江湖中,四川赤橙宏海商务信息咨询有限公司以其独特的抖音电商服务策略,迅速崭露头角,成为业界翘楚。今天,我们就来聊聊这家公司如何凭…

matplotlib赛博朋克绘图风格介绍(mplcyberpunk)

matplotlib绘图风格 mplcyberpunk mplcyberpunk是一个matplotlib绘图风格的扩展包,利用这个python包,可以轻易的创建出精美的赛博朋克风格图表,方法介绍: import matplotlib.pyplot as plt import mplcyberpunkplt.style.use("cyberpunk")add_glow_effects #使图形…

SQL Server - ROLLUP、GROUPING、CUBE、GROUPING SET

文章目录 SQL Server - ROLLUP、GROUPING、CUBE、GROUPING SETROLLUP函数GROUPING函数GROUPING SET函数CUBE函数网上例子 写在前面:如果我们想要对分组之后的数据进行类似小计的计算,那么就需要使用到下面的函数 SQL Server - ROLLUP、GROUPING、CUBE、G…

解决bat脚本输出中文乱码

2024.06.24 测试,使用方法(1)已解决问题。 原文连接 一、乱码原因 Windows的cmd.exe默认编码格式为ANSI。简体中文版的Windows, 其ANSI对应微软Codepage为cp936 如果你的bat文件是UTF-8编码的, 或者是是其他Codepage下创建的, 当bat文件编码…

C语言基础——函数(2)

ʕ • ᴥ • ʔ づ♡ど 🎉 欢迎点赞支持🎉 文章目录 前言 一、return语句 二、数组做函数参数 三、嵌套调用和链式访问 3.1 嵌套调用 3.2 链式访问 四、函数声明和定义 4.1 单个文件 4.2 多个文件 总结 前言 大家好啊,继我们上一…

快速鲁棒的 ICP (Fast and Robust Iterative Closest Point)

迭代最近点(Iterative Closet Point,ICP)算法及其变体是两个点集之间刚性配准的基本技术,在机器人技术和三维重建等领域有着广泛的应用。ICP的主要缺点是:收敛速度慢,以及对异常值、缺失数据和部分重叠的敏…

【强化学习的数学原理】课程笔记--1(基本概念,贝尔曼公式)

目录 基本概念State, Action, State transitionPolicy, Reward, Trajectory, Discount ReturnEpisodeMarkov decision process 贝尔曼公式推导确定形式的贝尔曼公式推导一般形式的贝尔曼公式State ValueAction Value 一些例子贝尔曼公式的 Matric-vector form贝尔曼公式的解析解…

图片多级缓存加载流程

图片多级缓存加载流程通常包括三个主要级别:内存缓存、本地缓存和网络缓存。以下是详细的加载流程: 1. 内存缓存(一级缓存) 流程: 当应用需要加载一张图片时,首先会检查内存缓存中是否存在该图片。 如果…

【Linux进阶】UNIX体系结构分解——操作系统,内核,shell

1.什么是操作系统? 从严格意义上说,可将操作系统定义为一种软件,它控制计算机硬件资源,提供程序运行环境。我们通常将这种软件称为内核(kerel),因为它相对较小,而且位于环境的核心。 从广义上…

智能屏幕人体雷达感应开关模块,飞睿智能低功耗毫米波雷达技术,让冰箱更节能

在智能家居日益普及的今天,各种创新技术层出不穷,极大地提升了人们的生活品质。其中,人体雷达感应开关模块作为一种创新的传感器技术,正在逐步改变我们对家电设备的传统认知。本文将深入探讨飞睿智能人体雷达感应开关中的毫米波雷…

【Golang】Steam 创意工坊 Mod 文件夹批量重命名

本文将介绍一个使用Go语言编写的脚本,其主要功能是解析XML文件并基于解析结果重命名文件夹。这个脚本适用于需要对文件夹进行批量重命名,并且重命名规则依赖于XML文件内容的情况。 脚本功能概述 Steam创意工坊下载的Mod文件夹批量重命名为id名称 运行前…

MySQL-java连接MySQL数据库+JDBC的使用

目录 1.准备所需要资源 2.导入驱动包 3.连接数据库步骤 首先在MySQL中创建好数据库和表 代码实现连接数据库 1.准备所需要资源 1.mysql和驱动包 我用的是5.7的mysql和5.1.49的驱动包,链接放在网盘里,需要的自取 链接:https://pan.bai…

K8S安装metrics-server

K8S安装metrics-server 使用kubeadm安装完成的集群,运行kubectl top node等命令式,报错:error: Metrics API not available。这是因为缺少metrics-server。 [rootk8s-master1 ~]# kubectl top node error: Metrics API not available简介 …

k8s集群搭建及对一些组件的简单理解

背景 k8s的学习环境(用kubeadm方式搭建),我也搭过几次了,但都有点问题。 要么在云服务器上弄,这个的问题是就只有一台轻量服务器,只能搭个单节点的;后来买了一台便宜的,所以就有了两…

SpringBoot使用滑动窗口限流防止用户重复提交(自定义注解实现)

在你的项目中,有没有遇到用户重复提交的场景,即当用户因为网络延迟等情况把已经提交过一次的东西再次进行了提价,本篇文章将向各位介绍使用滑动窗口限流的方式来防止用户重复提交,并通过我们的自定义注解来进行封装功能。 首先&a…