博世(BOSCH)× Milvus:智能驾驶领域的数据挖掘革新

news2024/11/16 23:40:08

01.博世智能驾控:智能驾驶技术的领航者

博世(BOSCH)智能驾控是全球汽车技术领域的领导者,以其在自动驾驶技术上的创新和深厚历史而闻名。博世的自动驾驶解决方案,包括先进的驾驶辅助系统(ADAS),如自适应巡航控制、车道保持辅助和自动泊车系统等,被业界广泛认可,并被多家顶级汽车制造商采用。通过与多方的合作,博世不断将研究成果应用于实际,引领自动驾驶技术的发展。

公司汇聚了众多资深技术专家,致力于通过先进的数据处理技术,推动智能驾驶的进一步发展。

02.智能驾驶的挑战:应对无穷的“corner case”

在自动驾驶领域,"corner case"指的是那些不常见、异常或极端的交通场景,例如突如其来的大雾、暴雨、暴风雪等极端天气,或是行人、动物、非常规交通工具的意外出现。这些场景对车辆的感知系统,包括雷达、摄像头和激光雷达(LiDAR)等,提出了严峻的挑战。自动驾驶系统的开发和测试必须特别关注这些难以预测的边缘情况,以确保在各种复杂和不可预测的环境下都能安全、可靠地运行。博世智能驾控面临的主要挑战是如何高效且低成本地获取符合这些场景的图片数据集。

03.探索新境界:大模型与向量数据库的结合

那些年,博世智能在探索过程中曾经走过了这些路程:

  • 人工采集:获取数据最传统的方法就是人工采集,为了采集特定的场景数据,可能需要派出多辆数据采集车,这个过程费时低效且不一定能够轻易遇到所需场景,这意味着整个过程需要一个很长的时间周期。

  • 知识图谱:用于将特定的属性或分类标注给数据点,以便于组织、检索和分析。但是 Corner case 是无穷的,为每一种 corner case 打上独特的标签是一项巨大的挑战。

由此可见,无论人工采集还是知识图谱,都存在成本高、效率低、覆盖面有限等问题。

而随着大型预训练模型和向量数据库技术的发展,博世智能驾控开始探索新的解决方案:利用大模型对采集到的数据进行 embedding,再通过向量数据库进行高效的以文搜图或以图搜图。在这一过程中,视觉大模型 LVM(Large Vision Model)以及多模态大模型 LMM (Large Multimodal Models)被确认能够满足业务需求,而落地的真正难点则在于大规模的向量检索,接下来向量数据库就成了关键。

04.向量检索的选型之道

博世智能驾驶业务使用的预训练大模型参数量已经达到数十亿,特征维度都在1000多维以上。以1024维为例,每个特征值如果是浮点数(4字节),那么一个特征在内存中的存储就需要大约4KB。这样的存储需求在大规模数据处理时会导致资源消耗巨大,从而使存储和计算成本变得非常高。

博世智能驾控的图像数据量是巨大的,当前已经至少达到数百亿甚至千亿级别,并且还在增长。在经过基于时序分片的聚类去重后,最终需要入库检索的数据量也在十亿级别。在向量数据库的选型过程中,博世智能驾控通过引入量化索引+分片技术来降低资源消耗,同时提高数据处理的效率。其中量化索引技术更适合大规模数据高效存储和高维特征的索引策略。而分片技术适应数据规模的增长,从而使得大规模的实时检索成为可能,同时提高了计算资源的利用效率。团队做了以下尝试或者调研:

  • 在nlp领域,智能问答知识库召回场景很多都采用了 HNSW 图索引,这是一种广泛使用的索引方法,它虽然简单易用,但需要将原始的高维特征直接存储进算法库,资源消耗量巨大,成本极高。

  • 很多传统向量搜索采用的是在结构化数据库中加入向量字段。对于量化索引算法,在分片更新后都需要重新训练码本(codebook),这增加了实现的复杂度。因此,市场上开源的传统数据库中引入的向量检索功能,基本都只支持HNSW索引,无法满足博世大规模底库的检索需求。

博世智能资深技术专家张工说到:“我们需要的是一种能够适应大模型和复杂搜索需求的索引技术,它应该能够减少训练成本,提高更新效率,并能够灵活应对不断变化的数据和查询需求。”

因此,一个专门的向量数据库才有可能满足博世智能的业务场景需求,在实践比对筛选后,Milvus 脱颖而出。

注:基于大模型+Milvus的coner case数据挖掘架构示意

Milvus 能够处理高维度数据,支持百亿级向量的毫秒级搜索,因此面对博世智能当前数十亿及未来不断增长的海量数据,依然可以保持高性能。更重要的是,Milvus 的量化索引技术大幅降低了存储和计算资源的消耗,使得博世智能在处理大规模数据集时更加得心应手。

1.成本效益:

  • 数据采集成本降低80%:通过 Milvus 的高效检索能力,博世智能驾控能够从已有的数据库中挖掘出70%-80%所需场景,这大幅减少了重新采集数据的成本。同时,使用 Milvus 进行向量搜索,如果所需数据已经存在于数据库中,就可以实现几乎即时的数据获取,数据挖掘效率也得到了大幅提升。张工举例说,如果今天提出了一个数据需求,当天就可能通过意图搜图/文本搜图搜索得到所需的场景数据。这种搜索方式极大提高了数据处理的效率,对业务流程产生了显著的积极影响。

  • 每年数据存储成本减少近千万:因为极大的减少了外采的数据,数据存储的成本就降了下来,“这部分成本是非常夸张的。如果一个企业每一年全靠自己出去采的数据,可能云成本都是要花到接近千万起的。”张工说道。

  • 搜索效率优化:Milvus 的量化索引技术大幅降低了存储和计算资源的消耗。在处理大规模数据集时,博世智能驾控不再受限于传统数据库的性能瓶颈,能够更加灵活和高效地进行数据处理。Milvus 还提供了分段以及分片的搜索方法,这样的效率更高,能够解决业务当前面临的痛点,特别是在处理大规模数据和高维度特征数据时。

2.利于业务拓展的弹性架构——数十亿数据毫秒级检索

目前博世智能驾控的自动驾驶业务架构也是基于云服务,而 Milvus 的云原生架构也简化了许多流程,使得部署过程相对容易。此外,Milvus 的云原生架构也展现出了良好的扩展性,这对于博世智能这种数据规模已经达到数十亿的业务来说至关重要。当需要扩容时,Milvus 能够一键扩容。更重要的是,根据实际生产环境验证,随着业务的扩展,搜索速度依然保持在毫秒级,“我们测过数十个并发搜索,根本感觉不到搜索速度变慢”,张工如是说。

3.活跃的社区服务

Milvus 是全球最受欢迎、迭代最快、架构最成熟的开源向量数据库,拥有最大的中国及海外用户及开发者社区。“我觉得还有一点做的非常好的是 Milvus 社区非常活跃。”张工表示,之前也遇到过一些问题,“在 Milvus 社区里面一反馈,立马就得到响应。这点我觉得也做的非常好。”

4.未来探索——基于多向量列+混合搜索的向量数据库应用

为了保证每个场景的多样性,需要上万张样图数据,这样才可以保证数据集的多样性。目前业务会优先用文本搜图,当文本搜索结果不理性的状态下再去以图搜图。

而随着 Milvus 对多向量列及混合检索的支持,按需搜图变得更有可能性,比如用天气图片叠加锥桶图片可以搜索出各种天气下的锥桶路况图,也可以用三角路牌叠加描述文字来搜索出不同示警功能的路牌。这也是未来 Milvus 和博世智能共同去探索的方向。

05.Milvus在智能驾驶领域的无限潜力

Milvus 不仅仅是一个工具,它更像是博世智能驾控在智能驾驶领域的一位战略伙伴。通过Milvus,博世智能驾驶业务能够更深入地理解和利用数据,从而在智能驾驶的赛道上占据先机。Milvus 的引入,让博世智能驾控在数据处理上实现了质的飞跃,从数据采集到处理,再到最终的应用,每一个环节都变得更加高效和精准。期待将 Milvus 的更多创新技术运用到博世智能驾驶业务的未来业务规划中,通过技术创新,让驾驶更安全、更智能、更便捷。

作者介绍:高甜甜,Zilliz Product Marketing Manager

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2042914.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

四十二、大数据技术之Kafka3.x(5)

🌻🌻 目录 一、Kafka-Eagle 监控1.1 MySQL 环境准备1.2 Kafka 环境准备1.3 Kafka-Eagle 安装1.4 Kafka-Eagle 页面操作 二、集成 SpringBoot2.1 前期准备2.2 SpringBoot 生产者2.3 SpringBoot 消费者 三、集成 Spark(拓展 Scala 语言&#xf…

Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data精读

文章目录 1.摘要2.引言2.相关工作3.Depth Anything3.1 Learning Labeled Images3.2. Unleashing the Power of Unlabeled Images3.3. Semantic-Assisted Perception 4. Experiment4.1. 实施细节4.2. 零样本相对深度估计4.3. 微调至度量深度估计4.3.1 领域内度量深度估计4.3.2 零…

数的个位相加

给定一个非负整数 num,反复将各个位上的数字相加,直到结果为一位数。返回这个结果。 示例 1: 输入: num 38输出: 2 解释: 各位相加的过程为: 38 --> 3 8 --> 11 11 --> 1 1 --> 2 由于 2 是一位数,所以返回 2。…

pytorch分布式训练卡住,显卡占用100

1、问题 使用pytorch进行分布式训练,一机多卡,采用 DistributedDataParallel 方式,多次执行卡在了同一个地方。但是单卡和 DataParallel 方式都没有卡住的现象。 执行nvidia-smi,此时全部GPU利用率均为100%: 2、debug…

【建模与仿真】一文搞定AFSIM

😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【建模与仿真】一文搞定AFSIM,期待与你一同探索、学习、进步,一起卷起来叭! 目录 一、CMAKE二、AFSIM前言架构元素核心应用核心架构…

《学会 SpringBoot 系列 · ConfigurableApplicationContext 详解》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

WordPress多用途电子商务博客新闻主题betheme 21.5.6版本

简介: WordPress多用途电子商务博客新闻主题betheme 21.5.6版本 自带500多套模板 BeTheme第一次发布于2014年5月21日,自那时以来,已有数以百万计的人下载了BeTheme,其评分为4.8。 这个主题是WooCommerce支持的,在此…

UniApp第一天

一、官网介绍 1.1、 SDK SDK是"Software Development Kit"的缩写,中文意思是“软件开发工具包”。SDK通常是由软件开发者为其他开发者提供的一个软件工具集合,用于帮助开发者快速开发、测试和部署软件应用。SDK通常包含了一系列的开发工具、库…

让3岁小孩都能理解LeetCode每日一题_3148.矩阵中的最大得分

解释说明&#xff1a; 上面的内容的意思是为了有只移动一次的情况&#xff0c;而后面的grid&#xff08;i,j)-grid(i,k)由于j严格大于k,所以至少移动了一次&#xff0c;前面可以保持不移动&#xff0c;不移动就是选择0。 class Solution {public int maxScore(List<List&l…

倍福EAP协议应用讲解

倍福EAP协议应用讲解 前言 倍福提供了用于在以太网上进行实时通信的EtherCAT协议&#xff0c;EtherCAT协议属于现场层协议&#xff0c;即具有主从结构&#xff0c;通信只能由主站发起&#xff0c;从站不具备发起通信的功能&#xff0c;只能被动接收数据并插入数据到通信帧中。…

Java基础之switch分支语句

switch分支语句 ​ switch语句也称为分支语句&#xff0c;其和if语句有点类似&#xff0c;都是用来判断值是否相等&#xff0c;但switch默认只支持byte、short、int、char这四种类型的比较&#xff0c;JDK8中也允许String类型的变量做对比。 语法&#xff1a; switch (表达式…

了解数据库中常用存储引擎数据结构(3)

接上文了解数据库中常用存储引擎数据结构&#xff08;2&#xff09;-CSDN博客 目录 CoW BTree 补充&#xff1a;写入时复制&#xff08;Copy-on-write&#xff0c;简称COW&#xff09;是一种计算机程序设计领域的优化策略&#xff1b; Lazy BTree&#xff08;惰性BTree&…

【Linux】缓冲区和文件系统

目录 一、缓冲区 1.1 概念 1.2 用户缓冲区和内核缓冲区 二、磁盘的结构 三、文件系统 3.1 初识“块”和inode 3.2 磁盘分区和文件系统 一、缓冲区 1.1 概念 要理解什么是缓冲区&#xff0c;先看这段代码 #include <stdio.h> #include <string.h> #includ…

OpenTelemetry:新一代的开源可观测性标准

OpenTelemetry是由OpenTracing和OpenCensus两个开源项目合并而成&#xff0c;由云原生计算基金会&#xff08;CNCF&#xff09;托管。该项目旨在提供一套标准化的、跨语言的观测性工具&#xff0c;帮助开发人员和运维人员更好地理解和管理分布式系统的性能和行为。通过统一的Me…

html5宠物网站模板源码

文章目录 1.设计来源1.1 主界面1.2 主界面菜单1.3 关于我们界面1.4 宠物照片墙界面1.5 宠物博客界面1.6 宠物服务界面1.7 宠物团队界面1.8 联系我们界面 2.效果和源码2.1 源代码 源码下载万套模板&#xff0c;程序开发&#xff0c;在线开发&#xff0c;在线沟通 【博主推荐】&a…

微信小程序同城信息共享

前端uniapp 后端thinkphp 热乎的纯手工代码

机械学习—零基础学习日志(如何理解线性代数3)

零基础为了学人工智能&#xff0c;正在快乐学习&#xff0c;每天都长脑子 行列式 最早行列式&#xff0c;是莱布尼茨用于判断&#xff0c;一个方程有没有解。例如&#xff0c;三元一次方程&#xff0c;如果有解&#xff0c;对应行列式就有值&#xff0c;但是如果无解&#xf…

一篇文章理清Java持久化脉络(关于JDBC、JPA、Hibernate、Spring Data JPA)

Java持久化 一、JDBC、JPA、Spring Data JPA 的定义及关系二、JDBC&#xff08;古老的东西&#xff0c;只需简单知道是啥&#xff09;1.1 JDBC概念1.2 JDBC示例 三、JPA&#xff08;第二代持久化&#xff0c;代表是Hibernate等框架&#xff09;3.1 JPA概念3.2 JPA示例 四、Spri…

GB/T 38082-2019 生物降解塑料购物袋检测

生物降解塑料购物袋是指以生物降解树脂为主要原料制得的&#xff0c;具有提携结构的&#xff0c;在销售、服务等场所用于盛装及携提商品的袋制品。 GB/T 38082-2019 生物降解塑料购物袋检测项目&#xff1a; 检测项目 测试标准 尺寸偏差 GB/T 38082 感官 GB/T 38082 提掉…

html+css+js网页设计 大一电商6个页面 带js 有轮播图,增删改查等功能

htmlcssjs网页设计 大一电商6个页面 带js 有轮播图&#xff0c;增删改查等功能 网页作品代码简单&#xff0c;可使用任意HTML编辑软件&#xff08;如&#xff1a;Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等…