智能驾驶中的数据标注

news2024/9/23 23:27:52

目前,各大自动驾驶汽车制造商都在通过获取高质量的训练数据最大化其数据资产的投入产出比。在海量的智能驾驶数据面前,如何让每个数据都有存在意义?从《数字商业时代》对澳鹏Appen(中国)高级产品总监张童皓的采访中,你或许能找到一些启发。 以下文章来源于数字商业时代DigitalTimes ,作者王宇。   数据无法解决所有问题,但在自动驾驶领域,数据却可以解决大部分问题。 在数字化时代,伴随高端传感器、高端芯片、5G通讯等新一代技术迅猛发展,自动驾驶网约车、无人配送车、无人清洁车、无人物流车等产品正在从概念走向现实,以智能驾驶技术为核心的科技手段正在重塑我们的城市生活。对于智能驾驶产业而言,数据的重要性堪比燃油车加油、新能源车充电。对各类传感器、激光雷达等设备采集到的数据进行有效训练、分析和处理,是智能驾驶技术平台的核心竞争力,也是智能驾驶技术革新与产品迭代的基础。 在海量的智能驾驶数据面前,如何让每个数据都有存在意义?训练数据就显得尤为重要。在智能驾驶AI训练数据方面,全球AI训练数据服务商澳鹏(Appen)正在打造出自己的理想版图。  

 

智能驾驶背后的训练数据

在智能驾驶领域,安全行驶是绝对的首要条件,这其中,感知是最重要的功能之一,车辆对行驶环境没有三维定量感知,就如同人失去双眼,智能驾驶的决策系统就无法正常工作,与其他智能应用场景相比,智能驾驶的落地场景更为复杂,尤其面对复杂多变的实时路况环境,必须有海量的、多维度的数据做支撑。但在数据采集过程中,并非所有数据均是高质量数据,那究竟哪些数据才能满足智能驾驶的真正需要? 在澳鹏(中国)高级产品总监张童皓看来,智能驾驶数据可以分为智能座舱和自动驾驶两部分,可以形象的理解为对车内驾驶者的智能识别与交互,和对车外路况的智能识别与交互。目前从智能座舱角度来看,除了车联网所产生的线上数据还在继续发挥其价值以外,车内智能设备相关的语音、手势等数据需求正在扩大。从自动驾驶角度看,车载视觉相机、激光雷达以及毫米波雷达传感器产生的数据是智能驾驶训练模型的核心要素。 在明晰智能驾驶所需数据定位后,对其而言,这些数据需要标注后才有意义,才能应用于算法的学习和训练。例如智能座舱的语音识别、手势动作识别、特种车辆驾驶员疲劳监测等技术能力,它们大多构建在深度神经网络模型基础上,这些深度神经网络均是在海量标注数据基础上训练的。 对于澳鹏而言,这家企业虽不直接参与自动驾驶相关的模型训练,但其技术团队会充分标注客户交予的不同场景下采集的语音、不同路况下采集的图像和3D激光点云等数据。并且,为了提高数据标注效率,澳鹏正在针对重点高频场景构建基线级别的算法能力,例如建构的3D点云车道线语义分割自动识别能力,该项技术能以高于人工标注几十倍的效率完成车道线点的分类。 毫无疑问,好的AI训练数据平台,不仅需要在数据标注上具备技术优势,在处理多维度数据时,也必须做到对视觉、语音、文本、点云等全品类的支撑。据了解,澳鹏的智能驾驶训练数据解决方案,就支持市场上语音、文本、图像、3D等所有的标注类型,包括分类、画框、分割、属性标记、跟踪等。 张童皓谈到,澳鹏近期对其自研的自动驾驶训练数据解决方案进行了大幅能力升级。该方案专为智能驾驶场景打造出包括像素级语义分割工具、2D图像复合标注工具、超高性能3D点云拉框、语义分割标注等工具在内的工具包,这些工具可以使原始数据在更短时间内变成高质量可用数据。 例如,其研发的3D点云拉框及语义分割工具,就能实现自动贴合,连续帧映射,3d2d融合标注,具备目标预识别等功能,能灵活配置数据有效性验证规则,可以直接在线上让客户做最低交付粒度的验收且可无缝打回。在实际应用中,该工具能够做到99.9%准确率,1秒/帧的质检速度。 据了解,澳鹏的技术平台可提供精度高达99%的复杂3D点云目标跟踪标注。借助该平台,智能驾驶整体方案服务商可以在标注2D图像数据时将其绑定到3D点云数据上,进行跨多个维度的映射,可以在单个任务单元内满足50多帧图像中保持目标ID一致性的要求。 据悉,澳鹏基于智能驾驶领域的经验,正在为亿咖通科技(Ecarx)构建多车型的智能化座舱及整车智能化人工智能解决方案提供AI训练数据服务。且澳鹏也已与全球十大汽车企业中的七家及多个一级供应商建立了深入合作。  

保障数据安全

不过在训练数据为智能驾驶提供更多落地机遇的背后,不容忽视的是数据安全。如今,大数据的确为公众生活带来了诸多便利性,但数据泄露、滥用等问题也同样为社会带来了安全隐患。保障数据安全,是各类AI训练数据服务商的立身之本,训练更多高质量数据的澳鹏更甚如此。 对于数据安全问题,张童皓表示,虽然澳鹏不是自动驾驶数据的直接收集者,但作为参与者,企业对其数据标注项目中的数据合规管理异常重视。在澳鹏内部,对人工智能模型所使用的数据给予的是最大限度的关注和保护。据悉,澳鹏已在全球获得ISO 27001安全认证,包括在上海的商务和研发总部、以及无锡和大连的数据服务交付中心。全球范围内,亦通过了GDPR,SOC 2 Type II,HIPAA等全球不同国家和地区的数据安全合规认证。 此外据张童皓介绍,澳鹏的智能驾驶训练数据平台也有权限管控,数据加密传输,PII信息加密存储等严格的数据安全管控策略。其每天会进行漏洞扫描,最大限度地保证客户数据资产安全。 对于智能驾驶数据安全,此前澳鹏全球副总裁、大中华区总经理田小鹏博士就曾表示,澳鹏在采集任何一个数据的时候,都是完全符合当地法规、制度要求的,而且都会征求数据被采集人员的同意,获得每一个人的承诺书。澳鹏会告知对方,所采集的数据会被哪个客户应用?应用在什么地方?对方本人是否同意?只有在取得对方的同意时才会应用这些数据,否则是绝对不会用的,这是一种基本的个人隐私和数据保护。 毫无疑问,在确保数据安全的前提下,澳鹏想用更高质量的训练数据,来赋能更好的智能驾驶解决方案。在全球,这家有着超过15年汽车行业经验的服务商,正在通过更先进的技术手段,打造出自己的训练数据版图,智能驾驶领域便是他们部署的重要一环。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/797309.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Leetcode】二叉树进阶面试题

文章目录 二叉树创建字符串二叉树分层遍历(从前开始)二叉树分层遍历(从后开始)二叉树的最近公共祖先二叉搜索树与双向链表从前序与中序遍历序列构造二叉树从中序与后序遍历序列构造二叉树二叉树的前序遍历(非递归&…

数仓学习---16、可视化报表(Superset)

星光下的赶路人star的个人主页 真正的才智是刚毅的志向 文章目录 1、Superset入门1.1 Superset概述1.2 环境说明 2、Superset安装2.1 安装Python环境2.1.1 安装Miniconda2.1.2 创建Python3.7 环境 2.2 Superset部署2.2.1 安装依赖2.2.2 安装Superset2.2.3 启动Superset2.2.4 Su…

黑客工具大全(网络安全)

1.Nmap 它是网络管理员必用的软件之一,以及用以评估网络系统安全。正如大多数被用于网络安全的工具,nmap 也是不少黑客及骇客(又称脚本小子)爱用的工具 。 系统管理员可以利用nmap来探测工作环境中未经批准使用的服务器&#xf…

性能如何通过分析后台资源确定瓶颈之磁盘网络

目录 影响性能的因素 磁盘 网络 应用程序-上下文切换 通俗的判断性能的好坏 影响性能的因素 磁盘 %Disk time指所选磁盘驱动器忙于为读或写入请求提供服务所用的时间的百分比。--磁盘的繁忙程度,一般不超过80%。 Disk reads(writes)b…

Linux-文件管理

1.文件管理概述 1.Bash Shell对文件进行管理 谈到Linux文件管理,首先我们需要了解的就是,我们要对文件做些什么事情? 其实无非就是对一个文件进行、创建、复制、移动、查看、编辑、压缩、查找、删除、等等 例如 : 当我们想修改系统的主机名…

momentjs

年月日 moment(date).format(YYYY-MM-DD) 年月日时间 moment(date).format(YYYY-MM-DD HH-MM-SS) 中文XX月XX日.moment(date).format(MMMDo)

A comprehensive survey on segment anything model for vision and beyond

视觉分割大模型的过去、现在和未来!SAM最新综述来了!今天自动驾驶之心很荣幸邀请到Garfield来分享视觉SAM分割大模型的最新综述,如果您有相关工作需要分享,https://mp.weixin.qq.com/s/-_QFvxBGzFpAgVGF-t-XRgSegment Anything Mo…

从游戏中理解《重构的时机和方法》(文末送书)

本次推荐的书籍是《重构的时机和方法》,该文是由法国克里斯蒂安克劳森(Christian Clausen) 著作,由郭涛翻译。 重构的时机和方法 寄语译者/本书作者原文作者群英推荐目录自我感受好书哪里来🤩免费的书籍哪里来🤩 寄语 作者寄语&a…

Tencent : TBDS

序言 腾讯大数据处理套件(Tencent Big Data Suite,TBDS)是基于腾讯多年海量数据处理经验,对外提供的可靠、安全、易用的大数据处理平台。您可以借助 TBDS 在公有云、私有云、非云化环境,根据不同数据处理需求选择合适…

栈和队列模拟实现(C++)

文章目录 1.deque的认识1.1介绍2.图析 2.stack模拟实现3.queue模拟实现4.优先级队列模拟实现4.1介绍4.2例题4.3模拟实现 5.测试函数 1.deque的认识 1.1介绍 双端队列 Deque(通常读作“deck”)是double-ended queue的不规则首字母缩写。双端队列是动态长度的序列容器&#xff0…

MySQL多表查询(联合查询、连接查询、子查询)

目录 多表联合查询 联合查询类型 多表连接查询 多表查询的分类 交叉查询(笛卡尔积) 内连接查询 外连接查询 自连接查询 子查询规则 子查询的分类 子查询的不同结果 EXISTS和NOT EXISTS 子查询应用的不同位置 不同外部语句的子查询应用情况…

spring boot--自动化注入组件原理、内嵌tomcat-1

前言 我们知道开发spring boot项目,在启动类上添加注解SpringBootApplication ,然后引入要自动注入的组件依赖,然后现application.properties中加上相应配置就可以自动注入这个组件,那么下面看看自动注入组件是如何实现的 一、S…

Idea 结合docker-compose 发布项目

Idea 结合docker-compose 发布项目 这里写目录标题 Idea 结合docker-compose 发布项目Docker 开启远程访问功能 添加相应端口配置IDEA 链接Docker配置项目 docker-compose.yml本地还需要安装 dockerwin11 安装本地Docker 可能存在问题 Linux内核不是最新 Docker 开启远程访问功…

回文链表——力扣234

文章目录 题目描述法一 将值复制到数组中后用双指针法法二 快慢指针 题目描述 法一 将值复制到数组中后用双指针法 class Solution { public:bool isPalindrome(ListNode* head) {vector<int> v;while(head!NULL){v.emplace_back(head->val);head head->next;}for…

同步、异步、阻塞、非阻塞

一、概念 同步与异步&#xff08;线程间调用&#xff09;的区别&#xff1a;关注的是调用方与被调用方之间的交互方式。同步调用会等待被调用方的结果返回&#xff0c;而异步调用则不会等待结果立即返回&#xff0c;可以通过回调或其他方式获取结果。 阻塞非阻塞&#xff08;…

Nautilus Chain 即将治理通证 NAUT ,生态发展进程加速

独特且优势明显的Nautilus Chain 目前&#xff0c;行业内首个模块化底层Nautilus Chain已经上线主网&#xff0c;并且即将有超过70个应用原生部署在Nautilus Chain上。Nautilus Chain本身是一个以Layer3为定位的区块链系统&#xff0c;其通过Celestia模块化底层来获得DA支持以…

网络安全 HVV蓝队实战之溯源

一、前言 对于攻防演练蓝军的伙伴们来说&#xff0c;最难的技术难题可能就是溯源&#xff0c;尤其在今天代理横行的时代更加难以去溯源攻击者。这里我就举两个溯源来帮助大家梳理溯源过程&#xff0c;一个是只溯源到公司&#xff0c;一个是溯源到个人。 二、溯源实例 2.1IP …

逻辑运算符和短路求值

要了解短路求值就必须先了解什么是逻辑运算符。 逻辑运算符 在了解运算符之前我们必须先知道再JAVA中逻辑运算符的结果是Boolean类型的值 逻辑与“&&” 表达式1 && 表达式2 逻辑与就是只有运算符两边的表达式都为真&#xff0c;结果才为真。 表达式1表达式…

2023潮玩盲盒小程序盲盒商城源码(开源+微信登录+支付对接)

潮玩盲盒星尘潮玩盲盒小程序2023潮玩盲盒小程序盲盒商城源码(开源微信登录支付对接)

209. 长度最小的子数组 中等 1.8K

209. 长度最小的子数组 原题链接&#xff1a;完成情况&#xff1a;解题思路&#xff1a;参考代码&#xff1a; 原题链接&#xff1a; 209. 长度最小的子数组 https://leetcode.cn/problems/minimum-size-subarray-sum/description/ 完成情况&#xff1a; 解题思路&#xff1…