FSD渐入佳境,视觉方案还在机器人中“打酱油”?

news2024/11/15 3:27:45

一边是技术圈顶流,一边在当前行业应用中没什么存在感。

优点缺点,两头拔尖

优点与缺点都突出的特点,让视觉方案一直伴随着争议,在近些年的行业应用上也一直透着“底气”不足。但随着在自动驾驶方面,纯视觉FSD开始表现出极其优秀的智驾能力,是否意味着,对于机器人导航方面,视觉方案也不仅仅是配角?

视觉方案的优势除却成本较低,更加重要的是能够获取更丰富的环境信息,让机器人在重定位、场景分类、交互等功能实现上更具优势。但缺陷也因为数据处理量巨大,对算力要求很高,在算法和硬件无法给予足够支持时,机器人就会出现精准度下降、卡顿、避障失灵等问题,进而导致任务无法达到预期,甚至失败。这意味着要发挥出视觉方案的实际潜力,要么搭载高算力平台,要么需要优化程度非常高的算法,否则所谓的巨大潜力,便成了笑话。

回到现实,让选择视觉的消费级扫地机器人产品重新拉高算力成本,显然不可能。但如果算力无法满足要求,算法就会做剪枝,阉割功能和极限性能,这也是视觉方案在当前行业应用上只能做配角的重要原因。

消费级的产品注定了其目前能搭载的芯片算力不会太高,想要真正发挥视觉方案的应用潜力,便只能在算法上下功夫。

算法瘦身,提升算力利用率

INDEMIND认为,对算法“瘦身”,并提高算力资源利用率,或许是打破算力桎梏的有效路径。为此,INDEMIND进行了多年的实践探索。

一方面,通过对算法进行轻量化“瘦身”,研发了轻量化VSLAM(基于深度学习特征的SLAM架构)、轻量化Depth(基于深度学习特征匹配的Depth)、轻量化深度学习模型(底层算子自研、剪枝、量化)等,在不影响功能表现的前提下,对算力要求有效降低。

另一方面, 通过采用硬件加速技术,对于视觉处理采用NEON加速、GPU加速、DSP加速等方式,提升芯片算力利用率。(系统运行时,芯片的计算单元不会全部被使用,导致算力资源浪费。)

结果证明,通过全栈自研轻量化算法和应用一系列软硬件优化技术,INDEMIND实现了在几美金的计算平台上稳定运行整套VSLAM算法。

目前,公司推出的家用机器人AI解决方案搭载4核A53/A55级别芯片即可满足需求,能够适配如RK3566、VicoreTek 6601/6801等(全解决方案情况下,双目视觉多传感器融合SLAM、双目Depth、物体识别及整机完整SDK)。需要说明的是,现有的大部分视觉导航方案在算力上大多需要TX2及以上,甚至PC级算力需求,且对CPU、GPU或NPU、内存均有较高要求。

算法再升级,赋能产品“真”创新

· 打破现有建图惯例,首创“真”三维建图

目前主流的传统2D栅格地图、拓扑地图虽然能够描述环境中存在的障碍物几何特征及其环境结构信息,但却缺乏机器人用于理解环境、人机/物机交互等业务逻辑的高层次语义信息。

工程机演示,不代表最终量产效果标题

INDEMIND则基于自研的VSLAM技术,首创了市面上真正意义上的三维地图。地图构建过程中,能够重建物体及环境的结构信息,还有物体类别、功能属性等“常识”性信息,这为上层功能开发提供了底层数据支持。

· 厘米级精准避障技术,无惧玻璃、积木

与自动驾驶渐入佳境相反,机器人仍在与避障死磕。一块积木、一面玻璃等似乎成了大多数扫地机器人无法逾越的天堑。

INDEMIND基于设备端、云端智能决策平台、大数据平台三端专门建立了一套智能决策引擎,用于支持机器人完成逻辑判断和决策,且在不断使用中,能够根据关键数据不断更新算法模型,持续提升场景处理和问题应对能力。借助微秒级的智能决策引擎,机器人能够稳定检测各类障碍物,支持低矮障碍物避障(地插、桌椅底座等);高反障碍物避障(玻璃、镜面等)。同时,配合环境补光技术,机器人在黑暗环境同样能够轻松应对。

· “真”脏污识别技术,哪里脏扫哪里

自研脏污识别技术,让扫地机器人像人一样“定点打击”。基于独有的图像算法,支持任何地面材质、花色、光线下的透明、半透明,不透明液体及干涸污渍识别、颗粒状脏污识别、粉末状脏污识别。而基于识别结果,系统能够针对脏污类型和脏污程度自主决策清洁策略,提升清洁质量和覆盖率。

在清洁过程中,机器人能够将脏污检测结果及位置与场景地图和轨迹进行叠加,实现全场景的脏污地图管理标题

通过深耕算法,打破算力限制,并对智能化方面深度创新,INDEMIND用实力证明视觉方案绝非配角。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1922683.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux】|开发工具介绍 | yum |vim | gcc/g++ | gdb | git

Linux开发工具详解 1. 引言💦2. Linux软件包管理器:Yum什么是软件包安装和卸载软件rzsz工具 3. Linux编辑器:VimVim的基本概念Vim的基本操作Vim模式和命令集🐳Vim配置 4. Linux编译器:GCC/G编译过程详解编译器的自举函…

如何通过兔子和窝窝的故事理解“在机器人学习和研究中的获得成本与维护成本”(节选)

获得成本 掌握一门课程,以最为简单的学校成绩过60为例,需要按要求提交材料,包括作业、报告、实验和考试等,依据学分和考核要求的不同,需要对于花费时间和经历进行完成。 维护成本 考完了,如果被动学习那…

Django 删除单行数据

1,添加模型 from django.db import modelsclass Post(models.Model):title models.CharField(max_length200)content models.TextField()pub_date models.DateTimeField(date published)class Book(models.Model):title models.CharField(max_length100)author…

安防监控视频平台LntonCVS视频融合共享平台智慧消防实现远程集中视频监控方案

近年来,电力系统内变电站着火事件频发,这对消防安全管理提出了严峻挑战。我国消防安全基础设施不完善、管理机制不健全、应急处置能力不足及公众消防安全意识淡薄等问题,严重制约了消防安全的提升。因此,加强变电站的消防安全管理…

Python应用爬虫下载QQ音乐歌曲!

目录: 1.简介怎样实现下载QQ音乐的过程; 2.代码 1.下载QQ音乐的过程 首先我们先来到QQ音乐的官网: https://y.qq.com/,在搜索栏上输入一首歌曲的名称; 如我在上输入最美的期待,按回车来到这个画面 我们首…

nx上darknet的使用-目标检测-在python中的使用

1 内置的代码 在darknet中已经内置了两个py文件 darknet_video.py与darknet_images.py用法类似,都是改一改给的参数就行了,我们说一下几个关键的参数 input 要预测哪张图像weights 要使用哪个权重config_file 要使用哪个cfg文件data_file 要使用哪个da…

240712_昇思学习打卡-Day24-LSTM+CRF序列标注(3)

240712_昇思学习打卡-Day24-LSTMCRF序列标注(3) 今天做LSTMCRF序列标注第三部分,同样,仅作简单记录及注释,最近确实太忙了。 Viterbi算法 在完成前向训练部分后,需要实现解码部分。这里我们选择适合求解…

Android Gantt View 安卓实现项目甘特图

需要做一个项目管理工具,其中使用到了甘特图。发现全网甘特图解决方案比较少,于是自动动手丰衣足食。 前面我用 Python和 Node.js 前端都做过,这次仅仅是移植到 Android上面。 其实甘特图非常简单,开发也不难,如果我…

PCL从理解到应用【04】Octree 原理分析 | 案例分析 | 代码实现

前言 Octree 作为一种高效的空间分割数据结构,具有重要的应用价值。 本文将深入分析 Octree 的原理,通过多个实际案例帮助读者全面理解其功能和应用,包括最近邻搜索、半径搜索、盒子搜索以及点云压缩(体素化)。 特性…

MongoDB - 查询操作符:比较查询、逻辑查询、元素查询、数组查询

文章目录 1. 构造数据2. MongoDB 比较查询操作符1. $eq 等于1.1 等于指定值1.2 嵌入式文档中的字段等于某个值1.3 数组元素等于某个值1.4 数组元素等于数组值 2. $ne 不等于3. $gt 大于3.1 匹配文档字段3.2 根据嵌入式文档字段执行更新 4. $gte 大于等于5. $lt 小于6. $lte 小于…

(Vue+SpringBoot+elementUi+WangEditer)仿论坛项目

项目使用到的技术与库 1.前端 Vue2 elementUi Cookie WangEditer 2.后端 SpringBoot Mybatis-Plus 3.数据库 MySql 一、效果展示 1.1主页效果: 1.2 文章编辑页面: 1.3 成功发布文章 1.4 文章关键字搜索提示 1.5 文章查询结果展示 1.6 文章内容及交互展示…

统信UOS服务器操作系统离线安装postgresql数据库

原文链接:统信UOS服务器离线安装postgresql数据库 Hello,大家好啊!今天给大家带来一篇关于在统信UOS服务器操作系统上离线安装PostgreSQL数据库的文章。PostgreSQL是一款功能强大的开源对象-关系型数据库管理系统。由于某些环境中无法直接访问…

免费开源的工业物联网(IoT)解决方案

什么是 IoT? 物联网 (IoT) 是指由实体设备、车辆、电器和其他实体对象组成的网络,这些实体对象内嵌传感器、软件和网络连接,可以收集和共享数据。 IoT 设备(也称为“智能对象”)范围广泛,包括智能恒温器等…

SpringBoot+Vue(2)excel后台管理页面

一、需求 SpringBootVue写excel后台管理页面(二级页面打开展示每一个excel表,数据库存储字段为“下载、删除、文件详情、是否共享、共享详情”) 二、解答 后端(Spring Boot) 1. 项目设置 使用Spring Initializr创建一个新的Spring Boot项目…

深入理解 Elasticsearch 分页技术

原文链接:https://zhuanlan.zhihu.com/p/609576187 Elasticsearch 是一款分布式的搜索引擎,提供了灵活的分页技术。本文主要介绍 Elasticsearch(简称 ES) 的几种分页技术,并深入分析各种分页技术的优缺点及应用场景。 …

基于AT89C51单片机篮球计时计分器的设计(含文档、源码与proteus仿真,以及系统详细介绍)

本篇文章论述的是基于AT89C51单片机篮球计时计分器的设计的详情介绍,如果对您有帮助的话,还请关注一下哦,如果有资源方面的需要可以联系我。 目录 绪论 原理图 ​编辑 仿真图 系统总体设计图 代码实现 系统论文 资源下载 绪论 本次…

内网服务器通过squid代理访问外网

一、背景 现在要对172.16.58.158服务器进行openssh升级操作,我用之前写好的升级脚本执行后,发现没有备份旧的ssh程序文件,然后还卸载了oenssl-devel,然后我发现其他服务器ssh该服务器失败。同时脚本执行时报错“ configure: error: *** zlib.h missing - please install first …

windows查看局域网所有设备ip

windows如何查看局域网所有设备ip 操作方法 一 . 在搜索栏里输入cmd 二 .在命令行黑窗口输入arp -a 三 . 最上面显示的动态地址就是所有设备ip

day20、21、22补卡

235. 二叉搜索树的最近公共祖先 这道题的解题思路,我想了一会都没想出来,看了题解想:对于二叉搜索树,当我们从上向下去递归遍历,第一次遇到 cur节点是数值在[q, p]区间中,那么cur就是 q和p的最近公共祖先。…

Database数据库 vs Data Warehouse数据仓库 vs Data Mart数据集市 vs Data Lake数据湖

1.DATABASE 数据库 数据库是一个结构化的数据集合,用于存储、管理和检索数据。数据库设计用于支持事务处理(OLTP,Online Transaction Processing)和日常操作。 数据库通常由数据库管理系统(DBMS)控制&…