MIT:只需一层RF传感器,就能为AR头显赋予“X光”穿透视力

news2024/9/21 19:05:05

近年来,AR在仓库、工厂等场景得到应用,比如GlobalFoundries、亚马逊、菜鸟裹裹就使用摄像头扫描定位货品,并使用AR来导航和标记。目前,这种方案主要基于视觉算法,因此仅能定位视线范围内的目标。然而,在一些堆满包裹的仓库,或是充满材料和隔层的厂房中,用视觉算法很难定位堆在底下、被遮挡的包裹。

因此,MIT Media Lab旗下的信号动力小组(The Signal Kinetics)提出了一种,将AR与射频(RF)技术结合的定位方案,并宣称可赋予使用者“X光”穿透视觉。据悉,该方案名为X-AR,其形态是一种柔性、拱形天线阵列,可叠加在HoloLens 2等AR头显外层,用于识别周围的RFID标签。将无线射频信号与AR头显的视觉功能结合后,可帮助用户快速定位和导航隐藏的目标物品,比如在仓库、物流等场景,可提醒工作人员注意隐藏在遮挡物后的放错位置的物品。

关于X-AR射频方案

细节方面,X-AR外观看起来像眼罩,重量不到1g,其形状专为AR眼镜/头显设计,可以很好的贴合头显前盖,不会遮挡头显上的摄像头或传感器。X-AR的接收器可识别超高频RFID信号,市面上很多产品已经使用RFID标签,比如服装、消费级商品、库存等等,而美国93%零售商已经采用UHF RFID技术(超高频RFID)。

RFID标签的优势在于,成本低、不用电,可规模化使用,适合用来管理仓库。相比于市面上其他RFID定位方案,X-AR的优势是采用单回路设计,因此体积更小,可环绕HoloLens 2等头显前盖的轮廓,而且天线之间不需要米级间距,也不需要在预设轨迹上移动。

那么X-AR是如何将RFID与与AR结合的呢?原来,X-AR不仅结合了HoloLens 2的计算机视觉功能,还结合AR用户界面,来很好的管理和分类库存。其使用方法如下:

首先,你要在AR中用手势选择想要在仓库中寻找的物品,比如某一件T恤。接着,X-AR系统通过传感器阵列发送无线信号,这些无线信号可激活周围的RFID标签,并接收返回的识别码。即使目标在箱子里或是被其他物品遮挡,X-AR也能接收到它返回的独特识别码。接着,X-AR根据收到的数据来生成3D场景图,当使用者在空间中移动时,该系统还会定位头显的移动路径,并结合RF检测结果,来预测场景中的目标RFID与头显的相对位置。

与此同时,X-AR还会在使用者运动时,扫描周围环境的位置,目的是缩小、锁定目标所在的范围。当X-AR识别到目标物体时,便会以AR的形式显示导航。此外,为了验证用户找到目标物体,X-AR还将识别到的手势动作与RF信号结合,以确认用户完成目标拾取。

这项研究主要有三大创新:

◎ AR-conformal宽带天线(RFID天线):特点是基于柔性设计,可以很好的贴合HoloLens 2的前盖,而且重量轻,不会给现有的头显产品带来更大负担,而且不阻挡头显传感器或用户视线;

◎ RF-Visual合成孔径雷达(SAR):将AR定位算法、计算机视觉摄像头、RF传感结合,即使用户在环境中自然行走,也能定位隐藏在视野之外的目标;细节方面,X-AR先用计算机视觉来实现自我定位,然后结合用户在移动时收集的RFID信息来创建合成孔径雷达(SAR),并以高精度定位RFID标记;

◎ 基于RF和视觉的验证步骤:通过追踪手势,X-AR可识别使用者拿到目标物体的动作,然后识别物品被拿起来时RFID的运动,执行反向SAR来确认找到目标物品。

性能与局限

理论上,天线可以放在头显顶部、用户肩膀上,甚至手中,X-AR的设计优势在于,它和头显很好的结合,不遮挡视线,也不占手,因此不影响使用者在仓库中执行其他任务。

经过234次性能试验,科研人员发现X-AR的定位效果非常准确,准确率达到95%以上,误差小于9.8厘米。不过该方案也存在一些局限,比如其原型机为有线设计,需要连接额外的电源或计算单元。科研人员指出,未来计划采用市面有售的RFID读取芯片,并集成到AR头显内部。

此外,X-AR仅支持单机运行,不支持多AR头显协作,而且识别范围仅3-4米,未来有望继续提升。值得注意的是,X-AR的传输功率低于市面上的穿戴式RFID传感器,因此未来可以在场景中使用RFID传感架构,为RFID标签供电。此外,RFID无法定位金属盒内的物品,智能读取金属或液体瓶子表面上的RFID标签。

随着物联网技术发展,RFID的应用范围越来越广泛,在仓储物流、医药、农业、畜牧业、汽车、电力、交通、零售等场景均可应用,比如超市、服装店、无人智能货柜、仓库等场景。其优势包括:扫描速度快、具有穿透性(可穿透纸张、木材、塑料等非金属或非透明材质)、数据储存容量大、小型化、外形多样化。

科研人员指出,X-AR方案在零售、工业等领域有多种应用场景,比如在仓库中,X-AR可指导员工补货、打包和处理退货,从而提升工作效率。而在零售店中,X-AR可帮助店员快速查找店内被乱放的商品,帮助客人找货,以及填补货架等等。在智能工厂领域,X-RA可以很好的将组装任务、工具信息可视化,还可以定位特定的元件,指导一线工人更好的执行工作,从而提升效率、降低失误率。

对于AR头显来讲,X-AR的意义还包括拓展了AR定位的范围,即使是摄像头和视觉算法感知范围外的目标,也能快速定位。未来,X-AR还有望与HoloLens 2之外的其他商用AR头显结合。参考:MIT

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/377753.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python基础—字符串操作

(1)字符串: Python内置了一系列的数据类型,其中最主要的内置类型是数值类型、文本序列(字符串)类型、序列(列表、元组和range)类型、集合类型、映射(字典)类型…

论文阅读 | Cross-Attention Transformer for Video Interpolation

前言:ACCV2022wrokshop用transformer做插帧的文章,q,kv,来自不同的图像 代码:【here】 Cross-Attention Transformer for Video Interpolation 引言 传统的插帧方法多用光流,但是光流的局限性在于 第一&…

Android Qcom Audio架构学习

总结: Android Audio不简单呀,一个人摸索入门不容易的,研究了一段时间,感觉还不是很懂,但以下的知识对入门还是有帮助的。 Audio架构中的名词 FE(Front End) 提供pcm的设备信息,将数据从用户空间传输到音…

【大数据离线开发】8.2 Hive的安装和配置

8.3 Hive的安装和配置 安装模式: 嵌入模式 :不需要使用MySQL,需要Hive自带的一个关系型数据库:Derby本地模式、远程模式 ----> 需要MySQL数据库的支持 安装 hive 安装包 1、解压tar -zxvf apache-hive-2.3.0-bin.tar.gz -C…

美格智能发布高性价比5G CPE解决方案SRT838I,赋能5G FWA行业数字化转型

2月27日,在MWC 2023世界移动通信大会上,美格智能重磅发布高性价比5G CPE解决方案SRT838I,该方案搭载高通骁龙X62调制解调器及射频系统WCN6856高速5G解决方案设计,其具有广覆盖、强信号、高速率等特点,非常符合5G CPE的…

.NET 导入导出Project(mpp)以及发布后遇到的Com组件问题

最近公司项目有一个对Project导入导出的操作,现在市面上能同时对Project进行导入导出的除了微软自带的Microsoft.Office.Interop.MSProject,还有就是Aspose.Tasks for .NET。但因为后者是收费软件且破解版的现阶段只到18.11,只支持.net Frame…

【博学谷学习记录】超强总结,用心分享丨人工智能 多场景实战 常用英文缩写概念总结

目录PV(Page View)UV(Unique Visitor)CPM(Cost Per Mille)CPC(Cost Per Click)CPA(Cost Per Action)CPI(Cost Per Install)ACU(Average concurrent users)PCU(Peak concurrent users)ARPU(Average Revenue Per User)ARPPU(Average Revenue Per Paying User)LTV(Life Time Value…

Windows系统部署瀚高数据库并在SuperMap iDesktop中使用

目录前言一:Windows系统部署瀚高数据库二:对数据库进行PostGIS扩展三:SuperMap iDesktop中新建HighGoDB数据库型数据源作者:kxj 前言 瀚高数据库是一款对象-关系型数据库,拥有非常丰富的数据库基本功能,涵盖…

【数据结构与算法】图 ( 图的存储形式 | 图的基本概念 | 图的表示方式 | 邻接矩阵 | 邻接表 | 图的创建 | 代码示例 )

文章目录一、图的存储形式二、图的基本概念三、图的表示方式1、邻接矩阵2、邻接表四、图的创建 ( 代码示例 )一、图的存储形式 线性表 中的元素 , 有 一个 直接前驱 和 一个 直接后继 ; 树 中的元素 , 有 一个 直接前驱 和 多个 直接后继 ; 图 中的元素 , 有 多个 直接前驱 和…

常见的视频文件格式有哪些?

常见的视频文件格式有哪些?常见在线流媒体格式:mp4、flv、f4v、webm移动设备格式:m4v、mov、3gp、3g2RealPlayer :rm、rmvb微软格式 :wmv、avi、asfMPEG 视频 :mpg、mpeg、mpe、tsDV格式 :div、…

【学习笔记】构建小型金融知识图谱(github项目)

前言 需要构建农业知识图谱,先来学习一下构建知识图谱的基本流程和套路,熟悉过程方便 科研 后续工作的开展,写下此篇博客作为我的笔记吧~ 参考代码来源:github项目 jm199504/Financial-Knowledge-Graphs 1.知识图谱存储方式 知…

intel的集成显卡(intel(r) uhd graphics) 配置stable diffusion

由于很多商务本没有独立显卡,只有Intel的集成显卡,在配置安装stable diffusion 时候需要特殊对待,参考不少帖子,各取部分现稍加整合。整体思路分两个部分:第一步是先配置环境,主要是安装Anaconda Pytorch&…

Biotin-PEG-SVA,生物素聚乙二醇琥珀酰亚胺戊酸酯,可用于检测或分子标记

Biotin-PEG-SVA 结构式:PEG分子量: 1000,2000,3400,5000,10000中文名称:生物素聚乙二醇琥珀酰亚胺戊酸酯,生物素-PEG-琥珀酰亚胺戊酸酯英文名称:Biotin-PEG-SVA &#xf…

自动化测试项目实战 ——12306火车票网站自动登录工具

还记得前几年春运,12306火车票预订网站经常崩溃无法登录吗。 今天我们就开发一个12306网站自动登录软件。 帮助您轻松订票 通过前两篇博客Fiddler教程和HTTP协议详解,我们了解了Web的原理. Web的原理就是,浏览器发送一个Request给Web服务器…

torchserve安装、模型的部署与测试(基于docker)

问题描述 pytorch 一直很受大家的欢迎,但是作为一个深度模型,与外界复杂的业务需求交互其实是一件比较麻烦的事情,这里 torchserve 提供一个基于 TCP 的交互方法,算法模型部署后,用户可以通过提交 post 请求&#xff…

今天面了个腾讯拿25K出来的软件测试工程师,让我见识到了真正的天花板...

今天上班开早会就是新人见面仪式,听说来了个很厉害的大佬,年纪还不大,是上家公司离职过来的,薪资已经达到中高等水平,很多人都好奇不已,能拿到这个薪资应该人不简单,果然,自我介绍的…

html实现浪漫的爱情日记(附源码)

文章目录1.设计来源1.1 主界面1.2 遇见1.3 相熟1.4 相知1.5 相念2.效果和源码2.1 动态效果2.2 源代码2.3 代码结构源码下载更多爱情表白源码作者:xcLeigh 文章地址:https://blog.csdn.net/weixin_43151418/article/details/129264757 html实现浪漫的爱情…

Vue3 组合式函数,实现minxins

截至目前,组合式函数应该是在VUE 3应用程序中组织业务逻辑最佳的方法。它让我们可以把一些小块的通用逻辑进行抽离、复用,使我们的代码更易于编写、阅读和维护。 一. 什么是“组合式函数”? 根据官方文档说明,在 Vue 应用的概念中…

你还不会用CAD一键布置停车位?赶紧学起来!

在设计CAD建筑图的过程中,你还在一个一个地画停车位吗?那未免也太低效了吧!今天,小编用浩辰CAD建筑软件来教大家一键布置停车位,赶紧学起来吧! 浩辰CAD建筑软件是行业应用最广泛的创新型建筑设计专业软件&…

2023软件测试金三银四常见的软件测试面试题-【接口测试】

九、接口测试 9.1 接口测试怎么测 (jmeter版本) 首先开发会给我们一个接口文档,我们根据开发给的接口文档,进行测试点的分析,主要是考虑正常场景与异常场景,正常场景,条件的组合,…