使用人工智能帮忙盲人进行环境地图绘制

news2024/12/27 11:18:07

介绍

据报道,仓鼠、狼、黑猩猩和蝙蝠等智能动物可以学习环境地图,并选择适当的行动路径。

因此,机器人自我定位和绘制环境地图以实现智能行为被认为是非常重要的。

另一方面,如果通过机器学习(如神经网络)来解决一项任务,使其朝着某个目标前进,则无需任何明确的映射机制就能成功实现目标。

这一机制尚未被人们所了解,而了解这一机制具有重要的学术意义和现实意义。

因此,本文将研究映射机制是否是一种新出现的现象。

本文的新颖之处在于,它关注的是在非常严格的盲目条件下,人工智能是否可以通过简单的奖励来自然学习地图(地图出现),并提出了多种有效的实验来阐明这一点。本文的研究结果包括

  1. 出色的行动规划能力:在新环境中出色地实现目标(成功率约为 95%)。
  2. 使用长期记忆:在一次发作中记忆约 1 000 步过去的经历
  3. 智能行为的表现:学习捷径。
  4. 环境地图和碰撞检测神经元的表达:人工智能学习到的内部表征暗示了环境地图和碰撞检测神经元。
  5. 选择性、任务依赖性地图:忘记探索性迂回路线

论文地址:https://arxiv.org/abs/2301.13261

卓越的行动规划能力

我们使用一座真实房屋的三维复制品来评估人工智能行动规划任务的性能。一个直径 0.2 米、高 1.5 米的圆柱体被视为人工智能的物理实体,并被模拟在仿真房屋内移动。

解决问题

每一集,人工智能的环境都是随机初始化的。目标点为(xg、yg、zg);人工智能可以执行四个动作:向前移动 0.25 米、左转 10°、右转 10°,并宣布已达到目标。设定最多允许 2000 个动作。

图 1 是人工智能行动环境的一个示例。图 1 中的蓝色立方体是起点,红色立方体是目标点。为了检验人工智能的泛化能力而非记忆力,我们对人工智能在从未见过的环境中达到目标的能力进行了评估。

人工智能会得到与目标的相对位置(Δx、Δy、Δz)和目标的相对方向(Δθ)。这可以说是给了鼹鼠一个全球定位系统和指南针。虽然鼹鼠是一种盲目的动物,但据说它能够通过整合自己走过的路径和捕捉地球磁场来确定自己的位置,这与给它一个全球定位系统和指南针类似。

图 1.行动计划任务。

在这种情况下,设定了两个评估指标来评估行动规划能力。一个是 “成功”,如果人工智能能宣布在距离目标 0.2 米以内到达目标,即为成功。另一个是 “最短路径长度(SPL)”。这一指标表明,通往成功的路径越短,行动的效率就越高。

人工智能算法

人工智能行为是根据长短期记忆(LSTM)模型确定的。在这里,目标位置(xg, yg, zg)、与目标的相对位置(Δx,Δy, Δz)、目标方向 Δθ和与目标的接近指数 min(||(xg,yg,zg)-(Δx,Δy, Δz)||,0.5)被作为 LSTM 的输入。每种行为都被映射到 32 维,并与前一种行为的 32 维嵌入连接起来,形成 160 维的 LSTM 输入;LSTM 的输出被馈送到全耦合层,该层输出行为空间分布和价值函数的估计值。该 LSTM 的模型参数通过强化学习 PPO(近端策略优化)进行优化。此时的奖励就是朝着目标前进。

评估结果

与之相比,受昆虫启发的行动规划算法 “虫虫”(Bug)是一种沿着目标方向基本直线前进的算法,当它碰到墙壁时,就会沿着墙壁前进。

当沿着墙壁前进时,可以选择向左或向右前进,此时,总是向右的 "总是向右的虫子 "和总是向左的 "总是向左的虫子 "都会被评估。此外,作为一种理想的虫虫算法,虫虫会根据情况选择向左或向右前进,以尽量缩短与目标的距离,这种情况被评估为 Clarivoyant 虫虫算法(虫虫不可能学会走哪条路,但我们正在研究如果可能的话的性能)。

图 2 举例说明了 “永远向右的虫子”(黑底白字)、“永远向左的虫子”(橙色)、“好奇的虫子”(浅蓝色)和人工智能(特工,蓝色)的行动路径比较。

图 2.不同方法下的不同行为路径。

从这个例子可以看出,虽然出现条纹的路径是千里眼虫的路径,但千里眼虫到达目标的效率非常高,因为这些路径与 "虫虫向右 "和 "虫虫向左 "的路径重叠。在 "只向左 "或 “只向右”( )的情况下,有些路径在到达目标时会出现绕远路的情况。另一方面,拟议的人工智能(Agent)显示,它能够选择相对平滑的路线。

表 1 显示了与人工智能(视觉)相比的性能,后者拥有深度传感器,可被视为具有视觉。

表 1.与视力正常的人工智能的比较(视力正常)

与视力正常的人工智能(视力正常)相比,拟议的盲人人工智能(盲人)虽然不如千里眼虫,但到达目标的成功率(成功)更高,到达目标的路径长度(SPL)更短。

使用长期记忆

我们研究了人工智能如何利用内存。具体来说,我们研究了记忆长度与性能指标之间的关系,以确定它是在利用短期记忆(关于碰撞是否发生在最近一步的信息)还是长期记忆(关于碰撞是否发生在几百步之前的信息)。

图 3 显示了内存长度与性能指标之间的关系,通过对 LSTM 进行精心设计,使其无法利用之前步骤的信息,对性能指标进行了评估。

图 3:内存长度与性能指标之间的关系。

两个评估指标 SPL 和 Success 的性能在内存长度达到约 1000 步时才达到饱和。这说明,所提出的人工智能可以通过利用长期内存来提高性能。

智能行为的体现

为了研究人工智能能记住哪些信息,我们进行了一次探测实验。在这个实验中,人工智能被要求规划从图 4 中绿色球体所代表的起点到红色球体所代表的目标点的行动,然后从起点再次瞄准目标点,同时继承已达到目标的人工智能的记忆。

图 4:探针实验。

结果显示,人工智能走的第一条路径是蓝色路径所指示的路径,但当它再次尝试从起点到达目标时,它走的是紫色路径。这说明它可以走捷径。虽然人工智能应该是盲目的,但它却像盲人一样选择了一条路径。

环境地图和碰撞检测神经元的表达。

如果人工智能能根据其学习到的神经元对障碍物的存在与否进行分类,那么它就能得到一张环境地图(相当于地图,因为没有障碍物的路线就是可通行的路线,而这里的地图显示的是可通行的路线)。根据障碍物的存在预测并从人工智能记忆中提取的环境地图如图 5 所示。

图 5:正确和预测的障碍物存在/不存在情况

图 5 显示了 A 和 B 两个示例,其中正确答案(地面实况)和预测结果(预测)基本相似。

接下来,我们研究了碰撞在人工智能内部表示(LSTM 神经元)中的结构:使用人工智能训练过的神经元作为特征,我们重新训练了一个稀疏线性分类器来分类碰撞是否存在,并提取了 10 个对碰撞分类影响较大的神经元。然后,我们使用 t-SNE 将其低维化到二维特征空间,并对行为进行聚类,结果如图 6 所示。

图 6:人工智能对碰撞的内部表示聚类

颜色表示碰撞或未碰撞,绿色表示未碰撞,红色表示碰撞。箭头表示前一个动作,前进表示前进,右转表示右转,左转表示左转。聚类的结果是 “前进-无碰撞”、"前进-碰撞 "和 “转弯-无碰撞”(2 个聚类)。数字和相应图像代表场景。

向前-向前-碰撞神经元群和向前-向前-无碰撞神经元群的产生表明,检测向前运动是否发生碰撞的神经元已经得到表达。

选择性、任务依赖性地图

人工智能的记忆力有限,这表明它会记住重要信息而遗忘不必要的信息;为了研究人工智能记住了哪些信息,我们调查了人工智能能否从其记忆中预测过去的位置。 具体来说,我们训练了一个网络,让它根据当前 LSTM 的输出预测过去的位置,并检查预测误差。预测误差越大,说明位置记忆越好。

图 7显示了对过去位置的预测误差(误差越小,对过去位置的记忆效果越好)。

图 7.对过去位置的预测误差因路线而异(误差越小,对过去位置的记忆效果越好)。

横轴为过去的步数,纵轴为预测误差。线的颜色表示过去位置的分类(哪种路径)。绿色(出口)是指包含在循环路径(循环出口)最后 10%步数中的位置,橙色(偏离)是指包含在循环路径(人们将其归类为绕一圈后返回原位的路径)中的位置。蓝色(Non-Excursion)为非循环路径中的位置。

基本上,预测误差会随着时间的推移而增大,但预测误差ogisa因路径而异。包含在循环路径中的地点的预测误差较大,而包含在非循环路径中的地点的预测误差较小。

循环路径可以被视为迂回路径,因为它们可以被视为迂回路径,但很明显,人工智能会忘记这些路径,而很好地记住那些不会忘记的路径。

另一方面,属于循环的一部分但退出循环的路径预测误差较小,这可以解释为记忆路径是避免再次进入同一循环的地标。

结论

本文介绍的论文表明,当一个盲人人工智能接近目标时会得到奖励,并被要求完成一项任务,该任务要求盲人人工智能从头到尾规划一条路线并采取行动,盲人人工智能学会了绘制环境地图。

他们能很好地利用自己的长期记忆,如果能到达目标就能选择捷径,只记住和忘记迂回路线的地标,能发现碰撞,学会沿着墙壁移动,表现出惊人的到达目标的能力,而不会让他们觉得自己是盲人。

虽然这不是一篇提出新算法的论文,但它设计了认知科学家和人工智能研究人员都感兴趣的问题,巧妙地进行了实验来回答这个问题,并对实验进行了清晰的描述,这些都被认为是优秀论文。

这篇论文在结构上很独特,有一系列有趣的标题,就像一篇通俗文章,这在一般论文中是没有的。附录中具体介绍了详细的实验装置,在明确描述技术细节的同时,突出了问题的答案。

国际人工智能大会(ICLR)是顶级人工智能大会之一,它先入为主地认为,通过数学理论和新颖高效的技术进行理解将受到高度重视,但看到通过本文介绍的论文等方法对行为学习的科学理解受到高度重视,我们可能会在未来看到更多对人类和动物的科学理解。基于人工智能的研究可能会促进这方面的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1834653.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【scrapy】爬虫,从429状态码说起

许久未爬,发现爬不动了,哈哈哈,记录下这次失败的爬取经历 问题描述 针对这样的一个网站: https://www.farfetch.cn/cn/shopping/women/dresses-1/items.aspx?page1&view96&sort3 需求: 1.需要爬取列表页…

MySQL中的客户端选项(二)

在全局选项文件之后读取此选项文件,但(在Unix上)在用户选项文件之前读取。如果文件不存在或无法访问,则会发生错误。如果file_name不是绝对路径名,则会相对于当前目录进行解释。 仅使用给定的选项文件。如果文件不存在…

HACH哈希紫外可见光分光光度计维修DR6000

DR3900可见分光光度计内置准双光束光学系统,自动校准波长,该可见光分光光度计预置200多个用户程序,几乎覆盖常规水质参数,彩色触屏搭载中文操作界面,可自动分析检测并存储2000组实验数据,是一款测量准确的可…

《EDA技术》 Quartus图3—4实验报告

目录 一:结构描述方式 1.1创建工程 1.1.1点击New Project Wizard,创建t34工程。 1.1.2设置工程路径和名称(t34) 1.2设计门电路 1.2.1设计三输入或非门VHDL程序 1.2.2 设计非门VHDL程序 ​编辑 1.2.3 设计二输入或非门VHD…

ubuntu16因swap分区uuid错误启动慢排查

感觉ubuntu16启动特别慢 dmesg查看如下: [ 10.050123] audit: type1400 audit(1718608189.395:11): apparmor"STATUS" operation"profile_load" profile"unconfined" name"webbrowser-app//oxide_helper" pid708 comm&q…

【测试专题】系统测试报告(原件Word)

软件测试报告在软件开发过程中起着至关重要的作用,主要有以下几个主要原因: 1、确保软件质量 2、提供决策支持 3、记录测试过程和结果 4、促进沟通和协作 5、符合标准和法规要求 6、改进测试流程和策略 7、降低风险 软件开发全套资料获取进主页或者本文末…

查询Kafka集群中消费组(group)信息和对应topic的消费情况

个人名片 🎓作者简介:java领域优质创作者 🌐个人主页:码农阿豪 📞工作室:新空间代码工作室(提供各种软件服务) 💌个人邮箱:[2435024119qq.com] &#x1f4f1…

一款超好用的国产 Redis 可视化工具,真香!

哈喽,大家好,我是黑板报君,一个资深的软件开发工程师,致力于为大家分享各领域优质开源项目,开发前沿技术以及互联网技术圈动态。 添加图片注释,不超过 140 字(可选) 日常开发过程中…

VBA学习(5):批量生成小饼图

之前给大家分享了如何用一个函数制作各种常见图表,之后有朋友问,下图中表示精确占比的饼图是怎么批量生成的? 批量生成小饼图有两种常用的方法,一种是用插件,比如Sparklines;另外一种是自己动手丰衣足食&am…

UDS诊断、ECU刷写、OTA升级、Tbox测试、CANoe实操

每天的直播时间: 周一至周五:20:00-23:00 周六与周日:9:00-12:00,14:00-17:00 TBOX 深圳 涉及过T-BOX测试吗Ota升级涉及的台架环境是什么样的?上…

位图法-有效的数独

有效的数独,主要是判断每行每列每宫有无重复元素。 每行每列用二重循环,每宫比较复杂,需要考虑每一宫的坐标与二重循环ij对应关系 行i,每一宫3行,3列 x3*(i/3)j/3 y3*(i%3)j%3

计算机考研|双非计算机专业是考研还是就业?主要看这一点!

去看一看招聘就知道了,看看公司需要的开发或者计算机岗位要求的东西你在本科的时候有没有精通的 如果你发现:哎?看着招聘的要求好像本科多少都接触过,但现在已经忘得差不多了,或者是,哦,我知道…

金蝶云星空程序员开发快速入门

文章目录 一 前言1.1 学习步骤1.2 学习需知 二、学习金蝶*云星空的步骤2.1 下载金蝶*云星空安装到本地2.2 查看官网的学习资料2.3 如何使用C#进行插件开发2.4 sqlserver的表设计以及存储过程2.5 如何使用python进行插件的开发2.6 第三方程序如何调用金蝶*云星空的数据 三 后记 …

移动硬盘数据恢复,6个亲测有效方法公开!

“我的移动硬盘已经用了很久了,最近不知道是怎么回事,里面有部分重要的数据居然不见了。想问问大家有什么方法可以恢复移动硬盘的数据吗?” 在数字时代的浪潮中,移动硬盘已成为我们存储和携带数据的重要工具。从海量的工作文档、珍…

在虚拟机中安装centos系统,及通过安装包安装jdk1.8,mysql5.7,redis7.2

在虚拟机中安装centos系统,及通过安装包安装jdk1.8,mysql5.7,redis7.2 第一章 CentOS7的下载1.1.使用阿里云开源镜像站下载。第二章 CentOS7的配置2.1.通过VMware 创建一个CentOS7虚拟机2.1.1.打开软件,点击如箭头所示按钮,创建虚拟机2.1.2.点击自定义,之后点击下一步2.1.3…

【触想智能】工业显示器定制时需要注意的重点问题

随着工业自动化的不断发展,工业显示器越来越重要。不同于普通的娱乐和商业应用,工业显示器需要更加耐用、可靠、安全,并且满足特定的工业环境和应用需求。 因此,仔细考虑和选择适合自己的工业显示器至关重要。本文将介绍一些您在进…

【YOLOv10改进[注意力]】使用注意力MLCA改进C2f + 含全部代码和详细修改方式 + 手撕结构图

本文将进行使用注意力MLCA改进C2f的实践,助力YOLOv10目标检测效果的实践,文中含全部代码、详细修改方式以及手撕结构图。助您轻松理解改进的方法。 改进前和改进后的参数对比: 目录 一 MLCA 二 使用注意力MLCA改进C2f 1 整体修改 2 配置文件

World Map Globe Edition 2

只需点击几下,World Political Map - Globe Edition 2就会在场景添加一个美丽且交互式的3D世界地图。将地球预制件拖动到场景中并自定义外观。 完整的资产,具有强大的可视化功能、示例和丰富的API,适用于构建VR、桌面和移动游戏和应用程序。 主要功能: - 在不访问互联网的情…

如何在前端应用程序中实现国际化(以英语为例)

如何在前端应用程序中实现国际化(以英语为例) 一、准备工作确定翻译需求:选择国际化库:创建语言文件: 二、实现步骤安装并引入国际化库:加载语言文件:在组件中使用翻译:实现语言切换…

对话华师大上海人工智能金融学院院长邵怡蕾:AI时代,人文见长的学校会非常有优势

金融,是关乎老百姓钱袋子的国民经济血脉,更是国家核心竞争力的重要组成部分。AI,是当之无愧最具「活力」的行业,也是千行百业革故鼎新的动力引擎。这两个对人类社会发展影响至深的行业,目前仍未展现出令人耳目一新的奇…