论文解读 | 基于蒙特卡罗树搜索的触觉目标识别主动末端执行器姿态选择

news2025/4/16 7:25:40

原创 | 文 BFT机器人

本论文提出了一种新颖的方法,使用仅触觉来进行主动物体识别。该算法通过蒙特卡罗树搜索来选择最佳的手腕姿态序列进行物体识别。

具体来说,该算法将问题建模为马尔可夫决策过程(MDP),并通过观察和动作来优化策略。该算法的核心思想是,连续触觉特征与机器人之间的运动相关联。本地特征不是唯一的,会在对称部位和相似曲率处重复。

将它们在物体上离散化会创建共同的特征,可以建模为概率分布,该分布可以在观察和动作的条件下进行建模,而不受大状态空间维数的影响。在物理引擎和真实机器人上进行的实验结果表明,该算法可以在不同的环境中实现高效的物体识别。

图1 左:实验设置。右:一个自适应选择的姿势

01 算法如何选择最佳的姿态序列对物体识别?

该算法通过蒙特卡罗树搜索来选择最佳的手腕姿态序列进行物体识别。具体来说,该算法将问题建模为马尔可夫决策过程(MDP),并通过观察和动作来优化策略。该算法的核心思想是,连续触觉特征与机器人之间的运动相关联。

本地特征不是唯一的,会在对称部位和相似曲率处重复。将它们在物体上离散化会创建共同的特征,可以建模为概率分布,该分布可以在观察和动作的条件下进行建模,而不受大状态空间维数的影响。

02 使用触觉传感进行物体识别的优势是什么?

与基于视觉的识别相比,使用触觉传感进行物体识别的优势在于,触觉传感器可以在一些视觉不可靠的环境下进行物体识别,例如在黑暗、灰尘、烟雾或模糊的水下环境中,透明和反射性物体,被遮挡的背面以及袋中的物体等。

此外,触觉传感器可以提供直接的物理外部感知,而视觉无法实现。在动物中,物理行动自然地与感知相结合,它们使用各种主动触觉感知器官。人类可以仅通过触摸恢复形状。虽然触觉传感的一些缺点可以通过更好的硬件来补偿,但其他缺点可以通过有效的规划和利用有限的输入来补偿。

03 论文原理

在PROBLEM FORMULATION部分,该论文阐述了他们的目标和问题的形式化描述。具体来说,他们的目标是通过仅使用触觉信息来选择最小的手腕姿态序列,以实现物体识别。

他们使用了一个现有的触觉物体描述符进行识别,并将观察到的三角形离散化为三维直方图。他们将问题建模为马尔可夫决策过程(MDP),并通过观察和动作来优化策略。他们还介绍了概率分布的概念,该分布可以在观察和动作的条件下进行建模,而不受大状态空间维数的影响。

最后,他们介绍了他们的主动概率模型,该模型可以在两个连续观察之间选择最佳的动作。

A. 描述符

在该论文中,作者使用了一个现有的触觉物体描述符进行识别,该描述符是基于三角形的。在观察到三角形之后,他们将三角形离散化为三维直方图。具体来说,他们将三角形的三个参数(即两个边和一个角)作为三个维度,并将它们分别划分为一定数量的区间。

然后,他们将每个观察到的三角形映射到直方图中的一个单元格,并将所有观察到的三角形组合成一个三维直方图。这个三维直方图就是他们用于物体识别的描述符。在后续的实验中,他们使用这个描述符来训练分类器,并用于物体识别。 

B. 马尔可夫决策

在该论文中,作者将问题建模为马尔可夫决策过程(MDP),并通过观察和动作来优化策略。具体来说,他们使用了一个有限时间段的MDP,其中状态空间X、动作空间A、转移函数T和奖励函数都是有限的。在每个时间步t,机器人观察到一个状态,并选择一个动作。然后,机器人根据转移函数T从状态转移到状态,并获得奖励。机器人的目标是最大化期望奖励的总和,即最大化折扣累积奖励:

在每个时间步t,MCTS算法使用一个策略网络来预测每个动作的概率,并使用蒙特卡罗模拟来评估每个动作的价值。然后,它选择具有最高价值的动作,并将其添加到动作序列中。最终,MCTS算法返回最佳的动作序列,机器人执行该序列以实现物体识别。

C.概率模型

在该论文中,作者提出了两个概率模型:一个是用于建模观察和动作之间关系的概率分布,另一个是用于在两个连续观察之间选择最佳动作的主动概率模型。这两个模型之间的区别在于它们的应用场景和目的不同。

概率分布模型用于建模观察和动作之间的关系,以便机器人可以根据观察值和动作来预测下一个观察值的概率分布。这个模型是基于直方图的,它将每个状态和观察值映射到一个直方图单元格,并将所有观察到的状态和观察值组合成一个直方图。这个模型的目的是为了帮助机器人更好地理解环境,并根据观察值和动作来选择最佳的动作序列,以实现物体识别。

主动概率模型用于在两个连续观察之间选择最佳的动作,以便机器人可以更快地识别物体。这个模型也是基于直方图的,它将每个状态和观察值映射到一个直方图单元格,并将所有观察到的状态和观察值组合成一个直方图。

然后,机器人使用这个模型来计算一个联合概率分布,以选择最佳的动作。这个模型的目的是为了帮助机器人更快地识别物体,并在有限的时间内选择最佳的动作序列。

因此,这两个模型的应用场景和目的不同,但它们都是基于直方图的概率模型。

图2 一个小的示例树。高亮部分表示最大奖励路径。节点标签是观测名称、最近邻距离、树深度t和直方图中项目数。NN距离与成反比。边缘标签是+1时的动作名称和奖励。

D.实验效果

1. 在模拟器上,作者比较了他们的方法与随机策略和贪婪策略。结果表明,他们的方法在物体识别方面表现最好,而且比其他方法更快地识别物体。

2. 在真实机器人上,作者比较了他们的方法与贪婪策略。结果表明,他们的方法在物体识别方面表现最好,而且比贪婪策略更快地识别物体。

3. 在模拟器上,作者比较了他们的方法与其他基于视觉的物体识别方法。结果表明,他们的方法在物体识别方面表现最好,并且比其他方法更快地识别物体。

4. 在真实机器人上,作者比较了他们的方法与其他基于视觉的物体识别方法。结果表明,他们的方法在物体识别方面表现最好,并且比其他方法更快地识别物体。

综上所述,作者的方法在模拟器和真实机器人上都取得了良好的效果,并且在物体识别方面表现最好。这些实验结果表明,作者提出的方法是有效的,并且可以用于实际应用中。

图3 在测试时由树策略选择的真实机器人动作。

图4 论文效果

论文资料:[1]Zhang,MM,Atanasov,et al.Active End-Effector Pose Selection for Tactile Object Recognition through Monte Carlo Tree Search[J].IEEE INT C INT ROBOT, 2017.

更多精彩内容请关注公众号:BFT机器人

本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/646222.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

记一次简单的SQL调优

记一次简单的SQL调优 前言排查分析问题分析SQL的执行流程存在的问题优化思路 验证解决验证执行流程一些执行计划的基本知识 优化先执行where条件过滤不需要的行,再进行左连接提示排序走索引为常用查询条件创建索引调整查询条件的顺序 前言 相信大家对后端数据库的S…

【Uniapp】小程序携带Token请求接口+无感知登录方案2.0

本次改进原文《【Uniapp】小程序携带Token请求接口无感知登录方案》,在实际使用过程中我发现以下bug: 若token恰好在用户访问接口时到期,就会直接查询为空,不反映token过期问题(例如:弹窗显示订单查询记录…

使用python脚本将视频素材转化为图片数据集并打标

1.前言 在深度学习的训练过程中,第一步要做的制作数据集。本文所介绍的内容就是在面临视频素材时,如何将这个视频素材转换成图片,并将生成的图片给打上标签。 2.视频转图片的代码展示 # codingutf-8 import cv2 import osroot "F:\H…

MySQL数据库及基础操作

MySQL数据库 一、数据库的基本概念二、数据库发展史1、第一代数据库2、第二代数据库3、第三代数据库 三、当今主流数据库介绍四、关系型数据库1、结构2、理解关系数据库 五、非关系数据库六、数据库基本操作1、常用的数据类型2、查看数据库结构3、SQL语句3.1 DDL3.2 DML3.3 DQL…

pycharm 命令行创建版本库

pycharm中已建好的项目如何上传自已的git服务器中 通过命令行创建一个新的版本库 touch README.mdgit initgit add README.mdgit commit -m "first commit"git remote add origin ssh://XXXXip:29418/newbb.gitgit push -u origin master 通过命令行推送一个已存在的…

数据挖掘课件01-07

1、数挖的定义、产生原因,解决问题 数据挖掘就是寻找数据中隐含的知识并用于产生商业价值。 数据挖掘产生动因:海量数据、维度众多、问题复杂 解决问题:分类问题,聚类问题、回归问题、关联问题、 分类算法:C4.5&…

微信如何设置快速回复?

目前微信线上沟通已经成为绝大多数人士的首选,尤其不管是企业还是个人,都会利用微信打造私域。而做微信沟通的话,大家最为关心的就是怎么做到最快捷的回复对方。 可以看看这个功能,提前设置好常见问题的回复话术,可个…

JS + 浮动 + 递归实现图片瀑布流懒加载

思路 页面 pege 分成左浮动的数列 lineBox,每列中图片 sinImg 依次向下摆放每加载一张图片时,判断页面中哪列的高度最小,将当前图片放到最小的那列尾部监听当前图片 onload 事件,当前图片加载完成后,再加载下一张图片…

【python】前方弹幕高能:教你一键实现自动化指定直播间发送弹幕,为你喜欢的女主播疯狂打call叭~

前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 不知道你们平时看不看直播,每次看到界面中的滚动弹幕,还挺有意思。 无中生事—— 前几天看到喜欢的主播打比赛呢~ 精彩时刻恨不得双手打字打call的飞快,那激动的无语轮次了都&#…

Android生态下的Kotlin有哪些更新#GoogleIO 2023

Android生态下Kotlin有哪些更新#GoogleIO 2023 自Android官方宣布Kotlin作为Android开发的第一语言,过去将近6年时间。下面是GoogleIO 2023宣布的Android生态的4项重要更新。 Kotlin编译器2.0版本 如果你是一位Kotlin开发者,你可能会对听到这个消息感…

PMP®增持CSPM-2等级证书,免重新考试与学习,申请简单!

好消息!好消息!好消息! 2023年起,持有PMP证书的朋友可以直接增持一个同等级证书CSPM-2,不用重新考试,不用重新学习,原PMP证书不影响正常使用,相当于多了一个国标项目管理领域的证书…

前端和后端分别是什么?

从技术工具来看: 前端:常见的 html5、JavaScript、jQuery... 后端:spring、tomcet、JVM,MySQL... 毕竟,如果这个问题问一个老后端,他掰掰手指可以给你罗列出一堆的名词来,比如设计模式、数据库…

Golang gin middleware的编写与使用 context.Next函数

中间件 在web应用服务中,完整的一个业务处理在技术上包含客户端操作、服务器端处理、返回处理结果给客户端三个步骤。 在实际的业务开发和处理中,会有更负责的业务和需求场景。一个完整的系统可能要包含鉴权认证、权限管理、安全检查、日志记录等多维度…

【软件分析/静态分析】chapter3 课程03/04 数据流分析的应用(Data Flow Analysis)

🔗 课程链接:李樾老师和谭天老师的:南京大学《软件分析》课程03(Data Flow Analysis I)_哔哩哔哩_bilibili 南京大学《软件分析》课程04(Data Flow Analysis II)_哔哩哔哩_bilibili 这篇文章总结…

识别一切模型RAM(Recognize Anything Model)及其前身 Tag2Text 论文解读

img 总览 大家好,我是卷了又没卷,薛定谔的卷的AI算法工程师「陈城南」~ 担任某大厂的算法工程师,带来最新的前沿AI知识和工具,欢迎大家交流~ 继MetaAI 的 SAM后,OPPO 研究院发布识别一切模型(Recognize Any…

MySQL如何保证数据的可靠性(保证数据不丢失)

1. 结论: 只要redo log 和 binlog 保证持久化到磁盘,就能确保MySQL异常重启后,数据可以恢复。 2. 机制 WAL机制,(Write Ahead Log): 事务先写入日志,后持久化到磁盘。 3. binlog…

华为OD机试真题 JavaScript 实现【非严格递增连续数字序列】【2022Q4 100分】

一、题目描述 输入一个字符串仅包含大小写字母和数字,求字符串中包含的最长的非严格递增连续数字序列的长度,比如122889属于非严格递增连续数字序列。 二、输入描述 输入一个字符串仅包含大小写字母和数字,输入的字符串最大不超过255个字符…

合金氢化物动力学与瞬时流量计算

在经典的合金氢化物动力学描述中,有一种是用JMAK方程来描述和拟合合金的吸放氢过程,方程很简洁:,其中是反应程度或者百分比,表示合金氢化物吸氢或者放氢的程度,是该合金吸氢或放氢的一种特征常数&#xff0…

57、基于51单片机智能硬币分拣分类机电子存钱罐报警系统设计(程序+原理图+PCB源文件+Proteus仿真+参考论文+参考PPT+元器件清单等)

摘 要 近年来,随着我国经济的发展和社会的进步,邮政事业得到了空前发展。邮政通信网的技术含量不断增加,技术装备水平也在不断的提高,邮件处理已基本实现机械化,并且朝着自动化的方向迈进。本文着眼于我国当前邮政事…

Unity编辑器扩展-第一集-在菜单栏加入自己的按钮

一、概述 unity自己本身就是一个大的程序,我们看见的所有功能,都是用程序写出来的,但是根据各行各业不同的需求,有些时候我们制作时,想要自己编辑一些原有的功能。 二、本节目标效果展示 1.在菜单栏加入属于自己的一…