机器人抓取与操作的挑战与进展——挑战赛角度

news2024/9/28 15:33:13

从竞赛中看机器人抓取与操作的挑战与进展

  • 前言
  • 一、国际机器人竞赛有哪些?
  • 二、感知方面的挑战与进展
  • 二、抓取方面的挑战与进展
  • 三、操作方面的挑战与进展
  • 总结


前言

本文根据最近的机器人抓取和操作挑战赛 (Robotic Grasping andManipulation Competitions (RGMCs)),首先回顾了近年赛事,然后重点讨论了机器人操作领域的挑战和进展。


一、国际机器人竞赛有哪些?

在过去十几年,已经举办了很多关于机器人操作的赛事,这些赛事虽复杂程度不同,但共同推动着领域的发展。
这些赛事主要集中在抓取,操作,装配,甚至移动操作,如下表所示。

从赛事任务上分,分为固定任务和自由选择任务。

固定任务:即环境,操作物,规则都是提前规定好的。这类任务方便进行不同队伍之间的对比和相同队伍不同年份的方案对比。
但是这种任务的缺点是参赛队伍可能会使用过度工程化的方案来完成任务,获得尽可能多的分数。

自由选择任务:这类任务允许参赛队伍自由选择任务场景,来展示他们的优势。通常只做宽泛的限制,如使用统一的机器人平台或演示任务中需要包含某一共同子任务。
这类任务的缺点是不容易比较队伍之间的方案。

机器人竞赛汇总表-操作相关

Y. Sun, J. Falco, M. A. Roa and B. Calli, “Research Challenges and Progress in Robotic Grasping and Manipulation Competitions,” in IEEE Robotics and Automation Letters, vol. 7, no. 2, pp. 874-881, April 2022.

目前ICRA和IROS共同举办的RGMCs依然是主流赛事,具体可参考网址:https://cse.usf.edu/~yusun/rgmc/2024.html
ICRA2024举办的是第九届机器人抓取与操作挑战赛,今年共有两个赛道,包括基础技能赛道和制造赛道。

基础技能赛道包括四个子任务(队伍可专注一个或多个子任务),分别是布料操作,手内操作,杂乱拾取,和人机交接。
制造赛道主要是装配和拆卸任务,其中涉及到的零部件有皮带和线缆。

二、感知方面的挑战与进展

1)反光表面:

挑战:
近年来在相关竞赛中,已多次出现反光物品的抓取与操作,如勺子和钳子(下图a&b)。此外还有装配任务中的塑料底座,制造任务中的金属零部件(下图g)等。
这些反光部分不能被很好地检测到,增加了物体分割和位姿检测的难度,最终会导致任务的成功率下降。

进展:
2020 年,已有研究团队已经能够将不同的勺子区分开并完成位姿估计。他们采用的方法是控制照明,即用多个闪光灯来主动地管理反光。
如果已知物体的模型且其位置变化有限,则具有反光表面的物体可能不是一个重大挑战。

2)半透明或透明物体:

挑战:
透明或者半透明的物体对于机器人视觉也十分具有挑战性。这些任务包括拾起透明杯子及其盖子(下图c),拾起容器中的冰块(下图d),向杯中导入一定量的水(下图e)。
相对于拾起透明的杯子和盖子,拾起冰块的任务更具有挑战。因为杯子和盖子是独立的物体,方便位姿识别和抓取,而冰块在容器中是随机堆叠且透明的。

进展:
透明物体的的识别仍然还是一个难点,尤其是类似于在容器中随机堆叠的冰块这样的复杂任务,没有团队能够完成这样的任务。
对于倒水任务,几乎所有的团队都使用的是硬编码的方式,另外杯中水位的检测依然是一个挑战。
对于完全透明的物体,也许使用视觉之外的感知方式能够带给我们一些启发。

3)需要高精度和准确度的任务:

挑战:
具有小容差的任务对视觉的精度要求较高。典型的任务如USB接头的插入,机器人需要准确地定位插槽的位置(下图f)。
为了弥补定位的不准确性,通常需要使用耗时的搜索算法或者故障恢复方法。使用力觉传感器来引导任务的执行就是一种常见的搜索策略。

进展:
对于插孔任务,目前已有多个团队能够完成此类任务,无非是耗费时间长短不同。总之,在模型已知的情况下,插孔任务现在已不再具有挑战性。

机器人抓取与操作竞赛感知方面的挑战

二、抓取方面的挑战与进展

1)感知误差:

挑战:
感知误差在抓取过程中引起了最多的失败。这些误差会导致机器人撞倒或者推开物体,最终导致不稳定抓取或者完全没有抓到。
即使对于不需要独立位姿检测步骤的端到端的方法,感知层的噪音仍然会影响到抓取结果。
所以抓取方法需要具备处理感知误差或者感知不确定的能力。

进展:
RGMC 中的团队正在逐步探索新方法来处理感知不确定性,因为他们发现这是导致其解决方案缓慢且不可靠的几个主要原因之一。这是一项重大挑战,需要科研界和工程界的共同合作。

2)不规则形状和表面:

挑战:
即使具有完美的视觉感知,一些具有可供抓握面积很小的物品仍然难以抓取。如一些弯曲和狭窄的表面很难抓握。
典型的案例有如何稳定握住剪刀的圆形手环处(下图a),还有如何稳定端起有杯子在其上的茶碟(下图b)。

进展:
目前多采用的方法是使用多个夹爪结合能够自动更换夹爪的算法。
亦或者是开发一个集成了不同夹持功能夹爪,它可以旋转或者翻转来更换与物体对应的夹持功能。
但是这些方法都是针对已知物体专门设计的,在未知场景的未知物体中的抓取可能仍然具有挑战性。

3)杂乱物体的抓取:

挑战:
在堆叠杂乱的物品中拾起物体也是一件具有挑战的事项。因为夹爪通常需要抓住目标物的两侧但只能从一侧去靠近物体,其旁边的物品可能会阻挡机器人的手并给规划带来困难。
反映这一挑战的一个典型任务就是在购物篮中拾取物体并放置到特定区域(下图c)。
而对于有的物体,还需要考虑操作任务所需的抓取点和抓取位姿,当物体处于杂乱状态时,其抓取挑战会更大。
例如对水的的搅拌任务(下图d)和舀取豆子(下图e)的任务中,要先从容器盒中以特定位姿抓出勺子,这是非常困难的。

进展:
针对这一情况,目前已经有所进展,但是杂乱场景的抓取毫无疑问依然非常耗时。
在面对新场景新物体的堆叠场景,可能仍然具有挑战性。

4)重抓取:

挑战:
机器人可以一次性拾起物品但是有时需要改变位姿来适用于具体的操作任务。
如在拧紧或者拆卸螺钉时(下图f),需要使用起子拧很多圈,机器人需要高效地重抓握起子来克服腕关节有限的转动角度并完成任务。

进展:
很多团队通过固定装置来作为过渡放置物体,然后再抓取。
但是,这些团队并没有使用空中的重抓取,尽管这种方法可能更高效。在空中的重抓取依然具有一定的挑战。

5)针对操作任务进行抓取:

挑战:
对于一些操作任务,物体需要以适当的抓取位姿被抓握才能高效地完成任务。
比如在钉钉子(下图g)和搅拌任务中需要根据操作任务考虑抓取的位置。在插入销钉的任务(下图j)中需要考虑到一定的抓握力以避免接触力导致的物体手内滑动。
此外,可变形物体的抓取需要控制它们的形状,以完成把皮带穿到滑轮上(下图k)和布线(下图l)等任务。

进展:
大多数团队通过预定义抓取点的方式来满足操作任务的需求。
这种方法,对于已知的物体完全足够,但是对于未知的物体依然行不通。

6)用于手内操作的抓取:

挑战:
手内操作依然是非常具有挑战的任务之一。
这些任务包括伸展和按压注射器(下图h),使用剪刀剪纸(下图a),使用钳子夹取冰块等。

进展:
手内操作依然是最大的挑战,这些团队不能够完成灵活地使用剪子,注射器,和钳子。
这些任务由于难度太大而在多数竞赛中已经取消。

机器人抓取与操作竞赛抓取方面的挑战

三、操作方面的挑战与进展

1)不完整感知的操作挑战与进展:

不完整感知和缺乏对运动结果的预测可能会导致操作任务的失败。

但是在RGMC比赛中,提供的物品是提前给到参赛队伍的,所以参赛人员可以通过对物体建模和使用确定的行为操作来减小不完整感知的挑战。
此外使用力触觉结合的方式也可以弥补这一缺陷。

2)需精确预测操作的挑战与进展:

对于一些任务容差要求太严格,或行为难以建模,为操作任务带来了挑战。
例如,钉入孔任务和拧紧或松开螺栓(下图d)
需要特定的的动作。撕纸巾(下图a)和倒水(下图b)需要机器人预测滚动动作和水流速度。打开拧紧的瓶盖时(下图c),需要机器人有一个预压力。

目前大多数队伍在操作规划时只考虑了避障,并没有考虑动力学和对行为进行预测。
但我们相信近期正在进行的一些研究将会解决部分挑战。

机器人抓取与操作竞赛操作方面的挑战


总结

本文首先总结了近年的机器人抓取与操作挑战赛,然后详细解释了近年来的挑战与进展。

需要指出的是这些挑战随着时间的推移,有的已经具有完善的解决方案,而有的依然非常棘手,读者可以调研最新的科研成果来判断还有哪些挑战未被解决。

本文是在文章《Research Challenges and Progress in Robotic Grasping and Manipulation Competitions》的基础上进行的整理和补充。

本文为个人观点,如有错误或不当之处请指正,转载请注明出处,欢迎大家交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1980699.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OCR图片矫正、表格检测及裁剪综合实践

问题描述 实际工程中,我们经常需要对图片进行预处理,比如: 1、图片是倾斜的 2、图片背景需要处理掉 3、图片的公章需要剔除 4、图片过暗,过亮 5、图片表格检测 6、图片表格版面分析 。。。。。。等等各种情况。 结果展示…

解决PuppeteerSharp生成PDF颜色问题的最佳实践

在现代网络开发中,使用爬虫技术生成PDF文件已成为一种常见需求。然而,开发者经常会遇到一些棘手的问题,其中之一便是使用PuppeteerSharp生成PDF时颜色丢失的问题。本篇文章将概述如何解决这一问题,并提供最佳实践和相关代码示例。…

TI音频功放TAS6511(二)

3.数字音频处理 芯片支持高级数字音频处理能力,包括: 高通滤波器/直流阻断 数字音量控制 PVDD的Foldback/AGL 热Foldback 双象限增益补偿 混合调制 实时负载诊断 低延迟路径 喇叭功率限制 1)PVDD Foldback 本功能主要为了防止音频…

学习笔记--算法(双指针)2

复写零 链接:https://leetcode.cn/problems/duplicate-zeros/ 题目 给你一个长度固定的整数数组 arr ,请你将该数组中出现的每个零都复写一遍,并将其余的元素向右平移。 注意:请不要在超过该数组长度的位置写入元素。请对输入的…

分享一个基于微信小程序的旅游自助拼团系统(源码、调试、LW、开题、PPT)

💕💕作者:计算机源码社 💕💕个人简介:本人 八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流&…

想业余时间做个网赚项目,有啥捷径?

前两年我陷入一段迷茫、浮躁、焦虑期。 主要原因是,心很大,力不足。 总想着找到一个高利润、高复购、少竞争的“蓝海”产品。 于是就面临一个尴尬的境地:普通业务看不上,蓝海业务找不着。 而且总想着做推广一步登天&#xff0…

程序员日志之DNF手游女鬼剑前瞻

目录 传送门正文日志1、概要女鬼剑 传送门 SpringMVC的源码解析(精品) Spring6的源码解析(精品) SpringBoot3框架(精品) MyBatis框架(精品) MyBatis-Plus SpringDataJPA SpringClou…

【教资 · 科目一】综合素质

【科目一】综合素质 单选题:29道/2分,共58分材料分析题:3道/14分,共42分写作题:1道,50分 卷面满分150分 —— 报告满分120分 及格分数99分以上 —— 及格分数70分 ‍ 考试内容: 职业理念&a…

Flink笔记整理(七)

Flink笔记整理(七) 文章目录 Flink笔记整理(七)九、容错机制9.1 检查点(Checkpoint)检查点的保存从检查点恢复状态检查点算法9.2 状态一致性9.3 端到端精确一次(End-To-End Exactly-Once&#x…

中科亿海微SoM模组——光纤陀螺控制板

光纤陀螺控制板 光纤陀螺仪是一种高精度、高可靠性的惯性测量仪器,被广泛应用于导航、姿态控制等应用场景,具有非常重要的应用价值。 本文介绍的光纤陀螺控制板是基于中科亿海微自研的SiP芯片平台,以及光纤陀螺数字信号处理流程&#xff0c…

安泰高压功率放大器的作用以及应用有哪些

高压功率放大器是一种用于增强信号强度的电子设备。它的作用是将输入信号的功率放大到足够的水平,以便在系统中进行传输或执行特定的任务。高压功率放大器在各种领域都有广泛的应用,从通信到科学研究再到医疗设备等多个领域都可以找到其身影。 高压功率放…

echarts横向柱状图

一、效果图 二、代码 let option {grid: {top: 8%,bottom: -20,right: 20,left: 20,containLabel: true},xAxis: {show: false},yAxis: [{triggerEvent: true,show: true,inverse: true,data: getArrByKey(data, name),axisLine: {show: false},splitLine: {show: false},axi…

React(五):XLS、XLSX文件在线预览

效果 依赖 $ yarn add xlsx源码 .xlsx-wrap {position: relative;width: 100%;height: 100%;background-color: #fafafa;.ant-tabs {width: 100%;height: 100%;.ant-tabs-nav {height: 50px;padding: 0 10px;margin-bottom: 0;}.ant-tabs-content-holder {border-top: 1px so…

JavaScript对象转数组的三种简单方法

大家好!今天我们要聊的是JavaScript中一个非常实用的技巧——将对象转换为数组。 方法1:使用Object.keys()和Array.map() 首先介绍一种基础但非常实用的方法,就是通过Object.keys()获取对象的键,然后用Array.map()把这些键对应的值…

C++ primer plus 第17 章 输入、输出和文件:文件输入和输出01

C primer plus 第17 章 输入、输出和文件:文件输入和输出01 C primer plus 第17 章 输入、输出和文件:文件输入和输出01 文章目录 C primer plus 第17 章 输入、输出和文件:文件输入和输出0117.4 文件输入和输出17.4.1 简单的文件 1/0程序清…

商家转账到零钱分销返佣申请方案及驳回处理办法

分销返佣场景是商家申请最多的场景,因而申请被驳回也是最多的,根据我们上万次成功开通商家转账到零钱的经验,当商家转账到零钱的分销返佣场景被驳回时,按照以下步骤,商家都可以快速过审: 一、分析驳回原因 …

C Primer Plus 第6章——第一篇

你该逆袭了 第6章:重点摘录 零、本章内容介绍一、while 循环1、程序注释(1)伪代码 2、C 风格读取循环 二、while 语句1、终止 while 循环2、语法要点 三、用 关系运算符 和 表达式 比较大小1、fabs( ) 函数 比较 浮点数(1) fabs( ) 函数 2、什么是 真&am…

世界人口过亿的一级行政区分布

世界国人口已经突破80亿,人口过亿的国家也有14个,分别是中国、俄罗斯、巴西、墨西哥,美国、日本、印度、巴基斯坦、印度尼西亚、尼日利亚、孟加拉国、埃塞俄比亚、菲律宾、埃及。 那么作为国家的一级行政区人口过亿的区域有那些呢?这里就来…

返璞归真:通过简化用例来简化用户界面01

Larry Constantine 著harvey 译 我们常被问及精简那些最简化、抽象和通用窗体用例的重要性。到底有多重要呢?在以用户为 中心的设计中,简化那些重要窗体的用例是获得成功的关键。它能够为开发者设计优秀的用户界面 助一臂之力。通过消除不必要的或技术驱…

书籍推荐-给数字化、PLM制造从业同行推荐的几本书

基础入门和提升的书籍: 1.《制造企业的产品数据管理--原理、概念、策略》,作者:[德]约瑟夫萧塔纳著,祁国宁译 这是一本很基础,但是也非常经典的企业实施PDM管理价值和方法的书籍,大概出版于2001年&#x…