抓取检测(Grasp Dection)

news2024/12/28 4:16:44

抓取检测

抓取检测被定义为能够识别任何给定图像中物体的抓取点或抓取姿势。抓取策略应确保对新物体的稳定性、任务兼容性和适应性,抓取质量可通过物体上接触点的位置和手的配置来测量。为了掌握一个新的对象,完成以下任务,有分析方法和经验方法。分析方法根据抓取稳定性或任务要求的运动学和动力学公式,选择手指位置和手部构型,经验方法根据具体任务和目标物体的几何结构,使用学习算法选择抓取。

根据是否需要进行目标定位,需要确定目标的姿态,进一步将其分为三类:具有已知定位和姿势的方法、具有已知定位和无姿态的方法、无定位和无姿态的方法。

1.1 具有已知定位和姿势

针对已知目标的经验方法,利用姿态将已知目标的抓取点转换为局部数据。主要算法有:

Multi-view self-supervised deep learning for 6d pose estimation in the amazon picking challenge.

Multi-view Self-supervised Deep Learning for 6D Pose Estimation in the Amazon Picking Challenge | Papers With Code
近年来,机器人仓库自动化引起了人们的极大兴趣 年,也许最明显的是亚马逊拣选挑战赛 (APC)。一个完全 自主仓库拾取和放置系统需要可靠的视觉 在杂乱的环境、自遮挡、 传感器噪声和各种各样的物体。在本文中,我们提出了一个 利用多视图 RGB-D 数据和自监督、数据驱动的方法 学会克服这些困难。该方法是 麻省理工学院-普林斯顿团队系统在装载和 拣选任务,分别在 APC 2016 上。在所提出的方法中,我们将 并使用全卷积神经网络标记场景的多个视图, 然后将预先扫描的 3D 对象模型拟合到生成的分割中,以获得 6D 对象姿势。训练深度神经网络进行分割,通常 需要大量的训练数据。我们提出了一种自监督方法 生成大型标记数据集,而无需繁琐的手动分割。我们 证明我们的系统可以可靠地估计物体的 6D 位姿 多种场景。所有代码、数据和基准测试均可在 http://apc.cs.princeton.edu/


Silhonet: An RGB method for 3d object pose estimation and grasp planning.

SilhoNet: An RGB Method for 6D Object Pose Estimation | Papers With Code

自主机器人操作涉及将要操纵的物体的平移和方向估计为 6 自由度 (6D) 姿势。使用RGB-D数据的方法在解决这个问题方面取得了巨大的成功。但是,在某些情况下,成本限制或工作环境可能会限制RGB-D传感器的使用。当仅限于单目相机数据时,物体姿态估计问题非常具有挑战性。在这项工作中,我们引入了一种名为SilhoNet的新方法,该方法可以从单目图像中预测6D物体姿态。我们使用卷积神经网络 (CNN) 管道,该管道接受感兴趣区域 (ROI) 建议,以同时预测具有相关遮挡蒙版和 3D 平移矢量的对象的中间轮廓表示。然后,将 3D 方向从预测的轮廓回归。我们表明,与两个最先进的网络相比,我们的方法在YCB-Video数据集上实现了更好的整体性能,用于从单目图像输入进行6D位姿估计。

1.2 具有已知定位和无姿态的方法

主要方法:

Automatic grasp planning using shape primitives.
Part-based grasp planning for familiar objects.
Transferring grasp configurations using active learning and local replanning.
Dex-net 2.0: Deep learning to plan robust grasps with synthetic point clouds and analytic grasp metrics.

1.3 无定位无姿态的方法

主要基于深度学习方法,包括:

Deep learning for detecting robotic grasps.

Deep Learning for Detecting Robotic Grasps | Papers With Code

我们考虑了在RGB-D视图中检测机器人抓取的问题。 包含对象的场景。在这项工作中,我们将深度学习方法应用于 解决了这个问题,从而避免了耗时的功能手工设计。这 提出了两个主要挑战。首先,我们需要评估大量的 候选人掌握。为了使检测快速且可靠,我们 呈现具有两个深度网络的两步级联结构,其中顶部 第一个检测结果由第二个检测结果重新评估。第一个网络有 功能更少,运行速度更快,并且可以有效地修剪出不太可能的 候选人掌握。第二个具有更多功能,速度较慢,但只需运行 在前几个检测中。其次,我们需要处理好多模态输入, 为此,我们提出了一种对权重应用结构化正则化的方法 基于多模态群正则化。我们证明了我们的方法 在机器人抓取检测方面优于以前最先进的方法, 并可用于在两个不同的机器人上成功执行抓取平台。


Real-time grasp detection using convolutional neural networks.

Real-Time Grasp Detection Using Convolutional Neural Networks | Papers With Code

我们提出了一种基于卷积神经网络的准确、实时的机器人抓取检测方法。我们的网络在不使用标准滑动窗口或区域建议技术的情况下对可抓取的边界框执行单阶段回归。该模型的性能比最先进的方法高出 14 个百分点,并在 GPU 上以每秒 13 帧的速度运行。我们的网络可以同时执行分类,以便在一个步骤中识别对象并找到一个好的抓取矩形。对此模型的修改通过使用局部约束的预测机制来预测每个对象的多个抓取。局部约束模型的性能明显更好,尤其是在可以通过多种方式抓取的对象上。


Object discovery and grasp detection with a shared convolutional neural network.

在机器人技术中,从一堆物体中实时抓取一个物体仍然是一个挑战。这就要求机器人具备快速发现物体和抓取检测的能力:首先从堆垛中挑出一个目标物体,然后应用适当的抓取配置来抓取物体。在本文中,我们提出了一种共享卷积神经网络(CNN),可以同时实时实现这两个任务。该模型在GPU上的处理速度约为每秒100帧,这在很大程度上满足了这一要求。同时,我们还建立了一个标记的RGBD数据集,其中包含用于机器人抓取的堆叠物体的场景。最后,我们演示了共享CNN模型在真实机器人平台上的实现,并展示了机器人可以从堆栈中准确地发现目标对象并成功抓取它。


Supersizing self-supervision: Learning to grasp from 50k tries and 700 robot hours.

Supersizing Self-supervision: Learning to Grasp from 50K Tries and 700 Robot Hours | Papers With Code目前基于学习的机器人抓取方法利用了人类标记 用于训练模型的数据集。但是,这样的存在两个问题 方法:(a)由于每个对象可以通过多种方式手动抓取 标记抓取位置并非易事;(b) 人类标记的偏差 语义学。虽然有人尝试使用试错法来训练机器人 实验,此类实验中使用的数据量仍然很大 低,因此使学习者容易过度拟合。在本文中,我们采取 将可用训练数据增加到比以前多 40 倍的飞跃 工作,导致在 700 小时内收集的 50K 数据点的数据集大小 机器人抓取尝试。这使我们能够训练卷积神经网络 (CNN)用于预测抓取位置的任务,而不会出现严重的过拟合。在 我们的公式中,我们将回归问题重铸为 18 向二进制 对图像斑块进行分类。我们还介绍了一个多阶段的学习 方法,其中使用在一个阶段训练的 CNN 来收集硬底片 后续阶段。我们的实验清楚地表明了使用 用于抓取任务的大规模数据集(和多阶段训练)。我们 还可以与几个基线进行比较,并在 泛化到看不见的物体进行抓取。


 


Real-time, highly accurate robotic grasp detection using fully convolutional neural networks with high-resolution images.

Real-Time, Highly Accurate Robotic Grasp Detection using Fully Convolutional Neural Networks with High-Resolution Images | Papers With Code
机器人抓取检测新物体是一项具有挑战性的任务,但在过去几年中,基于深度学习的方法在使用 RGB-D 数据时实现了显着的性能改进,准确率高达 96.1%。在本文中,我们提出了基于全卷积神经网络(FCNN)的机器人抓取检测方法。我们的方法还实现了最先进的检测精度(高达96.6%),以及康奈尔数据集上高分辨率图像(每张360x360图像6-20ms)的最先进的实时计算时间。由于FCNN,我们提出的方法可以应用于任何尺寸的图像,以检测多目标上的多抓取。使用带有小型平行夹持器和RGB-D相机的4轴机械臂评估了所提出的方法,以抓取具有挑战性的小型新物体。通过我们提出的基于学习的全自动方法进行精确的视觉-机器人坐标校准,我们提出的方法产生了 90% 的成功率。
 


Robotic pick-and-place of novel objects in clutter with multi-affordance grasping and cross-domain image matching.

Robotic Pick-and-Place of Novel Objects in Clutter with Multi-Affordance Grasping and Cross-Domain Image Matching | Papers With Code
本文提出了一种机器人拾取和放置系统,该系统能够在杂乱的环境中抓取和识别已知和新颖的物体。该系统的主要新功能是它可以处理广泛的对象类别,而无需对新对象进行任何特定于任务的训练数据。为了实现这一点,它首先使用与类别无关的可得性预测算法在四种不同的抓取基元行为中进行选择和执行。然后,它使用跨域图像分类框架识别选取的对象,该框架将观察到的图像与产品图像相匹配。由于产品图像可用于各种对象(例如,来自网络),因此该系统可以开箱即用地处理新对象,而无需任何额外的训练数据。详尽的实验结果表明,我们的多可用性抓取对杂乱中的各种物体都实现了很高的成功率,并且我们的识别算法对已知和新抓取的目标都实现了较高的准确率。这种方法是麻省理工学院-普林斯顿团队系统的一部分,该系统在 2017 年亚马逊机器人挑战赛的装载任务中获得了第一名。所有代码、数据集和预训练模型均可在 http://arc.cs.princeton.edu 在线获取


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1277462.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第二十二章 指定元素和属性的命名空间 - 指定被视为Global元素的对象的命名空间

文章目录 第二十二章 指定元素和属性的命名空间 - 指定被视为Global元素的对象的命名空间指定被视为Global元素的对象的命名空间指定映射为元素的属性的命名空间案例1:属性被视为本地元素案例2:属性被视为Global元素 第二十二章 指定元素和属性的命名空间 - 指定被视…

以热爱的态度对待生活,就是最自己的温柔

粉色系拼接款羽绒服 90白鸭绒+连帽立领设计 防风又保暖,柔软蓬松舒适感十足 衣服上加了时尚的字母印花元素 袖口做了魔术贴设计 下摆也做了可调节抽绳 防风保暖五部做到实处哦 宽松版型,很耐穿保暖性又很强 简单大方,搭配…

Filebeat使用指南

Filebeat介绍主要优势主要功能配置日志的解析Kibana中设置日志解析安装步骤安装Filebeat安装监控通过prometheus监控 Filebeat和Logstash的主要区别 Filebeat介绍 Filebeat是使用Golang实现的轻量型日志采集器,也是Elasticsearch stack的一员。它可以作为一个agent…

自定义Vue的DockPanel-Layout

创作来源 1、在vue项目中需要有停靠、浮动、面板布局等需求,如arcgis的界面布局 2、在npm中搜索了关于vue的docklayout组件,搜索后就一个组件imengyu/vue-dock-layout,截图如下,该组件没有停靠组件,没有浮动组件&…

python etree.HTML 以及xpath 解析网页的工具

文章目录 导入模块相关语法实战 导入模块 from lxml import etree相关语法 XPath(XML Path Language)是一种用于在XML文档中定位和选择元素的语言。XPath的主要应用领域是在XML文档中进行导航和查询,通常用于在XML中选择节点或节点集合。以…

C++模版

文章目录 C模版1、泛型编程2、函数模版2.1、函数模版概念2.2、函数模版格式2.3、函数模版原理2.4、函数模版的实例化2.5、模板参数的匹配原则 3、类模版3.1、类模版概念3.2、类模版格式3.3、类模板的实例化 C模版 1、泛型编程 泛型编程(Generic Programming&#x…

华清远见嵌入式学习——C++——作业4

作业要求&#xff1a; 代码&#xff1a; #include <iostream>using namespace std;class Stu {friend const Stu operator*(const Stu &L,const Stu &R);friend bool operator<(const Stu &L,const Stu &R);friend Stu operator-(Stu &L,const S…

2022年高校大数据挑战赛A题工业机械设备故障预测求解全过程论文及程序

2022年高校大数据挑战赛 A题 工业机械设备故障预测 原题再现&#xff1a; 制造业是国民经济的主体&#xff0c;近十年来&#xff0c;嫦娥探月、祝融探火、北斗组网&#xff0c;一大批重大标志性创新成果引领中国制造业不断攀上新高度。作为制造业的核心&#xff0c;机械设备在…

KEPserver和S7-200SMART PLC通信配置

KEPserver和S7-1200PLC通信配置,请查看下面文章链接: https://rxxw-control.blog.csdn.net/article/details/134683670https://rxxw-control.blog.csdn.net/article/details/134683670 1、OPC通信应用 2、选择Siemens驱动 3、添加S7-200设备

百度/抖音/小红书/微信搜索品牌形象优化怎么做?

搜索口碑是网络营销不可或缺的一部分&#xff0c;企业如何做好品牌搜索口碑优化呢&#xff1f;小马识途营销顾问建议从以下几方面入手。 1. 通过关键字优化提高自身知名度 通过对竞争对手和目标客户的关键字进行分析&#xff0c;企业可以确定哪些关键字可以提高自身品牌知名度。…

数据结构与算法-静态查找表

&#x1f31e; “清醒 自律 知进退&#xff01;” 查找 &#x1f388;1.查找的相关概念&#x1f388;2.静态查找表&#x1f52d;2.1静态查找表的类定义&#x1f52d;2.2顺序查找&#x1f52d;2.3二分查找&#x1f50e;二分查找例题 &#x1f52d;2.4分块查找&#x1f52d;2.5三…

SQL面试题,判断if的实战应用

有如下表&#xff0c;请对这张表显示那些学生的成绩为及格&#xff0c;那些为不及格 1、创建表&#xff0c;插入数据 CREATE TABLE chapter8 (id VARCHAR(255) NULL,name VARCHAR(255) NULL,class VARCHAR(255) NULL,score VARCHAR(255) NULL );INSERT INTO chapter8 (id, n…

非应届生简历模板13篇

无论您是职场新人还是转行求职者&#xff0c;一份出色的简历都是获得心仪岗位的关键。本文为大家精选了13篇专业的非应届生简历模板&#xff0c;无论您的经验如何&#xff0c;都可以灵活参考借鉴&#xff0c;提升自己的简历质量。让简历脱颖而出&#xff0c;轻松斩获心仪职位&a…

02数仓平台Zookeeper

概述 ZooKeeper是一种分布式协调服务&#xff0c;用于管理大型主机集。在分布式环境中协调和管理服务是一个复杂的过程。ZooKeeper通过其简单的架构和API解决了这个问题。ZooKeeper允许开发人员专注于核心应用程序逻辑&#xff0c;而不必担心应用程序的分布式性质。 Zookeepe…

Dart编程基础 - 一种新的编程语言

Dart编程基础 – 一种新的编程语言 Dart Programming Essentials - A New Type of Programming Language By JacksonML Dart is a client-optimized language for fast apps on any platform From dart.dev 在1999年之前&#xff0c;和我一样对计算机技术感兴趣的伙伴们&…

高级算法设计与分析练习1-10

文章目录 7-1 锦标赛7-2 选我啊&#xff01;7-3 朋友圈7-4 最短路径7-5 ICPC保定站7-6 填数字7-7 Werewolf7-8 球队“食物链”7-9 代码排版7-10 至多删三个字符 7-1 锦标赛 HBU有2 n名ACM选手&#xff0c;编号依次为1−2 n。他们现在要进行一场程序设计比赛&#xff0c;这个比…

规则引擎专题---1、什么是规则引擎

什么是规则引擎&#xff0c;为了更易大家理解&#xff0c;我们这边先抛出一个问题。 问题 现有一个在线申请信用卡的业务场景&#xff0c;用户需要录入个人信息&#xff0c;如下图所示&#xff1a; 通过上图可以看到&#xff0c;用户录入的个人信息包括姓名、性别、年龄、学…

基于51单片机的交通灯_可调时间_夜间+紧急模式

51单片机交通灯 1 讲解视频&#xff1a;2 功能要求3 仿真图&#xff1a;4 原理图PCB5 实物图6 程序设计&#xff1a;7 设计报告8 资料清单&#xff08;提供资料清单所有文件&#xff09;&#xff1a;设计资料下载链接&#xff1a; 51单片机简易交通灯_可调时间_夜间紧急 仿真代…

三、Linux高级命令

目录 1、重定向命令 1.1 重定向 > 1.2 重定向 >> 该章节的所有操作都在/export/data/shell目录进行&#xff0c;请提前创建该目录。 mkdir -p /export/data/ 1、重定向命令 1.1 重定向 > Linux 允许将命令执行结果重定向到一个文件&#xff0c;本应显示在…

「Verilog学习笔记」自动贩售机1

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点&#xff0c;刷题网站用的是牛客网 自动贩售机中可能存在的几种金额&#xff1a;0&#xff0c;0.5&#xff0c;1&#xff0c;1.5&#xff0c;2&#xff0c;2.5&#xff0c;3。然后直接将其作为状态机的几种状…