Science Robotics 麻省理工学院最新研究,从仿真中学习的精确选择、定位和抓放物体的视触觉方法

news2025/1/10 3:28:28

现有的机器人系统在通用性和精确性两个性能目标上难以同时兼顾,往往会陷入一个机器人解决单个任务的情况,缺乏"精确泛化"。本文针对精准和通用的同时兼顾提出了解决方法。提出了SimPLE(Pick Localize和placE的仿真模拟)作为精确拾取和放置的解决方案。该方法在仅给定物体的计算机辅助设计(CAD)模型的情况下,学习在仿真模拟中拾取、抓取和放置物体。它由三个部分组成:任务感知抓取、视触觉物体位姿估计和手对手抓取的运动规划。
在这里插入图片描述

图1 精确拾取和放置
之后使用对象的几何形状在模拟中设计组件,然后将SimPLE转移到真实系统,而不需要任何与对象相关的实际经验。
在这里插入图片描述

图2 模拟生成模型

在这里插入图片描述

图3 现实中的部署情况
1.任务感知抓取
SimPLE根据场景的深度图像对对映抓取进行采样并计算物体姿态的初始估计。之后,我们使用在模拟中学习到的任务感知质量指标来评估每个采样抓取的质量,并命令机器人执行最佳的反足抓取(图3-A)。任务感知抓取是指选择与拾取和放置任务兼容的抓取。
2.视觉触觉物体位姿估计
一旦抓取到物体,机器人就会接收触觉观察结果并作为输入信号。将触觉图像与初始深度图像相结合,同时对可能抓取的物体姿势分布估计做了更新。(图 3-B)。
3.运动规划
给定物体姿态的最佳估计,之后机器人计算出一组运动,这其中也包括必要的物体重新抓取的情况,并将物体放置在所需的配置之中(图3-C)。最后,机器人执行开环运动(图3-D)。
SimPLE在拾放任务中的实验评估
1.精确拾放任务:
通过精确拾放任务来验证了这一方法,其中需要拾取不同形状的刚性物体并将其精确地放置在刚性夹具上。对于每个测试的对象,SimPLE首先利用该对象的CAD模型并且仅在模拟中学习其感知、掌握稳定性和规划的模型。除此之外,机器人系统由带有平行颌夹具的双臂机器人组成,手指部分安装有触觉传感器。对于每个无碰撞抓取样本,截取了以抓取点为中心对齐的原始深度图像,并将其作为视觉模型的输入。将触觉观察与之前的深度图像相结合,就可以更新物体姿态的视觉估计。最后,采用最佳视觉触觉姿势估计来计算最短路径,并找到了机器人可以执行的最简单的运动计划来放置物体。在15个物体的抓取对SimPLE进行了评估。每个物体进行20次试验。
在这里插入图片描述

图5 15个物体
2.基线实验
对于15个物体中的5个,还进行了一组基线实验来评估SimPLE每个核心组件的影响:任务感知抓取、触觉定位和视觉定位。每个基线消除了其中一个组件,但保留了其他两个组件。在触觉基线中,执行任务感知抓取后,姿势估计仅使用触觉信息,而不是同时使用视觉和触觉观察。在视觉基线中,执行任务感知抓取后,姿势估计仅使用视觉信息,而不是同时使用视觉和触觉观察。最后,对于与任务无关的基线,该基线没有使用任务感知的抓取选择,而是根据Dex-Net (2)的抓取质量指标选择抓取。对该基线的感知使用视觉和触觉信息来估计抓取后的物体姿势。
在这里插入图片描述

图6 任务感知抓取有助于感知

在这里插入图片描述

图7 任务感知抓取提供更好的规划解决方案
结论
在这项工作中提出了一种精确拾取和放置的方法,该方法利用离线计算来实现高度的适应性。使用相同算法以及系统来精确放置从非结构化场景中获取的对象是仍然是许多操纵问题的难题。本文所提及的方法不需要机器人或人类对这些物体的先前经验,展示了可以构建快速适应其他物体而不影响准确性的系统。实验表明,通过视觉触觉感知,在模拟中学习的机器人模型可以成功地转移到真实系统中。与基线相比的结果验证了视触觉传感的需求,以及部署端到端考虑任务要求的策略的好处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1905393.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# 如何获取属性的displayName的3种方式

文章目录 1. 使用特性直接访问2. 使用GetCustomAttribute()方法通过反射获取3. 使用LINQ查询总结和比较 在C#中,获取属性的displayName可以通过多种方式实现,包括使用特性、反射和LINQ。下面我将分别展示每种方法,并提供具体的示例代码。 1.…

【Spring Cloud】一个例程快速了解网关Gateway的使用

Spring Cloud Gateway提供了一个在Spring生态系统之上构建的API网关,包括:Spring 5,Spring Boot 2和Project Reactor。Spring Cloud Gateway旨在提供一种简单而有效的路由方式,并为它们提供一些网关基本功能,例如&…

轻松驾驭开发之旅:Maven配置阿里云CodeUp远程私有仓库全攻略

文章目录 引言一、为什么选择阿里云CodeUp作为远程私有仓库?二、Maven配置阿里云CodeUp远程私有仓库的步骤准备工作配置Maven的settings.xml文件配置项目的pom.xml文件验证配置是否成功 三、使用阿里云CodeUp远程私有仓库的注意事项 引言 在软件开发的世界里&#…

【Linux进程】命令行参数 环境变量(详解)

目录 前言 1. 命令行参数 什么是命令行参数? 2. 环境变量 常见的环境变量 如何修改环境变量? 获取环境变量 环境变量的组织方式 拓展问题 导入环境变量 3. 本地变量* 总结 前言 在使用Linux指令的时候, 都是指令后边根命令行参数, 每个指令本质都是一个一个的可执行程…

数学系C++ 排序算法简述(八)

目录 排序 选择排序 O(n2) 不稳定:48429 归并排序 O(n log n) 稳定 插入排序 O(n2) 堆排序 O(n log n) 希尔排序 O(n log2 n) 图书馆排序 O(n log n) 冒泡排序 O(n2) 优化: 基数排序 O(n k) 快速排序 O(n log n)【分治】 不稳定 桶排序 O(n…

Kaggle网站免费算力使用,深度学习模型训练

声明: 本文主要内容为:kaggle网站数据集上传,训练模型下载、模型部署、提交后台运行等教程。 1、账号注册 此步骤本文略过,如有需要可以参考其他文章。 2、上传资源 不论是上传训练好的模型进行预测,还是训练用的…

2024组装一台能跑AI大模型的电脑

title: 2024组装一台能跑AI大模型的电脑 tags: [组装电脑, AI大模型] categories: [其他, 电脑, windows] 这里不写组装步骤,哪里接线,购买什么品牌网上一大堆。 这里只写如何根据你自己的需求,选择合适的、兼容的配件。 概述 需求&#xff…

区间最值问题-RQM(ST表,线段树)

1.ST表求解 ST表的实质其实是动态规划&#xff0c;下面是区间最小的递归公式&#xff0c;最大只需将min改成max即可 f[i][j] min(f[i][j - 1], f[i (1 << j - 1)][j - 1]); 二维数组的f[i][j]表示从i开始连续2*j个数的最小/大值。 例如&#xff1a;我们给出一个数组…

iOS中多个tableView 嵌套滚动特性探索

嵌套滚动的机制 目前的结构是这样的&#xff0c;整个页面是一个大的tableView, Cell 是整个页面的大小&#xff0c;cell 中嵌套了一个tableView 通过测试我们发现滚动的时候&#xff0c;系统的机制是这样的&#xff0c; 我们滑动内部小的tableView, 开始滑动的时候&#xff0c…

【驱动篇】龙芯LS2K0300之ADC驱动

实验目的 由于LS2K0300久久派开发板4.19内核还没有现成可用的ADC驱动&#xff0c;但是龙芯官方的5.10内核已经提供了ADC驱动&#xff0c;想要在4.19内核使用ADC就要参考5.10内核移植驱动&#xff0c;本次实验主要是关于ADC驱动的移植和使用 驱动移植 主要的驱动代码主要有3个…

ASRock Creator系列GPU:为AI推理及多GPU系统打造,采用16针电源接口的Radeon RX 7900系列显卡

ASRock 正在筹备推出专为人工智能推理和多GPU系统设计的AMD GPU——Creator系列显卡。这一系列显卡采用双槽位、吹风式设计&#xff0c;并配备16针电源连接器&#xff0c;首发产品包括基于Navi 31架构的AMD Radeon RX 7900XTX和RX 7900 XT型号。这些原属于WS系列的显卡最初在20…

网络安全设备——防火墙

网络安全设备防火墙是一种用来加强网络之间访问控制的特殊网络互联设备。以下是对防火墙的详细解释&#xff1a; 一、定义与基本概念 定义&#xff1a;防火墙是指设置在不同网络&#xff08;如可信任的企业内部网和不可信的公共网&#xff09;或网络安全域之间的一系列部件的…

力扣双指针算法题目:快乐数

目录 1.题目 2.思路解析 3.代码展示 1.题目 . - 力扣&#xff08;LeetCode&#xff09; 2.思路解析 题目意思是将一个正整数上面的每一位拿出来&#xff0c;然后分别求平方&#xff0c;最后将这些数字的平方求和得到一个数字&#xff0c;如此循环&#xff0c;如果在此循环中…

【Linux】在线求助命令--help,man page , info page

我们知道Linux有很多的命令&#xff0c;那LInux要不要背命令&#xff1f; 答案是背最常用的那些就行了 那有的时候我们想查询一些命令的详细用法该怎么办呢&#xff1f; 这里我给出3种方法 1.--help --help的使用方法很简单啊 要查询的命令 --help 我们看个例子 这里我只…

DoIP-1 简介

1. 概述 DoIP-Diagnostic Over Internet Protocol &#xff0c;基于TCPIP协议族的诊断传输协议 DoIP国际标准定义为ISO 13400&#xff0c;总共由五部分组成&#xff1a;  ISO13400-1DoIP的综述  ISO13400-2DoIP的传输层和网络层服务&#xff08;主体部分&#xff09;  I…

vue-element-admin集成方案如何运行以及代码解读

文章目录 1.vue-admin-admin介绍2.运行方法3.代码解读3.1基础外层文件解读&#xff0c;以及eslint关闭&#xff08;如下图&#xff09;3.2内层src文件分析3.2.1 login流程解析 1.vue-admin-admin介绍 1.1 是一个后台前端解决方案(vueelementui)&#xff0c;内置i18国际化解决方…

Javascript常见数据结构和设计模式

在JavaScript中&#xff0c;常见的数据结构包括两大类&#xff1a;原始数据类型&#xff08;Primitive Types&#xff09;和对象类型&#xff08;Object Types&#xff09;。对象类型又可以进一步细分为多种内置对象、数组、函数等。下面是一些JavaScript中常见的数据结构&…

【PWN · ret2syscall | GoPwn】[2024CISCN · 华中赛区]go_note

一道GoPwn&#xff0c;此外便是ret2syscall的利用。然而过程有不小的曲折&#xff0c;参考 返璞归真 师傅的wp&#xff0c;堪堪完成了复现。复现过程中&#xff0c;师傅也灰常热情回答我菜菜的疑问&#xff0c;感谢&#xff01;2024全国大学生信息安全竞赛&#xff08;ciscn&am…

落日余晖映晚霞

落日余晖映晚霞&#xff0c;立于海滨&#xff0c;望夕阳余晖洒于波光粼粼之上&#xff0c;金光跳跃&#xff0c;若繁星闪烁&#xff0c;耀人心目。 海风轻拂&#xff0c;心境宁静&#xff0c;凡尘俗务皆于此刹那消散&#xff0c;思绪万干&#xff0c;或忆往昔点滴&#xff0c;或…

7.7 洛谷

约瑟夫环 P1145 约瑟夫 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) index(indexm-1)%num;if(index>k && index<2*k){a[index]0;num--;}ac代码 #include<bits/stdc.h> using namespace std; typedef long long ll;#define IOS ios::sync_with_stdio(0…