【佳佳怪文献分享】通过引导学会行走: 动态环境中的感知四足运动

news2024/11/24 20:15:15

标题:Learning to Walk by Steering: Perceptive Quadrupedal Locomotion in Dynamic Environments

作者:Mingyo Seo , Ryan Gupta , Yifeng Zhu , Alexy Skoutnev , Luis Sentis , and Yuke Zhu

来源:2023 IEEE International Conference on Robotics and Automation (ICRA 2023)

这是佳佳怪分享的第3篇文章

摘要

我们要解决动态环境中的感知运动问题。在这个问题中,四足机器人必须针对环境杂波和移动障碍表现出稳健而敏捷的行走行为。我们提出了一个名为 PRELUDE 的分层学习框架,它将感知运动问题分解为预测导航指令的高层决策和实现目标指令的低层步态生成。在这一框架中,我们利用在可操纵小车上收集到的人类演示,通过模仿学习训练高级导航控制器,并利用强化学习(RL)训练低级步态控制器。因此,我们的方法可以 复杂的导航行为,并 因此,我们的方法可以从人类的监督中获取复杂的导航行为,并从试验和错误中发现多变的步态。我们展示了 我们在模拟和硬件实验中证明了我们方法的有效性。实验中展示了我们方法的有效性。
在这里插入图片描述
图 1:方法概述。PRELUDE 解决的是动态环境中的感知运动问题。我们引入了一种控制层级结构,其中高层控制器通过模仿学习训练来设定导航指令,低层步态控制器通过强化学习训练来通过联合空间执行来实现目标指令。这种组合使我们能够在真实世界环境中的四足机器人上有效地部署整个层次结构。
在这里插入图片描述
图 2:PRELUDE 的模型结构。高级导航策略根据机载 RGB-D 摄像头的观测数据和机器人航向,以 10Hz 的频率生成目标速度指令 ut。目标速度指令与速度指令缓冲区 Bt ut、最近的机器人状态 qt 和之前的关节空间动作 at-1 一起作为低级步态控制器的输入。低级步态策略以 38Hz 的频率将关节空间动作预测为所需的关节位置,并将其发送给四足机器人进行驱动。
在这里插入图片描述
图 3:硬件平台。专为收集人类导航演示而设计的可转向小车(左)和安装在小车高度上、带有以自我为中心的 RGB-D 摄像头的 Unitree A1 机器人(右)。它确保了根据演示数据训练的导航策略可以直接部署到机器人上。
在这里插入图片描述
图 4:真实机器人实验。(左图)我们进行了真实试验,机器人以不同的配置穿越 15 米长的轨道。图中显示了以米为单位的行走距离分布。黑线和红线分别表示穿越长度的范围和平均值。(右图)我们观察到,PRELUDE(A1 默认步态)在高速转弯后猛烈漂移并撞上墙壁,而 PRELUDE 则快速转弯绕过行走的人群并成功完成试验。
在这里插入图片描述
表 I: 模拟中 PRELUDE 与基线的比较。我们报告了以米为单位的平均穿越长度(轨道总长度:50 米)和以百分比为单位的成功率作为评估指标。
在这里插入图片描述
表二:步态控制器评估 我们以米为单位报告跟踪误差(越小越好),以百分比为单位报告跟踪成功率(越高越好)。

结论

我们介绍的 PRELUDE 是一种有效的方法,用于学习四足机器人的感知运动控制器,以穿越真实世界的动态环境。我们的方法结合了模仿学习和强化学习的互补优势,通过分层设计将运动问题分解为高级导航和低级步态生成。我们设计了一个可转向小车平台,用于收集复杂场景中的人类导航演示,并利用收集到的数据集训练高级导航策略。我们使用大规模强化学习在模拟中训练低级步态控制器,证明它能有效地转移到现实世界,并产生稳健而多变的运动。我们的工作主要集中在平地和室内环境,在这些环境中,人类的转向动作可以通过轮式平台方便地收集。在未来的工作中,我们希望将我们的轮式小车扩展到更复杂的机械设计中,以收集在室外崎岖地形上行走的人类数据集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/870981.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Titanic--细节记录二

merge、join以及concat的方法的不同以及相同 相同之处:都用于合并数据。 不同之处: merge主要是基于列的合并。join主要是基于索引(行标签)的合并。concat可以沿任意轴合并,更灵活。 import pandas as pddf1 pd.Da…

Linux 查看内存使用情况的几种方法

在运行 Linux 系统的过程中为了让电脑或者服务器以最佳水平运行,常常需要监控内存统计信息。 那么今天我们就来看看有哪些方法可以访问所有相关信息并帮助管理员监控内存统计信息。 查看或者获取 Linux 中的内存使用情况既可以通过命令的方式,也可以通…

OptaPlanner笔记6 N皇后

N 个皇后 问题描述 将n个皇后放在n大小的棋盘上,没有两个皇后可以互相攻击。 最常见的 n 个皇后谜题是八个皇后谜题,n 8: 约束: 使用 n 列和 n 行的棋盘。在棋盘上放置n个皇后。没有两个女王可以互相攻击。女王可以攻击同一水…

Python语言基础---选择判断循环结构详解

文章目录 🍀引言🍀if语句🍀if-else语句🍀if-elif-else语句🍀for循环🍀while循环 🍀引言 在Python编程语言中,选择判断和循环是两个非常重要的概念。它们可以让我们根据条件执行不同的…

分布式应用:Zabbix监控Tomcat

目录 一、理论 1.Zabbix监控Tomcat 二、实验 1.Zabbix监控Tomcat 三、问题 1.获取软件包失败 2.tomcat 配置 JMX remote monitor不生效 3.Zabbix客户端日志报错 一、理论 1.Zabbix监控Tomcat (1)环境 zabbix服务端:192.168.204.214 …

模型性能的主要指标

主要参数 ROC 曲线和混淆矩阵都是用来评估分类模型性能的工具 ROC曲线(Receiver Operating Characteristic curve): ROC曲线描述了当阈值变化时,真正类率(True Positive Rate, TPR)和假正类率&#xff0…

SAP 收藏夹Favorites介绍,收藏夹导入/导出功能

作为SAP用户,经常需要使用一些事务代码T-Code, 很多时候会因为不常用其中的一些遗忘这个功能,所以这时候分类收藏好不同Module的事务代码到收藏夹里是一个不错的选择。 经常面临的一个场景就是需要变换系统环境,比如从Client A01,去到Client…

springcloud 基础

SprinbCloud微服务简介 架构发展历史 SpringBoot由baiPivotal团队在2013年开始研发、2014年4月发布第一个du版本的全新开源的轻量级框架。 它基zhi于Spring4.0设计,不dao仅继承了Spring框架原有的优秀特性,而且还通过简化配置来进一步简化了Spring应用…

QIIME 2教程. 11元数据Metadata(2023.5)

QIIME 2用户文档. 11元数据 Metadata in QIIME 2 https://docs.qiime2.org/2023.5/tutorials/metadata/ 注:此实例需要一些基础知识,要求完成本系列文章前两篇内容:《1简介和安装Introduction&Install》和4《人体各部位微生物组分析Movin…

【硬件突击 电路】

文章目录 1. 电阻(Resistor):2. 电容(Capacitor):3. 电感:4、 RC、RL、RLC电路结构及工作原理基尔霍夫定律基尔霍夫电流定律(KCL)基尔霍夫电压定律(KVL&#…

【舌尖优省PLUS】美团、饿了么外卖免费领红包,尽情享受美食与省钱!

家人们!我昨天刚开发完并上线了一个超棒的外卖免费领红包的小程序,它叫做【舌尖优省PLUS】!如果你喜欢美食,还想省下一些钱,那这个小程序绝对不能错过! 在【舌尖优省PLUS】上,你可以通过简单的…

react 生命周期方法

组件的生命周期 每个组件都包含 “生命周期方法”,你可以重写这些方法,以便于在运行过程中特定的阶段执行这些方法。你可以使用此生命周期图谱作为速查表。在下述列表中,常用的生命周期方法会被加粗。其余生命周期函数的使用则相对罕见。 挂…

第4章:决策树

停止 当前分支样本均为同一类时,变成该类的叶子节点。当前分支类型不同,但是已经没有可以用来分裂的属性时,变成类别样本更多的那个类别的叶子节点。当前分支为空时,变成父节点类别最多的类的叶子节点。 ID3 C4.5 Cart 过拟合 缺…

springcloud3 sleuth实现链路状态监控

一 slueth的介绍 1.1 slueth的作用 在微服务框架中,一个由客户端发起的请求在后端系统中会经过多个不同的服务节点调用来协同产生最后的请求结果,每一个阶段请求都会形成一条复杂的分布式调用链路,链路中任何一环出现高延时或者错误都会引起…

通讯协议038——全网独有的OPC HDA知识一之聚合(七)最小值

本文简单介绍OPC HDA规范的基本概念,更多通信资源请登录网信智汇(wangxinzhihui.com)。 本节旨在详细说明HDA聚合的要求和性能。其目的是使HDA聚合标准化,以便HDA客户端能够可靠地预测聚合计算的结果并理解其含义。如果用户需要聚合中的自定义功能&…

MySQL环境安装

文章目录 MySQL环境安装1. 卸载1.1 卸载不要的环境1.2 检查卸载系统安装包 2. 安装2.1 获取mysql官方yum源2.2 安装mysql的yum源2.3 安装mysql服务 3. 登录(1)(2)(3) 4. 配置my.cnf MySQL环境安装 说明: 安装与卸载中,用户全部切换成为root&#xff0c…

基于YOLOv8+PyQt5开发的行人过马路危险行为检测告警系统(附数据集和源码下载)

系列文章目录 文章目录 系列文章目录前言欢迎来到我的博客!我很高兴能与大家分享关于基于YOLOv8的行人过马路危险行为检测告警系统的内容。 一、系统特点1. 采用最新最优秀的目标检测算法YOLOv82. 系统分别基于PyQt5开发了两种GUI图形界面,供大家学习使用…

ruoyi-vue-pro yudao 项目bpm模块启用及相关SQL脚本

目前ruoyi-vue-pro 项目虽然开源,但是bpm模块被屏蔽了,查看文档却要收费 199元(知识星球),价格有点太高了吧。 分享下如何启用 bpm 模块,顺便贴上sql相关脚本。 一、启用模块 修改根目录 pom.xml 启用模…

Day 29 C++ STL- 函数对象(Function Object)(仿函数)

文章目录 函数对象概念概念本质 函数对象使用特点示例 谓词——返回bool类型的仿函数谓词概念一元谓词——operator()参数只有一个的谓词二元谓词——operator()参数只有俩个的谓词 内建函数对象(Builtin Function Objects)内建函数对象概念注意算术仿函…

Flowable-边界事件-补偿边界事件

目录 定义图形标记XML内容使用示例演示demo 定义 补偿边界事件可以为所依附的节点附加补偿处理器,通过关联连接到补偿处理器(compensation handler)。补偿边界事件会在流程活动完成后根据情况(事务取消或者补偿中间事件触发&…