【具身相关】legged_gym, isaacgym、rsl_rl关系梳理

news2025/3/13 6:40:39

【legged_gym】legged_gym, isaacgym代码逻辑梳理

  • 总体关系
    • IsaacGym
    • legged_gym
    • rsl_rl
    • 三者的关系
  • legged_gym代码库介绍
    • 环境模块env

总体关系

IsaacGym

  • Isaac Gym 是 NVIDIA 开发的一个高性能物理仿真平台,专门用于强化学习和机器人控制任务。它基于 NVIDIA 的 PhysX 物理引擎,并利用 GPU 加速仿真,能够同时运行数千个仿真环境。
  • 主要特点:

GPU 加速:利用 GPU 并行计算能力,支持大规模并行仿真。
高性能:能够同时运行数千个仿真环境,适合强化学习训练。
灵活的 API:提供 Python API,方便与深度学习框架(如 PyTorch)集成。
支持多种机器人:包括四足机器人、机械臂、无人机等。
视觉和物理仿真:支持视觉传感器(如 RGB 相机、深度相机)和物理传感器(如 IMU、力传感器)。

legged_gym

  • Legged Gym 是一个基于 Isaac Gym 的四足机器人强化学习框架,由 ETH Zurich 的 Robotic Systems Lab 开发。它专注于训练四足机器人(如 ANYmal、Spot)的运动控制策略。
  • 主要特点:

基于 Isaac Gym:利用 Isaac Gym 的高性能仿真能力。
模块化设计:环境、策略、奖励函数等模块高度可配置。
支持多种机器人:包括 ANYmal、Spot 等四足机器人。
强化学习集成:与 rsl_rl 强化学习库无缝集成。

rsl_rl

  • rsl_rl 是 ETH Zurich 的 Robotic Systems Lab 开发的一个轻量级强化学习库,专门用于机器人控制任务。它基于 PyTorch 实现,支持多种强化学习算法(如 PPO、SAC)。
  • 主要特点:

轻量级:代码简洁,易于扩展和修改。
基于 PyTorch:与 PyTorch 生态系统无缝集成。
支持多种算法:包括 PPO、SAC 等常用强化学习算法。
高效训练:针对机器人控制任务进行了优化。

三者的关系

  • Isaac Gym 提供高性能的物理仿真环境。
  • Legged Gym 基于 Isaac Gym,专注于四足机器人的强化学习任务。
  • rsl_rl 提供强化学习算法的实现,用于训练 Legged Gym 中的机器人控制策略。

工作流程:

  1. 使用 Isaac Gym 创建仿真环境。
  2. 使用 Legged Gym 配置四足机器人的任务和环境。
  3. 使用 rsl_rl训练强化学习策略。
  4. 将训练好的策略部署到实际机器人上。

legged_gym代码库介绍

  • 项目地址:legged_gym代码库
    在这里插入图片描述

环境模块env

  • 环境模块定义了四足机器人的仿真环境和任务,它是 legged_gym 的核心部分,负责与 Isaac Gym 的交互
  • 这里将机器人看做是环境,env下每一个文件夹对应一种机器人
  • base/:包含基础环境类和机器人类的实现。
  • legged_robot.py:定义了四足机器人的基类,包括机器人初始化、状态更新、奖励计算等功能。
  • legged_robot_config.py:机器人配置类,用于定义机器人的物理参数、控制参数等
  • 每个环境由一个环境文件xx.py和一个配置文件xx_config.py定义
  • PPO的相关设置也在xx_config中定义
    在这里插入图片描述
  • 定义新环境时,需要在__init__函数中注册,传入类、配置、PPO的类
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2314145.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

侯捷C++课程学习笔记:构造函数那些事儿(四)

C 构造函数全面解析 上图节选自爱吃喵的鲤鱼 一、构造函数基础特性 1. 核心功能定位 ​对象初始化中枢:负责在对象创建时完成成员变量的初始化工作​生命周期唯一性:每个对象在其生命周期内仅被调用一次,类似出生证明的签发过程 2. 基础语…

微信小程序审核失败,你的小程序涉及提供播放、观看等服务,请补充选择:文娱-其他视频类目 解决

之前审核的都没有什么问题,结果这次就不给过还提示我们这个。 我们的视频是操作演示的视频。仅用于介绍使用。 是否接受修改指引,勾选我不理解以上内容 再勾选 下面不理解内容异项 申诉理由 视频播放和观看只限于当前用户自己使用,而视…

蓝桥杯嵌入式组第七届省赛题目解析+STM32G431RBT6实现源码

文章目录 1.题目解析1.1 分而治之,藕断丝连1.2 模块化思维导图1.3 模块解析1.3.1 KEY模块1.3.2 ADC模块1.3.3 IIC模块1.3.4 UART模块1.3.5 LCD模块1.3.6 LED模块1.3.7 TIM模块 2.源码3.第七届题目 前言:STM32G431RBT6实现嵌入式组第七届题目解析源码&…

苹果iOS 18.4将强制升级HomeKit架构,旧版设备或无法使用

在科技飞速发展的当下,智能家居领域也在不断革新。而苹果公司作为科技行业的巨头,其每一次动作都备受关注。近日,有消息称苹果计划在iOS 18.4版本中停止对旧版HomeKit架构的支持,这一举措意味着用户将被迫升级,也可能对众多使用Apple Home应用的智能家居设备用户产生深远影…

在MATLAB中实现PID控制仿真

在MATLAB中实现PID控制仿真可以通过代码编程或Simulink图形化建模两种方式完成。以下是两种方法的详细操作步骤和示例: 方法1:使用MATLAB脚本编程(基于控制系统工具箱) 步骤1:定义被控对象的数学模型 假设被控对象是…

Python核心模块的高级用法及Linux系统常用命令

一、Python相关 1、正则表达式 (1)正则表达式基础 ①含义:记录文本规则的代码。 ②注意:需要导入re模块 ③特点: 语法比较复杂,可读性较差。通用性很强,适用于多种编程语言 ④步骤&#…

Spring 框架学习

技术体系结构 总体技术体系 单一架构 一个项目,一个工程,导出为一个 war 包,在一个 Tomcat 上运行,也叫 all in one。 单一架构,项目主要应用技术框架为:Spring、SpringMVC 、Mybatis。 分布式架构 一个…

ubuntu22.04 关于挂在设备为nfts文件格式无法创建软连接的问题

最近遇到情况,解压工程报错,无法创建软连接 但是盘内还有130G空间,明显不是空间问题,查找之后发现是移动硬盘的文件格式是NTFS,在ubuntu上不好兼容,于是报错。 开贴记录解决方案。 1.确定文件格式 使用命…

pydub AudioSegment入门(基于Pyhton3)

目录 简介核心功能安装与依赖基本用法加载音频文件导出音频文件音频基础操作 简介 pydub 是一个简单易用的 Python 音频处理库,专注于提供高层次的音频操作接口,而 AudioSegment 是它的核心类,用于表示音频片段(如 MP3、WAV、OGG…

LLM预训练过程-简明版本

文章总结自视频:【1080P】安德烈卡帕西:深入探索像ChatGPT这样的大语言模型|Andrej Karpathy_哔哩哔哩_bilibili 1. 准备训练集 详细的数据集准备方法可参考视频,或者huggingFace ​ 2. 分词(Tokenizer) …

mingw32编译ffmpeg

ffmpeg https://gitee.com/mirrors/ffmpeg.git 使用msys2的mingw32 pacman -S mingw-w64-x86_64-toolchain compile ./confiure --enable-static --disable-shared --enable-gpl --target-oswin32 mingw32-make -j4 提示编译错误,msys2里面的路径是/d/tools/msys2…

MAVEN解决版本依赖冲突

文章目录 一、依赖冲突概念1、什么是依赖冲突2、依赖冲突的原因3、如何解决依赖冲突 二、查看依赖冲突-maven-helper1、安装2、helper使用1、conflicts的阅读顺序(从下向上看)2、dependencies as List的阅读顺序(从下向上看)3、de…

Linux Bash 单命令行解释 | 文件操作 / 字符串操作 / 重定向

注:本文为 “Linux Bash” 相关文章合辑。 中文引文,未整理。 英文引文,机翻未校。 第一部分:文件操作 1. 清空文件(清除文件大小为 0) $ > file这行命令使用输出重定向操作符 >。输出重定向造成文…

在终端中用code命令打开vscode并加载当前目录了

注册code命令 启动 VSCode 编辑器,按 shift command p输入 shell command,选择 Install ‘code’ command in PATH 选项, 安装code 命令 此操作会把 code 命令添加到系统的环境变量里。 打开 iTerm2 终端 在 iTerm2 中,cd 代码库根目录, …

ESMFold对决AlphaFold:蛋白质-肽相互作用预测的新进展

今天向大家介绍的这篇文章题目为:“Protein−Peptide Docking with ESMFold Language Model”,近期发表在JCTC上。 本文主要研究 ESMFold 语言模型在蛋白质-肽对接中的应用。通过探索多种对接策略,评估其在预测蛋白质-肽相互作用方面的性能&a…

win终端添加git-bash,支持linux的shell语法

git的git-bash支持很多linux的语法,比如ll,rm等等,用着很方便,比cmd、ps用着习惯 点击下箭头,设置 添加新配置 配置 地址为git地址\bin\bash.exe,不要用根目录的git-bash.exe,这个会打开新弹窗后…

wpf中DataGrid组件每一行的背景色动态变化

背景描述:存在多个轧辊,其中有的轧辊是成对的,成对的辊ROLL_NO这个变量的值相同,有的轧辊是单个暂时没有配对的。成对的辊北京颜色交替突出显示,单个辊不需要设置背景色。 实现: 换辊的时候给成对的辊分配相…

002-告别乱码-libiconv-C++开源库108杰

本课文包含三个视频! 为什么中文版Windows是编程出现乱码的高发地带?怎么用 libiconv 把国标编码的汉字转换成宇宙统一码?怎么简化 libiconv 那些充满坑的 纯C 函数API? 1. 安装 libiconv 通常,你在 MSYS2 中安装过 G…

DeepSeek赋能智慧交通:城市交通流量智能预测与优化,开启智能出行新时代

在数字化转型的浪潮中,智慧交通正成为提升城市运行效率、改善居民出行体验的关键领域。 DeepSeek作为人工智能领域的前沿技术,凭借其强大的数据分析、智能决策和多模态交互能力,正在为智慧交通注入新的活力,推动交通管理从“经验…

Token登录授权、续期和主动终止的方案(Redis+Token(非jwtToken))

1、RedisToken方案的授权 1.1 基本原理 登录后使用UUID生成token,前端每次请求都会带上这个token作为授权凭证。这种方案是能自动续签,也能做到主动终止。所以很多项目用的都是RedisToken方案,简单方便问题少。缺点就是需要依赖Redis和数据…