ACT训练调参技巧

ACT训练调参技巧

news2025/7/9 1:47:57

ACT Tuning Tips

这里是针对斯坦福Aloha机械臂远程训练调参技巧的中文解释，初学者可能会对此感到陌生，不过不用担心，多尝试，多实验。

- Chunk size is the most important param to tune when applying ACT to a new environment. One chunk should correspond to ~1 secs wall-clock robot motion.

- 当应用ACT到新环境时，块大小（chunk size）是最重要的调整参数。一个块应该对应大约1秒钟的机器人动作。

- High KL weight (10 or 100), or train without CVAE encoder.

- 高KL权重（10或100），或者在没有CVAE编码器的情况下进行训练。

- Consider removing temporal_agg and increase query frequency here to be the same as your chunk size. I.e. each chunk is executed fully.

- 考虑删除 temporal_agg 并增加查询频率，使其与您的数据块大小相同。即每个数据块都完整执行。

- train for very long (well after things plateaus, see picture)

- 长时间训练（直到达到平稳状态，参考图像）。

- Try to increase batch size as much as possible, and increase lr accordingly. E.g. batch size 64 with learning rate 5e-5 versus batch size 8 and learning rate 1e-5

- 尽可能的增加批次大小（batch_size），并增加相应学习率（lr）。

例如:

batch_size = 64，lr = 5e-5，

batch_size = 8，lr = 1e-5。

- Have separate backbones for each camera (requires changing the code, see this commit)

- 为每台摄像头单独设置主干网络（需要更改代码，请参考该提交），截图如下

- L1 loss > L2 loss (not precise enough)

- L1 损失 > L2 损失（表示不够精确）

- Abs position control > delta/velocity control (harder to recover)

- 绝对位置控制 > 增量/速度控制（更难恢复）

- Try multiple checkpoints

- 尝试多个检查点

For real-world experiments:

对于真实实验：

- Train for even longer (5k - 8k steps, especially if multi-camera)

- 增加训练时间（5k~8k 步，特别是在多摄像头的情况下）

- If inference is too slow -> robot moving slowly: disable temporal_agg and increase query frequency here. We tried as high as 20.

- 如果推理速度太慢导致机器人移动缓慢：禁用 temporal_agg 并增加查询频率。我们尝试过最高为20。

示例 loss 曲线 (L1)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2154622.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【YOLO目标检测学生课堂行为数据集】共4266张、已标注txt格式、有训练好的yolov5的模型

【YOLO目标检测学生课堂行为数据集】共4266张、已标注txt格式、有训练好的yolov5的模型

目录说明图片示例说明数据集格式：YOLO格式图片数量：4266 标注数量(txt文件个数)：4266 标注类别数：3 标注类别名称：hand、read、write 数据集下载：学生课堂行为数据集图片示例数据集图片&#…

阅读更多...

HTML5中新增元素介绍

HTML5中新增元素介绍

引入了许多新元素，以增强网页的语义和功能。这些新元素大致可以按以下几类进行分类和介绍。下面是对各标签的详解，section、header、footer、nav、article、aside、figure、code、dialog、meter、time、progress、video、audio、details、atagrid、menu…

阅读更多...

AIGC7: 高通骁龙AIPC开发者沙龙过程记录A

AIGC7: 高通骁龙AIPC开发者沙龙过程记录A

图中是一座高耸的宫殿。就像AI的出现，慢慢初现端倪，头角峥嵘。背景一直以来都比较关注AI的发展，有幸再一次参加异常AI的盛会。从我的角度看。高通是一家生产芯片的公司，国内的小米，荣耀，Oppo , Vi…

阅读更多...

Qt_窗口界面QMainWindow的介绍

Qt_窗口界面QMainWindow的介绍

目录 1、菜单栏QMenuBar 1.1 使用QMainWindow的准备工作 1.2 在ui文件中设计窗口 1.3 在代码中设计窗口 1.4 实现点击菜单项的反馈 1.5 菜单中设置快捷键 1.6 菜单中添加子菜单 1.7 菜单项中添加分割线和图标 1.8 关于菜单栏创建方式的讨论 2、工具栏QToolBar …

阅读更多...

[产品管理-32]：NPDP新产品开发 - 30 - 文化、团队与领导力 - 领导力与团队的可持续发展

[产品管理-32]：NPDP新产品开发 - 30 - 文化、团队与领导力 - 领导力与团队的可持续发展

目录一、团队领导的领导力 1.1 领导力 1、领导力的定义 2、领导力的重要性 3、领导力的构成要素 4、如何提升领导力 1.2 情商二、虚拟团队 1、团队定义与特征 2、团队优势 3、团队挑战与应对策略三、可持续发展四、团队管理和领导力中的度量指标 4.1 激励创新…

阅读更多...

unix中的进程标识以及使用场景

unix中的进程标识以及使用场景

一、前言本文将介绍unix系统中的进程标识以及使用场景。进程标识和用户标识类似，只不过其指代的对象是一个进程。我们常把进程标识称为进程ID，本文将讨论如下内容： 1.什么是进程标识？ 2.特殊的进程标识 3.如果获取以及使用进程标…

阅读更多...

深度学习02-pytorch-09(pytorch完结篇)-基本使用介绍-线性回归案例

深度学习02-pytorch-09(pytorch完结篇)-基本使用介绍-线性回归案例

使用PyTorch的基本流程：数据准备：通过make_regression生成回归数据，使用 TensorDataset 和 DataLoader 来封装数据。模型定义：使用 nn.Module 或内置层（如 nn.Linear）来定义模型结构。损失函数和优化器…

阅读更多...

【全网最全】2024年华为杯研赛D题成品论文获取入口（后续会更新）

【全网最全】2024年华为杯研赛D题成品论文获取入口（后续会更新）

您的点赞收藏是我继续更新的最大动力！ 一定要点击如下的卡片，那是获取资料的入口！ 点击链接加入【2024华为杯研赛资料汇总】：https://qm.qq.com/q/XzdIsvbiM0https://qm.qq.com/q/XzdIsvbiM0 你是否在寻找数学建模比赛的突破点…

阅读更多...

【他山之石】优化 JavaScript 的乐趣与价值（下）

【他山之石】优化 JavaScript 的乐趣与价值（下）

前言继本文的上篇发表之后，没想到反响还挺好，看来大家在 JS 优化的问题上越来越注重“与国际接轨”了。一起来看本文的下篇，也是干货满满。文章目录 6. Avoid large objectsWhat the eff should I do about this? 7. Use eval8. Use str…

阅读更多...

多元形式助力商业价值最大化，王鹤棣商业影响力遥遥领先

多元形式助力商业价值最大化，王鹤棣商业影响力遥遥领先

明星商业代言层出不穷，但在个人影响力的升级玩法上，当代青年偶像王鹤棣以其独特的个人魅力和卓越的商业头脑，正逐步搭建起一个以个人形象为核心，与各大品牌相互成就的立体商业模型。通过一系列创新的商务合作模式，王鹤…

阅读更多...

[Java并发编程] synchronized（含与ReentrantLock的区别）

[Java并发编程] synchronized（含与ReentrantLock的区别）

文章目录 1. synchronized与ReentrantLock的区别2. synchronized的作用3. synchronized的使用3.1 修饰实例方法，作用于当前实例，进入同步代码前需要先获取实例的锁3.2 修饰静态方法，作用于类的Class对象，进入修饰的静态方法前需要…

阅读更多...

React组件如何暴露自身的方法

React组件如何暴露自身的方法

一、研究背景最近遇到一个如何暴露React组件自身方法的问题。在某些时候，我们需要调用某个组件内部的方法以实现某个功能，因此我们需要了解如何暴露组件内部API的方法。二、实践过程本文主要介绍React组件暴露子组件API的方法，以下是实…

阅读更多...

2024年研赛-华为杯数模竞赛C题论文首发+论文讲解+代码分享

2024年研赛-华为杯数模竞赛C题论文首发+论文讲解+代码分享

2024年华为杯-研赛分享资料（论文分享部分代码）（已更新部分代码）：链接：https://pan.baidu.com/s/1HGIYjV3lqzUc_3H0vg5H8w 提取码：sxjm 题目： _基于数据驱动下磁性元件的磁芯损耗建模…

阅读更多...

leetcode第十三题：罗马数字转整数

leetcode第十三题：罗马数字转整数

罗马数字包含以下七种字符: I， V， X， L，C，D 和 M。字符数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1000 例如&#x…

阅读更多...

OpenCV特征检测(7)角点检测函数goodFeaturesToTrack()的使用

OpenCV特征检测(7)角点检测函数goodFeaturesToTrack()的使用

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述确定图像上的强角点。该函数根据 240中所描述的方法查找图像中最显著的角点或者指定图像区域内的最显著角点。函数使用 cornerMinEigenVal 或…

阅读更多...

华南理工大学信息工程高频电子线路课程设计——基于锁相环的调试解调器设计

华南理工大学信息工程高频电子线路课程设计——基于锁相环的调试解调器设计

完整报告链接如下： 通过网盘分享的文件：高频课设报告.docx 链接: https://pan.baidu.com/s/1J83UCDSU0UHcv4ONYxfyhg?pwdzqyr 提取码: zqyr --来自百度网盘超级会员v5的分享懒得贴上来了，放一下截图。

阅读更多...

ICM20948 DMP代码详解（34）

ICM20948 DMP代码详解（34）

接前一篇文章：ICM20948 DMP代码详解（33） 上一回解析了inv_icm20948_initialize_lower_driver函数中设置FIFO_RST和FIFO_CFG寄存器相关的代码，本回继续往下解析inv_icm20948_initialize_lower_driver函数的后续代码。为了便于理解和…

阅读更多...

蓝桥杯【物联网】零基础到国奖之路:十. OLED

蓝桥杯【物联网】零基础到国奖之路:十. OLED

蓝桥杯【物联网】零基础到国奖之路:十.OLED 第一节硬件解读第二节 MDK配置 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/fa7660b81be9407aa19c603561553db0.png)第三节代码第一节硬件解读 OLED硬件知识: 第二节 MDK配置第三节代码 include头文件。编…

阅读更多...

Webui 显卡有显存，会报错：CUDA out of memory

Webui 显卡有显存，会报错：CUDA out of memory

Webui 显卡明明有显存，会报错：CUDA out of memory 网上找了很多资料，都没有能解决这个问题 ，后来发现和电脑虚拟内存设置有关，这里记录一下具体的解决方法： 什么是 CUDA Out of Memory 错误？ …

阅读更多...

【MySQL】字符集与Collation

【MySQL】字符集与Collation

今天做项目，突然发现，项目中使用的MySQL的库排序规则是 utf8mb4_general_ci，而我自己用的MySQL8默认库规则是utf8mb4_0900_ai_ci，于是想要弄清楚出处（写的非常详细）：mysql设置了utf8mb4&#x…

阅读更多...

推荐文章

最新文章