自主学习库简化智能代理创建

news2025/3/12 10:02:09

观看当今毁灭人类的智能代理玩复杂的视频游戏可能很有趣 - 但创建一个是另一回事。构建有效的智能代理需要设置大量超参数来塑造环境、建立奖励等。来自马萨诸塞大学阿默斯特分校的一组研究人员试图通过他们新的自主学习图书馆项目来简化这一过程。

自治学习库是 PyTorch 的深度强化学习（DRL）库，可简化新型强化学习代理的构建和评估。该计划的核心理念之一是强化学习（RL）应该是基于代理的，这意味着模型只是接受状态和奖励，然后返回一个动作。

2023-08-11T06:17:28.png

规范代理-环境反馈循环

自治学习库将控制环路与代理逻辑分离，以简化代理实现和控制回路本身，从而提高代理使用方式的灵活性。在这种情况下，该项目允许代理的操作由控制循环确定，从而使代理接口和实现非常简洁。

2023-08-11T06:18:08.png

class Agent(ABC):
	@abstractmethod
	del act(self,state,reward):
		pass

自主学习库代理界面

在这里插入图片描述

def act(self,state,reword):
	self._store_transition(self._state,self._action,reward,state)
	self._train()
	self._state = state
	self._action = self.policy(state)
	return self.action

自治学习库中的 DQN 实现

自治学习库将RL代理分为两个不同的模块：“all.agents”和“all.presets”。“all.agents”模块包含常见算法的实现，如Rainbow，A2C，Vanilla等;而“all.presets”提供了这些代理在特定环境下调整的具体示例，例如雅达利游戏、经典控制任务等。

2023-08-11T06:18:49.png

雅达利游戏环境中 RL 代理的基准测试结果

该项目还强调函数逼近模块是其中心抽象之一。通过构建依赖于近似抽象而不是直接与 PyTorch 模块和优化器对象接口的代理，用户可以在不更改其源代码的情况下添加或修改代理的功能（称为“开闭原则”）。这使代理实现能够专注于自行定义 RL 算法。

2023-08-11T06:19:11.png

研究人员还制作了一个示例实现，以演示自主学习库在开发原始库中未包含的新代理方面的效用。虽然结果并没有使代理看起来特别聪明，但它们确实证明了库的实用性。

2023-08-11T06:19:28.png

使用自治学习库构建新的 RL 代理的示例演示的结果。

自主学习图书馆项目由马萨诸塞大学阿默斯特分校强化学习博士生克里斯托弗·诺塔（Christopher Nota）分享。其他信息可在项目Github上找到。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/865789.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

自主学习库简化智能代理创建

相关文章

Mysql - 配置Mysql主从复制-keepalived高可用-读写分离集群

【vue3】解决scope.row.id套标签太多无法随着点击按钮而变化

BGP小综合

分布式事务模式理论详解

SaaS，PaaS，IaaS之间的主要区别

DL_20无线串口模块

（二）结构型模式：1、适配器模式（Adapter Pattern）（C++实现示例）

Java基础篇--运算符

@RequestHeader使用

k8s 滚动更新控制（一）

Java泛型集合简明教程

Java课题笔记~ JSP编程

【逗老师的PMP学习笔记】10、项目沟通管理

光威神策DDR5 6800超频破10GHz，国产良心价高端内存创造历史

MySQL 中读写分离可能遇到的问题

JavaWeb-Servlet服务连接器（一）

《数据同步-NIFI系列》Nifi配置UpdateAttribute实现字符串时间戳转日期

章节5：脚本注入网页-XSS

web-js

Linux基础与应用开发系列九：各类系统函数