探索人工智能在大规模采用电动汽车的时代将解决电力供需难的问题

news2024/12/25 9:30:14

1.导言

论文地址:https://arxiv.org/abs/2404.12520
随着电动汽车(EV)的普及,高峰期的用电需求可能会大幅增加。因此,如何适当控制电动汽车充电并尽量减少高峰期的用电量是一项重要挑战。传统上,基于模型和单一代理的强化学习方法被用于电动汽车充电控制,但它们在处理不确定性、隐私和可扩展性方面面临挑战。

因此,本文提出了一种基于多代理强化学习(MARL)的分布式协调电动汽车充电控制方法。本文对所提出的方法进行了理论分析,并通过数值模拟对其性能进行了评估,结果表明该方法优于集中式方法,而且在有大量电动汽车用户的实际情况下非常有效。

2.相关研究

以往有关电动汽车充电控制的研究大致分为基于模型的强化学习方法和无模型强化学习方法。

2.1 基于模型的方法

- 已提出的方法包括二元优化、混合整数线性规划、稳健优化、随机优化、模型预测控制和动态规划。
- 这些方法都需要精确的系统模型。

2.2 强化学习法

- 单个代理强化学习方法:如深度 Q-learning、贝叶斯神经网络、Advantage Actor-Critic 和 DDPG 已被应用。假定完全可观测,但从隐私角度看不切实际。
- 多代理强化学习方法:一些研究将其用于学习多个电动汽车站和充电运营商的定价策略。然而,许多研究似乎并未考虑代理之间的合作。此外,在某些情况下,也尝试过通过联邦强化学习进行代理间协调,但其前提是每个代理都能观察到整个网络的需求。

在上述研究的基础上,本文的新颖之处在于提出了一种分散式 MARL 方法,这种方法在运行时考虑了合作并保护隐私。

3 . 建议方法

在所提出的方法中,电动汽车网络中的每个电动汽车用户都有一个安装在智能电表上的强化学习代理,如图 1 所示。网络有两层,由物理电源层和控制层组成。

在物理电源层,所有电动汽车通过共享变压器连接到上游电网(公用事业公司)。在控制层,安装在每个电动汽车用户智能电表中的 RL 代理负责根据动态电价和物理层限制(如共享变压器)有效管理和协调电动汽车充电。

作为具体的控制策略,本文提出了两种多代理 DDPG 方法,一种是集中式方法(CTDE-DDPG),另一种是分散式方法(I-DDPG)。

3.1 独立发展集团(I-DDPG)

- 完全分散式方法。
- 每个代理都有自己的代理-批评网络,并将其他代理视为环境的一部分。
- 计算成本低,政策梯度方差小,但容易受到非平稳性的影响。

3.2 集中培训 分散执行 DDPG (CTDE-DDPG)

- 代理之间仅在学习过程中进行合作,在执行过程中进行分布式操作 - 每个代理共享一个集中的价值函数,并集中管理词缀网络 - 代理之间的合作可减轻非平稳性的影响,但计算成本高,策略梯度方差大

在图 2 所示的 CTDE-DDPG 框架中,代理之间仅在学习阶段共享信息,而每个代理在执行阶段独立运行。在学习阶段,所有代理都能获取所有代理的观察结果和行动,但在执行阶段,它们无法获取此类信息。每个代理都有一个代理-批判网络,在学习阶段,代理根据本地观察结果选择行动,然后由一个集中的价值函数(即共同批判网络)进行评估。另一方面,在运行阶段,行动者是分散的,他们只根据本地信息决定自己的行动。

因此,在 CTDE-DDPG 中,学习过程中的合作可以减轻代理之间的不稳定性,同时在执行过程中保护隐私。而在 I-DDPG 中,代理的学习和执行是相互独立的。

4. 试验

4.1 实验装置

对基于 IEEE 5 巴士系统的电动汽车网络进行了模拟,并对多达 20 个代理(电动汽车用户)的场景进行了评估。充电阶段包括 34 个步骤。表 I 显示了 DDPG 的超参数。

4.2 一般性能

图 4 显示了 10 个代理的平均剩余电池容量。从图中可以看出,两种方法都能满足电动汽车用户的要求。

4.3 合作价值函数的影响。

图 5 显示了 10 个药剂的平均充电率:I-DDPG 显示了一种振荡充电模式,而 CTDE-DDPG 显示了一种平滑充电模式。根据公式 (21) 的定义,CTDE-DDPG 的总变化(简称 TV)比 I-DDPG 小约 36%。


图 6 显示了平均电价,图 7 显示了每天的平均充电成本。代理数量越多,CTDE-DDPG 的价格/成本往往越低。

4.4 趋同与公平

图 8 显示了平均每集奖励。两种方法都收敛于相同的策略,但方差往往更大。

图 9 显示了最差和最佳代理的性能比(公平性)。随着代理数量的增加,I-DDPG 的公平性下降了,而 CTDE-DDPG 则保持了良好的公平性。

根据理论分析,CTDE-DDPG 的政策梯度方差较大,但合作学习能够缓解非平稳性。这种合作有助于平滑收费模式、稳定价格和提高公平性。即使代理数量增加,CTDE-DDPG 的表现也很稳健。这些实验结果表明,CTDE-DDPG 是一种有效的分布式协调充电控制方法,可应用于大规模电动汽车网络。

5. 结论

本研究提出了一种用于电动汽车网络充电控制的集中式和分散式多代理强化学习方法,并从理论和实验两方面证明了该方法的有效性。所提出的方法既能提供高效的基于合作的充电控制,又能在执行过程中保护隐私。研究还发现,所提出的方法在大型电动汽车网络中具有鲁棒性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2211877.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

编程练习3 密码输入检测

#include<iostream> #include<vector> #include<string>using namespace std;// 判断字符是否为小写字母 bool isLower(char ch) {return ch > a && ch < z; }// 判断字符是否为大写字母 bool isUpper(char ch) {return ch > A && …

2024.10.8号培训计算机及外部设备装配调试员

1.理论 &#xff08;1&#xff09;电脑的种类&#xff1a;台式机&#xff1a;台式电脑&#xff0c;是一种各功能部件相对独立计算机&#xff0c;又分品牌机和兼容机。 &#xff08;2&#xff09;笔记本电脑&#xff1a;手提电脑或者膝上型电脑&#xff0c;是一种体积小&#…

【C++】内存管理,RALL原则和智能指针

1 C资源管理 C资源管理是确保程序运行效率和稳定性的关键。资源管理涉及变量、参数的存储和生命周期控制&#xff0c;以及动态内存的分配和释放。C通过一套内存管理机制来实现资源的有效分配和管理。 1.1 内存管理 为适用不同场景&#xff0c;C提供了多种内存管理方式&#…

基于Springboot+Vue的校园消费点评系统(含源码数据库)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: SpringBoot自带 apache tomcat 主要技术: Java,Springboot,mybatis,mysql,vue 2.视频演示地址 3.功能 这个系…

大顶堆优化dp,带限制的子序列

前言&#xff1a;看到这个题目的时候我们可以用大顶堆记录前面的最大值&#xff0c;这样我们转移的时候就少了很多繁琐的查询 题目地址 class Solution { public:int constrainedSubsetSum(vector<int>& nums, int k) {int n nums.size();vector<int> ans nu…

论文Idea | 人工智能与建筑的交叉领域探索

在人工智能&#xff08;AI&#xff09;与建筑领域的交叉研究中&#xff0c;学者们探索了如何利用AI技术优化建筑设计、施工、管理以及运营等各个环节。以下是关于这一交叉领域的一些关键内容、研究方向、代表性论文及资源。 1.人工智能在建筑领域的应用概述 人工智能技术的快速…

Dev-Cpp 5.11 安装教程【保姆级】

目录 1. 准备软件安装包 2. 软件安装 3. 软件使用过程中必备的预先设置 写在前面 1. 如果你的电脑是Win 7&#xff0c;建议安装Dev-Cpp 5.11&#xff0c;解决软件和系统的兼容问题。具体安装步骤按照本教程进行即可。 2. 如果你的电脑是Win 10&#xff0c;建议安装Embarca…

QML6 项目生成缓存文件取消办法

有时候我们创建QML项目会在 C:\Users\85720\AppData\Local 文件夹下生成临时缓存文件&#xff0c;不注意的话&#xff0c;文件会越来越多&#xff0c;很烦人。 可以试试通过下面方法取消生成qml缓存文件&#xff0c;配置-》构建和运行 这里选 Use qmlcachegen: 禁用

java web 之过滤器Filter

1、概念 当访问服务器的资源时&#xff0c;Filter过滤器可以将请求拦截下来&#xff0c;完成一些特殊的功能。 通常都是用来拦截request进行处理的&#xff0c;也可以对返回的response进行拦截处理。 一般用于完成通用的操作。如&#xff1a;登录验证、统一编码处理、敏感字…

丰田,也杀入料箱AGV市场

导语 大家好&#xff0c;我是社长&#xff0c;老K。专注分享智能制造和智能仓储物流等内容。 新书《智能物流系统构成与技术实践》人俱乐部 在全球仓储自动化领域的竞争日益激烈之际&#xff0c;一场引人注目的合作正在悄然展开。 丰田旗下的物料搬运巨头范德兰德(Vanderlande)…

NSSCTF-WEB-pklovecloud

目录 前言 正文 思路 尝试 结尾 前言 许久未见,甚是想念. 今天来解一道有意思的序列化题 正文 思路 <?php include flag.php; class pkshow {function echo_name(){return "Pk very safe^.^";} }class acp {protected $cinder;public $neutron;public $…

安当数据库透明加密组件:守护您的 ClickHouse 数据安全

数据库简介 ClickHouse 是一款高性能的列式数据库管理系统&#xff0c;专为在线分析处理&#xff08;OLAP&#xff09;设计。它以其卓越的查询性能、强大的 SQL 支持和灵活的可扩展性&#xff0c;在大数据分析领域广受赞誉。无论是实时数据分析、业务智能还是广告技术&#xf…

栈溢出0x0D ret2_dl_runtime_resolve

实际上&#xff0c;dl_runtime_resolve 是通过最后的 字符串 来确定执行那一个函数的&#xff0c;也就是说&#xff0c;可以通过控制这个地址的内容来执行任意函数&#xff0c;比如&#xff1a;system 而 reloc_arg 是我们可控的&#xff0c;我们需要控制reloc_arg 间接控制 最…

【096】基于SpringBoot+Vue实现的私人健身与教练预约管理系统

系统介绍 视频演示 基于SpringBootVue实现的私人健身与教练预约管理系统 文档 PPT 源码 数据库脚本 课程设计 基于SpringBootVue实现的私人健身与教练预约管理系统采用前后端分离的架构方式开发&#xff0c;系统整体设计了管理员、教练、用户三种角色&#xff0c;实现了用户查…

根据Vue对比来深入学习React 下 props 组件传值 插槽 样式操作 hooks 高阶组件 性能优化

文章目录 函数组件的特点props组件间的传值父传子看上例子传父兄弟组件传值祖先组件传值 插槽基础插槽具名插槽作用域插槽 样式操作**CSS Modules** 生命周期useRef常用hookuseStateuseEffectuseContextuseReduceruseMemouseCallback 高阶组件什么时候使用 react性能问题和优化…

LeetCode讲解篇之2266. 统计打字方案数

文章目录 题目描述题解思路题解代码题目链接 题目描述 题解思路 我们使用逆向思维发现如果连续按存在三个字母的按键&#xff0c;最后一个按键表示的字母可以是某个字母连续出现一次、两次、三次这三种情况的方案数之和 我们发现连续按存在三个字母的按键&#xff0c;当连续按…

数据治理中的核心 元数据

数据治理中的核心元素——元数据 一、关于元数据 1、什么是元数据 元数据&#xff08;metadata&#xff09;是关于数据的组织、数据域及其关系的信息&#xff0c;简单来说&#xff0c;元数据就是被用来描述数据的数据。 概念阐述总归生涩&#xff0c;下面用几个简单的例子来…

【千图网-登录_注册安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 1. 暴力破解密码&#xff0c;造成用户信息泄露 2. 短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉 3. 带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造…

【双指针算法】移动零

1.题目解析 2.算法分析 可以归结为数组划分/数组分块&#xff08;采用双指针算法&#xff09;-->利用数组下标充当指针 &#xff08;1&#xff09;首先定义两个指针 dest&#xff1a;已处理的区间内&#xff0c;非零元素的最后一个位置cur&#xff1a;从左往右扫描数组&…

Stm32+Esp8266连接阿里云程序移植教程(MQTT协议)

Stm32Esp8266连接阿里云程序移植教程&#xff08;MQTT协议&#xff09; 一、前期准备二、移植过程三、程序的使用3.1 连接上阿里云3.2 传输用户数据到阿里云3.3 解析从阿里云下发给用户的数据3.4 关于调试接口 一、前期准备 自己要的工程文件移植所需的文件&#xff08;如下图&…