“具有分布式能源资源的多个智能家庭的能源管理的联邦强化学习”文章学习一

news2025/1/22 13:08:25

一、摘要

        本文提出了一种新型的联邦强化学习(FRL)方法,用于管理带有家电、太阳能光伏系统和储能系统的多个智能家庭的能源。

        所提出的FRL方法的创新点在于开发了一种由本地家庭能源管理系统(LHEMS)和全局服务器(GS)组成的分布式深度强化学习(DRL)模型。使用能源消耗数据,LHEMS的DRL代理构建并上传其本地模型到全局服务器。然后,全局服务器聚合本地模型以更新LHEMS的全局模型并将其广播到DRL代理。最后,DRL代理用全局模型替换之前的本地模型,并反复重建其本地模型。在异构家庭环境下获得的仿真结果表明了所提出方法在收敛速度、设备能耗和代理数量方面的优势。

二、关键词

        深度强化学习(DRL)、分布式能源资源、联邦强化学习(FRL)、家电、家庭能源管理系统、智能家庭

三、前言

        智能家居(Smart Homes)正在配备部署在高级计量基础设施(AMI)中的智能电表,以实时监测消费者能源消耗并分析不同的消费模式。此外,连接到智能家居设备的智能插头可以快速测量能源消耗并控制设备的运行。从智能电表和智能插头收集的大量数据可以作为家庭能源管理系统(HEMS)的关键输入数据,用于管理带有电器和分布式能源资源(DERs)的智能家居的能源消耗,例如屋顶太阳能光伏(PV)和储能系统(ESS)。显然,有效利用这些大量能源消耗数据来改善HEMS的性能是大有希望的。本研究旨在开发一种基于机器学习(ML)的数据驱动方法,以实现多个智能家居的优化能源管理。

        HEMS是一种在住宅领域实现高效和经济能源管理的有希望的技术。HEMS通过使用智能电表和智能插头,可以快速实时地监测消费者的能源消耗;它们自动安排家用电器和DERs的操作,以减少电费并确保消费者的舒适度,同时考虑到他们的偏好。传统上,已经将众多的HEMS算法表述为基于模型的优化问题[1]-[7]。这些算法包括使用混合整数线性规划(MILP)进行单户和多户住宅的负荷调度[1],[2],在不同热和电条件下开发住宅能源管理系统[3],考虑实时定价下操作依赖性的家用电器最优能源消耗调度[4]。设计一个与储能系统(ESS)集成的家庭能源管理系统(HEMS) [5],同时考虑通过ESS进行双向能源控制 [6],以及开发基于分层优化技术的HEMS,包括本地HEMS和全局HEMS,以实现多个智能家庭的能源管理 [7]。

        然而,基于优化的HEMS方法是通过使用确定性和抽象的方程来表述的。它们没有考虑到家用电器和DERs的动态变化操作条件,例如WM和AC的消费者偏好的操作时间间隔和热舒适度,以及ESS的时间变化状态。因此,基于模型的HEMS优化方法可能为家庭能源消耗计划提供不准确的解决方案。此外,用于HEMS操作的大量参数和数据可以显著增加计算复杂性,甚至产生发散的解决方案。请注意,从一百万个智能电表每小时采样四次获得的数据将产生350.4亿条记录,大约相当于2920太字节[8]。

        为了解决基于模型的HEMS所遇到的这些挑战,作为ML方法的强化学习(RL)最近引起关注作为一种模型无关的HEMS方法。已经提出了与人工神经网络(ANN)模型集成的基于RL的HEMS [9]-[11]。在这些研究中,在HEMS中采用ANN预测模型,用于预测实时价格、PV发电输出和各种电力服务下的室内温度过渡,从而确保更有效的RL过程。使用Q-learning算法的HEMS中需求响应的新结构已经被提出[12]。最近,深度RL(DRL)被用于安排住宅设备的能源消耗[13]和[14]。与基于离散动作空间的Q-learning不同,DRL框架利用连续动作空间来安排家用设备的能源消耗。

        请注意,用于训练智能家居能源消耗模型的的大量数据可以为HEMS带来巨大的计算负担。为了解决这个问题,集中式基于RL的HEMS可以通过在一个单独的位置训练来自HEMS的能源消耗数据来降低本地HEMS的计算负担。然而,很明显,集中式方法对于大量动态时间变化数据处理来说可能不是实时的计算充分解决方案。此外,在中央服务器上的消费者聚合私有数据可能会暴露给潜在对手,他们可能会滥用数据来识别消费者的能源消费模式。为了同时降低由大量不确定数据引起的HEMS计算复杂性并保护消费者的隐私,本研究采用了联邦学习(FL)来解决多个智能家居的能源消耗调度问题。

        FL是一种ML方法,以分布式方式训练本地设备并计算它们的最佳模型,同时减少上传到GS的本地数据,适应异构本地设备,并保护个人数据的隐私[16]。FL被应用于无线网络边缘服务器,消除了边缘服务器和移动设备之间的大量通信开销,并保护了移动设备用户的隐私数据[17],[18]。以前的一项研究使用FL预测了电动汽车充电站的能源需求[19]。因此,充电站只将其本地模型发送给充电站提供商,从而减少了通信开销,并有效地保护了电动汽车用户的隐私数据。最近,联邦强化学习(FRL)被用于以前的研究中[20],其中确定每个代理的最佳策略,但训练数据不共享给代理,并且通过利用高斯差分来保护共享信息时的数据和模型的隐私。以前的一项研究使用基于离散控制的RL方法的DQN来开发FRL模型进行个性化代理[21]。在另一项研究中[22],为云机器人系统的导航开发了FRL架构,其中导航学习机器人有效利用其先验知识并迅速适应新环境。

        尽管FL和FRL用于解决各种工程领域的分布式控制和管理问题,但据我们所知,还没有研究开发基于FRL的HEMS框架来管理多个智能家庭的能源消耗,在考虑消费者的偏好并以分布式方式提供舒适度。在本文中,我们提出了一种计算效率高、隐私保护的基于FRL的HEMS,它由多个本地HEMS(LHEMS)和一个GS组成,如图1所示。GS和LHEMS通过以下两个步骤迭代交互构建多个家庭中空调、窗户和ESS的最优能源消耗模型。1)GS通过聚合来自所有LHEMS的本地模型来更新全局模型,并将其广播到LHEMS。2)LHEMS根据全局模型使用能源消耗数据训练其本地模型,并将它们上传到GS。

        在每个LHEMS中,空调、窗户和ESS三个代理进行DRL过程[23]。在强化学习中,随着状态-动作空间维数的增加,ANN需要更多的隐藏层来准确描述训练过程中状态和动作之间的关系。在我们的HEMS问题中,我们采用了五层隐藏层的DRL方法。如果HEMS集成了其他可控家用电器,则状态和动作空间的维度将显著增加。在这种情况下,更多的隐藏层将有利于有效的训练过程。

        本文的主要贡献如下:

        与传统的以云为中心的机器学习模型不同,在本文中,我们提出了一种使用联邦强化学习的分层分布式机器学习框架,该框架可以优化安排多个智能家庭中的空调、窗户和ESS的能源消耗,同时确保消费者的舒适度。

        我们提出了一个基于联邦强化学习的HEMS算法,该算法在全局服务器和本地HEMS之间迭代执行。全局服务器使用基于本地模型的联邦随机梯度下降算法(FedSGD)为所有本地HEMS开发全局模型。对于每个本地HEMS,三个针对空调、窗户和ESS的DRL代理将使用基于全局模型的能源消耗数据构建他们的本地模型。全局服务器和本地HEMS之间只交换本地和全局模型,可以减少通信开销并保护消费者的能源使用数据隐私。

        仿真结果表明,提出的FRL方法可以成功地安排多个智能家庭中空调、窗户和ESS的最优能源消耗,并考虑到不同的设备参数和消费者的舒适度和偏好。此外,我们还证明了提出的FRL方法在收敛速度方面优于没有FRL的DRL方法。此外,我们还证明了即使有更多的DRL代理加入FRL网络,提出的FRL方法仍然可以保持良好的性能。

        本文的其余部分组织如下:第二部分简要概述了深度强化学习和联邦强化学习。第三部分介绍了提出的基于联邦强化学习的HEMS算法的开发过程。第四部分展示了提出的方法的性能仿真结果。最后,第五部分总结了本文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1210219.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023-11-15 LeetCode每日一题(K 个元素的最大和)

2023-11-15每日一题 一、题目编号 2656. K 个元素的最大和二、题目链接 点击跳转到题目位置 三、题目描述 给你一个下标从 0 开始的整数数组 nums 和一个整数 k 。你需要执行以下操作 恰好 k 次,最大化你的得分: 从 nums 中选择一个元素 m 。将选中…

保姆级前端翻牌效果(CSS)

效果 翻牌效果 hover 时候 代码直接上 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document<…

【ArcGIS Pro微课1000例】0032:创建具有指定高程Z值的矢量数据

本文讲解ArcGIS Pro中创建具有指定高程值的矢量数据的两种方法。 文章目录 一、独立创建1. 新建地图场景2. 新建shapefile3. 绘制多边形4. 添加高程字段5. 三维显示二、基于高程源创建1. 创建栅格范围2. 添加Z值字段3. 添加Z信息4. 要素更新Z值一、独立创建 1. 新建地图场景 …

编辑器vim和编译器gcc/g++

目录 一、编辑器vim 1、概念 2、基本操作 1、进入vim 2、模式切换 3、命令行模式 4、插入模式 5、底行模式 6、vim 的配置 二、编译器gcc/g 1、概念 2、背景知识 3、gcc/g中的编译链接 1、预处理 2、编译 3、汇编 4、链接 4、函数库 1、静态库 2、动态库 一…

创新的Sui项目在CoinDCX的Unfold 2023黑客松中获奖

近日&#xff0c;在印度班加罗尔&#xff08;Bengaluru&#xff09;&#xff0c;超过2500人参加了CoinDCX组织的综合性Web3活动Unfold 2023。作为讨论、聚会和活动的一部分&#xff0c;进行了一次多链黑客松&#xff0c;Sui联合赞助了该活动。所有团队&#xff0c;无论他们构建…

python 爬虫之urllib 库的相关模块的介绍以及应用

文章目录 urllib.request 模块打开 URL&#xff1a;发送 HTTP 请求&#xff1a;处理响应&#xff1a; 应用如何读取并显示网页内容提交网页参数使用HTTP 代理访问页面 urllib.request 模块 在 Python 中&#xff0c;urllib.request 模块是用于处理 URL 请求的标准库模块之一。…

CSS 实现新拟态(Neumorphism) UI 风格

什么是新拟态(Neumorphism) UI 风格&#xff1f;网上似乎还没有一个准确统一的定义。按照我个人的通俗理解&#xff0c;就是将界面的一部分凸起来&#xff0c;另一部分凹下去&#xff0c;形成的一种错落有致的拟物风格。代表作是乌克兰设计师 Alexander Plyuto 在各平台发布的新…

μC/OS-II---内存管理2(os_core.c)

流程---内存管理扩展 初始化μC/OS-II创建用户起始任务开始多任务调度统计Task创建用户应用程序任务 初始化μC/OS-II void OSInit (void) {OSInitHookBegin(); /* Call port specific initialization code */OS_InitMisc(); …

算法笔记-第七章-链表(未完成)

算法笔记-第七章-链表 链表的遍历链表结点的个数链表的头插法!链表删除元素链表反转例题思路一:原地反转思路二:头插法链表去除重复元素(有些复杂了)思路题目一题目二链表的遍历 #include<cstdio> const int N = 100; struct Node {int data, next;//表示的是当前数据和…

C++语言相关笔记

写在前面 记录一下C的要点&#xff0c;参考的书籍如下&#xff1a; 《C Primer Plus》是偏向教学的工具书&#xff0c;可以视为偏基础&#xff1b;《C Primer》 是偏向工程实践的工具书&#xff0c;可以视为偏进阶&#xff1b;《深度探索C对象模型》则针对C对象模型进行剖析&…

flutter背景图片设置

本地图片设置 1、在配置文件pubspec.yaml中&#xff0c;设置以下代码 assets:- assets/- assets/test/2、如果目录中没有assets文件夹&#xff0c;则创建一个文件夹&#xff0c;并且取名为assets&#xff0c;在此文件夹中存放图片资源即可&#xff0c;如果想分文件夹管理&…

golang中context使用总结

一、context使用注意事项 在使用context时&#xff0c;有一些需要注意的事项&#xff0c;以及一些与性能优化相关的建议&#xff1a; 避免滥用context传递数据&#xff1a;context的主要目的是传递请求范围的数据和取消信号&#xff0c;而不是用于传递全局状态或大量数据。滥用…

ElasticSearch 增删改查操作

本文主要是介绍 ElasticSearch 的文档增删改查和批量操作&#xff0c;同时会介绍一些 REST API 返回状态码的具体含义。 我们先来看下这个表&#xff1a; 这个表包含了 Index、Create、Read、Update、Delete 这五种方法&#xff0c;我们先来看下 CRUD 操作的 HTTP 请求都长什么…

美团拼图滑块

有时候放弃也是一种智慧。 就像这说的一样&#xff0c;美团的拼图滑块&#xff0c;不知道这个缺口该怎么去处理&#xff0c;正常划顶到最外面去了&#xff0c;所以就不知道这个是咋计算的。 先来看看他的这个加密&#xff0c;跟原来的一划到底其实是一样的&#xff0c;难度只是…

php+vue3实现点选验证码

buildadmin 中的点选验证码实现 验证码类 <?phpnamespace ba;use Throwable; use think\facade\Db; use think\facade\Lang; use think\facade\Config;/*** 点选文字验证码类*/ class ClickCaptcha {/*** 验证码过期时间(s)* var int*/private int $expire 600;/*** 可以…

萌宠俱乐部

一、html代码 二、CSS代码 三、效果图 四、继续努力呀&#xff01;&#xff01;&#xff01; 一、html代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"wi…

如何使用线性模型的【分箱】操作处理非线性问题

让线性回归在非线性数据上表现提升的核心方法之一是对数据进行分箱&#xff0c;也就是离散化。与线性回归相比&#xff0c;我们常用的一种回归是决策树的回归。为了对比不同分类器和分箱前后拟合效果的差异&#xff0c;我们设置对照实验。 生成一个非线性数据集前&#xff0c;…

Java计算数据百分比

public class CalculatePCT {public static void main(String[] args) {System.out.println(getPercent(9, 100));System.out.println(getPercent2(3, 7));}/*** 方式一&#xff1a;使用java.text.NumberFormat实现*/public static String getPercent(int x, int y) {double d1…

ACM练习——第二天

今天又是一天课&#xff0c;满课&#xff0c;很累哈&#xff0c;计组真的挺难的&#xff0c;但是多学学还是可以学明白。行吧&#xff0c;继续进入今天的ACM练习&#xff0c;现阶段都是主要练习Java到C的语言过渡。 因为今天的题目多半都是昨天的延伸&#xff0c;我就不提供Jav…

Java主流分布式解决方案多场景设计与实战

Java的主流分布式解决方案的设计和实战涉及到多个场景&#xff0c;包括但不限于以下几点&#xff1a; 分布式缓存&#xff1a;在Java的分布式系统中&#xff0c;缓存是非常重要的一部分。常用的分布式缓存技术包括Redis、EhCache等。这些缓存技术可以用来提高系统的性能和响应…