“具有分布式能源资源的多个智能家庭的能源管理的联邦强化学习”文章学习三——基于联邦深度学习的多智能家居能源管理

news2025/1/14 18:02:49

一、系统描述

        我们考虑一个基于FRL的HEMS,它由单个GS和N个LHEMS组成,如图2所示。如图2-C所示,FRL训练过程包括两个步骤:步骤1)使用本地数据对LHEMS(即本地神经网络的权重ωn)进行本地模型的训练和更新;步骤2)通过平均法(ωG = 1N [1]Nn=1 ωn)对GS进行全局模型的聚合和更新。更新后的本地模型和全局模型将迭代交换,直到满足某种停止标准。

        我们考虑LHEMS调度三种可控设备的情形:1)可减少设备(AC);2)具有非可中断负载的可调度设备(WM);3)具有可中断负载的可调度设备(ESS)。可减少设备的能源消耗可以降低电力成本。在分时电价方案下,可调度设备的能源消耗可以从一个时间段转移到另一个时间段,以最小化总电力成本。具有可中断或不可中断负载的可调度设备。在设备任务期间,HEMS控制不能停止具有不可中断负载的可调度设备的运行。相比之下,具有可中断负载的可调度设备可以随时中断。

        在HEMS中,AC、WM和ESS的代理通过A2C深度强化学习过程独立执行各自设备的提前一天调度,以1小时为调度分辨率,遵循分时电价。每个设备代理的目标是在满足消费者舒适水平和偏好的同时,降低电力成本并考虑设备运行特性。对于AC,给定状态SAC包括电价、室外温度和室内温度(如4所示),AC代理通过最大化Rt AC(如8所示)来决定AC的最优能耗调度[即,动作Et AC(7)],该函数为负电价和与室内温度相关的消费者舒适成本的之和。对于WM,给定状态SWM包括电价(如5所示),WM代理通过最大化Rt WM(如9所示)来计算WM的最优能耗调度[即,动作Et WM(7)],该函数为负电价和与WM首选运行时间相关的消费者舒适成本的之和。对于ESS,给定状态SESS包括电价、SOE和预测的PV发电量(如6所示),ESS代理通过最大化Rt ESS(如10所示)来计算ESS的最优充放电调度[即,动作Et ESS(7)],该函数为负电价和与ESS过充电和欠充电相关的可靠运行成本的之和。

        我们假设HEMS配备了智能电表和智能插头,为本地深度强化学习模块提供输入数据,例如消费者的净能耗和单个设备的能耗。接下来两节将阐述FRL方法的数学模型和算法——状态空间和动作空间的制定以及LHEMS代理的奖励函数和包括A2C方法在内的基于FRL的能量管理方法。

二、数学模型

        (1)状态空间:对于∀t = 1,..., 24,WM、AC和ESS代理的状态空间定义如下:

在状态空间定义里,t表示WM、AC和ESS的调度时间。状态Pt表示在t时刻的TOU价值。状态 是t时刻预测的室外温度。 是t时刻预测的室内温度,它的计算将使用到 ,用下式:

  。t时刻AC的能源消耗为 ,环境参数 为描述室内温度条件的参数。其它参数的定义类似。

        (2)动作空间:每个设备的最优动作取决于代理的环境,包括现在的状态,如(4)至(6)所示。WM、AC和ESS的动作空间如下所示:

每个动作空间的变量分别表示时间t上空调能耗、WM能耗以及ESS的充电或放电能量。

        (3)奖励函数:对于每个设备代理,奖励函数被制定为与消费者偏好的舒适度和设备运行特性相关的负电力成本和负不满成本的之和。首先,空调代理的奖励函数可表达为

其中, 是消费者热不适来定义的惩罚。这种不舒适的价值定义为消费者偏好的温度 之间的偏差。只有当 偏离 范围时,才将其视为带有负号的奖励。接下来,WM代理的奖励函数可表达为

        其中,ωs_pref 和 ωf_pref 分别是消费者偏好的 WM 起始和结束时间,而 δ 和 δ 分别是比消费者偏好的运行时间提前和延迟操作的惩罚。如果 WM 代理在 ωs_pref之前或 ωf_pref 之后安排 WM 的能耗,则将不满成本添加到奖励函数中并带有负值;否则,奖励函数只具有负电力成本。最后,ESS 代理的奖励函数定义为

其中,两个τ 分别代表 ESS 过充电和欠充电的惩罚。如果 SOE 低于 SOEmin(欠充电)或高于 SOEmax(过充电),则 ESS 发生能量利用不足。在 ESS 利用不足的情况下,将其视为奖励项,同时考虑在此期间的电力成本。每个代理都执行自己的学习过程,以在有限的时间间隔 T 内从环境中获得的总累积奖励最大化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1218689.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

9步打造个人ip

什么是个人IP? 就是一个人创造出来的属于自己的有个性有价值的,能让他人记住你,信任你,认可你的东西。 如何强化个人IP呢? 需要一些必要的条件如专业性、耐心、勤奋等等要知道,打造IP是一个见效慢的过程&am…

MATLAB中zticks函数用法

目录 语法 说明 示例 指定 z 轴刻度值和标签 指定非均匀 z 轴刻度值 以 2 为增量递增 z 轴刻度值 将 z 轴刻度值设置回默认值 指定特定坐标区的 z 轴刻度值 删除 z 轴刻度线 zticks函数的功能是设置或查询 z 轴刻度值。 语法 zticks(ticks) zt zticks zticks(auto)…

Postman接收列表、数组参数@RequestParam List<String> ids

示例如下: 接口定义如下: GetMapping(value "/queryNewMoviePath")public List<Map<String, Object>> queryNewMoviePath(RequestParam List<String> ids ) {return service.queryNewMoviePath(ids);}postman中测试如下&#xff1a; http://loc…

计算机毕业设计项目选题推荐(免费领源码)java+mysql二手校园交易平台67613

目录 摘要 1 绪论 1.1 研究背景 1.2国内外研究现状 1.3论文结构与章节安排 2 二手校园交易平台系统分析 2.1 可行性分析 2.2 系统流程分析 2.2.1 数据流程 3.3.2 业务流程 2.3 系统功能分析 2.3.1 功能性分析 2.3.2 非功能性分析 2.4 系统用例分析 2.5本章小结 …

TensorRT基础知识及应用【学习笔记(十)】

这篇博客为修改过后的转载&#xff0c;因为没有转载链接&#xff0c;所以选了原创 文章目录 一、准备知识1.1 环境配置A. CUDA DriverB. CUDAC. cuDNND. TensorRT 1.2 编程模型 二、构建阶段2.1 创建网络定义2.2 配置参数2.3 生成Engine2.4 保存为模型文件2.5 释放资源 三、运…

C/C+=内存管理

C/C内存管理以及动态内存的申请_c动态内存的申请与释放_Demo Test的博客-CSDN博客 问题是&#xff0c;这个0x0804 8000 到0xC 0000 0000之间&#xff0c;不止3GB&#xff0c;应该有47GB&#xff0c;该怎么解释呢&#xff1f;

Azure的AI使用-(语言检测、图像分析、图像文本识别)

1.语言检测 安装包&#xff1a; # 语言检测 %pip install azure-ai-textanalytics5.2.0 需要用到密钥和资源的终结点&#xff0c;所以去Azure上创建资源&#xff0c;我这个是创建好的了然后点击密钥和终结者去拿到key和终结点 两个密钥选择哪个都行 语言检测代码示例&#…

obsidian和bookmaster

1 手动安装插件 插件地址&#xff1a;https://forum-zh.obsidian.md/t/topic/12333 安装file服务器 地址&#xff1a;http://www.rejetto.com/hfs/ hfs.exe可以改个端口 改成8866&#xff0c;ip地址也可以改成 127.0.0.1 # 因为安装到本地 如果要创建账户的话&#xff0c;就…

【PB续命05】WinHttp.WinHttpRequest的介绍与使用

0 WinHttp.WinHttpRequest简介 winhttp.winhttprequest是Windows操作系统中的一个API函数&#xff0c;用于创建和发送HTTP请求。它可以用于从Web服务器获取数据&#xff0c;或将数据发送到Web服务器。该函数提供了许多选项&#xff0c;例如设置请求头、设置代理服务器、设置超…

软件安全学习课程实践3:软件漏洞利用实验

1 逆向分析 1.1.1 和 1.1.2 直接 F5 看 flag 就可以了,故略。 1.1.3 对输入用了算法变换,能看到flag,比如输入x,经过f处理成f(x)然后判断f(x)=y,现在要破解f的算法然后写个逆预算g(y)=x 这个代码看起来很抽象,因为 IDA 没有正确的恢复这里的变量结构。选中变量按“N”重…

2023年中国开式冷却塔应用现状及行业市场规模前景分析[图]

开式塔是目前应用最广、类型最多的一种冷却系统。循环水移走工艺介质或换热设备所散发的热量后成为热水&#xff0c;热水进入冷却塔后和空气直接接触&#xff0c;大部分热水得到冷却后&#xff0c;再循环使用。开式冷却塔又可以分为逆流式冷却塔和横流式冷却塔&#xff0c;按照…

Spring Cloud Hystrix:服务容错保护

&#x1f497;wei_shuo的个人主页 &#x1f4ab;wei_shuo的学习社区 &#x1f310;Hello World &#xff01; Spring Cloud Hystrix&#xff1a;服务容错保护 Spring Cloud Hystrix是Spring Cloud中的一个子项目&#xff0c;主要用于服务容错保护&#xff1b;分布式系统中&…

muduo源码剖析之TcpServer服务端

简介 TcpServer拥有Acceptor类&#xff0c;新连接到达时new TcpConnection后续客户端和TcpConnection类交互。TcpServer管理连接和启动线程池&#xff0c;用Acceptor接受连接。 服务端封装 - muduo的server端维护了多个tcpconnection 注意TcpServer本身不带Channel&#xff0…

员工电脑管理软件,企业电脑管理软件是什么

员工电脑管理软件&#xff0c;企业电脑管理软件是什么 企业电脑管理软件是指用于管理和监控企业员工工作电脑的软件。这些软件通常提供多种功能&#xff0c;旨在帮助企业管理员工电脑的使用、监控和维护&#xff0c;同时确保信息安全、提高生产力并确保合规性。推荐一款功能强…

【Attack】针对GNN-based假新闻检测器

Attacking Fake News Detectors via Manipulating News Social Engagement AbstractMotivationContributions FormulationMethodologyAttacker Capability&#xff08;针对挑战1&#xff09;Agent Configuration&#xff08;针对挑战3&#xff09; WWW’23, April 30-May 4, 20…

第14届蓝桥杯青少组python试题解析:23年5月省赛

选择题 T1. 执行以下代码&#xff0c;输出结果是&#xff08;&#xff09;。 lst "abc" print(lstlst)abcabc abc lstlst abcabc T2. 执行以下代码&#xff0c;输出的结果是&#xff08;&#xff09;。 age {16,18,17} print(type(sorted(age)))<class set&…

深度学习入门(第四天)——递归神经网络与词向量原理解读

一、RNN网络架构解读 常规神经网络并不能考虑时间序列的特征&#xff08;比如前天昨天今天或者带有前后关联的特征&#xff09;&#xff0c;现在每个特征都是独立考虑的&#xff0c;那么如果有这样的特征&#xff0c;网络应该怎么学呢 而递归递归网络hidden这里的转回箭头&…

NSS [NISACTF 2022]bingdundun~

NSS [NISACTF 2022]bingdundun~ 考点&#xff1a;phar伪协议 点击连接&#xff0c;跳转到上传文件界面 提示只能上传图片或者压缩包 同时注意到了&#xff0c;url栏有个GET传参。传值为index试试&#xff0c;发现回显好多个//index.php&#xff0c;猜测这里传参&#xff0c;…

wpf devexpress添加TreeListControl到项目

此教程示范如何添加TreeListControl到项目和绑定控件自引用数据源&#xff1a; 添加数据模型 绑定tree&#xff0c;并添加如下字段到数据源对象&#xff1a; Key字段包含唯一值索引节点 Parent字段包含父索引节点 添加数据模型&#xff08;Employee和Staff类&#xff09;到…

初学UE5 C++②

目录 导入csv表格数据 创建、实例化、结构体 GameInstance Actor camera 绑定滚轮控制摇臂移动 碰撞绑定 角色碰撞设定 按钮 UI显示 单播代理 多播和动态多播 写一个接口 其他 NewObject 和 CreateDefaultSubobject区别 导入csv表格数据 创建一个object的C类 …