Flink 在新能源场站运维的应用

news2025/1/23 17:02:25

摘要:本文整理自中南电力设计院工程师、注册测绘师姚远,在 Flink Forward Asia 2022 行业案例专场的分享。本篇内容主要分为四个部分:

    1. 建设背景

    2. 技术架构

    3. 应用落地

    4. 后续及其他

Tips:点击「阅读原文」免费领取 5000CU*小时 Flink 云资源

01

建设背景

e920ea219014ac0331442321b2c8af15.jpeg

建设背景主要分为宏观背景和场站侧的需求。

上图引用的是 2022 年我国电力发展和改革形势分析报告的统计数据,展示了 2013-2021 年,九年间装机容量的增长百分比。可以看出传统火电和水电的增长已经乏力;核电由于基数较少基本处于平稳发展;而新能源电站,特别是风电站和光伏电站经过多年的建设,在维持较高增长率的同时,很多电站已经进入存量运维的阶段。随着时间推移,设备老化等运维问题逐渐增加。

246d90351265f1d0cc4d18f4275c77f1.jpeg

从发电设备的日平均利用小时数来看,风电和光伏的日平均可利用小时数都维持在一天五个小时左右,这还是综合了全年的数据进行的平均计算。如果单看某一段时期,利用小时数会更低,对整个电网的稳定运行是特别不利的,主要是因为风电和光伏严重依赖自然条件进行发电。所以,针对场站,在自然条件允许的情况下,确保风电和光伏的满负荷运转,是运维考虑的首要问题。

d49cd8cb03f1c5ff81b76e96303bcd20.jpeg

从场站侧来看,我们在系统建设上的主要出发点有以下三点:

  • 刚才所描述的设备,在风光可利用窗口期内,尽可能多发电是首要的目的。

  • 希望合理减少人工的运维投入,更多进行自动化的运转。

  • 能预测风光的强度,也就能大概预测发电量,对并网运行和电力市场的现货交易情况都有很大用处。


02

技术架构

2.1 整体架构

ba1c64abc4165ad6db360360f2309dc6.jpeg

从上图抽象的简单处理架构可以看出,我们把核心系统分为了三个部分,分别是采集、处理、服务。

  • 采集:利用物联网的子系统,适配各种采集协议,进行数据采集。更多的是电力行业相关的专有协议,经过简单的处理后推送到处理系统。

  • 处理:包含了整个 Flink 流处理在内的整套处理分析、存储中心。

  • 服务:利用处理之后的数据,结合业务系统的数据进行对外服务。


2.2 “分布式”系统

52f90b88dc6cdc13129b19c87bcfe8f9.jpeg

通常意义上的分布式系统,可能就是系统分布在各个节点里进行协同的交互。但由于我们现场场站的限制,我们的分布节点之间不能进行直接通讯。按照标准要求会进行设备隔离的分区,它利用硬件将系统中设备进行了物理分区,网络是独立的,但它又没有完全阻挡数据的交互,它可以通过特殊装置进行数据交换,物理隔离装置就起到了这个作用。我们的系统采用的是单向隔离,数据只从分区到主系统分区进行单向的数据传输。

03

应用落地

3.1 隔离分区处理

7cdfdba53e8454499d2ae535cface3d5.jpeg

时间问题可能是分布式系统大家都会碰到的常见问题,在我们的系统里这个问题也比较突出。传感器的数量较多,而且传感器的数值对系统的运作还很重要。因为系统处于受限的网络环境中,高精度在线授时无法进行请求,软件授时精度及可靠性也无法得到保证。同时,我们采用流处理模式处理时间的问题,很难进行数据的清洗,剔除又会降低数据的可用率。

最开始我们的思路是采用清洗的办法来处理,但处理难度太大,我们就换了个思路。我们在隔离分区内部加上了北斗授时装置,这样分区内的高精度授时传感器都从授时装置中获取高精度的时间。当传感器的数据到达处理系统时,绝大部分时间都可以确保是正常的,极少量的异常数据也是在可容忍的范围内。

eb844716018402e820d60394628fee43.jpeg

通常空间和时间是相伴的问题,特别是风机,它的运作和摆头式的电风扇很类似,叶片绕电机的轴转动,电机又绕基座转动,但风机的转动频率可能会比电风扇低很多。这个问题如果在游戏里,它就是相对坐标和矩阵运算的问题。

在我们的系统里,我们希望所有组件都可以,以统一的坐标进行展示。简单来说就是,给定一个时刻场站所有运行风机的瞬时状态位置,可以在一张图里反馈出来,不需要再进行一些复杂的矩阵或者空间运算。

处理方式是,传感器的数据在进入系统后,匹配塔基的基础数据,然后基于统一的坐标框架,把瞬时姿态信息求解,之后就会落库到时序数据库里进行存储。

afcf99a532e8e54c83f96065a2fd7915.jpeg

传感器的数据预处理和清洗是数据利用的基础。

在预处理上,不少传感器数据在设计时,为了数据的高效和快速传输,会进行一定的计算或者合并处理。在预处理过程中就需要根据传感器的元数据定义,还原数据的真实含义值,最后进行测试和分析。

在数据清理上,我们主要用来处理时间标注、值的跳变、数据量缺失,进行补充差值。

6c904733c652964c39713c2b07a51f6b.jpeg

在数据架构部分,我们介绍了网络的隔离状况,它无法利用 tcp 进行数据交互,只能通过文件的方式进行数据传输。基于这个方式,我们利用了增量同步的思路,将数据加上指标后序列化到小文件里,在主服务端循环监测数据文件的变化情况。

有新的文件到达系统之后立即进行反序列化,解析到消息队列中进行后续处理。在整个过程中,数据其实会存在一定延迟,但数据交换的频率足够高,影响不是特别大。

3.2 主系统区处理

d834bdf112f3e7b414e2dcc12c7e07a7.jpeg

在主系统分区里,不仅包含了很多传感器数据,还包含了业务系统数据、与传感器有关联的设备的详细信息、传感器所组成的主设备的详细信息。在这里,可以利用系统之间的数据进行合并分析,掌握设备全体的状态信息。根据我们的划分,我们将按照聚合差值、推导进行数据的拼装合并,然后也会按照比值、差值、时间进行统计。

9f7936332481fd3af4f2e785d74d6a2e.jpeg

下面以一个设备的数据整合为例说明一下。

通常一个设备它有上千个传感器,它每个传感器获取的都是单一的测点信息,且每个传感器获取的采样频率不一致。那么设备的瞬时状态和整体的情况是如何的分析的呢?

这个问题就和盲人摸象的故事一样,即使我们上了很多监测手段,但每个监测手段都是独立的。我们真正需要的是,可以整合所有问题,然后告诉我们这个设备的状态是否正常。

318393dff51a9f3fe17b8ad2af5de665.jpeg

针对设备的瞬时状态,我们处理的思路是,根据设备传感器的分组,确定它是属于计量、控制还是监测。当新的测点数据到达系统后,我们利用属性信息将传感器的分组进行整合运算。在运算状态里,我们会来维持设备本身的传感器信息的分组、运算函数、运算函数所需要的前置信息。

当新的数据进入系统后,我们会进行状态值的更新。而瞬时状态值的计算是定时根据传感器值和拟合函数计算得到。这些拟合函数用的比较多的,包含一次函数、二次函数、分段函数、反比例函数、对数函数等。最终这些设备的瞬时状态会通过异步的形式落库。

5e2bd7729b895d961727c3380a062043.jpeg

接下来我们来看一下长时间维度的整体情况。

按照五分钟或者一个小时的情况统计,处理过程其实是类似的。不同的是计算过程及函数方法的差异,对应的结果会进入其他的系统进行综合的分析和利用。

73e08c8d56be74bffc34bdaddb016470.jpeg

单一的设备处理介绍,基本上就是上述思路。更上一层,可能涉及到设备之间和场站之间的信息。主要包括遥测数据、峰谷差数据、电镀统计数据、停运数据。他们的整体统计情况,我们主要通过一些聚合运算来完成。

82a9dd2b2141fdfa1981903f4c842b6a.jpeg

还记得我们在最开始的时候,我们提到了风光严重靠天吃饭的问题。气象就是天的核心,准确的预测气象是非常重要的研究内容。

e523764acdd8102dddfce1cea5add042.jpeg

当前主流的方法是进行物理模型的创建,然后进行气象模拟,但它的专业度高,复杂度也高。所以我们想尝试通过将场站几年的历史数据进行拟合,不断迭代分析完善,进行大概的预测。利用文献资料,我们选取了自适应滤波法和平稳时间序列模型,在 Flink 里进行实现。然后根据历史数据和传感器当前的实时数据进行迭代分析。

效果其实不是特别理想,也没有想到更好的解决办法。后续我们可能还会借助建模的方式进行场站范围内微气象的建模,进行分析和预测。

04

后续及其他

4.1 后续

b22468affb1fadd1c1acab9eedd837cf.jpeg

在气象预测方面,如果一条路不太通顺,我们可能会换种思路进一步尝试。

在辅助传感器的应用方面,无论是我们还是业界,基于传感器数据的综合使用分析,还属于浅层利用,离智能化的路还比较长。

在管理融合方面,结合现场的实际需求,真正的让传感器发挥效应,是很值得挖掘的。另外运维现状,新的系统在不断建设,系统之间也没有打通。后续将构想以处理中心的办法来驱动技术和管理应用的结合。

4.2 总结

75af096b01be1f57d96e067d0b86f418.jpeg

首先,在专业度上,我们属于跨越不同行业进行融合,在广度而非深度上进行 Flink 利用,很少会动底层实现的能力;其次,对能稳定运行且不干扰其他业务系统的运转,我们将会降低应用程序设计的复杂度,从而达到减少出错率的目的;最后,我们考虑更多的是,通过软硬件结合来协同处理问题。比如时间问题,Flink 处理起来可能会比较困难,我们就会引入硬件来解决这个问题。问题可能在系统之内,但是解决的办法可能在软件系统之外。软硬件结合,其实我们的批处理和流处理也是分开的系统。后续我们可能也会考虑在批流合一方面进行一些尝试。

4.3 今年工作的地点和环境

02794d33603addd3cce50be1c78a4f21.jpeg

往期精选

e9aba9fcbb7cd7ae2d29458b30f5ba46.png

a3fa1ac2493ef96a6dba85e7fc2a61d2.png

89de4600afbf249d4479083666c25494.jpeg

49826fee27d31818c25637e9a83a2c30.jpeg

7a8a688ab9c7339775cb94a9407aa553.png


▼ 「活动推荐扫下方图片参与报名

dd227ea6ddf88f8cc3d14dbec0274d10.png

▼ 关注「Apache Flink」,获取更多技术干货 ▼

d5c90b3dcdfbf6283cd96c93259f4491.png

 01bb721f9f26784e0fbb001ad6092781.gif  点击「阅读原文」,免费领取 5000CU*小时 Flink 云资源

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/755807.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue localhost 从 http 307 到 https

Vue localhost 从 http 307 到 https HTTP 307 与 HSTS HTTP 307中间人攻击HSTS - HTTP Strict Transport Security 如何解决问题 Vue localhost 从 http 307 到 https 一个 Vue2 项目之前本地都是通过 HTTP 的 localhost 访问(如下) 后来突然无法访问了, 提示的错误内容是 E…

静电接地桩的设计和施工

静电接地桩是用于将静电荷引导到地下的装置,以确保工作环境。以下是一般静电接地桩设计的一些建议和步骤: 1. 选择合适的位置:静电接地桩应该位于静电产生源附近,并接近地面。可以选择在室内或室外,但要确保容易维护和…

web中引入live2d的moc3模型

文章目录 前言下载官方sdk文件使用ide编译项目(vsCode)项目初始化使用vsCode项目树介绍使用live server运行index页面 演示导入自己的模型并显示modelDir文件resources文件夾案例模型修改modelDir然後重新打包項目運行 前言 先跟着官方sdk调试一遍&…

14.live555mediaserver-play请求与响应

live555工程代码路径 live555工程在我的gitee下(doc下有思维导图、drawio图): live555 https://gitee.com/lure_ai/live555/tree/master 章节目录链接 0.前言——章节目录链接与为何要写这个? https://blog.csdn.net/yhb1206/art…

基于C/S架构工作原理序号工作步骤和理论的区别

基于C/S架构工作原理序号工作步骤和理论的区别 SSH 概念 对称加密linux 系统加密,就是加密和揭秘都是使用同一套密钥。 非对称加密有两个密钥:“私钥”和“公钥”。私钥加密后的密文,只能通过对应的公钥进行揭秘。而通过私钥推理出公钥的…

深入解析浏览器Cookie(图文码教学)

深入解析浏览器Cookie 前言一、什么是 Cookie?二、Cookie的特点二、如何创建 Cookie?三、服务器如何获取 Cookie四、Cookie 值的修改4.1 方案一4.2 方案二 五、浏览器查看 Cookie六、Cookie 生命控制七、Cookie 有效路径 Path 的设置八、案例:Cookie 练…

183_Power BI 折线图之平滑线性类型

183_Power BI 折线图之平滑线性类型 一、背景 曾几何时,为了在 Power BI 让折线图显示出平滑曲线,各路大佬是尽显神通。如今时间来到 2023 年 7 月,刚刚更新的 Power BI 已经支持折线图的平滑曲线。让我们来看看最终效果。 同时&#xff0c…

【SpringBoot3】--04.核心原理

文章目录 SpringBoot3-核心原理1.事件和监听器1.1生命周期监听1.1.1 监听器-SpringApplicationRunListener1.1.2生命周期全过程 1.2事件触发时机1.2.1各种回调监听器1.2.2完整触发流程 1.3SpringBoot事件驱动开发 2.自动配置原理2.1入门理解2.1.1自动配置流程2.1.2SPI机制2.1.3…

apache ranger

简介: ranger 是一个用于启用、监控和管理跨hadoop平台的全面的数据安全框架。 ranger的愿景是在hadoop系统中提供全面的安全管理。随着yarn的出现,hadoop 平台能够支持真正的数据糊架构。企业能够在多租户环境中运行多个任务负载。hadoop 数据安全需要…

面向对象编程/原型及原型链

一.面向对象 (1)对象是什么?为什么要面向对象? 通过对代码的抽象,进而描述单个种类物体的方式. (2)特点:面向对象-逻辑上迁移更加灵活,代码的复用性更高,高度的模块化. (3)对象的理解 1.对象是对于单个物体的简单抽象; 2.对象是容器,封装了属性和方法 **属性:对象状态…

Python官方文档中Availability: not Emscripten, not WASI是什么意思?

在我们阅读Python官方文档中,当某个模块或特性的文档中写着 "Availability: not Emscripten, not WASI" 时,它表示该模块或特性在 Emscripten 和 WASI 环境中不可用。 Emscripten 是一个工具链,用于将C和C代码编译为WebAssembly&am…

【Python从入门到进阶】28、xpath的安装以及使用

接上篇《27、Handler处理器使用及代理和Cookie登录实现》 上一篇我们讲解了urllib中Handler处理器的基本使用,以及实现代理访问和Cookie的登录。本篇我们来讲解HTML文档解析中的核心插件xpath的安装及使用。 一、xpath介绍 XPath是由W3C(World Wide We…

kotlin中使用Room数据库(包含升降级崩溃处理)

目录 1.导入依赖库 2.数据实体类 3.数据访问对象 (DAO) 4.数据库类 5.调用DAO里面的“增、删、改、查”方法 6.数据库升降级处理 升级(保存数据库历史数据): 升级(不保存数据库历史数据): 降级&…

剑指 offer 数学算法题:数值的整数次方

题目描述: 实现 pow(x, n) ,即计算 x 的 n 次幂函数(即,xn)。不得使用库函数,同时不需要考虑大数问题。 分析: 直接计算法,通过判断 n 的正负,若为负数, x 即…

无法加载文件\venv\Scripts\Activate.ps1,因为在此系统上禁止运行脚本

一、问题发生 运行环境Windows 10、python 3.11.1、IDE VScode 当然你可能使用了其他IDE,例如pycharm等,不过没有关系解决问题的方法都是一致的。 报错信息如下图所示: actvivate.ps1这个脚本文件是用来激活python虚拟环境的。 其实&…

LabVIEW开发图像采集和图像处理程序

LabVIEW开发图像采集和图像处理程序 扫描电子显微镜(SEM)是一种功能强大的工具,广泛用于高分辨率的生物和半导体样品检测。然而,对于大面积或3D成像,SEM成像是一个耗时的过程。MBSEM旨在通过同时扫描多个像素来减少采…

spring5源码篇(10)——spring-aop代理过程

spring-framework 版本:v5.3.19 文章目录 1、ProxyFactory1.1、createAopProxy() 创建AopProxy1.2、getProxy() 创建代理对象1.3、JdkDynamicAopProxy#invoke 代理逻辑1.3.1、advised.getInterceptorsAndDynamicInterceptionAdvice() 匹配添加的advisor并转化成所需…

集群基础3——haproxy负载均衡apache

文章目录 一、环境说明二、安装配置httpd三、安装配置haproxy四、验证http负载均衡五、配置https负载均衡六、haproxy网页监控6.1 监控参数详解6.2 页面操作 一、环境说明 使用haproxy对apache进行负载均衡。 主机IP角色安装服务真实IP:192.168.161.129VIP&#xff…

通识强化学习,初步了解强化学习的运行规则和估值方法

1.强化学习的发展及应用现状 1.1.强化学习的由来 目前,大家认为强化学习(Reinforcement Learning, RL)的来源与两个领域密切相关:即心理学的动物试错学习和最优控制的优化理论。 这里都是有相应的共性的,在environme…

PostgreSQL MVCC的弊端优化方案

我们之前的博客文章“我们最讨厌的 PostgreSQL 部分”讨论了大家最喜欢的 DBMS 多版本并发控制 (MVCC) 实现所带来的问题。其中包括版本复制、表膨胀、索引维护和真空管理。本文将探讨针对每个问题优化 PostgreSQL 的方法。 尽管 PostgreSQL 的 MVCC 实现是 Oracle 和 MySQL 等…