以下内容整理自2023年夏季学期大数据能力提升项目《大数据实践课》同学们所做的期末答辩汇报。
我们将从六个方面进行展示。
第一部分是项目背景与需求分析。在“双碳”目标的大背景下,能源电力行业面临着深刻的变革,负荷预测作用也更加突出。虚拟电厂由于其经济效益显著,市场需求也日益扩大。该项目是基于与大唐科研总院的合作,明确从数据、算法和系统等方面提出了完整的需求文档。主要技术路线包括以下三个部分,分别为多类型数据预处理、用户负荷特征分析与提取以及负荷预测模型系统建立。
第二部分是数据处理与分析。为了更好地预测实时负荷,我们调用了API来收集用户当地的气象数据,并且对所有数据进行了预处理。通过聚类分析,我们能明确得到5种不同用户类型的负荷分析。并且对于大工业负荷、电采暖负荷、充电站及厂用电负荷均可以看到呈现出不同的特点。进一步通过层次聚类分析,可以以很好的解释性直观地划分同一用户在不同时间的电力负荷特征。
第三部分是算法设计与建模。我们使用了包括统计学方法、传统的机器学习模型,以及自主研发的是深度学习在内的十余种方法进行建模。以唐山某企业为例,通过比较模型在不同时间尺度上的预测性能,集成学习表现出了最佳的整体性能。
我们还研发了Pyramid-Transformer的深度学习模型,虽然在评价指标上略低于机器学习模型,但是可以很好地捕获短时间内负荷变化特征。
第四部分是系统设计与集成。我们将上述的分析结果利用DWF系统建立平台。数据流过程包括以表格形式建立的时间序列,以及通过API自动获得的气象数据。然后分别将时序数据和关系型数据存放到IoTDB和PostgreSQL中,通过前后端脚本编程来实现数据预处理、特征提取、负荷分解、模型预测等功能,并通过ECharts实现结果可视化展示。具体的数据接入、组成方法以及系统最小数据关系图如下图所示。
分析计算、展示与导出过程如下:
由于时间关系,我们简单展示一下负荷预测系统。我们支持自主企业的数据上传,可以设定企业不同的地点,API可以自动获得气候数据,企业也支持上传和删除。对于同一企业不同类型的数据,我们支持历史负荷上传,并且自动对其进行数据预处理。对于结果展示和特征分析模块,可以自动分析基线负荷、平均负荷以及上下四分位数的负荷。对于负荷预测模块,我们支持实时负荷数据,包括分钟级别、小时级别以及日级别的负荷,并且可以自动设计预测步长来对未来的一段序列进行预测,支持最优预测方法的展示及多种预测评价。上报下载模块可支持96点的预测,我们可以将所有点的预测效果在平台上进行可视化展示,并且也支持上传和加载。
通过两个月的实习,我们系统梳理了实习成果,完成了一篇近6000字全英文会议论文,建立了一个负荷预测系统,包括4大模块、10张表单和87个脚本,共7000余行代码以及20000余字实习报告,系统总结实习成果。以上是我们汇报的所有内容。
编辑:文婧
校对:林亦霖