基于LSTM神经网络的电力负荷预测（Python代码实现）

news2025/4/7 18:14:05

目录

💥1 概述

📚2 运行结果

🌈3 Python代码及数据

🎉4 参考文献

💥1 概述

前馈神经网络的输出只依赖当前输入，但是在文本、视频、语音等时序数据中，时序数据长度并不固定，前馈神经网络的输入输出维数不能任意更改，因此难以适应这类型时序数据的处理。短期电力负荷预测的输入与输出均为时间序列，其本质仍是基于先前元素的序列预测问题，为此需要采用与前馈神经网络不同的方法，进行短期电力负荷预测。
循环神经网络具有记忆功能，可提升网络性能。与前馈神经网络相比，循环神经网络具备可同时接受自身信息与其他神经元信息的神经元，更贴合生物神经网络结构，在文本等序列数据分析中有广泛应用。循环神经网络的参数学习随时间反向传播，错误信息前传递学习，建立长时间间隔的状态间依赖，支持序列数据的分析处理。但随着网络层数增多与时间加长，循环神经网络容易因梯度消失或爆炸问题，导致只能学习短距离依赖，无法解决长距离依赖问题。为了解决循环神经网络的长程依赖问题，在循环神经网络上添加门控机制,实现调度信息积累速度控制，这类方法被称之为基于门控的循环神经网络，例如LSTM长短期记忆网络。LSTM是一种基于RNN的改进模型，通过引入门和单元的概念，解决长距离依赖问题，具有比RNN更强的适应性。LSTM网络的单结构如图1所示。每个神经单元内部结构如图2所示。
每个LSTM神经单元都包含遗忘门、输入门和输出门三个门控结构，以控制数据有信息的换地。其中，遗忘门负责丢弃和保留上一个时刻的有效信息在C{C内，输入门将当前时刻有效信息存放在Ct内，输出门决定神经单元输出中C·的信息。

与传统神经网络算法相比，LSTM网络具有更强的自适应学习能力，对复杂样本数据有更好的拟合效果。LSTM网络通过门控结构，有效避免了时间增加所导致的梯度消失的问题，且由于采用了三个输入值与两个输入值的当前时刻记忆单元，因此模型也具有更好的泛化能力。

📚2 运行结果

City AEP, model MLP, epoch 10, train_mse_loss 0.035387418246355606, [150s]
City AEP, model MLP, epoch 20, train_mse_loss 0.032379517520683396, [289s]
City AEP, model MLP, epoch 30, train_mse_loss 0.02896040348687034, [427s]
City AEP, model MLP, epoch 40, train_mse_loss 0.025020044269985046, [567s]
City AEP, model MLP, epoch 50, train_mse_loss 0.020603562772705936, [705s]
City AEP, model MLP, epoch 60, train_mse_loss 0.017132578714602234, [841s]
City AEP, model MLP, epoch 70, train_mse_loss 0.013568510578108438, [2662s]
City AEP, model MLP, epoch 80, train_mse_loss 0.010349302512148151, [2804s]
City AEP, model MLP, epoch 90, train_mse_loss 0.008659378628826875, [2966s]
City AEP, model MLP, epoch 100, train_mse_loss 0.007364045838703928, [3117s]
City AEP, model MLP, epoch 110, train_mse_loss 0.006385179391751687, [3279s]
City AEP, model MLP, epoch 120, train_mse_loss 0.005340989620046879, [3414s]
City AEP, model MLP, epoch 130, train_mse_loss 0.004808902484027372, [3553s]
City AEP, model MLP, epoch 140, train_mse_loss 0.004394962796536477, [3705s]
City AEP, model MLP, epoch 150, train_mse_loss 0.0043113342354722, [3850s]
City AEP, model MLP, epoch 160, train_mse_loss 0.00431272537663471, [4003s]
City AEP, model MLP, epoch 170, train_mse_loss 0.004233362978202817, [4165s]
City AEP, model MLP, epoch 180, train_mse_loss 0.0041272962850559015, [4320s]
City AEP, model MLP, epoch 190, train_mse_loss 0.004165695266514693, [4465s]
City AEP, model MLP, epoch 200, train_mse_loss 0.004172246530314611, [4606s]
City AEP, model MLP, epoch 210, train_mse_loss 0.0043414913436762344, [4760s]
City AEP, model MLP, epoch 220, train_mse_loss 0.00410465720831754, [4895s]
City AEP, model MLP, epoch 230, train_mse_loss 0.00419495751797829, [5028s]
City AEP, model MLP, epoch 240, train_mse_loss 0.004089633657502523, [5168s]
City AEP, model MLP, epoch 250, train_mse_loss 0.0042064220887487345, [5331s]
City AEP, model MLP, epoch 260, train_mse_loss 0.004085837542821748, [5491s]
City AEP, model MLP, epoch 270, train_mse_loss 0.004034197799847933, [5645s]

运行时间比较长。

      for loss_type in ['mse', 'smoothl1loss']:
            args.loss_type = loss_type
            preds = pd.read_csv(args.save_res_dir + 'ele_' + args.loss_type + '_preds_' + args.model_name + '.csv')

            # 绘图
            plt.plot(preds[[args.city_name]].values.flatten()[::args.plot_gap], 'r', label='prediction')
            plt.plot(np.multiply(data_y.flatten()[::args.plot_gap], scalar), 'b', label='real')
            plt.legend(loc='best')
            plt.savefig(save_plot_dir + args.city_name + '_' + args.loss_type + '.jpg')
            # plt.show()
            plt.close()

部分代码：

#一、数据准备

datas = df1.values[:, 2]
print(datas.shape)

#归一化处理，这一步必不可少，不然后面训练数据误差会很大，模型没法用

max_value = np.max(datas)
min_value = np.min(datas)
scalar = max_value - min_value
datas = list(map(lambda x: x / scalar, datas))

#数据集和目标值赋值，dataset为数据，look_back为以几行数据为特征维度数量

def creat_dataset(dataset,look_back):
    data_x = []
    data_y = []
    for i in range(len(dataset)-look_back):
        data_x.append(dataset[i:i+look_back])
        data_y.append(dataset[i+look_back])
    return np.asarray(data_x), np.asarray(data_y) #转为ndarray数据

#以2为特征维度，得到数据集

dataX, dataY = creat_dataset(datas,2)

train_size = int(len(dataX)*0.7)

x_train = dataX[:train_size] #训练数据
y_train = dataY[:train_size] #训练数据目标值

x_train = x_train.reshape(-1, 1, 2) #将训练数据调整成pytorch中lstm算法的输入维度
y_train = y_train.reshape(-1, 1, 1)  #将目标值调整成pytorch中lstm算法的输出维度

 #将ndarray数据转换为张量，因为pytorch用的数据类型是张量

#一、数据准备

datas = df1.values[:, 2]
print(datas.shape)

#归一化处理，这一步必不可少，不然后面训练数据误差会很大，模型没法用

max_value = np.max(datas)
min_value = np.min(datas)
scalar = max_value - min_value
datas = list(map(lambda x: x / scalar, datas))

#数据集和目标值赋值，dataset为数据，look_back为以几行数据为特征维度数量

def creat_dataset(dataset,look_back):
    data_x = []
    data_y = []
    for i in range(len(dataset)-look_back):
        data_x.append(dataset[i:i+look_back])
        data_y.append(dataset[i+look_back])
    return np.asarray(data_x), np.asarray(data_y) #转为ndarray数据

#以2为特征维度，得到数据集

dataX, dataY = creat_dataset(datas,2)

train_size = int(len(dataX)*0.7)

x_train = dataX[:train_size] #训练数据
y_train = dataY[:train_size] #训练数据目标值

x_train = x_train.reshape(-1, 1, 2) #将训练数据调整成pytorch中lstm算法的输入维度
y_train = y_train.reshape(-1, 1, 1)  #将目标值调整成pytorch中lstm算法的输出维度

 #将ndarray数据转换为张量，因为pytorch用的数据类型是张量