深度学习与电网信号故障诊断：基于卷积神经网络和残差网络的应用

news2025/2/24 23:46:26

在本文中，我们将探讨如何使用深度学习方法，特别是卷积神经网络（CNN）和残差网络（ResNet），来进行信号故障诊断。通过实践，我们将逐步演示如何加载数据、处理数据、建立模型并进行训练和评估。同时，我们还将展示如何通过LSTM网络来进行对比实验。

完整代码：基于卷积神经网络和残差网络的电网信号故障诊断

1. 项目背景

信号故障诊断在工业领域具有重要意义，通过分析传感器收集的信号数据，可以提前发现故障，避免设备损坏。传统的信号处理方法虽然有效，但在处理复杂、高维数据时显得力不从心。因此，深度学习特别是卷积神经网络（CNN）因其强大的特征提取能力逐渐成为故障诊断领域的主流技术。

在这个项目中，我们将使用一个多类故障数据集，利用深度学习模型来进行故障类型的分类，并评估模型的性能。

2. 数据预处理

数据加载是深度学习的基础。我们首先从CSV文件中加载数据，随后进行标签编码和特征缩放。

import pandas as pd
from sklearn.preprocessing import LabelEncoder, StandardScaler

multi_data = pd.read_csv('./Data1.csv').iloc[0:4362, :]
multi_data['faultType'] = multi_data['G'].astype(str) + multi_data['C'].astype(str) + multi_data['B'].astype(str) + multi_data['A'].astype(str)
X = multi_data.drop(['G', 'C', 'B', 'A', 'faultType'], axis=1)
y = multi_data['faultType']

# 标签编码
le = LabelEncoder()
y = le.fit_transform(y)

# 数据标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
X = pd.DataFrame(X_scaled, columns=X.columns)

在上面的代码中，我们将多个故障信号拼接成一个字符串，作为标签。接下来对数据进行标准化处理，以保证特征在相同的数值范围内，这对于深度学习模型的收敛速度有很大帮助。

3. 卷积神经网络模型构建

我们使用卷积神经网络（CNN）进行特征提取和分类。CNN在处理时序数据时可以很好地提取局部特征，这使其成为信号处理任务的理想选择。

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv1D, Flatten, Dense

model = Sequential([
    Conv1D(64, 1, activation='relu', input_shape=(6, 1)),
    Conv1D(128, 1, activation='relu'),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(4, activation='softmax')  # 假设有4种故障类型
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

我们构建了一个简单的CNN模型，使用两层卷积层和全连接层来提取数据的局部和全局特征。最后一层使用softmax函数输出故障分类结果。

4. 模型训练与评估

模型训练的关键是如何选择合理的超参数，例如批大小和学习率。在本文中，我们使用Adam优化器，并设置早停机制来防止模型过拟合。

history = model.fit(X_train, y_train, epochs=100, batch_size=64, validation_split=0.2)

模型训练完毕后，我们可以对其进行评估，查看模型的混淆矩阵、准确率等指标。

from sklearn.metrics import accuracy_score, confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt

y_pred = model.predict(X_test)
y_pred = np.argmax(y_pred, axis=1)
sns.heatmap(confusion_matrix(y_test, y_pred), annot=True, cmap='Blues', fmt='g')
plt.show()
print(f'Accuracy Score: {accuracy_score(y_test, y_pred)*100:.2f}%')

5. 残差网络的引入

残差网络（ResNet）通过引入残差块解决了深层网络中的梯度消失问题，使得网络可以更快、更深地训练。我们构建了一个简单的残差网络模型。

from tensorflow.keras.layers import Add, BatchNormalization, Activation

def residual_block(x, filters, kernel_size):
    shortcut = x
    x = Conv1D(filters, kernel_size=kernel_size, padding='same')(x)
    x = BatchNormalization()(x)
    x = Activation('relu')(x)
    x = Conv1D(filters, kernel_size=kernel_size, padding='same')(x)
    x = BatchNormalization()(x)
    if shortcut.shape[-1] != filters:
        shortcut = Conv1D(filters, 1)(shortcut)
    x = Add()([x, shortcut])
    return x

通过多层残差块，模型在特征提取的同时保留了原始输入信息，使得训练更加稳定。

6. 学习曲线分析

为了进一步分析模型的表现，我们绘制了学习曲线和损失曲线，观察模型在训练过程中的变化趋势，识别可能出现的过拟合现象。

plt.plot(history.history['loss'], label='Training Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Model Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.show()

7. 多分类ROC和PR曲线

为了更好地评估分类器的表现，我们绘制了多分类的ROC和PR曲线，这些曲线可以帮助我们深入理解模型在不同类别上的表现。

from sklearn.metrics import roc_curve, auc
from itertools import cycle

# 计算每个类别的ROC曲线和AUC
fpr, tpr, roc_auc = dict(), dict(), dict()
for i in range(n_classes):
    fpr[i], tpr[i], _ = roc_curve(y_test_bin[:, i], y_score[:, i])
    roc_auc[i] = auc(fpr[i], tpr[i])

# 绘制ROC曲线
for i, color in zip(range(n_classes), cycle(['blue', 'red', 'green', 'yellow'])):
    plt.plot(fpr[i], tpr[i], label=f'Class {i} ROC curve (area = {roc_auc[i]:0.2f})')
plt.plot([0, 1], [0, 1], 'k--')
plt.legend()
plt.show()