1.效果视频:机械寿命预测(NASA涡轮风扇发动机剩余使用寿命RUL预测,Python代码,CNN_LSTM模型,有详细中文注释)_哔哩哔哩_bilibili
环境库版本:
2.数据来源:https://www.nasa.gov/intelligent-systems-division
数据文件夹
数据介绍:
当前基于机器学习的剩余寿命预测方法的研究异常火爆,其中C-MAPSS数据集在该领域的使用非常广泛,为了方便各位同仁的学习和理解,借此文章向大家简单介绍一下。
1)首先说明,C-MAPSS数据集为模拟数据。这是由于航空发动机的构造复杂,其气路变化复杂多变;并且航空发动机的运行数据通常作为各个航空公司的保密数据,一般不易获取。因此由NASA使用Commercial Modular Aero-Propulsion System Simulation软件生成了该套数据集,其目的是结合发动机的运行特点,来测试不同的模型性能。
2)NASA提出的涡扇引擎退化监测数据集(C-MPASS)的结构简图如下所示。主要构件包含风扇、低压压气机(LPC)、高压压气机(HPC)、燃烧室、高压涡轮(HPT)、低压涡轮(LPT)及其喷管。
其子数据集共四个,每个子类都有不同数量的工况条件和故障状态。C-MAPSS数据如下图所示
当前的论文研究中,主要以单工况、单故障状态的FD001数据集为主(笔者认为该数据集相对简单,相比于多工况数据,不需要额外的数据处理)。以FD001为例,其进一步分为训练和测试子集,其包含1种故障状态和1种工况。训练集Train_FD001.txt收录了100台保持全寿命循环状态的发动机参数信息;测试集Test_FD001.txt收录了100台非全寿命循环状态的发动机参数信息,即仅包含发动机故障前某个时间终止的多个传感器数据,根据给定的运行参数对每台发动机的RUL进行实时的预测;RUL_FD001.txt中收录了测试集中100台发动机的RUL真实值。每台发动机的参数信息包含3种工作状况监测参数(飞行高度,马赫数,油门杆角度)和21个性能监测参数,其24个传感器监测参数如下图所示。
单工况数据集
1)单工况。笔者认为,所谓的单工况可以理解为飞机巡航时所记录的时间节点,大致可以认为飞机巡航时其工况参数(飞行高度、马赫数和油门杆角度)是不变化的。
2)随机选取FD001训练数据集中的发动机3个性能参数进行可视化分析,如下图所示。图中横坐标代表发动机的运行循环数(所谓运行循环数,是指发动机从出厂到下发的过程中,记录发动机性能参数变化的不同时间节点。直观来讲就是:并非发动机从运行到下发的每一个时间点都记录,只是记录的各个飞行时间段中的某些时间节点。),纵坐标代表各个参数的变化量。其中不同的颜色代表不同的发动机。由图可见,单工况的数据在运行周期内具有明显的单调变化特性,这更有助于机器学习模型对于故障特征的判断。
多工况。基于前面的理解,多工况可以理解为包含了发动机从滑跑、起飞、巡航和降落的不同阶段。由于工况的不断变化,其参数的变化特点也更为复杂。
1)随机选取FD002训练数据集中的发动机三个性能参数进行可视化分析,如下图所示。由图可见。多工况的性能参数在运行周期中没有显现出明显的单调特性,这不利于机器学习。相比于单工况,机器学习模型不能有效的学习到关键的退化特征。更详细的介绍可参照论文(赵洪利,张奔,张青.基于工况聚类和残差自注意力的发动机剩余使用寿命预测[J].航空科学技术,2023,34(04):31-40.DOI:10.19452/j.issn1007-5453.2023.04.004.)
3.模型
4.CNN_LSTM模型的效果
预测值与真实值对比
对项目感兴趣的,可以关注最后一行
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif']=['simhei'] # 添加中文字体为黑体
plt.rcParams['axes.unicode_minus'] =False
# -*- coding: utf-8 -*-
import numpy as np # 导入NumPy库,用于进行数值计算
import pandas as pd # 导入Pandas库,用于数据处理和CSV文件读写
#代码和数据集的压缩包:https://mbd.pub/o/bread/ZJ6Wlp9s