1. 田纳西-伊斯曼过程(TE)数据集简介
整个TE数据集由训练集和测试集构成,TE集中的数据由22次不同的仿真运行数据构成,TE集中每个样本都有52个观测变量。d00.dat至d21.dat为训练集样本,d00_te.dat至d21_te.dat为测试集样本。d00.dat和d00_te.dat为正常工况下的样本。d00.dat训练样本是在25h运行仿真下获得的。观测数据总数为500。而d00_te.dat测试样本是在48h运行仿真下获得的,观测数据总数为960。
d01.dat至d21.dat为带有故障的训练集样本,d01_te.dat至d21_te.dat为带有故障的测试集样本。每个训练集\测试样本代表一种故障。
要值得注意的是对于带有故障的训练集样本,是在25h运行仿真下获得的。仿真开始时没有故障情况,故障是在仿真时间为1h的时候引入的。但观测数据是在引入故障后才开始采集的,即只有480个观测值。
带有故障的测试集样本是在48h运行仿真下获得的,故障在8h的时候引入,共采集960个观测值,其中前160个观测值为正常数据。
2. 田纳西-伊斯曼过程
这是一个美帝的伊斯曼化工公司开发的模拟实际化学过程的数据集,用来进行异常检测和过程的调整。这整个过程包括五个操作单元:反应器,冷凝器,气液分离器,循环压缩机和产品汽提塔等等。它模拟的概率图如下:
这个数据集一共有55个变量。介绍如下,大致有一些从不同地方注入原料的量,压力温度之类的东西。剩下的一些变量属于未知可能是非公开的变量。这个数据集可以在哈佛公开的地址下