论文地址:https://ieeexplore.ieee.org/abstract/document/9507359
论文源码:未开源
期刊:IEEE Transactions on Knowledge and Data Engineering
如今,多传感器技术被应用于许多领域,如医疗保健(HC)、人体活动识别(HAR)和工业控制系统(ICS)。这些传感器可以产生大量的多变量时间序列数据。多传感器时间序列数据的无监督异常检测在机器学习研究中具有重要意义。关键的挑战是通过捕获多传感器数据中的时空相关性来发现广义的正常模式。除了这个挑战之外,噪声数据经常与训练数据交织在一起,这可能会误导模型,使其难以区分正常、异常和噪声数据。以往的研究很少能同时解决这两个问题。在本文中,提出了一种新的基于深度学习的异常检测算法,称为深度卷积自编码记忆网络(CAE-M)。
首先构建了一个深度卷积自编码器,用最大平均差异(MMD)来表征多传感器数据的空间依赖性,以更好地区分噪声、正常和异常数据。然后,构建了一个由线性(自回归模型)和非线性预测(双向LSTM with Attention)组成的记忆网络,以捕获时间序列数据的时间依赖性。最后,CAE-M对这两个子网进行联合优化。将所提出的方法与几种最先进的HAR和HC数据集的异常检测方法进行了实证比较。实验结果表明,提出的模型优于现有的方法。
本文提出了一种卷积自编码记忆网络。首先,通过深度卷积自编码器(Deep Convolutional Autoencoder, CAE)将多传感器时间序列信号中的空间信息编码为低维表示。加入MMD促使训练数据的分布近似于相同的分布,从而降低了训练数据中噪声和异常引起的过拟合风险。
卷积自编码记忆网络主要包含两个部分:特征网络和记忆网络。
特征网络使用深度卷积自编码器来学习低维特征,Z_f表示的自编码器的特征提取结果,Z_r表示原始数据与重构数据之间的均方误差。这里加入MMD loss来降低了训练数据中噪声和异常引起的过拟合风险。
记忆网络使用了两个阶段的预测,非线性预测和线性预测。非线性预测采用了一种带有注意机制的双向LSTM,它可以在计算相关隐藏状态时考虑整个/局部上下文。线性预测采用一种利用观测值与滞后观测值之间的依赖关系的回归模型。
最后通过计算Prediction Error来进行异常判定。
本文引入了一种深度卷积自编码记忆网络CAE-M来检测异常。CAE-M模型使用复合框架捕获多传感器时间序列数据的时空相关性,对正常数据的广义模式进行建模。我们首先构建了具有最大平均差异(MMD)惩罚的深度卷积自编码器,以表征多传感器时间序列信号,并降低由训练数据中的噪声和异常引起的过拟合风险。为了更好地表征时序数据的时间依赖性,我们使用了非线性双向LSTM和线性自回归模型进行预测。对HAR和HC数据集的大量实证研究表明,CAE-M比其他基线方法表现更好。
在未来的工作中,我们将专注于基于点的细粒度异常检测方法,并通过设计适当的稀疏操作进一步改进我们的多传感器数据检测方法。
论文下载地址:
链接:https://pan.baidu.com/s/19vw0ZoVirnGEFcDSdv1Nqw
提取码:1msi
--来自百度网盘超级会员V6的分享