论文来源
标题: Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series
(Vincent Jacob,2021)
作者: Vincent Jacob, Fei Song, Arnaud Stiegler, Bijan Rad, Yanlei Diao, Nesime Tatbul
期刊: Proceedings of the VLDB Endowment
研究问题
Exathlon是第一个针对高维时间序列数据进行可解释异常检测的综合性公共基准测试。 Exathlon 是基于在 Apache Spark 集群上重复执行大规模流处理作业的真实数据跟踪而系统构建的。
研究方法
其中一些执行是通过引入六种不同类型的异常事件(例如,行为不当的输入、资源争用、进程失败)的实例来故意干扰的。 对于每个异常实例,都提供了根本原因区间和扩展效应区间的基本事实标签,支持开发和评估范围广泛的异常检测 (AD) 和解释发现 (ED) 任务。
研究结果
通过使用三种最先进的 AD 和 ED 技术(LSTM , AE , and BiGAN)进行的实验研究,展示了 Exathlon 的数据集、评估方法和端到端数据科学管道设计的实用性。
Exathlon 专注于大规模计算系统中熟悉的度量监控领域,并提供了一个基准测试平台,包括:(i) 精选的异常数据集,(ii) 用于 AD 和 ED 的新型基准测试方法,以及 (iii) 用于根据提供的数据集和方法实施和评估 AD 和 ED 算法的端到端数据科学管道。
关键贡献
与当前用于时间序列 AD 研究的公共资源相比,Exathlon 的一个关键贡献是它端到端地全面涵盖了一个具有挑战性的应用领域,而不是提供多个更小、更简单的数据集几个独立的域。
研究方向
异常检测、解释发现
实验地址
https://github.com/exathlonbenchmark/exathlon
References
[1]V. Jacob, F. Song, A. Stiegler, B. Rad, Y. Diao, and N. Tatbul, “Exathlon,” Proc. VLDB Endow., vol. 14, no. 11, pp. 2613–2626, 2021, doi: 10.14778/3476249.3476307.
论文下载
Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series