时间序列论文-聚类和异常检测（二）

时间序列论文-聚类和异常检测（二）

news2026/2/14 21:40:06

同样摘自知乎的回答：https://www.zhihu.com/question/29507442/answer/1212624591?utm_id=0

正巧之前做过时间序列的异常检测项目，这里介绍几种尝试过的方法，也算是抛砖引玉吧，欢迎大家讨论交流~

背景与定义

时间序列异常检测的目的就是在时间序列中寻找不符合常见规律的异常点，无论是在学术界还是工业界这都是一个非常重要的问题。

应用十分广泛，这里拿“智能运维 ”场景的异常检测应用举例。企业的运维场景中有海量的运维指标数据，如果单纯依靠人力来发现并定位异常，将是十分低效的，所以如果可以开发一个智能运维系统对于异常波动自动定位，将会提高运维效率。

课题背景与应用举例

课题背景与应用举例

现有方法

现有方法可以分为以下四类：

统计方法–通过历史同期的数据分布来确定当前数据的合理波动范围。例如，k-sigma方法。
预测方法 –比较预测值与真实值的差异，超出阈值认为是异常点。
直接异常检测方法–有很多成熟算法，例如LOF，孤立森林，One-class SVM。
深度学习生成方法–对数据降维再升维重构，不能良好复原的点认为是异常点。例如GAN，VAE。

现有方法及优缺点

现有方法及优缺点

现有的方法在时间序列数据中也许直接使用效果不好，这一点我们接下来的实验也能看出。

尝试的方法

统计方法（ADTK软件包）
直接异常检测
预测+统计方法（Prophet+3-sigma）
预测+直接异常检测
深度学习生成方法

–统计方法

异常检测工具包（ADTK）是一个Python软件包，用于无监督/基于规则的时间序列异常检测。无需基于训练+测试范式，本方法具有极低的时间成本。基本思想是基于历史数据的统计，按照分位数或者阈值或者统计检验的方法来判断当前点是否异常。

ADTK实验效果

ADTK实验效果

实验效果：模型倾向于把过多的点识别成异常值点。

–直接异常检测

这种方法成熟的方法较多，大家可以参照Python的pyod软件包。

One-class SVM实验效果

One-class SVM实验效果

实验效果：时间序列正常的波动的高峰和低谷被判断为异常，没有充分利用时间维度的信息。

–预测+统计方法（Prophet+3-sigma）

总体思路：如果数据超出了预测值的合理的波动范围，认为是异常。

总体思路示意图

总体思路示意图

预测方法采用Prophet实现，3-sigma可以借助历史的波动数据来估计，例如我们将时间往前推数周，得到间隔不同周的同一时刻的数据；将时间往前推1~7天，得到同一周内不同天的同一时刻的数值。计算这些数值的标准差，作为sigma的估计。在Prophet的预测上下界的基础上分别加上和减去3-sigma得到数据波动的合理范围，超出范围用异常标注。

Prophet+3-sigma实验效果

Prophet+3-sigma实验效果

实验效果：考虑了时间维度的相关性，准确、高效。

–预测+直接异常检测的方法

去除时间序列的趋势和周期性。用预测模型给出的预测值与真实值相减计算序列的残差，残差不包含周期性和趋势性，可以用作后续的异常检测。

框架示意图

框架示意图

当然为了提升模型的稳定性，我们可以在预测步骤采取多种预测方法，检测部分我们也可以用到pyod里面提供的多种方法，最终投票决定最终的结果。

模型集成

模型集成

异常检测部分的11个模型介绍

异常检测部分的11个模型介绍

实验效果

实验效果

实验效果：较好。

–深度学习生成模型

这里我们尝试了LSTM-AE的方法，效果不错。

总体思路：将高维数据压缩至某一个特定维度大小，再还原至与原始数据同样的维度。训练模型使得复原数据和原数据差距尽可能小。不能良好复原的点被认为是异常点。

LSTM-AE示意图

LSTM-AE示意图

实验效果

实验效果

总结

第3、4、5模型效果较好，对于时间序列检测问题可以尝试。

注：实验结果并非答主一人完成，也感谢当时一起参与项目的小伙伴_{此为原创内容，转载请注明原文链接}

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1002626.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

c++实现数据结构栈和队列

c++实现数据结构栈和队列

1、栈头文件 #ifndef ZHAN_H #define ZHAN_H#define MAX 8 #include <iostream> using namespace std;class Shu {int datatype; //入栈的数据int *arr; //栈的数组int top; //记录栈顶元素的下标public://构造函数Shu();//析构函数~Shu();//判断空int stack_empty…

阅读更多...

COSCon'23 Call for Speakers

COSCon'23 Call for Speakers

一年一度的开源盛会，COSCon23 第八届中国开源年会，将于10月28~29日，在四川成都市高新区菁蓉汇召开！ The yearly open source event, COSCon23 8th Annual China Open Source Conference, will be taken place on 28th~29th Octobe…

阅读更多...

【编码魔法师系列_构建型1.1】简单工厂模式（Static Factory）

【编码魔法师系列_构建型1.1】简单工厂模式（Static Factory）

学会设计模式，你就可以像拥有魔法一样，在开发过程中解决一些复杂的问题。设计模式是由经验丰富的开发者们（GoF）凝聚出来的最佳实践，可以提高代码的可读性、可维护性和可重用性，从而让我们的开发效率更高。通…

阅读更多...

让照片动起来的软件，轻松制作照片动效

让照片动起来的软件，轻松制作照片动效

随着社交媒体的日益普及，我们对于照片的要求也越来越高。普通的照片已经不能满足我们的需求，我们希望照片更加生动有趣。照片动效便应运而生，它可以让照片动起来，吸引更多的注意力，让照片更加生动有趣。照片动效制作起…

阅读更多...

软件验收测试

软件验收测试

1. 服务流程验收测试 2. 服务内容测试过程中，根据合同要求制定测试方案，验证工程项目是否满足用户需求，软件质量特性是否达到系统的要求。 3. 周期 10-15个工作日 4. 报告用途可作为进行地方、省级、国家、部委项目的验收&#xff0…

阅读更多...

Java-华为真题-预定酒店

Java-华为真题-预定酒店

需求： 放暑假了，小王决定到某旅游景点游玩，他在网上搜索到了各种价位的酒店（长度为n的数组A），他的心理价位是x元，请帮他筛选出k个最接近x元的酒店（n>k>0）&#xff…

阅读更多...

JavaScript中的Generator函数及其使用方式

JavaScript中的Generator函数及其使用方式

聚沙成塔每天进步一点点 ⭐ 专栏简介⭐ Generator函数⭐ 创建Generator函数⭐ 调用Generator函数⭐ Generator函数的应用1. 异步编程2. 生成器（Generator） ⭐ 写在最后 ⭐ 专栏简介前端入门之旅：探索Web开发的奇妙世界记得点击上方或者右侧…

阅读更多...

L1-002 打印沙漏分数 20

L1-002 打印沙漏分数 20

L1-002 打印沙漏分数 20 全屏浏览题目切换布局作者陈越单位浙江大学本题要求你写个程序把给定的符号打印成沙漏的形状。例如给定17个“*”，要求按下列格式打印 ************ *****所谓“沙漏形状”，是指每行输出奇数个符号；各行符…

阅读更多...

23年11月PMP考试如何报名？如何备考？（含备考干货）

23年11月PMP考试如何报名？如何备考？（含备考干货）

总分为4个步骤：英文报名--审核【抽中后快递材料审核】--中文报名--在线支付费用一、PMP英文报名： 英文报名时间无限制，但有一年的有效期，所以大家尽量提前报名二、审核： PMI网站对你英文报名的材料进行审核&…

阅读更多...

Java——》synchronized锁升级

Java——》synchronized锁升级

推荐链接： 总结——》【Java】总结——》【Mysql】总结——》【Redis】总结——》【Kafka】总结——》【Spring】总结——》【SpringBoot】总结——》【MyBatis、MyBatis-Plus】总结——》【Linux】总结——》【MongoD…

阅读更多...

Win11共享文件夹怎么设置

Win11共享文件夹怎么设置

当我们在使用Win11的过程中有时会因为一些操作需要共享文件夹，那么Win11系统该如何设置共享文件夹呢，下面小编就给大家详细介绍一下Win11设置共享文件夹的方法，有需要的小伙伴快来和小编一起看看吧。 Win11设置共享文件夹的方法：…

阅读更多...

MySQL——无法打开MySQL8.0软件安装包或者安装过程中失败，如何解决？

在运行MySQL8.0软件安装包之前，用户需要确保系统中已经安装了.Net Framework相关软件，如果缺少此软件，将不能正常地安装MySQL8.0软件。解决方案：到这个地址 https://www.microsoft.com/en-us/download/details.aspx?id42642…

阅读更多...

如何查询成绩或工资

如何查询成绩或工资

为什么每次查询成绩或者工资的时候都觉得麻烦又耗时呢？在过去，我们可能需要去学校或公司的相关部门，填写繁琐的表格，然后等待工作人员进行查询和处理。这不仅浪费了我们宝贵的时间，还可能出现查询结果不准确或者遗漏的…

阅读更多...

华为OD机试 - 快速人名查找 - 深度优先搜索dfs（Java 2023 B卷 200分）

华为OD机试 - 快速人名查找 - 深度优先搜索dfs（Java 2023 B卷 200分）

目录专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明华为OD机试 2023B卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试（JAVA）真题（A卷B卷&#…

阅读更多...

天津大数据培训学校大数据可从事的行业

天津大数据培训学校大数据可从事的行业

大数据行业近年来呈现出爆炸式的增长态势，各行各业都越来越依赖数据来指导业务决策和创新发展，因此，大数据专业人才的需求也随之增长。这种行业需求的增长为大数据就业提供了良好的机会，尤其是对于具备相关技能和知识的人来说。 …

阅读更多...

KT142C-sop16语音芯片9600串口uart命令如何测试_详细说明

KT142C-sop16语音芯片9600串口uart命令如何测试_详细说明

KT142C是一个提供串口的SOP16语音芯片，完美的集成了MP3的硬解码。内置330KByte的空间，最大支持330秒的语音长度，支持多段语音，支持直驱0.5W的扬声器无需外置功放串口测试的软件截图如下： 7E 3F 00 02 00 04 EF--- 代…

阅读更多...

第五章 Linux常用应用软件

第五章 Linux常用应用软件

第五章 Linux常用应用软件 Ubuntu包含了日常所需的常用程序，集成了跨平台的办公套件LibreOffice和Mozila Firefox浏览器等。还提供了文本处理工具、图片处理工具等。 1.LibreOffice LibreOffice免费开源，遵照GPL分发源代码，与OpenOf…

阅读更多...

oauth2 授权模式 - 第三方登录

oauth2 授权模式 - 第三方登录

Oauth2 OAuth 2.0 是目前最流行的授权机制，用来授权第三方应用，获取用户数据。 OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的规范标准。与以往的授权方式不同之处是 OAuth 的授权不会使第三方触及到用户的帐号信息（如用户…

阅读更多...

3D WEB轻量化引擎HOOPS Commuicator技术概览（一）：数据导入与加载

HOOPS Communicator是一款功能强大的SDK，适用于基于Web的高级工程应用程序，代表HOOPS Web平台的Web开发组件。使用HOOPS Communicator，您可以构建一个在 Web浏览器中提供3D模型的Web应用程序。 HOOPS Communicator可以本地加载多种模型格式。…

阅读更多...

GO语言篇之CGO

GO语言篇之CGO

GO语言篇之CGO 文章目录 GO语言篇之CGO前言C代码嵌入GO代码C文件嵌入GO代码缺点前言 Go语言可以通过内置的CGO调用C语言接口，从而实现C语言代码的交互，CGO提供了一种将Go代码嵌入到C代码中，或者从Go代码中调用C函数的方法 C代码嵌入GO代码…

阅读更多...

推荐文章

最新文章