一、什么是异常?
1、异常的定义
异常是指与其他数据有很大不同的数据。异常现象是“一种与其他观测结果大相径庭的观测结果,以至于人们怀疑它是由不同的机制产生的。”,也被称为“异常”或“离经叛道”。
所有观测值 = 正常数据 + 异常值
异常值 = 噪声 + 异常
噪声 = 人们不感兴趣的异常值
异常 = 人们关心的的异常值
2、两个基本问题
1、要将一个点归类为异常,偏差必须有多大?没有明确的答案。在一定程度上取决于主观判断。
2、如何将异常与噪声区分开来?这取决于你更关心什么。
3、异常类型
1、点异常:与其他数据相比,单个数据点似乎很奇怪。示例:一次异常大额的