异常检测 | MATLAB实现基于孤立森林的数据异常检测
目录
- 异常检测 | MATLAB实现基于孤立森林的数据异常检测
- 效果一览
- 基本介绍
- 程序设计
- 参考资料
效果一览
基本介绍
Matlab实现基于孤立森林(Isolation Forest)的数据异常数据检测可视化(完整源码和数据)
基于孤立森林(Isolation Forest)的数据异常数据检测可视化可直接运行注释清晰~Matlab
1.多特征输入,可用于检测异常数据,异常数据会在工作区变量中用0和1自动标识出来,非常方便,图中也会清楚显示正常值与离群值的分布,算法较新,需要Matlab2021B及以上版本~
2.孤立森林与随机森林非常相似,它是基于给定数据集的决策树集成而建立的,然而,也有一些区别,孤立森林将异常识别为树上平均路径较短的观测结果,每个孤立树都应用了一个过程:随机选择m个特征,通过在所选特征的最大值和最小值之间随机选择一个值来分割数据点。 观察值的划分递归地重复,直到所有的观察值被孤立。
3.直接替换数据即可用适合新手小白~
程序设计
- 完整程序和数据资源处直接下载:Matlab实现基于孤立森林(Isolation Forest)的数据异常数据检测可视化
%% 清空环境变量
warning off % 关闭报警信息
close all % 关闭开启的图窗
clear % 清空变量
clc % 清空命令行
%% 读取数据
res = xlsread('数据集.xlsx');
%% 超参数设置
rng("default") % 固定随机种子
contaminationFraction = single(0.05); % 设置异常比例
参考资料
[1] https://blog.csdn.net/kjm13182345320/article/details/124864369
[2] https://blog.csdn.net/kjm13182345320/article/details/127896974?spm=1001.2014.3001.5502