深度异常检测入门

news2024/11/28 12:41:53

异常检测定义

        Anomaly detection。异常检测是对与标准行为或模式显著不同的罕见事件、项目或可疑观察的识别。异常也被称为异常值、噪声、偏差等。

对于异常的理解:

  • 异常不一定是无用的,部分异常对数据挖掘领域有较大的价值
  • 不同的场景下,异常的界定结果也并非均是异常

检测难点

  • 相对于正常点,异常点数量可能非常少
  • 异常和数据本身的噪声波动很难区分
  • 无法预知异常点所属类型

异常分类

点异常、条件异常、聚集异常

异常结果

呈现方式:

  • 异常标签 labels:直接标记正常数据和异常数据
  • 异常得分 score:表示异常程度的数值

传统异常检测方法

        传统的异常检测技术方法,主要是基于类标号和研究方法进行分类。

1、基于类标号。可细分为监督、半监督、无监督

2、基于研究方法。根据其训练步所使用方法不同,分为基于模型、邻近度、基于聚类和分类的异常检测。

 2.1 基于模型的异常检测。可细分为基于模型、深度、误差的方法。

1)基于模型/统计。古早的异常检测是基于统计来判断的。由训练步和测试步组成,检测效率随着数据维度和数据量的增加而降低,适用于单变量数据集。

2)基于深度。其异常检测方法包括:

  • 凸壳剥离法:从最外层开始构建凸壳,类似onion
  • 半空间深度法:根据深度值判断异常点,
  • FDC法:基于半空间深度法,设定阈值筛选异常点,效率较高
  • 最小椭球体积估计:通过数据分布划分椭圆边界,其外则异常

3)基于误差。理论充足,应用较少,需事先了解数据特征。

2.2 基于邻近度。具体细分为基于距离、密度。经典方法LOF。存在的不足:难以确定最小近邻域。

 2.3 基于聚类。会将联系紧密的数据归分至同簇,异常数据则不属于任一簇或者原理簇中心。为无监督方法,其主要任务是对数据聚类,且异常检测的效果不咋理想。

2.4 基于分类。根据训练集建立分类器(分类模型),确定对象所属目标类,适用于预测二元分类数据集。

  • 基于神经网络。将信息的存储和处理结合,对数据建模的同时区分异常类,有较好的智能性和容错能力,应用较广。
  • 基于贝叶斯网络、基于支持向量机、基于规则。即学习正常标签数据中的规则来寻找异常。

深度异常检测方法

        深度异常检测即深度学习支持的异常检测。

为何会选择采取深度检测的方法?实践中,深度方法具有更强的处理这类大规模数据的能力

深度异常检测方法分类:只作为特征提取器、用于表示学习配合其他loss使用、端到端得到异常分值

参考

  • 深度异常检测入门:一个统—框架与一个分类
  • 异常检测综述:Deep Learning for Anomaly Detection: A Review

参考文献

[1]卓琳,赵厚宇,詹思延.异常检测方法及其应用综述[J].计算机应用研究,2020(S01):9-15

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/537650.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CHATGPT的前世今生

ChatGPT是一款基于GPT(Generative Pre-trained Transformer)模型的聊天机器人,它的前世今生充满着令人惊叹的故事。在这篇文章中,我们将深入探讨ChatGPT的诞生、发展和未来。 一、ChatGPT的起源 ChatGPT是由OpenAI团队开发的一款…

夏驰和徐策的解决数学问题思路之——数学归纳法

前言: 今天在复习概率论1.2.3 事件的概率及其性质中证明性质2有限可加性中运用到了数学归纳法,我对数学归纳法早有听闻,但是一直不知道怎么用这个方法,其实数学归纳法早在高中我们就已经接触到了在人教版教材选修2中就有这个方法…

ChatGPT 3.5 API的调用不全指南(持续更新ing...)

诸神缄默不语-个人CSDN博文目录 最近更新时间:2023.5.17 最早更新时间:2023.5.17 关于怎么才能上ChatGPT、怎么才能获取API额度等等信息,建议直接见我的medium账号。 因为这不是能在内网发的内容。 本文不涉及相关网络问题。 我本来想靠问…

【云原生|Kubernetes】03-Pod详解

【云原生|Kubernetes】03-Pod详解 文章目录 【云原生|Kubernetes】03-Pod详解前言Pod解析Pod简介Pod的组成Pod中的几种容器的概念Pause容器初始化容器主容器伴随容器容器的启动顺序容器与pod与node的关系 Pod种类普通Pod静态pod静态Pod创建方式配置文件方式http方式 Job PodCro…

Debian11之 K3s 部署 K8S 集群

K3S 架构方案 Server 节点指的是运行 k3s server 命令的主机,control plane 和数据存储组件由 K3s 管理Agent 节点指的是运行 k3s agent 命令的主机,不具有任何数据存储或 control plane 组件Server 和 Agent 都运行 kubelet、容器运行时和 CNI 基于 …

ESP32C3之PlatformIO IDE开发环境

一、下载​​platformio ide扩展 在vscode里面直接搜索​​platformio ide,点击安装即可 二、新建esp32c3工程 2.1 首先点击小蚂蚁的图标,然后点击pio home 2.2 点击projects->create New Project 2.3 填写工程名和工程路径:勾选钩表示默认路径&a…

Kubernetes第1天

第一章 kubernetes介绍 本章节主要介绍应用程序在服务器上部署方式演变以及kubernetes的概念、组件和工作原理。 应用部署方式演变 在部署应用程序的方式上,主要经历了三个时代: 传统部署:互联网早期,会直接将应用程序部署在物…

Redis学习---02

一、Redis基础知识 (1)redis默认有16个数据库;默认使用的是第0个数据库;切换数据库: select index 获取数据库中的值大小:dbsize (2):查看所有的key (3):清空当前数据库:flushdb (4)清空所有的数据库:flu…

LCD1602液晶显示模块

1.认识LCD1602 1、概述: LCD1602(Liquid Crystal Display)是一种工业字符型液晶,能够同时显示 1602,32个 字符(16列两行)。是我们接触引脚最多的模块。LCD1602我们的非标准协议(标准协议有IIC、IIS、SPI&…

利用暴力攻击破解登陆密码

长久以来,入侵远程计算机系统的工具和技术并没有发生翻天覆地的变化。例如,在许多情况下,普通用户只要知道了相关密码,就能立刻变身为管理员。虽然这些情形听起来不够曲折,但在大多数情况下,暴力攻击是通过…

Kubernetes第3天

第五章 Pod详解 本章节将详细介绍Pod资源的各种配置(yaml)和原理。 Pod介绍 Pod结构 每个Pod中都可以包含一个或者多个容器,这些容器可以分为两类: 用户程序所在的容器,数量可多可少 Pause容器,这是每个…

JavaScript实现水印效果

效果 实现思路 利用canvas绘制出文字将canvas作为遮罩层背景图, 将背景x轴和y轴重复 实现步骤 动态生成canvas并画出文字 const canvas document.createElement("canvas"); canvas.width len * fontSize; // canvas宽度, 目前是根据文字长度和大小来调整的, 自…

Postman调试依赖登录接口的3种方法

在接口测试种, 我们经常会遇到有些接口登录后才能访问.我们在使用Postman调试这种接口时一般有3种方法: 1.依次请求 如果有登录接口的文档,或者通过抓包比较容易抓出登录请求的参数和格式,可以先使用Postman请求一下登录接口,这时Cookies会存到本地(可以通过Postman Cookies管理…

JVM学习(十一):对象的实例化内存布局与访问定位

目录 一、对象的实例化 1.1 创建对象的方式 1.2 创建对象的步骤 二、对象的内存布局 2.1 对象头 2.1.1 运行时元数据(Mark Word) 2.1.2 典型指针 2.2 实例数据(Instance Data) 2.3 对齐填充(Padding&#…

一个奇葩的网络问题,把技术砖家“搞蒙了“

问题现象 客户反馈有一个server端S, 两个client端C1, C2, S的iptables规则对C1, C2都是放通的,但是C2无法连接上S,客户很着急,催我们尽快解决。 这里解释一下,iptables规则是防火墙规则,是linux系统实现防…

【C++刷题集】-- day1

目录 选择题 单选 编程题 组队竞赛⭐ 【题目解析】 【解题思路】(排序 贪心) 删除公共字符⭐ 【题目解析】 【解题思路】(哈希映射) 选择题 单选 1、 以下for循环的执行次数是 ( ) for(int x 0, y 0; (y 123) && (x < 4); x); 是无限循环 循环次数不…

Leetcode刷题之有效的括号

我们的内心和心智&#xff0c;是决定我们未来命运的最强劲的力量。 -- 奥普拉温弗瑞目录 &#x1f341;一.有效的括号 &#x1f34d;1.使用栈实现 &#x1f352;2.完整代码&#xff1a; 题目描述&#xff1a; 给定一个只包括 (&#xff0c;)&#xff0c;{&#xff0…

Sonar Qube代码质量检测工具安装及基本使用

Sonar介绍 Sonar Qube是一个开源的代码分析平台&#xff0c;支持Java、Python、PHP、JavaScript、CSS等25种以上的语言&#xff0c;可以检测出重复代码、代码漏洞、代码规范和安全性漏洞的问题。 Sonar Qube可以与多种软件整合进行代码扫描&#xff0c;比如Maven&#xff0c;…

算法套路十七——买卖股票问题:状态机 DP

算法套路十七——买卖股票问题&#xff1a;状态机 DP 状态机DP是一种将动态规划方法应用于有限状态机&#xff08;Finite State Machine&#xff09;的问题求解方法。 状态机DP&#xff08;State Machine DP&#xff09;是一种动态规划的思想&#xff0c;它通常用于解决一些具…

行动元宣布推出面向精密制造领域的智能运动控制解决方案

近日&#xff0c;AI 工业工程化平台行动元宣布推出面向精密制造领域的智能运动控制解决方案。该方案融合大数据模型、数字孪生以及人工智能技术&#xff0c;通过数字化建模、适配、调试等过程&#xff0c;极大提升终端设备集成方案的设计、选型与测试效率&#xff0c;并通过算法…