异常检测经典作:基于teacher-students的无监督异常检测

news2025/2/21 19:32:49

来源:投稿 作者:Mr.Eraser
编辑:学姐

论文链接:https://arxiv.org/pdf/1911.02357.pdf

贡献

提出了一种基于师生学习的无监督异常检测新框架:来自预训练教师网络的局部描述符用作学生集合的代理标签。模型能够在大型无标签图像数据集上利用所有可用的训练数据进行端到端知识蒸馏训练。

引入了基于学生网络预测方差和回归误差的评分函数,以获得用于分割自然图像中异常区域的密集异常图。描述了如何通过调整学生和教师网络的感受野来扩展到多个尺度上的异常区域分割。

1.Student–Teacher Anomaly Detection 概览

[Input images] 通过教师网络提取局部图像区域的密集特征。训练M个集成学生网络,以将教师网络的输出回归到无异常数据上。推理过程中,学生网络将在感受野覆盖的异常区域像素中产生额外增加的回归误差e和预测不确定性v。可以组合使用不同感受野生成的异常图以进行多尺度异常分割。

2.Student–Teacher Anomaly Detection 细节

给定一个训练数据集 D = {I_1, I_2, . . . , I_N }的无异常图像,目标是建立一个 [学生网络 S_i] 的集合,该网络稍后可以检测测试图像 J 中的异常。这意味着它们可以为测试图的每个像素分配一个分数,表明与训练数据流形的偏离程度。为此,学生模型针对从在大型自然图像数据集上预训练过的描述性 [教师网络T] 获得的回归目标进行训练。经过训练后,可以从学生网络的回归误差和预测方差中得出每个图像像素级别的异常分数。

3.Learning Local Patch Descriptors 原理

使用度量学习和知识蒸馏有效地构建描述性教师网络T :

 为了让 T^ 输出语义较强的描述符,我们研究了自监督的度量学习以及从具有描述性但计算效率低的预训练网络中提取知识。通过 [RandomCrop] 可以从任何图像数据集中获得大量的训练patch-p,本文中使用 ImageNet数据集。

3.Learning Local Patch Descriptors 细节

4.Ensemble of Student Networks for Deep Anomaly Detection

接下来,描述如何训练学生网络 S_i以预测教师在无异常训练数据上的输出。最后从学生网络在推理过程中产生的预测不确定性和回归误差中得出异常分数。

其中,diag(\sigma )^{-1}表示用σ值填充的对角矩阵的逆。

「异常分数方程:」

在每个学生网络训练收敛之后,通过对集合的预测分布进行均等的加权,能够在图像每个像素处获得混合高斯量。由此可以通过两种方法获得异常测度:

  • A) Regression Error(Residual error)回归误差:

[Insight:推理过程中,学生网络无法在异常区域内回归教师的输出,因为在训练过程中没有观察到相应的描述符]

  • B) Student’s predictive uncertainly of the Gaussian mixture 预测不确定误差:

为了结合这两个分数,分别在无异常图像的验证集上计算所有e_{(r,c)}v_{(r,c)}的均值e_\mu, v_\mu和标准差e_\sigmav_\sigma。通过一组无异常图像的验证集,将归一化的分数相加得到最终的异常分数:

5. Multi-Scale Anomaly Segmentation

在实际测试阶段,如果一个异常区域只覆盖了教师网络的感受野大小为 p 的一小部分,则提取的特征向量主要描述了局部图像区域的无异常特征。因此,这导致学生网络能够很好地预测描述符,异常检测性能会下降。可以通过对输入图像进行下采样来解决这个问题。然而,这会导致输出异常图的分辨率出现一定的损失。

6. Experiments on MvTec Anomaly Detection Dataset

参数/网络结构选择细节:

Baseline 比较概览:

关注下方《学姐带你玩AI》🚀🚀🚀

回复“500”获取AI必读论文合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/519049.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

<<和>>操作符、取地址重载、const关键字

文章目录 自定义类型<<和>>重载const关键字取地址重载&#xff08;类的默认构造函数&#xff09; 自定义类型<<和>>重载 在内置类型中&#xff0c;<<和>>可以自动识别 在自定义类型冲&#xff0c;运算符重载&#xff0c;<<和>&…

maven从入门到精通 第六章 在Maven中项目导入、生命周期、插件、目标、仓库

这里写自定义目录标题 一 工程与模块导入1 工程导入的方法1.1 版本控制系统1.2 来自工程目录1.2.1 直接导入工程文件1.2.2直接解压 2 模块导入 二 生命周期的基本概念1 生命周期存在的意义 三 插件和目标四 仓库 一 工程与模块导入 1 工程导入的方法 1.1 版本控制系统 通常使…

有赞一面:亿级用户DAU日活统计,有几种方案?

说在前面 在40岁老架构师 尼恩的读者社区(50)中&#xff0c;最近有小伙伴拿到了一线互联网企业如极兔、有赞、希音、百度、网易、滴滴的面试资格&#xff0c;遇到一几个很重要的面试题&#xff1a; (1) 亿级用户场景&#xff0c;如何高性能统计日活&#xff1f; (2) 如何实现亿…

九、Ribbon负载均衡

目录 一、Ribbon负载均衡策略&#xff08;常用7种&#xff09;&#xff1a; 详细介绍&#xff1a; 1、轮询策略&#xff1a; RoundRibbonRule&#xff08;Ribbon默认策略&#xff09; 2、重试策略&#xff1a;RetryRule 3、加权响应时间策略&#xff1a;WeightedResponseT…

【模拟电子技术】常用半导体器件——本征半导体

&#x1f347;&#x1f347;只有强大的意志&#xff0c;才能成就最艰难的选择。 ——CSDN厉昱辰 目录 &#x1f34d;&#x1f34d;一、半导体 &#x1f34d;&#x1f34d;二、本征半导体的晶体结构 &#x1f34d;&#x1f34d; 三、本征半导体中的两种载流子 &#x1f34d…

数字图像处理基础知识(自救指南)

概念 本部分多来自课件&#xff0c;见水印 数字图像处理的目的 提高图像的视感质量&#xff0c;以达到赏心悦目的目的。提取图像中所包含的某些特征或特殊信息&#xff0c;主要用于计算机分析&#xff0c;经常用作模式识别、计算机视觉的预处理。对图像数据进行变换、编码和压…

炫云为什么要采用让人看不懂的GHZ计费?

很多人看到炫云GHZ计费都表示看不懂&#xff0c;觉得麻烦&#xff0c;没有按核数、按线程或者按分钟计费简单易懂&#xff0c;甚至还被某些同行经常拿来攻击。哪为什么炫云还坚持用GHZ计费呢&#xff1f;哪是因为使用GHZ计费更加公平、透明&#xff0c;且具有硬件无关性。今天就…

10个适合Web开发的最佳CSS生成器工具

在写CSS的时候&#xff0c;我们可以手写CSS&#xff0c;也可以直接使用一些CSS生成器来完成&#xff0c;今天我就跟大家分享10个好用的CSS生成器工具&#xff0c;帮助你提升工作效率。 1.纯CSS条纹生成器 网址&#xff1a;https://stripesgenerator.com 没有 Flash&#xff0…

QT多线程基础

文章目录 前言一、多线程概念介绍二、创建一个线程三、start和terminate函数四、如何不使用terminate函数终止线程总结 前言 本篇文章来讲解一下QT中的多线程使用方法。 其实线程这个概念对于我们来说并不陌生&#xff0c;main函数在多线程中一般就被称为主线程。 在QT中&am…

《计算机网络—自顶向下方法》 第四章Wireshark实验:TCP 协议分析

在因特网协议族&#xff08;Internet Protocol Suite&#xff09;中&#xff0c;TCP 层是位于 IP 层之上&#xff0c;应用层之下的中间层。不同主机的应用层之间经常需要可靠的、像管道一样的连接&#xff0c;但是 IP 层不提供这样的流机制&#xff0c;而是提供不可靠的包交换。…

Ordinal 是什么? BTC NFT 解释

Ordinal NFT 于 2023 年 1 月 20 日由开发者 Casey Rodarmor 在 BTC 主网上推出&#xff0c;它是在 BTC上 创建 NFT 的最新方式。虽然 BTC 上的 NFT 并不是一个新概念&#xff0c;BTC 之上的第 2 层网络&#xff08;例如 Counterparty 和 Stacks&#xff09;已经支持基于 BTC 的…

第七届中华梦乡·福清石竹山梦文化节举办

第七届中华梦乡福清石竹山梦文化节现场 5月9日至12日&#xff0c;第七届中华梦乡福清石竹山梦文化节暨海峡两岸&#xff08;福清&#xff09;道教论坛在福州福清举办。本届梦文化节以“福佑中华 梦圆石竹”为主题&#xff0c;旨在发挥海峡两岸道教界同根同源、联系密切的独特优…

【Java零基础入门篇】第 ⑤ 期 - 抽象类和接口(二)

博主&#xff1a;命运之光 专栏&#xff1a;Java零基础入门 学习目标 1.了解什么是抽象类&#xff0c;什么是接口&#xff1b; 2.掌握抽象类和接口的定义方法&#xff1b; 3.理解接口和抽象类的使用场景&#xff1b; 4.掌握多态的含义和用法&#xff1b; 5.掌握内部类的定义方法…

【HBase】介绍

文章目录 什么时候用Hbase&#xff1f;常见应用场景逻辑结构物理结构数据模型Name Space TableRowColumnTime StampCell 存储设计HLogHFileHfile生成方式 Apache HBase™ 是以 hdfs 为数据存储的&#xff0c;一种分布式、可扩展的 NoSQL 数据库。 Bigtable 是一个稀疏的、分布式…

5项目五:W1R3S-1(思路为主!)

特别注明&#xff1a;本文章只用于学习交流&#xff0c;不可用来从事违法犯罪活动&#xff0c;如使用者用来从事违法犯罪行为&#xff0c;一切与作者无关。 目录 前言 一、信息收集 二、网页信息的收集 三、提权 总结 前言 思路清晰&#xff1a; 1.信息收集&#xff0c;…

《程序员面试金典(第6版)》面试题 16.19. 水域大小(深度优先搜索,类似棋盘类问题,八皇后的简化版本,C++)

题目描述 你有一个用于表示一片土地的整数矩阵land&#xff0c;该矩阵中每个点的值代表对应地点的海拔高度。若值为0则表示水域。由垂直、水平或对角连接的水域为池塘。池塘的大小是指相连接的水域的个数。编写一个方法来计算矩阵中所有池塘的大小&#xff0c;返回值需要从小到…

【数据结构与算法】图的遍历与拓扑排序

文章目录 一、用数组模拟邻接表二、图的深度优先遍历&#xff08;dfs&#xff09;2.1 概念2.2 例题&#xff1a;树的重心 三、图的广度优先遍历&#xff08;bfs&#xff09;3.1 概念3.2 例题&#xff1a;图中点的层次 四、拓扑排序4.1 概念4.2 例题&#xff1a;有向图的拓扑序列…

2直接连接的网络与VLAN划分-2.2【实验】【计算机网络】

2直接连接的网络与VLAN划分-2.2-2.3【实验】【计算机网络】 前言推荐2直接连接的网络与VLAN划分2.1共享式以太网和交换式以太网2.2交换机MAC地址表建立与帧转发实验目的实验内容及实验环境实验原理交换机通过逆向学习帧的源地址&#xff0c;构建MAC地址表;交换机中MAC地址的构建…

netty基础(五)

1.基本介绍 1>.异步的概念和同步相对.当一个异步过程调用发出后,调用者不能立刻得到结果.实际处理这个调用的组件在完成后,通过状态、通知和回调来通知调用者; 2>.Netty中的I/O操作是异步的,包括Bind、Write、Connect等操作会简单的返回一个 ChannelFuture; 3>.调用…

二、Eureka注册中心

目录 注册中心主要有三种角色&#xff1a; 1、服务提供者&#xff08;RPC Server&#xff09; 2、服务消费者&#xff08;RPC Client&#xff09; 3、服务注册中心&#xff08;Registry&#xff09; 注册中心实现原理 常用的注册中心&#xff1a; 常用注册中心对比&…