【计算机视觉】CVPR 23 新论文 | 异常检测最新改进方法:DeSTSeg

news2025/1/12 4:04:49

文章目录

  • 一、导读
  • 二、背景
    • 2.1 主要贡献
    • 2.2 网络介绍:DeSTSeg
  • 三、方法
    • 3.1 Synthetic Anomaly Generation 合成异常生成
    • 3.2 Denoising Student-Teacher Network 去噪教师学生网络
    • 3.3 Segmentation Network 分割网络
  • 四、实验结果

一、导读

DeSTSeg: Segmentation Guided Denoising Student-Teacher for Anomaly Detection

论文为:

在这里插入图片描述
论文地址:

https://arxiv.org/pdf/2211.11317

二、背景

工业异常检测旨在发现产品的异常区域,在工业质量检测中发挥着重要作用。在工业场景中,很容易获得大量的正常示例,但缺陷示例很少。

大多数现有的工业异常检测方法都是基于2D图像的。然而,在工业产品的质量检查中,人类检查员利用3D形状和颜色特征来确定它是否是缺陷产品,其中3D形状信息对于判断是重要和必要的。

无监督异常检测的核心思想是找出异常和正态表示之间的区别。目前2D工业异常检测方法可分为两类:

(1)基于重构的方法。图像重建任务被广泛用于异常检测方法中,以学习正常表示。基于重建的方法对于单模态输入(2D图像或3D点云)很容易实现。但对于多模态输入,很难找到重建目标。

(2)基于预训练特征提取器的方法。利用特征提取器的直观方法是将提取的特征映射到正态分布,并将分布外的特征作为异常。

2.1 主要贡献

  • 提出了一种去噪学生编码器-解码器,它经过训练,可以从具有异常输入的教师那里显式地生成不同的特征表示。
  • 使用分割网络来自适应地融合多级特征相似性,以取代经验推理方法。
  • 在基准数据集上进行了广泛的实验,以证明我们的方法对各种任务的有效性。

2.2 网络介绍:DeSTSeg

在训练期间生成并使用合成的异常图像。在第一步骤(a)中,训练具有合成输入的学生网络,以从干净的图像生成与教师网络类似的特征表示。在第二步(b)中,学生和教师网络的归一化输出的元素乘积被级联并用于训练分割网络。分割输出是预测的异常得分图。

在这里插入图片描述

三、方法

  • 所提出的 DeSTSeg 由三个主要组件组成:预先训练的教师网络、去噪的学生网络和分割网络。
  • 将合成异常引入到正常训练图像中,并分两步训练模型。
  • 在第一步中,模拟的异常图像被用作学生网络的输入,而原始的干净图像被用作教师网络的输入。教师网络的权重是固定的,但用于去噪的学生网络是可训练的。
  • 在第二步中,学生模型也是固定的。学生网络和教师网络都以合成的异常图像作为输入,以优化分割网络中的参数来定位异常区域。
  • 为了推断,以端到端模式生成像素级异常图,并且可以通过后处理来计算相应的图像级异常分数。

3.1 Synthetic Anomaly Generation 合成异常生成

我们模型的训练依赖于使用 [Draem] 中提出的相同算法生成的合成异常图像。生成随机二维Perlin噪声,并通过预设阈值进行二值化以获得异常掩模 M。通过用无异常图像和来自外部数据源A的任意图像的线性组合替换掩模区域来生成异常图像 ,其中不透明度因子β在[0.15,1]之间随机选择:

在这里插入图片描述
表示逐元素乘法运算。异常生成在训练期间在线执行。通过使用该算法,介绍了三个优点。

首先,与绘制矩形异常掩模相比,随机Perlin噪声生成的异常掩模更不规则,与实际异常形状相似。其次,用作异常内容A的图像可以在没有精心选择的情况下任意选择。第三,引入不透明度因子β可以被视为数据扩充,以有效增加训练集的多样性。

3.2 Denoising Student-Teacher Network 去噪教师学生网络

在以前的多层次知识蒸馏方法中,学生网络(正常图像)的输入与教师网络的输入相同,学生网络的架构也是如此。然而,提出的去噪学生网络和教师网络以成对的异常和正常图像作为输入,去噪学生网络具有不同的编码器-编码器架构。在接下来的两段中,我们将研究这种设计的动机。

首先,建立优化目标,以鼓励学生网络生成不同于教师的异常特定特征。我们进一步赋予学生网络一个更直接的目标:在教师网络监督的异常区域上建立正常特征表示。由于教师网络是在大型数据集上预先训练的,它可以在正常和异常区域生成判别特征表示。因此,在推理过程中,去噪学生网络将生成与教师网络不同的特征表示。其次,考虑到特征重建任务,得出结论,学生网络不应该复制教师网络的架构。考虑到重建早期层的特征的过程,众所周知,CNN的较低层捕获局部信息,如纹理和颜色。相反,CNN的上层表达全局语义信息。

我们采用它作为去噪学生网络的架构。有一种替代方法可以使用教师网络作为编码器,并将学生网络反向作为解码器;初步实验结果表明,完整的编码器-解码器学生网络性能更好。一种可能的解释是,预先训练的教师网络通常在ImageNet上进行分类任务训练;因此,最后一层中的编码特征缺乏足够的信息来重建所有级别的特征表示。

在这里插入图片描述

3.3 Segmentation Network 分割网络

在这里插入图片描述

四、实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667629.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数字图像处理【10】直方图反向投影与模板匹配

本篇简单描述直方图在图像处理中典型的应用场景,属于是比较老旧的应用技术,但不妨拿出来再学习,温故而知新,为新知识做一个铺垫。 直方图反向投影(Back Projection) 还记得之前学习过的图像直方图的计算/…

Knowledge Distillation of Large Language Models

这是大模型系列模型的文章,针对《Knowledge Distillation of Large Language Models》的翻译。 大模型的知识蒸馏 摘要1 引言2 方法2.1 MiniLLM:利用逆向KLD进行知识蒸馏2.2 策略梯度优化2.3 训练算法 3 实验3.1 实验设置3.2 结果3.3 分析3.4 消融实验 …

源码编译安装LAMP——LAMP+DISCUZ论坛搭建

文章目录 一.Apache1.什么是apache2.apache的主要特点3.apache的软件版本4.编译安装优点5.安装服务的一般步骤 二.LAMP简介与概述1.LAMP平台概述2.构建LAMP平台顺序3.各组件的主要作用 三.LAMPDISCUZ论坛搭建1.部署Apache1.1 下载apache相关安装包放入服务器中1.2 解压apache的…

数学公式识别(Mathpix + pix2tex)

文章目录 数学公式识别(Mathpix pix2tex)1. 下载安装2. 如何使用3. 限制4. 替代品4.1 pix2tex - LaTeX OCR4.2 pix2tex(网页版)4.3 Simple Tex OCR 数学公式识别(Mathpix pix2tex) 当我们看论文时&#…

2023软件工程中各种图在现代企业级开发中的使用频率

概览 系统流程图 ✔ 数据流图 不常用 ER图 ✔ 状态转换图 ✔ Warnier图 不常用 IPO图 不常用 Petri网 不常用 层次方框图 不常用 层次图 a.k.a. H图 ✔ 1,层次图描绘软件的层次结构.层层次方框图描绘的是数据结构。 2,层次图的方框表示模块或子模块。层次方框图的方框表示数据结…

C++基础(12)——STL(vector和deque)

前言 本文主要介绍C中STL中的vector和deque容器 7.3:vector容器 7.3.1:vector容器基本概念、特点和构造函数 vector和数组的区别:数组是静态空间,一旦指定大小,之后就不能发生改变。vector可以动态扩展&#xff0c…

(秋招准备)三角化复习

用SVD分解继续宁特征点三角化 三角化又叫三角测量,本质是用相机的运动估计特征点的空间位置,发生在估计得到帧间运动之后(单目情况)。三角测量是指,通过在两处观察同一个点的夹角,确定该点的距离。由于双目本身就能得到视角不同的…

Java集合与数组概述

Java 集合可分为Collection 和Map 两种体系 实线是继承 虚线是实现类 1.Collection接口:单列数据,用来存储一个一个的对象。定义了存取一组对象的方法的集合 ​ List:元素有序、可重复的集合 -->(动态数组) ​ ----…

B2B2C多用户商城系统是怎么报价的?

买东西的时候,喜欢先问商品的价格,更不用说多用户商城系统的高成本了,现在有很多多用户商城系统,但是价格不一样。所以很多商家朋友都在问,开发一个多用户商城系统的价格是多少,下面jsudo小编一起来看看吧。…

【机器学习】树模型的三种序列化方式的区别(模型存储大小、序列化所用内存、序列化速度)

文章目录 一、导读二、模型运行例子三、运行内存计算四、保存和加载4.1 jsonpickle4.2 pickle4.3 模型自带 五、实验5.1 模型存储大小对比实验5.2 运行的memory对比实验 六、序列化时间对比七、源代码八、总结 一、导读 本文总结常用树模型: rf,xgboost…

【操作系统】进程概述

目录 1.进程的概念和定义 2.进程的特征 3.进程的状态 4.进程状态转换 5.进程的构成 5.1进程控制块(PCB) 5.1.1PCB的组织方式 5.2程序段 5.3数据段 6.如何控制进程 6.1进程的创建 6.2进程的终止 6.3进程的阻塞和唤醒 7.进程之间的通信手段 …

OceanBase—02(入门篇——使用obd安装OceanBase的几种方式)

OceanBase—02(入门篇——使用obd安装OceanBase的几种方式) 1. 一键部署1.1 下载并安装 all-in-one 安装包1.2 单机部署 OceanBase 数据库1.2.1 部署命令 1.3 使用 OBClient 客户端连接 OceanBase 数据库1.3.1 两种连接方式1.3.2 遇到的问题1.3.2.1 通过…

Allegro如何设置默认器件的高度信息操作指导

Allegro如何设置默认器件的高度信息操作指导 在给PCB设置限高的时候,一般会添加一个package keepout的铜皮,如下图 如果器件有高度信息,且没有超过限高要求,是不会有DRC报错的,如果器件没有高度信息,软件会默认给匹配一个高度信息,从而导致误报,如下图 可以看到默认的高…

Windows 查看端口占用情况 80端口被占用处理方法

一 . 用netstat指令查看是端口占用情况 查看所有端口的占用情况 C:\Users\Administrator>netstat -ano 活动连接协议 本地地址 外部地址 状态 PIDTCP 0.0.0.0:21 0.0.0.0:0 LISTENING 2228TCP 0.0.0.0:8…

【Leetcode60天带刷】day20二叉树—— 654.最大二叉树 , 617.合并二叉树 , 700.二叉搜索树中的搜索 , 98.验证二叉搜索树

题目: 530. 二叉搜索树的最小绝对差 给你一个二叉搜索树的根节点 root ,返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数,其数值等于两值之差的绝对值。 示例 1: 输入:root [4,2,6,1,3] 输出&#xff1…

【工具使用】Gitee

怎么创建Gitee仓库 1. 进入Gitee官网 https://gitee.com/ 2. 没有账号先注册 https://gitee.com/signup?redirect_to_url%2F 3.创建仓库 参考操作页面 你的电脑上要安装git 4. 电脑安装Git 1. 进入git官网(官网下载方法-需要魔法工具) https://…

视觉SLAM十四讲——ch13代码祥读(设计SLAM系统)

视觉SLAM十四讲——ch13学习过程及代码祥读 0. 可以下载文件的网址1. 重读《视觉SLAM十四讲》ch13实践设计SLAM系统2. 主函数的阅读3. config配置文件4. visual_odometry.cpp视觉里程计文件5. frontend.cpp前端文件(重要文件1)6. backend.cpp后端文件&am…

【人工智能概论】 Python标准库——typing(类型标注)、 assert断言、 @property装饰器、setter装饰器

【人工智能概论】 Python标准库——typing(类型标注)、 assert断言、 property装饰器、setter装饰器 文章目录 【人工智能概论】 Python标准库——typing(类型标注)、 assert断言、 property装饰器、setter装饰器一. typing&#…

向量数据库的行业标准逐渐清晰!Vector DB Bench 正式开源!

大模型带火了向量数据库赛道,也让各式各样的向量数据库进入开发者视野。 对于开发者而言,如何选择一个适合自己的向量数据库至关重要。不过,向量数据库的选型并不简单,开发者不仅需要对市面上各种开源和闭源的数据库进行全面的性能…

我心中世界上最好的语言是PHP,别不信【偷笑】

文章目录 一、前言1.1 最适合的语言2.2 流行的语言2.3 Java和PHP2.4 PHP的性能2.5 关于PHP2.6 作文思路概览 二、PHP的优势2.1 跨平台2.2 开发运行环境搭建方便2.3 强大的包管理工具2.4 拥有优秀的代码调试工具xdebug2.5 上手快,学习成本低2.6 丰富的企业级框架2.7 …