广义OOD检测最新综述

news2024/9/23 3:27:32

arXiv在2021年10月21日上传的论文**“Generalized Out-of-Distribution Detection: A Survey“,作者来自新加坡的南洋理工大学(NTU)和美国的威斯康星大学Madison分校**。
在这里插入图片描述
OOD检测对确保机器学习系统的可靠性和安全性至关重要,例如,在自动驾驶中,希望驾驶系统在检测以前从未见过异常场景或目标并且无法做出安全决策时,要发生警报并将控制权移交给人。(安全员)
OOD检测已经开发了大量的方法,从基于分类、基于密度到基于距离的方法。同时,其他几个问题在动机和方法论方面都与OOD检测密切相关,包括:异常检测(AD,anomaly detection)、新颖性检测((ND,novelty detection)、开放集识别(OSR,open set recognition)、和异常值检测(OD,outlier detection)、尽管有不同的定义和问题设置,这些问题经常使大家感到困惑。
该技术提出了一个广义的OOD检测的通用框架,包括上述五个问题,即:AD、ND、OSR、OOD检测和OD,这五个问题可以看作该框架的特例和子任务。
现有的机器学习模型大多基于封闭世界假设进行训练的,其中假设测试数据是来自与训练数据相同的分布,称为:in-distribution (ID)。然而,当模型部署在开放世界场景中,测试样本可能是OOD,分布漂移可能是由语义漂移(例如:OOD样本来自不同的类),或**Covariate shift(**例如、来自不同域的OOD样本)引起,这里主要讨论语义漂移检测的。
综述聚焦于计算机视觉和基于深度学习方法,基本分成4个类:

  • 基于密度的方法
  • 基于重建的方法
  • 基于分类的方法
  • 基于距离的方法。
    如图是本文提出的广义OOD检测框架:包括 anomaly 检测 (AD), novelty 检测 (ND), open set 识别 (OSR), out-of- distribution 检测 (OOD)和outlier 检测 (OD) 。
    在这里插入图片描述

异常检测(AD)

  • AD旨在检测在测试期间偏离预定义正态性的任何异常样本。 偏差可能由于covariate shift或语义漂移而发生,同时假设其他分布漂移不存在。 这带来两个子任务:感官 AD 和语义 AD

  • 感官AD 检测 covariate shift 的测试样本,基于正态性来自相同协变量分布的假设。语义 AD 检测有标签漂移的测试样本,基于正态性来自相同的语义分布(类别)假设,即正态性应该只属于一个类。

  • 感官AD 仅关注具有相同或相似语义的目标,并识别其表面的观测差异。 具有感官差异的样品被识别为感官异常。 示例应用包括对抗防卫、biometrics和艺术品的伪造识别、图像取证、工业检查等。一种流行的现实世界 AD 基准是用于工业检测的 MVTec。

  • 与感觉 AD 相比**,语义 AD 只关注语义漂移**,不存在covariate shift。 实际应用的一个例子是犯罪监控。 特定类的活跃图像爬虫也需要语义 AD 方法来确保收集的图像纯度

新颖性检测(ND)

ND旨在检测不属于任何训练类别的任意测试样本。 检测的新样本通常是为未来的建设性程序准备,例如更专业的分析,或模型本身的步进学习(incremental learning)。 根据训练类数目,ND 包含两种不同的设置: 1)只一个类的新颖性检测(one-class ND); 2)多个类新颖性检测(multi-class ND)。 值得注意的是,尽管有很多in-distribution(ID)类,但多个类 ND 的目标只是将新样本与in-distribution区分开来。 一个类ND和多个类 ND 都被表述为二元分类问题

真实世界的 ND 应用包括视频监控、行星探索和步进学习

开放集识别(OSR)

OSR要求多分类器,

  • 同时准确分类来自已知的已知类,的测试样本,以及
  • 同时检测来自,未知的未知类的测试样本
  • OSR通常支持真实世界图像分类器的稳健部署,其拒绝开放世界的未知样本

OOD检测

OOD检测旨在检测相对训练数据不重复标签的测试样本,形式上,OOD检测设置中的测试样本来自in-distribution(ID)语义飘移分布, 这个in-distribution(ID)数据可以包含单个类或多个类。 当训练中存在多个类时,OOD 检测不应损害其in-distribution(ID)数据分类能力

OOD检测的应用通常属于安全-紧要的情况,例如、自动驾驶、在构建算法基准时,OOD数据集不应该与in-distribution(ID)数据集有标签重叠

异常值检测(OD)

  • OD旨在检测由于covariate shift或语义漂移与给定观察集中其他样本明显不同的样本。

  • 虽然OD主要应用于数据挖掘任务,但也用于现实世界的计算机视觉应用,如视频监控和数据集清理。 数据集清理的应用,OD通常用作主要任务的预处理步骤,例如从开放集噪声标签中学习、微监督学习(webly supervised learning)和开放集半监督学习。

  • 如图是广义OOD检测框架的实例问题设置概览:
    在这里插入图片描述
    尽管 OSR 和实际使用具有关联性,但仍然存在一些限制,比如在训练期间不允许额外的数据,以及对理论开放风险界限的必要保证。这些限制排除了更注重有效性改进但可能违反 OSR 约束的方法。另一方面,OOD 检测包含更广泛的学习任务和解决方案空间

有趣的是**,异常值检测(OD)任务可以被视为广义 OOD 检测框架中的异常值**,因为异常值检测器(OD)是给定所有观察值,而不是遵循训练-测试方案。此外,在最近的深度学习领域很少看到这个主题的文章发表。然而,从直观上讲异常值也属于一种OOD

相关领域题目由如下5个领域:

  • 带拒绝的学习
  • 域自适应和域泛化。
  • 新颖性发现
  • 零样本学习
  • 开放世界识别(持续学习)

总结

慢慢的将OOD检测,全部都搞透彻,研究OOD的策略及其深入研究OOD的识别方案,用到了在进行补充与全部将其搞定都行啦的理由与打算。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32725.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

秦皇岛科学选育新品种 国稻种芯·中国水稻节:河北谱丰收曲

秦皇岛科学选育新品种 国稻种芯中国水稻节:河北谱丰收曲 冀时客户端报道(河北台 张志刚 米弘钊 赵永鑫) 新闻中国采编网 中国新闻采编网 谋定研究中国智库网 国稻种芯中国水稻节 中国农民丰收节国际贸易促进会 中国三农智库网-功能性农业农业…

Java对象拷贝原理剖析及最佳实践

作者:宁海翔 1 前言 对象拷贝,是我们在开发过程中,绕不开的过程,既存在于Po、Dto、Do、Vo各个表现层数据的转换,也存在于系统交互如序列化、反序列化。 Java对象拷贝分为深拷贝和浅拷贝,目前常用的属性拷…

2023年系统规划与设计管理师-学习计划安排

一.学习计划和安排: 序号 学习内容 分数以及题型 学习安排 完成日期 1 浏览教程, 了解知识结构 1天 11/24 2 前三章内容: 课本, 单元练习, 思维导图, 总结归纳, 第一遍背诵 分数占…

希望所有计算机学生都知道这些宝藏课程

数据结构 青岛大学——王卓老师的数据结构与算法基础 浙江大学——陈越、何钦铭老师的数据结构课程 清华大学——邓俊辉老师的数据结构课程 北京大学——数据结构基础课程 操作系统 哈工大——李治军老师的操作系统 清华大学——操作系统原理 南京大学——操作系统概述 计算…

机器学习知识经验分享之一:卷积神经网络介绍

文章目录前言一、卷积神经网络的构成1.卷积层2.池化层3.激活函数4.批量归一化5.损失函数二、卷积神经网络的特点总结前言 本系列文章将对机器学习知识进行分享总结。便于大家从理论层面了解人工智能基础原理,从而更好的运用算法发论文写作以及实际应用。关注即免费…

CNI设计解读

何为cni? kubernetes在设计网络方案的时候并没有设计统一的网络方案,只提供了统一的容器网络接口也就是所谓cni,这么做的目的就是为了遵循kubernets的核心理念OutOfTree,简单来讲就是专注于自身核心能力,将其他能力类…

使用albumentations对coco进行数据增强

数据增强的必要性 目前几乎所有描述最先进的图像识别模型的论文都使用了基本的增强技术 深度神经网络需要大量的训练数据来获得良好的结果,并防止过度拟合,然而要获得足够的训练样本往往非常困难,多种原因可能使得收集足够的数据非常困难&a…

【计算机毕业设计】27.仓库管理系统源码

一、系统截图(需要演示视频可以私聊) 摘 要 网络的广泛应用给生活带来了十分的便利。所以把仓库管理与现在网络相结合,利用JSP技术建设仓库管理系统,实现仓库管理系统的信息化。则对于进一步提高公司的发展,丰富仓库管…

户外运动耳机推荐、十大户外运动耳机品牌推荐排名清单

最近南方的天气有点秋高气爽,这样的天气要说最适合进行什么运动,那户外徒步肯定是最佳选择,在这样适宜的天气下去拥抱大自然,体验户外山野环境的美好绝对是个很棒的过程!但是一个人的长时间徒步多少还是会少了些味道&a…

408 | 大纲知识点考点冲刺 复习整理 ——【计网】第三章 数据链路层

自用冲刺笔记整理。 部分图片来自王道。 加油ヾ(◍∇◍)ノ゙ (一)数据链路层的功能 结点: 主机、 路由器。帧 : 链路层的协议数据单元, 封装网络层数据报。其主要作用是加强物理层传输原始比特流的功能,将物理层提供的可能出错的物理连接改造成为逻辑上无差错的数据链路,…

11.24Spring学习第四天

整合Mybatis(重点) 步骤 1.引入依赖 <!--引入相关依赖--><!-- spring jdbc --><dependency><groupId>org.springframework</groupId><artifactId>spring-jdbc</artifactId><version>${spring.version}</version></…

在字节跳动做了5年软件测试,12月无情被辞,想给划水的兄弟提个醒...

前言 先简单交代一下背景吧&#xff0c;某不知名 985 的本硕&#xff0c;17 年毕业加入字节&#xff0c;以“人员优化”的名义无情被裁员&#xff0c;之后跳槽到了有赞&#xff0c;一直从事软件测试的工作。之前没有实习经历&#xff0c;算是5年的工作经验吧。 这5年之间完成…

如何在数据库只保存oss上的文件名, 当查询数据时根据字段的文件名, 获取oss的公网访问地址,并对字段内容重写

如何在数据库只保存oss上的文件名, 当查询数据时根据字段的文件名, 获取oss的公网访问地址,并对字段内容重写. 有这样一个需求, 图片上传到oss 上, 返回文件名和公网访问地址, 但是要求数据库中只存储文件名称. 有两个目的: 数据库只存储文件名称, 方便后期oss 上数据迁移到其他…

面试官:在 Java 中 new 一个对象的流程是怎样的?彻底被问懵了。。

对象怎么创建&#xff0c;这个太熟悉了&#xff0c;new一下(其实还有很多途径&#xff0c;比如反射、反序列化、clone等&#xff0c;这里拿最简单的new来讲)&#xff1a; Dog dog new Dog();我们总是习惯于固定语句的执行&#xff0c;却对于背后的实现过程缺乏认知&#xff0…

[附源码]java毕业设计医院门诊信息管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

【多线程 (二)】线程安全问题、同步代码块、同步方法、Lock锁、死锁

文章目录线程安全问题前言2.1多线程模拟卖票出现的问题2.2卖票案例中出现的问题分析2.3同步代码块解决数据安全问题2.4同步方法解决数据安全问题2.5Lock锁2.6死锁总结线程安全问题 前言 之前我们讲了多线程的基础知识&#xff0c;但是在我们解决实际问题中会遇到一些错误&…

接口自动化测试实战之智能场景如何攻破

智能场景的意思就是怎么样才能让接口自动化智能化&#xff0c;让使用接口框架的人越来越没有要求&#xff0c;大街上随便拉一个人来&#xff0c;一分钟了解框架的使用&#xff0c;就能完美地去完成接口自动化测试。 1.找出公司要求我们测试的接口的共同点 假设有10个接口&…

【附源码】计算机毕业设计JAVA移动电商网站

【附源码】计算机毕业设计JAVA移动电商网站 目运行 环境项配置&#xff1a; Jdk1.8 Tomcat8.5 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; JAVA mybati…

(一)进程与线程

黑马程序员深入学习Java并发编程&#xff0c;JUC并发编程全套教程_哔哩哔哩_bilibili 一、进程与线程&#xff08;P5&#xff09; 1. 进程 &#xff08;1&#xff09;程序由指令和数据组成&#xff0c;但这些指令要运行&#xff0c;数据要读写&#xff0c;就必须将指令加载至…

查阅标准文档以及effective c++作者文笔 真正搞懂万能引用和引用折叠以及完美转发

在解释任何东西以前 我都必须要强调 我们为什么需要这个东西 如果一个东西我们都是不需要的 那么我们解释他干嘛? 假定你彻底了解了一个东西 但是你并不知道你为什么需要他 他能解决什么问题 那你仅仅就只是背了一段理论性的东西 对于你本人的成长毫无用处 这里我们一次性讲懂…