目标检测——X光安检数据集

news2025/1/22 9:11:54

1. OPIXray数据集(2020)

2. HIXray数据集(2021)

3. SIXray数据集(2019)

4. CLCXray数据集(2022)

5. PIDray数据集(2021)

6. GDXray数据集(2015)

7. 科大讯飞挑战赛数据集(2020)


1. OPIXray数据集(2020)

论文题目:Occluded Prohibited Items Detection: an X-ray Security Inspection Benchmark and De-occlusion Attention Module

论文链接:https://arxiv.org/pdf/2004.08656

Github链接:https://github.com/OPIXray-author/OPIXray

数据集介绍:在安全检查中,经常需要处理行李或手提箱中的物体,这些物体在X光图像中严重重叠,导致违禁品检测的性能不令人满意。在文献中,很少有研究和数据集触及这一重要主题。在本项工作中,我们贡献了首个针对安全检查的高质量目标检测数据集,称为遮挡违禁品X光(OPIXray)图像基准。OPIXray专注于广泛出现的违禁品“刀具”,由国际机场的专业检查员手动标注。测试集进一步被划分为三个遮挡级别,以更好地理解探测器的性能。此外,为了解决X光图像检测中的遮挡问题,我们提出了一种去遮挡注意力模块(De-occlusion Attention Module, DOAM),这是一个即插即用模块,可以轻松插入并提升大多数流行探测器的性能。尽管X光成像中存在严重的遮挡,物体的形状外观可以得到很好的保留,同时不同材质在视觉上呈现出不同的颜色和纹理。受这些观察结果的启发,我们的DOAM同时利用违禁品的不同外观信息来生成注意力图,这有助于为通用探测器细化特征图。我们在OPIXray数据集上全面评估了我们的模块,并证明了我们的模块可以一致地提高SSD、FCOS等最先进检测方法的性能,并显著优于几种广泛使用的注意力机制。特别是在遮挡程度更高的场景中,DOAM的优势更加显著,这表明它在现实世界检查中的潜在应用。该数据集于2020年提出,总共包含5个类别,共8885张图片,具体分布如下:

测试集分布如下:

实验结果:

创新点:该作者提出了一种去遮挡注意力模块(De-occlusion Attention Module, DOAM),通过两个子模块——边缘引导(Edge Guidance, EG)和材料意识(Material Awareness, MA)——同时重点强调被遮挡物体的边缘信息和材质信息。本模块进一步利用这两种信息生成一个注意力分布图,作为输入样本的高质量掩码,以产生高质量的特征图,为通用检测器提供可识别的特征信息。


2. HIXray数据集(2021)

论文题目:Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition Module For Prohibited Items Detection

论文链接:Towards Real-world X-ray Security Inspection: A High-Quality Benchmark And Lateral Inhibition Module For Prohibited Items Detection

Github链接 https:// github.com/HiXray-author/HiXray

数据集介绍:X光图像中的违禁品检测在保护公共安全方面经常扮演重要角色,通常处理的是色彩单调、光泽不足的物体,导致性能不佳。到目前为止,由于缺乏专门的高质量数据集,很少有研究触及这一主题。在这项工作中,我们首先提出了一个高质量的X光(HiXray)安全检查图像数据集,它包含了8个类别的102,928个常见违禁品。这是迄今为止违禁品检测领域最大的高质量数据集,收集自现实世界机场安全检查并由专业安全检查员标注。此外,为了准确检测违禁品,我们进一步提出了侧抑制模块(Lateral Inhibition Module, LIM),灵感来自于人类通过忽略无关信息并专注于可识别的特征来识别这些物品,特别是当物体相互重叠时。具体来说,LIM是一个精心设计的灵活附加模块,通过双向传播(Bidirectional Propagation, BP)模块最大限度地抑制嘈杂信息,并通过边界激活(Boundary Activation, BA)模块从四个方向激活最可识别的、具有特征的边界。我们在HiXray和OPIXray上广泛评估了我们的方法,结果表明它超越了最先进的检测方法。数据集分布如下:

创新点:LIM模块,在神经生物学中,侧抑制机制阻止了兴奋神经元的行动电位向同一层次中相邻神经元的侧向传播。我们通过设计一种双向传播架构来模仿这一机制,以适应性地过滤由违禁品邻近区域产生的噪声信息。此外,侧抑制在刺激中创造对比,从而允许增加感觉感知,因此我们通过从每层内部的四个方向加强边界信息并将其聚合成一个整体形状来激活边界信息。因此,受到同一层次中相邻神经元通过侧抑制使网络更有效的机制的启发,我们提出了侧抑制模块(Lateral Inhibition Module, LIM)

加入LIM的实验效果:

实验数据如下:


3. SIXray数据集(2019)

论文题目:SIXray: A Large-scale Security Inspection X-ray Benchmark for Prohibited Item Discovery in Overlapping Images

论文链接:https://arxiv.org/pdf/1901.00303

Github链接  https://github.com/MeioJane/SIXray

数据集介绍:在本文中,我们提出了一个大规模数据集,并为安全检查X光图像中的违禁品发现建立了一个基线。我们的数据集被命名为SIXray,包含1,059,231张X光图像,其中6个类别的8,929个违禁品已由人工进行标注。它提出了重叠图像数据的全新挑战,同时与现有数据集共享相同属性,包括复杂但无意义的上下文和类别不平衡。我们提出了一种名为类别平衡分层细化(Class-Balanced Hierarchical Refinement, CHR)的方法来应对这些困难。CHR假设每个输入图像都是从混合分布中采样得到的,并且深层网络需要一个迭代过程来准确推断图像内容。为了加速这一过程,我们在不同的网络主干之间插入了反向连接,传递高级视觉线索以协助中级特征。此外,设计了一个类别平衡损失函数,以最大限度地减轻由简单负样本引入的噪声。我们在SIXray上以不同的正/负样本比例评估了CHR。与基线相比,CHR在利用中级特征辨别对象方面具有更好的能力,这为使用弱监督方法进行准确对象定位提供了可能性。特别是在正训练样本较少的场景中,CHR的优势更加显著,这表明它在现实世界的安全检查中有潜在的应用。

Class-balanced Hierarchical Refinement (CHR)创新点结构图如下:

实验结果:

分类平均精度: 定位精度:


4. CLCXray数据集(2022)

论文题目:《Detecting Overlapped Objects in X-Ray Security Imagery by a Label-Aware Mechanism》

论文链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9722843

Github链接  https://github.com/GreysonPhoenix/CLCXray

数据集介绍:X光安全检查的一个关键挑战是在X光图像中检测背包或手提箱中重叠的物品。大多数现有方法通过增强底层视觉信息(如颜色和边缘)来提高模型对目标重叠问题的鲁棒性。然而,这一策略忽略了物体与背景具有相似视觉线索,以及物体相互重叠的情况。由于这两种情况很少出现在现有的数据集中,我们贡献了一个新的数据集——刀具和液体容器X光数据集(CLCXray),以完善相关研究。此外,我们提出了一种新颖的标签感知机制(Label-aware Mechanism, LA),以解决目标重叠问题。特别是,LA建立了特征通道与不同标签之间的关联,并根据分配的标签(或伪标签)调整特征,以帮助改善预测结果。广泛的实验表明,LA在检测重叠对象方面是准确和鲁棒的,并且还验证了LA对于任意最新技术(State-of-the-Art, SOTA)方法的有效性和良好的泛化能力。此外,实验结果表明,由LA构建的网络在OPIXray和CLCXray上优于SOTA模型,特别是在解决高度重叠对象子集的挑战方面。

数据集分布如下:

 论文的整体网络结构如下:

实验结果如下:

在CLCXray数据集上实验:

该作者还在OPIXray数据集上进行了实验,实验结果如下:


5. PIDray数据集(2021)

论文题目:Towards Real-World Prohibited Item Detection: A Large-Scale X-ray

Benchmark

论文链接:https://arxiv.org/abs/2108.07020

Github链接  https://github.com/bywang2018/security-dataset

数据集介绍:使用计算机视觉技术进行自动安全检查在现实世界场景中是一项具有挑战性的任务,由于各种因素,包括类内差异、类别不平衡和遮挡。大多数先前的方法很少解决违禁品故意隐藏在杂乱物体中的情况,这主要是因为缺乏大规模数据集,限制了它们在现实世界场景中的应用。为了实现现实世界中的违禁品检测,我们收集了一个大规模数据集,命名为PIDray,它涵盖了现实世界场景中违禁品检测的各种情况,特别是故意隐藏的物品。通过大量的努力,我们的数据集包含了47,677张X光图像中的12个类别的违禁品,具有高质量的标注分割掩模和边界框。据我们所知,这是迄今为止最大的违禁品检测数据集。同时,我们设计了选择性密集注意力网络(Selective Dense Attention Network, SDANet)来构建一个强大的基线,它由密集注意力模块和依赖细化模块组成。由空间和通道密集注意力构成的密集注意力模块被设计为学习区分性特征以提升性能。依赖细化模块用于利用多尺度特征的依赖性。在收集的PIDray数据集上进行的广泛实验表明,所提出的方法在性能上与最先进的方法相媲美,特别是在检测故意隐藏的物品方面。 

数据集分布:

论文提出的SDANet网络结构如下:

 实验结果如下:

6. GDXray数据集(2015)

论文题目:《GDXray: The Database of X-ray Images for Nondestructive Testing》

论文链接:https://link.springer.com/article/10.1007/s10921-015-0315-7

Github链接  https://github.com/computervision-xray-testing/GDXray/blob/main/README.md

数据集介绍:在本文中,我们介绍了一个新的数据集,包含19,407张X光图像。这些图像被组织在一个名为GDXray的公共数据库中,该数据库可以免费使用,但仅限于研究和教育目的。数据库包括五组X光图像:铸件、焊接、行李、自然物体和设置。每组包含多个系列,每个系列包含多张X光图像。大多数系列都进行了注释或标记。在这些情况下,感兴趣对象的边界框坐标或图像的标签可在标准文本文件中获得。GDXray的大小为3.5 GB,可以从我们的网站下载。我们相信GDXray对X光检测社区是一个重要的贡献。一方面,学生、研究人员和工程师可以使用这些X光图像来开发、测试和评估图像分析和计算机视觉算法,而无需购买昂贵的X光设备。另一方面,这些图像可以用作基准,以便在相同数据上测试和比较不同方法的性能。此外,该数据库可以用于人类检查员的培训项目中。该数据集包含5组图片,分别为:

  • Castings (314 MB)
  • Welds (209 MB)
  • Baggage (3.048 GB)
  • Nature (192 MB)
  • Settings (73 MB)

 Castings数据集:

 

 Welds数据集:

 

 Baggage数据集:

 

 

 

 Nature数据集:

 Settings数据集:

7. 科大讯飞挑战赛数据集(2020)

数据集下载链接:https://aistudio.baidu.com/datasetdetail/151995

官方比赛链接:https://challenge.xfyun.cn/topic/info?type=Xray

数据说明:

此次比赛分为初赛和复赛两个阶段,

  • 初赛提供
  1. 带标注的训练数据,即待识别物品在包裹中的X光图像及其标注文件;

  2. 不带标注的测试数据。

  • 复赛在初赛的基础上再提供
  1. 无标注训练数据即包裹X光图像(其中有的包裹包含待识别物品);

  2. 部分待识别物品X光图像(无背景)。

本次比赛标注文件中的类别为10类,包括刀具、剪刀、打火机、打火机油、压力容器罐、弹弓、手铐、指甲油、充电宝、烟花爆竹。对应的label名称为knife、scissors、lighter、zippooil、pressure、slingshot、handcuffs、nailpolish、powerbank、firecrackers。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978382.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++-引用,inline,nullptr

一,引用 1.1引用的概念与定义 引用不是新定义⼀个变量,而是给已存在变量取了⼀个别名,编译器不会为引用变量开辟内存空间,它和它引用的变量共用同⼀块内存空间。 引用的使用方式如下: 类型& 引用别名 引用对象…

【带你入门生信】什么是生物信息学

生物信息学 生物信息学:利用应用数学、信息学、统计学和计算机科学,对生物学数据进行搜索(收集和筛选)、处理(编辑、整理、管理和显示)及分析(计算和模拟),提取生物信息…

一键生成原创文案,轻松成为文案高手的方法

当下时代,文案写作对于各个企业推广产品和服务显得隔外重要。优秀的文案能够吸引用户的注意力,激发购买欲望,从而为企业带来更多的销售机会。然而,对于许多人来说,撰写出一篇吸引人的原创文案可能并不容易。但是&#…

【C++】C++11之新的类功能与可变参数模板

目录 一、新的默认成员函数 二、新的关键字 2.1 default 2.2 detele 2.3 final和override 三、可变参数模板 3.1 定义 3.2 递归展开参数包 3.3 逗号表达式展开参数包 3.4 emplace_back 一、新的默认成员函数 在C11之前,默认成员函数只有六个,…

2024华数杯选题建议-建模思路-代码论文助攻

你是否在寻找数学建模比赛的突破点?数学建模进阶思路! 作为经验丰富的数学建模团队,我们将为你带来2024 华数杯的全面解析。这个解决方案包不仅包括完整的代码实现,还有详尽的建模过程和解析,帮助你全面理解并掌握如何…

C:关于static 和 extern 关键字的介绍-学习笔记

目录 1、作用域与生命周期 1.1 作用域 1.2 生命周期 1.3 变量的作用域和生命周期之间的关系 2、static 和 extern 2.1 static 修饰局部变量: 2.2 static 修饰全局变量(包含extern的作用): 2.3 static修饰函数&#xff1a…

海思RTSP推流第二篇——海思平台和H264编码Demo

前言: 记得行内一个老师说过,基础不牢,地动山摇,对于海思的编码过程还是不是很熟悉所以回头把这个分析一遍。 海思平台: 官方手册:HiMPP IPC V2.0 媒体处理软件开发参考,里面有介绍海思IPC平台的…

polyfit曲线拟合

一、简介 polyfit函数是matlab中用于进行曲线拟合的一个函数。其数学基础是最小二乘法曲线拟合原理。曲线拟合:已知离散点上的数据集,即已知在点集上的函数值,构造一个解析函数(其图形为一曲线)使在原离散点上尽可能接…

深度学习 —— 个人学习笔记10(池化层、LeNet)

声明 本文章为个人学习使用,版面观感若有不适请谅解,文中知识仅代表个人观点,若出现错误,欢迎各位批评指正。 二十一、池化层 1、 最大池化层和平均池化层 与互相关运算符一样,汇聚窗口从输入张量的左上角开始&#…

打靶记录6——靶机EvilBox---One

靶机下载地址 https://www.vulnhub.com/entry/evilbox-one,736/学习记录 在进行目录爆破和文件爆破的过程当中,如果有发现新的路径,一定要对新的路径再次进行更深层次的爆破虚拟机出现问题就删除掉,重新导入虚拟机 目标: 获取两个flag&am…

如何准备专利申请书的摘要部分?

如何准备专利申请书的摘要部分?

基于概率神经网络的异方差不确定性估计

目录 摘要1 介绍2 预热3 分析3.1对称性和特征非线性3.2逆方差加权有效欠样本 4 方法5 实验5.1合成数据集5.2真实数据集6 结论 摘要 捕获任意不确定性是许多机器学习系统的关键部分。在深度学习中,达到这一目的的一种常用方法是训练神经网络,通过最大化观…

力扣SQL50 组合两个表 入门基础连表查询

Problem: 175. 组合两个表 select FirstName, LastName, City, State from Person left join Address on Person.PersonId Address.PersonId ;

AI说 | 如何入门AI行业,成为人工智能产品经理?(上)

这周在上海出差,划个水,发一篇之前写的文章,谈谈如何入门AI行业 另外,有朋友说我的文章读起来很累,自我反思,确实写的太长,后面我会在保证有趣或有干货的情况下,将文章内容尽量减短…

《深入浅出WPF》学习笔记四.提高效率,code snippets的使用

《深入浅出WPF》学习笔记四.提高效率,code snippets的使用 背景 再跟着视频教程学习Wpf的过程中,发现这个小技巧。很惭愧好几年开发经验,没用过这个东西。 这个信息差还是很让人头疼的,特别在此分享。 code snippets是什么 Code Snippets是插入代码…

Elasticsearch 未授权访问漏洞

Elasticsearch 未授权访问漏洞 ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索…

zabbix监控中文乱码解决方案

zabbix切换中文后,会出现乱码情况,如下图: 解决方案如下: 1、找到字体 WinR打开运行,输入fonts,回车进入Windows字体目录,找到微软雅黑-常规字体,复制出来将文件名修改为msyh.ttf…

Substance Painter工具栏及快捷键

3 菜单栏_哔哩哔哩_bilibili ctrl右键左右滑动调整笔刷大小/左键流量 上下滑动有其他作用 线框显示工具 制作随机效果 Fill要配合遮罩使用 白色遮罩显示底色,黑色遮罩不显示底色 核心工具 图层关系 必须添加在蒙版的效果下 选择中蒙版 滤镜仅能添加在图层下 id图…

k8s中yaml文件的编写

目录 1.编写pod.yaml 2.编写deploment.yaml 3.编写service.yaml关联创建的pod 4.总结获取K8S资源配置清单文件模板方法 方法1:根据现有资源导出yaml文件修改配置,重新创建 方法2:根据现有资源,进入其配置中,复制…

Go语言实现多协程文件下载器

文章目录 前言流程图主函数下载文件初始化分片下载worker分发下载任务获取下载文件的大小下载文件分片错误重试项目演示最后 前言 你好,我是醉墨居士,最近在开发文件传输相关的项目,然后顺手写了一个多协程文件下载器,代码非常精…