【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(7 月 13 日论文合集)

news2024/11/23 15:16:14

文章目录

  • 一、检测相关(8篇)
    • 1.1 Exposing the Fake: Effective Diffusion-Generated Images Detection
    • 1.2 Large Class Separation is not what you need for Relational Reasoning-based OOD Detection
    • 1.3 Visualization for Multivariate Gaussian Anomaly Detection in Images
    • 1.4 YOGA: Deep Object Detection in the Wild with Lightweight Feature Learning and Multiscale Attention
    • 1.5 A New Dataset and Comparative Study for Aphid Cluster Detection
    • 1.6 Rethinking Mitosis Detection: Towards Diverse Data and Feature Representation
    • 1.7 Automated Artifact Detection in Ultra-widefield Fundus Photography of Patients with Sickle Cell Disease
    • 1.8 Improving Segmentation and Detection of Lesions in CT Scans Using Intensity Distribution Supervision

一、检测相关(8篇)

1.1 Exposing the Fake: Effective Diffusion-Generated Images Detection

揭露伪装:有效的扩散生成图像检测

https://arxiv.org/abs/2307.06272

在这里插入图片描述
图像合成已经看到了显着的进步,基于扩散的生成模型,如去噪扩散概率模型(DDPM)和文本到图像扩散模型的出现。尽管它们的有效性,但致力于检测扩散生成的图像的研究缺乏,这可能会带来潜在的安全和隐私风险。本文通过提出一种新的检测方法,称为扩散生成图像检测(SeDID)的逐步误差,解决了这一差距。由基于统计的 SeDID Stat \text{SeDID}_{\text{Stat}} SeDIDStat和基于神经网络的 SeDID NNs \text{SeDID}_{\text{NNs}} SeDIDNNs组成,SeDID利用了扩散模型的独特属性,即确定性反向和确定性去噪计算误差。我们的评估表明,SeDID的优越性能优于现有的方法时,应用于扩散模型。因此,我们的工作作出了关键的贡献,区分扩散模型生成的图像,标志着在人工智能安全领域的重要一步。

1.2 Large Class Separation is not what you need for Relational Reasoning-based OOD Detection

大型类分离不是基于关系推理的OOD检测所需要的

https://arxiv.org/abs/2307.06179

在这里插入图片描述
标准的识别方法在测试时无法处理新的类别。他们对已知类别的过度自信使得预测对于医疗保健或自动驾驶等安全关键应用来说不可靠。分布外(OOD)检测方法通过识别语义新颖性提供了一种解决方案。这些方法中的大多数都利用了已知数据的学习阶段,这意味着训练(或微调)模型以捕获正态性的概念。该过程显然对可用样本的量敏感,并且对于机载系统来说可能在计算上是昂贵的。一个可行的替代方案是评估由大型预训练模型产生的嵌入空间中的相似性,而无需任何进一步的学习努力。我们专注于这样一个无微调的OOD检测设置。这项工作提出了一个深入的分析最近引入的关系推理预训练和调查的学习嵌入的属性,突出的类间特征距离和OOD检测精度之间的相关性的存在。由于类分离取决于所选择的预训练目标,我们提出了一种替代的损失函数来控制类间的利润,我们通过彻底的实验显示其优势。

1.3 Visualization for Multivariate Gaussian Anomaly Detection in Images

图像中多变量高斯异常检测的可视化方法

https://arxiv.org/abs/2307.06052

在这里插入图片描述

本文介绍了一种简化的PaDiM(像素化异常检测通过实例建模)方法的异常检测在图像中,拟合一个单一的多元高斯(MVG)分布的特征向量提取的骨干卷积神经网络(CNN)和使用他们的马氏距离作为异常得分。我们在这个框架中引入了一个中间步骤,通过应用白化变换的特征向量,这使得能够在视觉上解释由MVG学习的特征的热图的生成。所提出的技术进行评估的MVTec-AD数据集,结果显示了可视化模型验证的重要性,提供了在这个框架中的问题,否则不可见的见解。本文生成的可视化结果可在www.example.com上公开获得https://doi.org/10.5281/zenodo.7937978。

1.4 YOGA: Deep Object Detection in the Wild with Lightweight Feature Learning and Multiscale Attention

瑜伽:基于轻量级特征学习和多尺度注意力的野外深层目标检测

https://arxiv.org/abs/2307.05945

在这里插入图片描述

我们介绍了YOGA,这是一种基于深度学习的轻量级对象检测模型,可以在低端边缘设备上运行,同时仍能实现有竞争力的准确性。YOGA架构由一个两阶段特征学习管道和一个廉价的线性变换组成,它只使用传统卷积神经网络所需的卷积滤波器的一半来学习特征图。此外,它执行多尺度特征融合在其颈部使用的注意机制,而不是传统的检测器使用的朴素级联。YOGA是一个灵活的模型,可以很容易地放大或缩小几个数量级,以适应广泛的硬件限制。我们在COCO-val和COCO-testdev数据集上评估YOGA与其他超过10个国家的最先进的对象检测器。结果表明,YOGA在模型大小和准确性之间取得了最佳平衡(AP增加高达22%,参数和FLOPs减少23-34%),使其成为低端边缘设备上野外部署的理想选择。我们在NVIDIA Jetson Nano上的硬件实施和评估进一步证实了这一点。

1.5 A New Dataset and Comparative Study for Aphid Cluster Detection

一种新的麦长管蚜种群检测数据集及其比较研究

https://arxiv.org/abs/2307.05929

在这里插入图片描述

蚜虫是农作物、农村家庭和全球粮食安全的主要威胁之一。化学害虫防治是作物生产的必要组成部分,以使产量最大化,然而,考虑到环境污染和成本,没有必要将化学方法应用于整个田地。因此,准确定位蚜虫和估计侵染程度是准确地局部施用农药的关键。蚜虫检测是非常具有挑战性的,因为每一个蚜虫都非常小,并且所有的蚜虫都聚集在一起作为集群。在本文中,我们建议通过检测蚜虫集群来估计感染水平。我们在高粱地里拍摄了数百万张图片,手动选择了5,447张含有蚜虫的图片,并对图片中的每个蚜虫集群进行了注释。为了将这些图像用于机器学习模型,我们将图像裁剪成补丁,并创建了一个包含超过151,000个图像补丁的标记数据集。然后,我们实现和比较四个国家的最先进的目标检测模型的性能。

1.6 Rethinking Mitosis Detection: Towards Diverse Data and Feature Representation

对有丝分裂检测的再思考:走向多样化的数据和特征表征

https://arxiv.org/abs/2307.05889

在这里插入图片描述
有丝分裂检测是计算病理学的基本任务之一,由于有丝分裂细胞的异质性,这是极具挑战性的。目前的研究大多是通过增加模型的复杂性来解决技术方面的异质性。然而,由于缺乏对生物学知识的考虑和复杂的模型设计可能会导致过拟合问题,同时限制了检测模型的泛化能力。在本文中,我们系统地研究了形态外观在不同的有丝分裂阶段,以及模糊的非有丝分裂细胞,并确定平衡的数据和功能的多样性,可以实现更好的概括性。基于这一观察结果,我们提出了一种新的可推广的框架(MitDet)有丝分裂检测。多样性指导样本平衡(DGSB)考虑了数据的多样性。利用类间和类内特征多样性保持模块(InCDP)来保持特征多样性。引入染色增强(SE)模块以同时增强数据和特征的域相关多样性。大量的实验表明,我们提出的模型优于所有的SOTA方法在几个流行的有丝分裂检测数据集在内部和外部测试集使用最小的注释工作与点注释。全面的消融研究也证明了重新思考数据和特征多样性平衡的有效性。通过对实验结果的定性和定量分析,我们相信我们提出的模型不仅可以达到SOTA的性能,而且可以从新的角度启发未来的研究。源代码位于https://github.com/Onehour0108/MitDet。

1.7 Automated Artifact Detection in Ultra-widefield Fundus Photography of Patients with Sickle Cell Disease

镰状细胞病患者超宽带眼底照相中伪影的自动检测

https://arxiv.org/abs/2307.05780

在这里插入图片描述
重要性:超宽视野眼底摄影(UWF-FP)已显示出用于镰状细胞视网膜病变筛查的实用性;然而,图像伪影可能降低图像质量和分级能力。目的:建立一种UWF-FP伪影自动分类算法。设计:基于神经网络的自动伪影检测算法被设计用于识别患者UWF-FP横截面中常见的UWF-FP伪影。在图像的子集上训练预训练的ResNet-50神经网络,并且在保持测试集上量化分类准确度、灵敏度和特异性。背景:本研究基于三级保健医院的患者。参加者:从镰状细胞病(SCD)患者获得了243个UWF-FP,并进行了以下类别的伪影标记:存在睫毛、下眼睑阻塞、上眼睑阻塞、图像太暗、暗伪影和图像未居中。结果:总体而言,每个类别的准确度为睫毛存在83.7%,下眼睑阻塞83.7%,上眼睑阻塞98.0%,图像过暗77.6%,暗伪影93.9%,图像未居中91.8%。结论和相关性:该自动算法显示出识别SCD患者中Optos UWF-FP子集上常见成像伪影的前景。正在进行进一步改进,其目标是通过向摄影师提供关于存在的伪影类型和图像重新采集的需要的实时反馈来提高镰状细胞视网膜病变(SCR)中远程视网膜筛查的效率。该算法还可能具有潜在的未来应用性,通过提高UWF-FP图像采集的质量和效率。

1.8 Improving Segmentation and Detection of Lesions in CT Scans Using Intensity Distribution Supervision

利用强度分布监督改进CT扫描中的病变分割和检测

https://arxiv.org/abs/2307.05804

在这里插入图片描述
我们提出了一种方法,将CT扫描的目标病变的强度信息,在训练分割和检测网络。我们首先建立一个基于强度的病变概率(ILP)的功能,从强度直方图的目标病变。它用于基于其强度计算每个体素的病变概率。最后,每个输入CT扫描的计算的ILP图被提供作为用于网络训练的附加监督,其目的是在没有附加标记成本的情况下就强度值而言通知网络关于可能的病变位置。该方法被应用于改善三种不同的病变类型,即小肠类癌肿瘤,肾脏肿瘤,肺结节的分割。所提出的方法的检测任务的有效性进行了研究。我们观察到在分割小肠类癌肿瘤、肾肿瘤和肺结节中,就每个病例的Dice评分而言,分别改善了41.3% -> 47.8%、74.2% -> 76.0%和26.4% -> 32.7%。就平均精度而言,在检测肾肿瘤方面实现了64.6% -> 75.5%的改进。ILP图的不同用途的结果和不同数量的训练数据的效果也被提出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/749693.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

unity计时,1秒执行一次

1.核心代码示例 2.代码 using System.Collections; using System.Collections.Generic; using UnityEngine;public class AddRandomChilden : MonoBehaviour {// Debug.Log("开始进入update");float i 0;// Start is called before the first frame updatevoid Sta…

【智慧交通项目实战】 《 OCR车牌检测与识别》(五):模型部署与优化

👨‍💻作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。✨公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等&#xf…

用python合并execl做统计分析

背景: 我们有项目问题记录的表格,每一个项目都会反馈来一个execl表格,表格的格式都是统一的,我需要定期把这些项目上反馈来的表格进行统计,但是表格非常多,我要每个都统计出来在来相加,这样操作…

Mysql 数据库开发及企业级应用

文章目录 1、Mysql 数据库开发及企业级应用1.1、为什么要使用数据库1.1.1、数据库概念(Database)1.1.2、为什么需要数据库 1.2、程序员为什么要学习数据库1.3、数据库的选择1.3.1、主流数据库简介1.3.2、使用 MySQL 的优势1.3.3、版本选择 1.4、Windows …

C语言,通过多文件编辑定义字符指针,指向堆区空间,计算字符串长度

通过多文件编辑,定义字符指针,分别指向堆区空间,计算字符串长度 要求: 1、定义函数实现堆区空间申请 2、在主函数中实现输入字符串 3、定义函数实现字符串长度 函数原型:size_t my_strlen(const char *s) 4、定义函数释…

vue 下拉框显示从后端请求的数据

下拉框<!-- 给产品添加推广人员弹出框 --><el-dialog :title"titlePerson" :visible.sync"openAddPerson" width"1000px" append-to-body><el-select v-model"this.bindingProductPerson.recommendId" filterable plac…

分层解耦-IOCDI-IOC详解

目录 Bean的声明 注意 声明bean的时候&#xff0c;可以通过value属性指定bean的名字&#xff0c;如果没有指定&#xff0c;默认为类名首字母小写 使用以上四个注解都可以声明bean&#xff0c;但在SpringBoot集成Web开发中&#xff0c;声明控制器bean只能使用Controller或者R…

springboot时间管理系统

通过前面的功能分析可以将时间管理系统的功能分为管理员&#xff0c;用户两个部门&#xff0c;系统的主要功能包括首页&#xff0c;个人中心&#xff0c;系统公告管理&#xff0c;用户管理&#xff0c;时间分类管理&#xff0c;事件数据管理&#xff0c;目标数据管理&#xff0…

MySQL数据库第七课————数据的增删改查----------简单操作

作者前言 欢迎小可爱们前来借鉴我的gtiee秦老大大 (qin-laoda) - Gitee.com —————————————————————————————— 目录 SQL增删改查 新增数据 删除数据 修改&#xff08;更新&#xff09;数据 查询数据 条件 ————————————————…

java ajax

1.ajax定义:异步刷新技术 2.ajax语法 3.ajax实战 在不需要点击刷新按钮时达到局部刷新显示&#xff0c;如下图所示 步骤一&#xff1a;创建工程/包/js 步骤二&#xff1a;数据库/表创建 步骤三&#xff1a;实体类 步骤四&#xff1a;UserDao package cn.kgc.dao;import cn…

linux_driver_day10

作业1 题目&#xff1a; 使用驱动代码实现如下要求 应用程序通过阻塞的io模型来读取number变量的值 number是内核驱动中的一个变量 number的值随着按键按下而改变&#xff08;按键中断&#xff09; 例如 numbero 按下按键 number1&#xff0c;再次按下按键 number0 在按下按…

pdf文件怎么删除密码?4个方法实用简单!

PDF文件作为一种常见的电子文档格式&#xff0c;广泛应用于各行各业。有时候&#xff0c;我们可能会遇到需要删除PDF文件密码的情况&#xff0c;无论是因为忘记密码、接收到加密的文件或是需要与他人共享文件等。为了帮助你轻松解决这一问题&#xff0c;本文将介绍四种简单实用…

【GitHub】腾讯这一款设计神器,开源了!PAG 动效组件

作为一个资深的互联网用户&#xff0c;我们经常会在各种产品上看到十分酷炫的动画效果。比如&#xff0c;短视频中有趣的虚拟场景、直播间粉丝打榜的 “火箭”、“轮船” 等等。 如今&#xff0c;优质的动效不仅可以使用户更容易地理解产品功能和操作方式&#xff0c;减少用户…

简单分享怎么做卖货小程序

微信卖货小程序是一种基于微信平台开发的小程序应用&#xff0c;它可以帮助用户在小程序中完成商品展示、下单购买、在线支付等操作。下面我们来介绍微信卖货小程序的好处和优点。 一、便捷快速 微信卖货小程序可以直接在微信App中使用&#xff0c;无需下载和安装&#xff0c;…

docker-compose安装gitlab

docker安装gitlab 1、创建docker-compose.yml文件 version: 3 services:gitlab:image: twang2218/gitlab-ce-zh:11.1.4restart: unless-stoppedhostname: gitlab.example.comenvironment:TZ: Asia/ShanghaiGITLAB_OMNIBUS_CONFIG: |external_url http://gitlab.example.comgi…

基于STM32LVGL8.2保姆级教程①软件资料准备

下载LVGL源码 LVGL资料包下载点击直达 点击master -》选择8.2分支,也就是倒数第二个 准备开发环境 这个软件玩STM32的有好吧 准备代码模板 需要准备一份能够成功点亮屏幕的keil工程 既然是保姆级教程 So我免费分享出来 私信或评论区获取 此屏幕驱动 就是图片里面的那块屏幕 具…

【安装】windows环境下的 JDK官网下载 安装配置 环境变量

目录 官网下载JDK8windows安装JDKJava环境配置JDK、JRE、JVMJava环境配置1.JAVA_HOME2.PATH3.CLASSPATH 测试环境变量运行命令行cmd查看jdk是否安装 官网下载JDK8 Oracle 甲骨文中国 | 云应用和云平台 选择产品/Java 下载JDK8 点击下载Java 选择Java archive 选择x64位安装包 …

读笛卡尔《方法论》有感

1.新书到手 今天又到手一本新书《谈谈方法》&#xff08;又称《方法论》&#xff09;&#xff0c;此书的作者是笛卡尔&#xff0c;本书介绍了笛卡尔是如何运用自己的理性在各门学科里寻求真理的方法。 勒内笛卡尔&#xff08;1596年3月31日-1650年2月11日&#xff09;&#xf…

MySQL每日一练:单表查询、连接查询

目录 1、创建两张表 student表&#xff1a; score表 &#xff1a; 2.为student表和score表增加记录 student表&#xff1a; score表&#xff1a; 3、按条件查找 1、创建两张表 student表&#xff1a; CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY…

dubbo核心知识

1、简介 Apache Dubbo (incubating) |ˈdʌbəʊ|是一款高性能、轻量级的开源Java RPC框架&#xff0c;它提供了三大核心能力&#xff1a;面向接口的远程方法调用&#xff0c;智能容错和负载均衡&#xff0c;以及服务自动注册和发现。 官网&#xff1a;http://dubbo.apache.or…