【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(5月24日论文合集)

news2024/11/23 18:35:41

文章目录

  • 一、检测相关(7篇)
    • 1.1 Learning Remote Sensing Object Detection with Single Point Supervision
    • 1.2 Online Open-set Semi-supervised Object Detection via Semi-supervised Outlier Filtering
    • 1.3 Generalizable Synthetic Image Detection via Language-guided Contrastive Learning
    • 1.4 A New Comprehensive Benchmark for Semi-supervised Video Anomaly Detection and Anticipation
    • 1.5 ColMix -- A Simple Data Augmentation Framework to Improve Object Detector Performance and Robustness in Aerial Images
    • 1.6 Detection of healthy and diseased crops in drone captured images using Deep Learning
    • 1.7 nnDetection for Intracranial Aneurysms Detection and Localization

一、检测相关(7篇)

1.1 Learning Remote Sensing Object Detection with Single Point Supervision

学习单点监控的遥感目标检测

论文地址:

https://arxiv.org/pdf/2305.14141.pdf

在这里插入图片描述

点级监督目标检测(PSOD)由于其相对于基于边界框的监督目标检测更低的标注成本而引起了广泛关注。然而,在遥感(RS)图像领域中,复杂场景、密集和动态尺度的目标阻碍了PSOD方法的发展。本文首次尝试实现基于单点监督的RS目标检测,并提出了一个专门针对RS图像的PSOD框架。具体而言,我们设计了一个点标签升级器(PLUG),从单点标签生成伪边界框标签,然后使用伪边界框来监督现有检测器的优化。此外,为了应对RS图像中密集目标的挑战,我们提出了一种稀疏特征引导的语义预测模块,可以通过充分利用稀疏目标的信息线索生成高质量的语义地图。在DOTA数据集上进行的大量消融研究验证了我们方法的有效性。与最先进的基于图像级和点级监督检测方法相比,我们的方法在性能上取得了显著改进,并缩小了PSOD与基于边界框的监督目标检测之间的性能差距。

1.2 Online Open-set Semi-supervised Object Detection via Semi-supervised Outlier Filtering

基于半监督孤立点滤波的在线开集半监督目标检测

论文地址:

https://arxiv.org/abs/2305.13802

1.3 Generalizable Synthetic Image Detection via Language-guided Contrastive Learning

基于语言制导对比学习的泛化合成图像检测

论文地址:

https://arxiv.org/pdf/2305.13800.pdf

在这里插入图片描述
AI生成图像的高度逼真可以归因于合成模型的快速发展,包括生成对抗网络(GAN)和扩散模型(DM)。然而,合成图像的恶意使用,如传播虚假新闻或创建虚假个人资料,引发了人们对图像真实性的重大关切。尽管已经开发了许多用于检测合成图像的取证算法,但它们的性能,特别是泛化能力,仍远远不足以应对日益增多的合成模型。

在这项工作中,我们提出了一种简单而非常有效的合成图像检测方法,通过语言引导对比学习和对检测问题的新形式化。我们首先使用精心设计的文本标签增强训练图像,使我们能够使用联合图像-文本对比学习进行取证特征提取。

此外,我们将合成图像检测形式化为一个识别问题,这与传统的基于分类的方法截然不同。

实验证明,我们提出的基于语言引导的合成检测(LASTED)模型在面对未见过的图像生成模型时具有更好的泛化能力,并以超过最先进竞争对手22.66%的准确率和15.24%的AUC表现出有希望的性能。代码可在https://github.com/HighwayWu/LASTED上获得。

1.4 A New Comprehensive Benchmark for Semi-supervised Video Anomaly Detection and Anticipation

一种新的半监督视频异常检测与预测综合基准

论文地址:

https://arxiv.org/pdf/2305.13611.pdf

在这里插入图片描述
半监督视频异常检测(VAD)是智能监控系统中的关键任务。然而,VAD中一种重要类型的异常,即场景相关异常,尚未引起研究人员的关注。此外,目前没有研究探讨异常预测,这是一项更重要的任务,用于防止异常事件的发生。为此,我们提出了一个新的综合数据集,NWPU Campus,包含43个场景,28个类别的异常事件和16小时的视频。目前,它是具有最多场景和异常类别、最长持续时间并考虑了场景相关异常的最大规模的半监督VAD数据集。同时,它也是第一个用于视频异常预测的数据集。我们进一步提出了一种新颖的模型,能够同时检测和预测异常事件。与近年来的7种优秀VAD算法相比,我们的方法在处理场景相关异常检测和异常预测方面表现出色,在上海科技大学、香港中文大学Avenue、印度理工学院Bombay走廊以及新提出的NWPU Campus数据集上均取得了最先进的性能。我们的数据集和代码可在https://campusvad.github.io上获得。

1.5 ColMix – A Simple Data Augmentation Framework to Improve Object Detector Performance and Robustness in Aerial Images

ColMix–一种改进航空影像目标探测器性能和稳健性的简单数据增强框架

论文地址:

https://arxiv.org/pdf/2305.13509.pdf

在这里插入图片描述
在过去的十年中,基于卷积神经网络(CNN)和基于Transformer的目标检测器在各种数据集上取得了高性能。尽管大多数检测文献是在MS COCO等数据集上开发这种能力,但这些检测器仍然在遥感应用中表现出有效性。然而,该领域面临一些挑战,如标注对象数量较少和目标密度较低,这些因素阻碍了整体性能的提升。在这项工作中,我们提出了一种新颖的增强方法,称为拼贴剪贴,用于增加目标密度,无需分割掩码,从而提高检测器的性能。我们证明了拼贴剪贴在精确度和召回率方面优于相关方法(如马赛克增强),并且可以更好地控制目标密度。然而,我们发现拼贴剪贴对于某些超出分布范围的变化(如图像破坏)是脆弱的。为了解决这个问题,我们提出了两种将拼贴剪贴与PixMix增强方法结合的简单方法,并将我们的组合技术称为ColMix。通过广泛的实验证明,采用ColMix可以得到在航空影像数据集上性能优越且对各种图像破坏具有鲁棒性的检测器。

1.6 Detection of healthy and diseased crops in drone captured images using Deep Learning

基于深度学习的无人机捕获图像中健康和病态作物的检测

https://arxiv.org/pdf/2305.13490.pdf

在这里插入图片描述
植物健康和食品安全是密不可分的。人们都担心绿色植物的状态。植物疾病通过干扰植物的正常状态来破坏或改变其重要活动。所提出的方法有助于检测植物疾病。从互联网上收集的数据库经过适当的分离,并对各种植物物种进行识别,以获取一个包含众多植物疾病的测试数据库,用于分析项目的正确性和置信水平。然后,使用训练数据,我们将训练分类器,并以最高可能的准确性进行预测。我们采用卷积神经网络(CNN),它由多个层组成,用于预测。在涉及作物疾病分类和检测的问题中,CNN的性能优于其他技术。它们能够在恶劣的成像条件下处理复杂的挑战。正在利用原型无人机模型对大面积农田进行实时监测,附加了高分辨率摄像头,用于记录植物的照片,这将作为输入用于确定植物的健康状况。

1.7 nnDetection for Intracranial Aneurysms Detection and Localization

神经网络检测用于颅内动脉瘤的检测和定位

https://arxiv.org/ftp/arxiv/papers/2305/2305.13398.pdf

在这里插入图片描述
颅内动脉瘤是一种常见且危及生命的疾病,约影响到普通人口的3.2%。因此,对这些动脉瘤的检测在其管理中起着关键作用。病变检测涉及医学图像中异常的同时定位和分类。在这项特定研究中,我们采用了nnDetection框架,这是一个专门设计用于3D医学目标检测的自配置框架,用于有效地检测和定位动脉瘤的3D坐标。为了捕捉和提取与动脉瘤相关的多样化特征,我们使用了两种模态:TOF-MRA和结构性MRI,这两种模态均来自ADAM数据集。通过使用自由响应接收者操作特性进行评估,我们评估了我们提出的深度学习模型的性能。该模型的权重和TOF-MRA边界框的3D预测可在https://github.com/orouskhani/AneurysmDetection上公开获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/567143.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录训练营Day51| 309.最佳买卖股票时机含冷冻期 714.买卖股票的最佳时机含手续费 总结

目录 目录 学习目标 学习内容 309.最佳买卖股票时机含冷冻期 714.买卖股票的最佳时机含手续费 学习目标 309.最佳买卖股票时机含冷冻期 714.买卖股票的最佳时机含手续费 总结 学习内容 309.最佳买卖股票时机含冷冻期 309. 最佳买卖股票时机含冷冻期 - 力扣&#xff0…

大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑

夕小瑶科技说 原创 作者 | 小戏、Python 大模型在其巨大体量背后蕴藏着一个直观的问题:“大模型应该怎么更新?” 在大模型极其巨大的计算开销下,大模型知识的更新并不是一件简单的“学习任务”,理想情况下,随着世界…

网络协议 — IPSec 安全隧道协议族

目录 文章目录 目录IPSec 安全隧道协议族封装协议Authentication HeaderEncapsulating Security Payload 封装模式传输模式隧道模式 安全偶联协商Security AssociationInternet Key ExchangeIKE 的交换过程 IPSec Virtual Private NetworkIPSec NAT-TTransport 模式Tunnel 模式…

mjpg-streamer框架分析

mjpg-streamer框架分析 文章目录 mjpg-streamer框架分析框架maininput_initinput_runoutput_init 框架 main 这个函数是一个C程序的主函数,接受命令行参数并执行相应的操作。下面是这个函数的要点: 定义了一些变量,包括输入插件数组input、输…

知识点滴 - dBm和mW的转换

分贝毫瓦dBm,decibel-milliwatts,全写为“decibel relative to one milliwatt”,为一个指代功率的绝对值,而不同于dB只是一个相对值。 dBm或dBmW(分贝-毫瓦)用于表示功率的水平或级别,以分贝&am…

Android | 关于 OOM 的那些事

前言 Android 系统对每个app都会有一个最大的内存限制,如果超出这个限制,就会抛出 OOM,也就是Out Of Memory 。本质上是抛出的一个异常,一般是在内存超出限制之后抛出的。最为常见的 OOM 就是内存泄露(大量的对象无法被释放)导致…

精准数据分析,TeeChart为企业量身定制可视化退休预估方案

TeeChart for .NET是优秀的工业4.0 WinForm图表控件,官方独家授权汉化,集功能全面、性能稳定、价格实惠等优势于一体。TeeChart for .NET 中文版还可让您在使用和学习上没有任何语言障碍,至少可以节省30%的开发时间。 点击立即下载最新版Tee…

docker下不同容器的网络互相访问问题

目录 背景 ​编辑 docker网络模式 解决方法 mysql下 docker-compose下网络设置 nacos 效果 背景 我这边有两个容器,宿主机ip为 192.168.1.115,一个mysql,一个nacos,部署在主机上,使用的默认网络bridge&#xff…

学习SpringBoot入门知识,附带教程源码分享,快速掌握开发技巧-【imooc-java2021】体系课-Java工程师 2022版

学习SpringBoot入门知识,附带教程源码分享,快速掌握开发技巧 目录福利:文末有分享SpringBoot教程及源码哦 一、Spring Boot 是什么二、为什么要使用 Spring Boot三、快速入门3.1 创建 Spring Boot 项目3.1.1 通过 Spring Initializr 来创建1、…

微信小程序入门开发懂你找图小程序

文章目录 搭建 tabbar页面路径 首页模块tabs组件需求推荐组件精选大图月份热门分类模块需求 分类详情业务 首页模块专辑模块需求 专辑详情精美视频需求 视频详情需求 图片详情需求 搭建 tabbar 页面路径 页面名称路径首页index横屏horizontal精美视频video搜索search我的mine …

MySQL——存储引擎于索引应用

文章目录 一、 存储引擎1.1 MySQL结构1.2 存储引擎简介1.3 存储引擎特点1.3.1 InnoDB1.3.1.1 InnoDB 基本介绍1.3.1.2 InnoDB 逻辑存储结构 1.3.2 MyISAM1.3.3 Memory 1.4 三种引擎特点及区别1.5 存储引擎选择 二、 索引 - 重点2.1 介绍2.2 索引结构2.2.1 B-Tree 多路平衡二叉树…

【Linux:动态库与静态库】

1 动态库与静态库的概念 静态库(.a):程序在编译链接的时候把库的代码链接到可执行文件中。程序运行的时候将不再需要静态库。 动态库(.so):程序在运行的时候才去链接动态库的代码,多个程序共享使…

企业微信4.1.6 版本新功能介绍

一、效率工具与基础体验优化 文档 文档增加了丰富的模板,包含项目管理、日报周报、信息收集等多种场景,帮助了解更多文档功能,助力日常工作。 权限管理新增了「成员加入确认」开关,开启后需要管理员确认才能添加成员&#xff0…

相爱相杀的在线帮助文档语雀、Baklib、石墨文档,到底有何区别?

在线帮助文档是现代企业不可或缺的一部分,它提供了针对特定产品或服务的详细说明和指南,以帮助用户更好地理解产品或服务并解决问题。目前市面上有许多在线帮助文档工具,其中语雀、Baklib和石墨文档是比较受欢迎的三种,本文将对它…

卸载旧版本Keil,安装新版本的注意事项以及安装完成以后的一些问题

1. 资料 这里使用的是MDK536安装包和Keil.STM32F4xx_DFP.2.16.0安装包(因为板子是正点原子stm32F407的); 安装包放到下面(安装包也是在网上找的,里面还是比较全的,有C51,以及注册机等&#xf…

只做笔记有必要买apple pencil吗?好写的电容笔排行榜

随着科技的发展,出现了许多新的电子器件和数码器件。比如智能手机,比如ipad,比如电容笔等等。但实际上,想要让ipad发挥出最大的作用,就必须要有一支好的电笔。就像是我们在ipad上写字,总是要手写&#xff0…

硬件工程师-电路设计1-概念

学习电路设计及分析需要掌握的三大定律详解 1、遵循 源 回路 阻抗 分析回路上的节点,分析节点的内阻,电压,功率电流 2、分析电路上的波形:电路设计的过程就是波形整形的过程 波形整形:幅值的整形 波的…

CNNs:ZFNet之基于AlexNet特征可视化实验分析

CNNs:ZFNet之基于AlexNet特征可视化实验分析 导言基于AlexNet网络的实验分析实验一:不同卷积层特征提取分析实验二:不同卷积层提取特征收敛分析 ZFNet网络介绍基于ZFNet网络的实验分析实验三:针对AlexNet特征提取改善可视化实验四:特征不变性…

HW之轻量级内网资产探测漏洞扫描工具

简介 RGPScan是一款支持弱口令爆破的内网资产探测漏洞扫描工具,集成了Xray与Nuclei的Poc 工具定位 内网资产探测、通用漏洞扫描、弱口令爆破、端口转发、内网穿透、SOCK5 主机[IP&域名]存活检测,支持PING/ICMP模式 端口[IP&域名]服务扫描 网…

腾讯云图形验证码申请流程

目录 一、官方指引二、操作步骤1.步骤1:新建验证,获取验证码密钥2.步骤2:客户端接入验证码,展示验证页面3.步骤3:服务端接入验证码,调用票据校验 API 进行二次校验 一、官方指引 https://cloud.tencent.co…