【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月19日论文合集)

news2024/11/24 12:34:19

文章目录

  • 一、检测相关(7篇)
    • 1.1 Vehicle Occurrence-based Parking Space Detection
    • 1.2 Squeezing nnU-Nets with Knowledge Distillation for On-Board Cloud Detection
    • 1.3 MixedTeacher : Knowledge Distillation for fast inference textural anomaly detection
    • 1.4 Efficient Search and Detection of Relevant Plant Parts using Semantics-Aware Active Vision
    • 1.5 The Big Data Myth: Using Diffusion Models for Dataset Generation to Train Deep Detection Models
    • 1.6 Scaling Open-Vocabulary Object Detection
    • 1.7 Fusing Structural and Functional Connectivities using Disentangled VAE for Detecting MCI

一、检测相关(7篇)

1.1 Vehicle Occurrence-based Parking Space Detection

基于车辆发生的车位检测

论文地址:

https://arxiv.org/abs/2306.09940

在这里插入图片描述
智能停车解决方案使用传感器、摄像头和数据分析来提高停车效率并减少交通拥堵。近年来,基于计算机视觉的方法已被广泛用于解决停车场管理问题,但大多数工作都假设停车位是手动标记的,这影响了部署的成本和可行性。为了填补这一空白,这项工作提出了一种自动停车位检测方法,该方法接收停车场的图像序列,并返回识别检测到的停车位的坐标列表。所提出的方法采用实例分割来识别汽车,并使用车辆发生,生成停车位的热图。使用来自PKLot和CNRPark-EXT停车场数据集的12个不同子集的结果表明,该方法的AP 25得分高达95.60%,AP 50得分高达79.90%。

1.2 Squeezing nnU-Nets with Knowledge Distillation for On-Board Cloud Detection

基于知识蒸馏的NNU-Net压缩星载云检测

论文地址:

https://arxiv.org/abs/2306.09886

在这里插入图片描述
云检测是一个关键的卫星图像预处理步骤,可以在地面和卫星上执行,以标记有用的图像。在后一种情况下,它可以通过修剪多云区域来减少下行链路的数据量,或者通过数据驱动的采集重新调度来使卫星更加自主。我们使用nnU-Nets来完成这项任务,nnU-Nets是一种自重构框架,能够在各种数据集上执行分割网络的元学习。不幸的是,这样的模型通常是内存效率低,由于其(非常)大的架构。为了在机载处理中受益,我们将nnU-网络与知识蒸馏压缩成更小和更紧凑的U-网络。我们在Sentinel-2和Landsat-8图像上进行的实验表明,nnU-Nets无需任何手动设计即可提供最先进的性能。我们的方法在On Cloud N:云覆盖检测挑战赛,我们在超过10000张看不见的Sentinel-2图像上达到了0.882的Jaccard指数(获胜者获得了0.897,具有ResNet-34主干的基线U-Net:0.817,以及经典的Sentinel-2图像阈值:0.652)。最后,我们表明,与nnU-Nets相比,知识蒸馏能够精心制作更小(几乎280倍)的U-Nets,同时仍然保持其分割功能。

1.3 MixedTeacher : Knowledge Distillation for fast inference textural anomaly detection

MixedTeacher:用于快速推理纹理异常检测的知识提炼

论文地址:

https://arxiv.org/abs/2306.09859

在这里插入图片描述

长期以来,用于异常检测的无监督学习一直是图像处理研究的核心,也是高性能工业自动化过程的垫脚石。随着CNN的出现,已经提出了几种方法,例如自动编码器,GAN,深度特征提取等。在本文中,我们提出了一种新的方法的基础上有前途的知识蒸馏的概念,其中包括正常样本的训练网络(学生),同时考虑一个更大的预训练网络(教师)的输出。本文的主要贡献有两个方面:首先,提出了一个简化的学生结构与优化层选择,然后提出了一个新的学生-教师结构与网络偏差减少结合两个教师,以共同提高异常检测的性能和其定位精度。提出的纹理异常检测器具有一个出色的能力,以检测任何纹理和快速推理时间相比,SOTA方法。

1.4 Efficient Search and Detection of Relevant Plant Parts using Semantics-Aware Active Vision

基于语义感知主动视觉的植物相关部位高效搜索与检测

论文地址:

https://arxiv.org/abs/2306.09801

在这里插入图片描述
为了使用机器人自动收获和脱叶番茄植物,重要的是搜索和检测相关的植物部分,即番茄,茎和叶柄。这是具有挑战性的,由于在番茄温室中的高水平的闭塞。主动视觉是一种很有前途的方法,它可以帮助机器人有意识地规划摄像机视点,以克服遮挡,提高感知精度。然而,当前的主动视觉算法无法区分相关和不相关的植物部分,使得它们对于特定植物部分的目标感知效率低下。我们提出了一个语义主动视觉策略,使用语义信息来识别相关的植物部分,并优先考虑他们在视图规划使用的注意力机制。我们评估了我们的策略,使用不同的结构复杂性的番茄植物的3D模型,这密切代表了现实世界中的遮挡。我们使用模拟环境来深入了解我们的策略,同时确保可重复性和统计显著性。在十个观点结束时,我们的策略是能够正确地检测到85.5%的植物部分,约4个部分,平均每株植物相比,体积主动视觉策略。此外,与两个预定义策略相比,它检测到5和9个部分,与随机策略相比,它检测到11个部分。在96次实验中,每株植物正确检测到的对象中位数为88.9%。我们的策略也是强大的不确定性,在工厂和工厂部分的位置,工厂的复杂性,和不同的观点采样策略。我们相信,我们的工作可以显着提高番茄作物生产中自动收获和脱叶的速度和鲁棒性。

1.5 The Big Data Myth: Using Diffusion Models for Dataset Generation to Train Deep Detection Models

大数据神话:使用扩散模型生成数据集来训练深度检测模型

论文地址:

https://arxiv.org/abs/2306.09762

在这里插入图片描述
尽管深度目标检测模型取得了显着的成就,但仍然存在的一个主要挑战是需要大量的训练数据。获取这种真实世界数据的过程是一项艰苦的工作,这促使研究人员探索新的研究途径,如合成数据生成技术。本研究提出了一个框架,通过微调预训练的稳定扩散模型生成合成数据集。然后人工注释合成数据集并用于训练各种对象检测模型。这些检测器在331张图像的真实世界测试集上进行评估,并与在真实世界图像上训练的基线模型进行比较。这项研究的结果表明,在合成数据上训练的对象检测模型执行类似的基线模型。在果园中的苹果检测的上下文中,与基线的平均精度偏差范围为0.09至0.12。这项研究说明了合成数据生成技术的潜力,作为收集广泛的训练数据以训练深度模型的可行替代方案。

1.6 Scaling Open-Vocabulary Object Detection

缩放式开放词汇目标检测

论文地址:

https://arxiv.org/abs/2306.09683

在这里插入图片描述
开放词汇的对象检测已经大大受益于预训练的视觉语言模型,但仍然受到可用检测训练数据量的限制。虽然检测训练数据可以通过使用Web图像-文本对作为弱监督来扩展,但这还没有在与图像级预训练相当的规模上完成。在这里,我们扩大检测数据与自我训练,它使用现有的检测器生成伪框注释图像-文本对。缩放自训练的主要挑战是标签空间的选择、伪注释过滤和训练效率。我们提出了OWLv 2模型和OWL-ST自训练配方,以解决这些挑战。OWLv 2在相当的训练规模(约1000万个示例)上已经超越了以前最先进的开放词汇检测器的性能。然而,使用OWL-ST,我们可以扩展到超过1B的示例,从而获得进一步的巨大改进:使用L/14架构,OWL-ST将LVIS稀有类的AP从31.2%提高到44.6%(相对提高43%),其中模型没有看到人类框注释。OWL-ST为开放世界本地化解锁了Web规模的训练,类似于图像分类和语言建模。

1.7 Fusing Structural and Functional Connectivities using Disentangled VAE for Detecting MCI

解缠VAE融合结构和功能连接性检测MCI

论文地址:

https://arxiv.org/abs/2306.09629

在这里插入图片描述
脑网络分析是研究人类大脑疾病的一种有用方法,因为它可以通过检测异常连接来区分患者和健康人。由于多模态神经图像的互补信息,多模态融合技术具有很大的潜力,以提高预测性能。然而,有效地融合多模态医学图像以实现互补性仍然是一个具有挑战性的问题。本文提出了一种新的分层结构-功能连接融合(HSCF)模型,用于构建脑结构-功能连接矩阵,并基于功能磁共振成像(fMRI)和扩散张量成像(DTI)预测异常脑连接。具体地,将先验知识并入分离器中,用于通过图卷积网络(GCN)解开信息的每个模态。为了保证解缠的有效性,设计了解缠余弦距离损耗。此外,分层表示融合模块被设计成有效地最大化模态之间的相关和有效特征的组合,这使得所生成的结构-功能连接性在认知疾病分析中更鲁棒和有区别。从公共阿尔茨海默氏病神经影像学倡议(ADNI)数据库上进行的广泛的测试结果表明,所提出的模型比竞争的方法在分类评价方面表现更好。在一般情况下,所提出的HSCF模型是一个有前途的模型,用于产生大脑的结构功能连接和识别异常的大脑连接的认知疾病的进展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667328.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

金测评 听歌更自如的骨传导耳机,音质更出色,南卡Runner Pro 4S体验

我一直对骨传导耳机很感兴趣,因为这种耳机可以让我在户外运动的时候,既能享受音乐,又能保持对周围环境的敏感。为了获得更好的听歌体验,我的骨传导耳机换代频率很高,目前我用的是一款南卡Runner Pro 4S的骨传导耳机&am…

windows环境cmake引用boost库

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、下载源代码二、编译前准备1.操作系统2.gcc环境3.建立安装目录 三、开始编译1.解压源代码2.开始编译 四、开始使用1.Clion创建项目2.Boost版本差异3.Boost版…

数据结构Pta训练题函数题详解

​ pta网站:PTA | 程序设计类实验辅助教学平台 (pintia.cn) 文章内容较长,建议搭配目录使用 点击直达快乐 6-1 线性表元素的区间删除解析: 6-2 有序表的插入解析: 6-3 合并两个有序数组解析 6-4 顺序表操作集解析 6-5 递增的整数…

Linux磁盘空间占满,但搜不到大文件

使用 df -h 查看磁盘空间 使用 du -sh * 查看每个目录的大小 经过查看没有发现任何大的文件夹。 继续下面的步骤 如果您的Linux磁盘已满,但是通过 du -sh 找不到大文件,可能是因为有一些进程正在写入磁盘,但是这些文件已经被删除&#…

与用户同行!2023卡萨帝开启高端生活方式新时代

6月20日,2023思享荟暨卡萨帝品牌升级发布会在重庆国际博览中心举行。在经历了高端产品引领、高端品牌引领、高端场景引领后,卡萨帝启动全新品牌升级,持续与用户同行,开启高端生活方式引领的新时代。 现场,海尔智家副总…

千万不能小瞧的PCB半孔板

PCB半孔是沿着PCB边界钻出的成排的孔,当孔被镀铜时,边缘被修剪掉,使沿边界的孔减半,让PCB的边缘看起来像电镀表面孔内有铜。 模块类PCB基本上都设计有半孔,主要是方便焊接,因为模块面积小,功能…

一键打车/代驾小程序源码app+司机入住uniapp+thinkphp

一键打车/代驾小程序源码app司机入住uniappthinkphp 系统技术架构 开发环境:PHP7.2 mysql5.7 后端:thinkphp 前端:uniapp 后台管理:PC端 司机端:安卓端 苹果端 乘客端:安卓端 苹果端 小程序端 功…

ai聊天推荐这些工具,告诉你ai聊天网站有哪些

“ai聊天网站有哪些”是一个常见的问题,当今互联网时代,人工智能技术正在不断发展,ai聊天网站和软件成为了人们交流和获取信息的重要工具。本文将为您介绍一些知名的ai聊天网站和软件,让您快速了解“ai聊天网站有哪些”这个问题。…

按钮权限布局(设置 element中 tree 树的排列)

页面中使用 <el-buttontype"text"click"edit(slotProps.date)"v-btn-key"[client:clue:update]">编辑</el-button><el-buttontype"text"click"del(slotProps.date)"v-btn-key"[client:clue:delete]&quo…

想读2023级中外合作办学硕士,人大女王金融硕士国际班或许是你最后的机会了

已经进入6月下旬&#xff0c;大部分院校中外合作办学在职研究生的招生已经截止&#xff0c;部分同学还在犹豫纠结中&#xff0c;各大高校的名额就已经都满了。想要读2023级还有可能吗&#xff1f;中国人民大学与加拿大女王大学金融硕士国际班还能给你一次机会。 虽然我们无法确…

【2023 阿里云云计算工程师 ACP 认证练习题库】03、ECS 知识点题库(下)

目录 单选题 1 2 3 答案与解析 4 ​5 6 ​答案与解析 7 8 答案与解析 9 ​答案与解析 10 ​答案与解析 11 12 13 14 15 16 答案与解析 17 18 19 20 21 22 23 24 25 ​答案与解析 26 27 28 29 ​答案与解析 …

校园外卖平台怎么做

校园外卖小程序是一款基于智能手机的移动应用&#xff0c;提供订餐、支付、配送等服务。它能为顾客提供丰富的美食选择&#xff0c;为商家提供进一步发展业务的机会&#xff0c;同时骑手也有机会赚取额外的收入。 一、 用户端功能介绍 1. 地图定位&#xff1a;用户可以利用小…

渐进式学习:如何用R和GO富集可视化捕捉生命的关键信号?

一、引言 生命科学中的数据分析和可视化是一个具有挑战性的领域。随着技术和理论的不断发展&#xff0c;研究人员需要处理越来越复杂和庞大的数据集&#xff0c;以研究生物体在不同尺度上的结构和功能&#xff0c;探索不同生物过程和疾病的机制。在这个领域&#xff0c;GO&…

【MySQL】一文带你了解数据过滤

&#x1f3ac; 博客主页&#xff1a;博主链接 &#x1f3a5; 本文由 M malloc 原创&#xff0c;首发于 CSDN&#x1f649; &#x1f384; 学习专栏推荐&#xff1a;LeetCode刷题集&#xff01; &#x1f3c5; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指…

华为云“企业快成长大数据与微服务技术创新论坛”成功举办

6月16日&#xff0c;由华为云、msup、厦门火炬大学堂、厦门市行业软件协会联合主办的“企业快成长大数据与微服务技术创新论坛”在厦门成功举办。本次活动汇聚了华为云、珍爱网等知名企业的CTO和技术专家&#xff0c;通过技术案例解析了大数据平台构建、微服务演进等内容&#…

K8S证书过期解决办法之替换证书

目录 1 证书过期的情况 2 Kubernetes环境介绍 3 替换证书步骤 3.1 在master上查看各证书的过期时间 3.2 查看master&#xff08;192.168.0.190&#xff09;上kubelet证书列表 3.3 查看master&#xff08;192.168.0.190&#xff09;上kubelet证书的过期时间 3.4 查看nod…

在openSUSE-Leap-15.5-DVD-x86_64的gnome下使用远程桌面tigervnc

在openSUSE-Leap-15.5-DVD-x86_64的gnome下使用远程桌面tigervnc 在openSUSE-Leap-15.5-DVD-x86_64的tigervnc-1.12.0软件设计有变动了&#xff0c;变为一开机就启动远程桌面服务&#xff0c;没有vncserver取而代之是Xvnc&#xff0c;也在自己之前写的一篇博文的基础上作了修改…

vue跨域实现:proxy配置

一、什么是跨域 要了解跨域&#xff0c;首先得知道浏览器的同源策略。 同源策略&#xff1a;是由Netscape提出的一个安全策略&#xff0c;能够阻挡恶意文档&#xff0c;保护本地数据。它能限制一个源的文档或脚本对另一个源的交互&#xff0c;使得其它源的文档或脚本&#xf…

来看一个RuoYi-Cloud-Plus的Bug_今天突然发现的---RuoYi-Cloud-Plus-master工作笔记0002

用的时候可以注意一些,今天发现一个问题: 是关于角色管理这里的,如果你用的不是超级管理员登录,超级管理员他这里指定了ID是1, 如果你用其他,也是管理员账号,比如用超级管理员创建了一个管理员的角色,并且分配了,角色管理给这个管理员,那么,这个时候,你在给这个分配了角色管理…

CSAPP - LinkLab实验(阶段1-5)

LinkLab实验&#xff08;阶段1-5&#xff09; 官网&#xff1a;http://csapp.cs.cmu.edu/3e/labs.html 实验内容 每个实验阶段&#xff08;共5个&#xff09;考察ELF文件组成与程序链接过程的不同方面知识 阶段1&#xff1a;全局变量 <-> 数据节 阶段2&#xff1a;强符…