【计算机视觉 | 目标检测】arxiv 计算机视觉关于目标检测的学术速递(6月 30 日论文合集)

news2024/12/22 20:53:50

文章目录

  • 一、检测相关(8篇)
    • 1.1 Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and Localization
    • 1.2 Sustainable Palm Tree Farming: Leveraging IoT and Multi-Modal Data for Early Detection and Mapping of Red Palm Weevil
    • 1.3 Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications
    • 1.4 Metric-aligned Sample Selection and Critical Feature Sampling for Oriented Object Detection
    • 1.5 Real-Time Fully Unsupervised Domain Adaptation for Lane Detection in Autonomous Driving
    • 1.6 Improving Fairness in Deepfake Detection
    • 1.7 A systematic study of the foreground-background imbalance problem in deep learning for object detection
    • 1.8 The State of Applying Artificial Intelligence to Tissue Imaging for Cancer Research and Early Detection

一、检测相关(8篇)

1.1 Detect Any Deepfakes: Segment Anything Meets Face Forgery Detection and Localization

检测任何深度伪装:分割任何符合人脸的伪装检测和定位

论文地址:

https://arxiv.org/abs/2306.17075

在这里插入图片描述
计算机视觉的快速发展刺激了面部伪造技术的显著进步,引起了致力于检测伪造和精确定位操纵区域的研究人员的关注。尽管如此,在有限的细粒度像素监督标签的情况下,deepfake检测模型在精确的伪造检测和定位方面表现不尽如人意。为了解决这一挑战,我们引入了训练有素的视觉分割基础模型,即,分割任意模型(SAM)在人脸伪造检测和定位中的应用。基于SAM,我们提出了带有多尺度适配器的检测任何深度伪造(DADF)框架,该框架可以捕获短距离和长距离伪造上下文以进行有效的微调。此外,为了更好地识别伪造的痕迹和增强模型对伪造区域的敏感性,提出了重建引导注意(RGA)模块。所提出的框架无缝集成端到端伪造定位和检测优化。在三个基准数据集上进行的大量实验表明了我们的方法在伪造检测和定位方面的优越性。这些代码将很快在www.example.com上发布https://github.com/laiyingxin2/DADF。

1.2 Sustainable Palm Tree Farming: Leveraging IoT and Multi-Modal Data for Early Detection and Mapping of Red Palm Weevil

可持续棕榈树养殖:利用物联网和多模式数据早期检测和绘制红棕榈象甲

论文地址:

https://arxiv.org/abs/2306.16862

在这里插入图片描述
红棕榈象鼻虫(RPW)是一种高度破坏性的昆虫,造成经济损失并影响全球棕榈树种植。本文提出了一种创新的方法,可持续的棕榈树农业利用先进的技术,早期检测和管理的RPW。我们的方法结合了计算机视觉,深度学习(DL),物联网(IoT)和地理空间数据,以有效地检测和分类RPW出没的棕榈树。主要阶段包括:(1)使用来自IoT设备的声音数据的DL分类,(2)使用UAV图像上的YOLOv8进行棕榈树检测,以及(3)使用地理空间数据的RPW映射。我们的自定义DL模型在检测和定位受感染的棕榈树方面实现了100%的准确率和召回率。整合地理空间数据可以创建一个全面的RPW分布图,以实现有效的监控和有针对性的管理策略。这种技术驱动的方法有利于农业当局,农民和研究人员管理RPW侵扰和保护棕榈树种植园的生产力。

1.3 Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications

用于AR应用的定向包围盒目标检测的环境条件评估

论文地址:

https://arxiv.org/abs/2306.16798

在这里插入图片描述

增强现实(AR)的目标是将数字内容添加到自然图像和视频中,以在用户和环境之间创建交互式体验。场景分析和对象识别在AR中起着至关重要的作用,因为它们必须快速准确地执行。在这项研究中,提出了一种新方法,该方法涉及使用具有检测和识别深度网络的定向边界框来提高性能和处理时间。该方法使用两个数据集进行评估:通常用于计算机视觉任务的真实图像数据集(DOTA数据集),以及模拟不同环境、照明和采集条件的合成数据集。评估的重点是难以检测和识别的小物体。结果表明,所提出的方法往往会产生更好的平均精度和更高的精度为小对象在大多数测试条件。

1.4 Metric-aligned Sample Selection and Critical Feature Sampling for Oriented Object Detection

面向目标检测的度量对齐样本选择和关键特征采样

论文地址:

https://arxiv.org/abs/2306.16718

在这里插入图片描述
面向任意对象的目标检测是一个相对新兴但具有挑战性的任务。虽然已经取得了显着的进展,仍然存在许多未解决的问题,由于在航空图像中的对象的方向,比例,纵横比和视觉外观的图案的大的多样性。现有的方法大多采用粗粒度的固定标签分配策略,并且遭受分类得分和定位精度之间的不一致。首先,针对固定IoU策略导致的样本选择和回归损失计算之间的度量不一致,引入仿射变换来评估样本质量,并提出了一种基于距离的标签分配策略。提出的度量对齐选择(MAS)策略可以根据对象的形状和旋转特性动态地选择样本。其次,为了进一步解决分类和本地化之间的不一致,我们提出了一个关键特征采样(CFS)模块,该模块对分类任务的采样位置进行本地化细化,以准确地提取关键特征。第三,我们提出了一个规模控制的平滑L_1损失(SC-Loss),通过改变回归损失函数的形式,在训练过程中的统计建议的基础上,自适应地选择高质量的样本。在四个具有挑战性的旋转对象检测数据集DOTA,FAIR 1 M-1.0,HRSC 2016和UCAS-AOD上进行了广泛的实验。结果显示了所提出的检测器的最先进的精度。

1.5 Real-Time Fully Unsupervised Domain Adaptation for Lane Detection in Autonomous Driving

用于自动驾驶车道检测的实时全无监督区域自适应算法

论文地址:

https://arxiv.org/abs/2306.16660

在这里插入图片描述
虽然深度神经网络被大量用于自动驾驶,但它们需要适应新的未知环境条件。我们专注于车道检测的安全关键应用,并提出了一种轻量级的,完全无监督的,实时的自适应方法,只适应批量归一化参数的模型。我们证明,我们的技术可以执行推理,然后在设备上的适应,在Nvidia Jetson奥林30 FPS的严格约束下。其显示类似的准确度(avg.的92.19%)作为最先进的半监督自适应算法,但是其不支持实时自适应。

1.6 Improving Fairness in Deepfake Detection

提高深伪检测的公平性

论文地址:

https://arxiv.org/abs/2306.16635

在这里插入图片描述
尽管近年来开发了有效的deepfake检测模型,但最近的几项研究表明,用于开发deepfake检测模型的训练数据中的偏差可能会导致不同种族和/或性别的人口群体的不公平表现。这可能导致这些群体被不公平地定位或排除在检测之外,从而允许错误分类的深度伪造操纵公众舆论并侵蚀对模型的信任。虽然这些研究集中在识别和评估深度伪造检测中的不公平性,但尚未开发出在算法层面解决深度伪造检测的公平性问题的方法。在这项工作中,我们首次尝试通过提出新的损失函数来提高deepfake检测的公平性,以不可知或了解人口统计因素的方式训练公平的deepfake检测模型。在四个deepfake数据集和五个deepfake检测器上进行的广泛实验证明了我们的方法在提高deepfake检测公平性方面的有效性和灵活性。

1.7 A systematic study of the foreground-background imbalance problem in deep learning for object detection

深度学习目标检测中前景背景不平衡问题的系统研究

论文地址:

https://arxiv.org/abs/2306.16539

在这里插入图片描述
深度学习中的类不平衡问题已经在几项研究中进行了探索,但在对象检测中还没有对这种现象进行系统的分析。在这里,我们提出了全面的分析和实验的前景-背景(F-B)的不平衡问题,在对象检测,这是非常常见的,所造成的小,罕见的感兴趣的对象。我们通过实验研究了F-B不平衡的不同方面(对象大小,对象数量,数据集大小,对象类型)对检测性能的影响。此外,我们还比较了9种解决这个问题的主要方法,包括Faster-RCNN,SSD,OHEM,Libra-RCNN,Focal-Loss,GHM,PISA,YOLO-v3和GFL,以及来自不同成像领域的一系列数据集。我们的结论是(1)F-B不平衡确实会导致检测性能的显著下降,(2)当较少的训练数据可用时,检测性能更受F-B不平衡的影响,(3)在大多数情况下,减小对象尺寸比减小对象数量导致更大的性能下降,给定对象像素与非对象像素的比率的相同变化,(6)在所有选择的方法中,Libra-RCNN和PISA在解决F-B失衡问题方面表现最好。(7)当训练数据集很大时,方法的选择没有影响力(8)软采样方法,包括焦点损失,GHM和GFL,平均表现相当好,但相对不稳定。

1.8 The State of Applying Artificial Intelligence to Tissue Imaging for Cancer Research and Early Detection

人工智能在组织成像中的应用现状及其在肿瘤研究和早期检测中的应用

论文地址:

https://arxiv.org/abs/2306.16989

在这里插入图片描述
人工智能代表了人类医学的一个新前沿,可以挽救更多的生命,降低成本,从而增加可及性。因此,人工智能在癌症医学成像,特别是组织病理学方面的进步速度已经爆炸,使其面临伦理和技术问题,这些问题可能会阻碍其在现有系统中的采用。为了绘制AI在癌症组织成像中的应用路径,我们回顾了当前的工作,并确定了它如何改善癌症病理学诊断和研究。在这篇综述中,我们确定了模型开发的5个核心任务,包括回归,分类,分割,生成和压缩任务。我们讨论了这些方法所面临的好处和挑战,以及它们如何适用于癌症预防和治疗。本文中的研究代表了这一领域的开始,未来的实验将建立在我们强调的基础上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/722070.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【DP+博弈】ABC195 E

E - Lucky 7 Battle (atcoder.jp) 题意&#xff1a; 思路&#xff1a; Code&#xff1a; #include <bits/stdc.h>//#define int long longusing namespace std;const int mxn2e510; const int mxe1e610; const int mod1e97; const int Inf0x3f3f3f3f;string s,x;int N;…

【设计模式】第十九章:访问者模式详解及应用案例

系列文章 【设计模式】七大设计原则 【设计模式】第一章&#xff1a;单例模式 【设计模式】第二章&#xff1a;工厂模式 【设计模式】第三章&#xff1a;建造者模式 【设计模式】第四章&#xff1a;原型模式 【设计模式】第五章&#xff1a;适配器模式 【设计模式】第六章&…

VI-SLAM系统对比

任何类型的相机对运动物体&#xff0c;视线遮挡&#xff0c;光照剧烈变化等恶劣情况下都不够鲁棒&#xff0c;而惯性测量单元&#xff08;IMU&#xff09;对环境基本没有要求&#xff0c;并且IMU可以提供高频的位姿估计&#xff0c;视觉一般只能提供低频的位姿。依据视觉与IMU的…

前后端实现导出导入功能

目录 导出 1.后端代码 &#xff08;1&#xff09;相关依赖 &#xff08;2&#xff09;自定义实体类 &#xff08;3&#xff09;写一个查询方法list &#xff08;4&#xff09;写导出接口 2.前端代码 3.效果示例 导入 1.后端代码 &#xff08;1&#xff09;写导入接口 …

在SpringBoot中对es集群的基本操作

在创建SpringBoot项目之前要先把上一篇文档搭建的集群打开,然后再创建SpringBoot项目,不会创建的可以访问这里 快速创建SpringBoot项目 提前准备: 1.导入pom依赖 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starte…

23西安电子科技大学光电工程学院851考研录取情况

01、光电工程学院各个方向 02、23光电工程学院一志愿考研录取情况总览、平均分 PS&#xff1a;在23年&#xff0c;西电物理与光电工程学院拆分为两个院&#xff0c;分别是&#xff1a;物理学院和光电工程学院。其中物理学院改考602高等数学872普通物理&#xff0c;光电学院专业…

六、盒子模型

盒子模型 1、元素分类 1、元素分类 行内元素&#xff08;内联元素&#xff09;inline 从左向右&#xff0c;从上到下&#xff0c;依次显示 一个挨着挨一个 以下属性无效&#xff1a;width、height、maring、pading 行内元素内部无法嵌套块级元素 行内元素列表 a strong span …

leetcode 160.链表相交

⭐️ 往期相关文章 &#x1f4ab;链接1&#xff1a;链表分割 &#x1f4ab;链接2&#xff1a;链表中倒数第k个结点(快慢指针问题) &#x1f4ab;链接3&#xff1a;leetcode 876.链表的中间结点(快慢指针问题) &#x1f4ab;链接4&#xff1a;leetcode 206.反转链表 &#x1f4…

Servlet 的常用 API + 综合运用【表白墙】

前言 小亭子正在努力的学习编程&#xff0c;接下来将开启JavaEE的学习~~ 分享的文章都是学习的笔记和感悟&#xff0c;如有不妥之处希望大佬们批评指正~~ 同时如果本文对你有帮助的话&#xff0c;烦请点赞关注支持一波, 感激不尽~~ 目录 前言 一、HttpServlet Servlet 的生…

医学图像分割的全卷积transformer

文章目录 The Fully Convolutional Transformer for Medical Image Segmentation摘要本文方法实验结果 The Fully Convolutional Transformer for Medical Image Segmentation 摘要 我们提出了一种新的Transformer &#xff0c;能够分割不同模式的医学图像。医学图像分析的细…

【机器学习核心总结】什么是EM(最大期望值算法)

什么是EM(最大期望值算法) 在现实生活中&#xff0c;苹果百分百是苹果&#xff0c;梨百分白是梨。 生活中还有很多事物是概率分布&#xff0c;比如有多少人结了婚&#xff0c;又有多少人有工作&#xff0c; 如果我们想要调查人群中吸大麻者的比例呢&#xff1f;敏感问题很难得…

FOF常用的七种投资策略全解析

从当前市场上的投资策略种类来看&#xff0c;大致有七种&#xff0c;包括核心*卫星投资策略、「杠铃」投资策略、反向投资策略、成本平均策略和时间分散化策略、买入并持有策略、美林投资时钟策略、Alpha/Beta投资策略。 投资策略一:美林投资时钟策略 美林投资时钟投资策略相信…

CAN(2)-GD32

CAN(2)-GD32 GD32中CAN的特征 结构框图 CNA总线的工作模式 睡眠工作模式 初始化工作模式 正常工作模式 CAN通信模式 静默通信模式 回环通信模式 回环静默通信模式

hadoop --- MapReduce

MapReduce定义&#xff1a; MapReduce可以分解为Map (映射) Reduce (规约) &#xff0c; 具体过程&#xff1a; Map : 输入数据集被切分成多个小块&#xff0c;并分配给不同的计算节点进行处理Shuffle and Sort&#xff1a;洗牌和排序&#xff0c;在 Map 阶段结束后&#xf…

CCF-CSP真题《202303-4 星际网络II》思路+python,c++满分题解

想查看其他题的真题及题解的同学可以前往查看&#xff1a;CCF-CSP真题附题解大全 试题编号&#xff1a;202303-4试题名称&#xff1a;星际网络II时间限制&#xff1a;2.0s内存限制&#xff1a;1.0GB问题描述&#xff1a; 问题描述 随着星际网络的进一步建设和规模的增大&#x…

docker-compose部署BCH节点

BCH gitlab BCH github 1、下载BCH二进制文件 rootiZj6c076dm0c5n5b39lzlxZ:/data/docker-compose/bch# wget https://github.com/bitcoin-cash-node/bitcoin-cash-node/releases/download/v26.1.0/bitcoin-cash-node-26.1.0-x86_64-linux-gnu.tar.gz --2023-07-05 16:30:46--…

攻防世界-web-CAT

题目描述&#xff1a;抓住那只猫。界面如下&#xff1a; 1. 思路分析 界面很简单&#xff0c;只有一个输入框&#xff0c;提示我们输入域名&#xff0c;我们随便输入一个baidu.com 发现这个域名赋值给url参数传递到后台。因此&#xff0c;这里能做文章的地方只有这个url参数&a…

GPT模型支持下的Python-GEE遥感云大数据分析、管理与可视化技术

第一章 理论基础 1、Earth Engine平台及应用、主要数据资源介绍 2、Earth Engine遥感云重要概念、数据类型与对象等 3、JavaScript与Python遥感云编程比较与选择 4、Python基础&#xff08;语法、数据类型与程序控制结构、函数及类与对象等&#xff09; 5、常用Python软件…

算法与数据结构-栈

文章目录 什么是栈如何实现一个“栈”&#xff1f;定长顺序栈动长链式栈 栈的应用栈在函数调用中的应用栈在表达式求值中的应用栈在括号匹配中的应用 总结 什么是栈 后进者先出&#xff0c;先进者后出&#xff0c;这就是典型的“栈”结构。 就像一摞叠在一起的盘子。我们平时放…

JavaScript中的substring方法和fill方法,使用详细(fill方法获取一天24小时)

简介&#xff1a;JavaScript中的数组方法&#xff0c;可以帮助我们操作数组中的元素&#xff0c;以及对数组进行排序和过滤等操作&#xff1b;最近有用到substring和fill方法&#xff0c;这里来记录一下。 一. substring 方法&#xff1a; substring 方法用于从一个字符串中提…