2023年4月份上新的目标检测系列论文(附下载链接)

news2025/1/22 21:08:55

来源:投稿 作者:王老师
编辑:学姐

目标检测-预训练相关

论文标题:DetCLIPv2: Scalable Open-Vocabulary Object Detection Pre-training via Word-Region Alignment

论文链接: https://arxiv.org/abs/2304.04514
代码链接:暂未开源

作者单位:香港科技大学 & 华为诺亚方舟实验室 & 中山大学

发表于CVPR 2023

本文提出了DetCLIPv2,这是一个高效且可扩展的训练框架,它结合了大规模的图像-文本对来实现开放词汇对象检测(open-vocabulary object detection,OVD)。与以前的OVD框架不同,它们通常依赖于预先训练的视觉语言模型(例如CLIP)或通过伪标记过程利用图像-文本对,DetCLIPv2以端到端的方式直接从海量图像-文本配对中学习细粒度的单词区域对齐。为了实现这一点,我们在区域建议和文本单词之间使用最大单词区域相似性来指导对比目标。为了使模型能够在学习广泛概念的同时获得定位能力,DetCLIPv2在统一的数据公式下通过检测、基础和图像-文本对数据的混合监督进行训练。通过使用交替方案进行联合训练,并对图像-文本对采用低分辨率输入,DetCLIPv2高效利用图像-文本配对数据:在相似的训练时间下,DetCLIPv2比DetCLIP多使用13倍的图像-文本对数,并提高了性能。DetCLIPv2拥有1300万个图像-文本对用于预训练,显示出卓越的开放词汇检测性能,例如,具有Swin-T主干的DetCLIPv2在LVIS基准上实现40.4%的零样本AP,这分别比以前的作品GLIP/GLIPv2/DetCLIP高14.4/11.4/4.5%的AP,甚至大大超过了其完全监管的同类产品。

目标检测-半监督相关

论文标题:SOOD: Towards Semi-Supervised Oriented Object Detection

论文链接: https://arxiv.org/abs/2304.04515
代码链接:https://github.com/HamPerdredes/SOOD

作者单位:华中科技大学 & 百度

发表于CVPR 2023

半监督对象检测(Semi-Supervised Object Detection, SSOD)旨在探索未标记的数据,以增强对象检测器,近年来已成为一项积极的任务。然而,现有的SSOD方法主要关注水平物体,而航空图像中常见的多向物体尚未被探索。本文在主流伪标记框架的基础上,提出了一种新的半监督面向对象检测模型SOOD。针对空中场景中的定向对象,我们设计了两个损失函数,以提供更好的监督。关注对象的方向,第一损失利用基于其方向间隙的自适应权重来正则化每个伪标签预测对(包括预测及其对应的伪标签)之间的一致性。关注图像的布局,第二个损失正则化了相似性,并明确地建立了伪标签集和预测集之间的多对多关系。这样的全局一致性约束可以进一步促进半监督学习。我们的实验表明,当用两种拟议的损失进行训练时,在DOTA-1.5基准的各种设置下,SOOD超过了最先进的SSOD方法。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR”获取CV方向顶会必读论文

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/439523.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Auto-GPT免费尝鲜之初体验-使用攻略和总结

Auto-GPT免费尝鲜之初体验-使用攻略和总结 写在前面的废话一、部署 Auto-GPT二、试运行 Auto-GPT三、我踩过的坑四、后续探索 写在前面的废话 ChatGPT 的交互模式,是和一个 “人” 对话聊天。 如果你想了解更多ChatGPT和AI绘画的相关知识,请参考&#…

【代码调试】《Frustratingly Simple Few-Shot Object Detection》

更多问题可参考: https://blog.csdn.net/qiankendeNMY/article/details/128450196 论文地址:https://arxiv.org/abs/2003.06957 论文代码:https://github.com/ucbdrive/few-shot-object-detection 我的配置: Python &#xff1a…

从零开始,详解亚马逊店铺注册流程及技巧指南

近几年跨境电商的势头越来越猛,所以很多新手都想去闯荡一番。很多人的第一选择都是亚马逊,毕竟亚马逊是世界上最大的电商平台之一,因此今天东哥就跟大家分享亚马逊店铺的注册方法,想在亚马逊开店的朋友不要错过! 亚马逊…

设计模式 -- 工厂方法模式以及抽象工厂模式

前言 月是一轮明镜,晶莹剔透,代表着一张白纸(啥也不懂) 央是一片海洋,海乃百川,代表着一块海绵(吸纳万物) 泽是一柄利剑,千锤百炼,代表着千百锤炼(输入输出) 月央泽,学习的一种过程,从白纸->吸收各种知识->不断输入输出变成自己的内容 希望大家一起坚持这个过程,也同…

Mysql MVCC实现

文章目录 背景MVCC定义快照读和当前读当前读快照读 MVCC实现原理隐式字段undo log版本链1.插入一条记录2.修改记录3.修改记录 Read View读视图属性:Read View可见性算法 隔离级别长事务为什么要避免长事务 背景 并发事务可能产生的问题: 读读&#xff…

zk111111111111111111

Zookeeper 1 zookeeper(作为 dubbo 的注册中心): 概述: zookeper 是 一个分布式的、开源的分布式应用程序的协调服务,管理分布式应 用 作用: 配置管理,分布式锁,集群管理 2 zookeeper 的安装 (dubbo 的资料中已经整理) 3 zookeeper 的数据模型 zookeeper 是一个树形的服…

微信小程序php+vue 校园租房指南房屋租赁系统

本着诚信的原则,平台必须要掌握出租方必要的真实可信的信息,这样就可以防止欺诈事件的发生,事后也可以联系找到出租方。并且租金等各方面规范标准化,在这易租房诚信可信的平台让承租方与出租方充分有效对接,既方便了承…

扫清盲点:带你学习 树状数组 这种数据结构

什么是树状数组 树状数组是一种用于维护数列前缀和的数据结构,它可以在 O(logn) 的时间复杂度内修改单个元素的值,以及查询某个区间的元素和。 树状数组的特点是什么? 树状数组的特点其实就是,在单点修改 ,和区间查询…

rancher2.7丢失集群信息

使用Docker 单节点安装rancher,然后在rancher中创建了一个k8s的集群。重启rancher所在的虚拟机后,登录rancher发现这是新的实例,集群信息丢失了。但是k8s集群还是好好的。 检查k8s的日志,api server日志会报错 time"2023-0…

11 - 多平台适配

多平台适配 11-1:开篇 在上一章中,我们知道了,当【慕课热搜】运行到 h5 端的时候,那么会出现一些问题,这些问题具体有: hot 列表滚动,tabs 置顶效果消失在火狐浏览器中,横线出现非…

kafka-kafka集群配置、kafka集群启动创建kafka主题、获取主题数据

本文章使用三台主机,分别为:master、slave1、slave2 一、解压kafka安装包至目录下 tar -zxvf kafka_2.12-2.4.1.tgz -C /需要放置的路径/ 二、修改配置文件 server.properties 该配置在kafka目录的config目录下 #修改文件中id数值 broker.id0 kafka集群…

Linux -- Web服务器-Apache 快速安装及主配置文件分析

目录 快速安装 Apache : 预处理 : 关闭安全上下文检测 : 关闭防火墙 : 启动 Apache 服务 ( 启动 httpd ): 测试 : 主配置文件分析 : 常见配置文件所在位置 : 目录文件结构 :…

购物车--订单模块,练习完成

目标: 在购物车页面,增加一个创建订单的超链接。通过创建订单,在Order表里新增一条数据,同时把session中的订单条目都保存到数据库中。 1、创建两个表,orders用来具体存储每一个订单的细节,order_用来存储…

基于MobileNetV2的Transfer Learning模型,实现物体检测(附源码)

文章目录 一、MobileNet1. 深度可分离卷积(Depthwise separable convolution)2. MobileNet V13. MobileNet V2 二、物体检测源码(基于MobileNetV2) 一、MobileNet 1. 深度可分离卷积(Depthwise separable convolution…

智慧园区综合管理平台开发基本功能有哪些?

随着智慧城市建设与信息化发展,园区管理也需要更加智能便捷化,于是智慧园区管理系统开发应运而生。智慧园区综合管理系统就是利用物联网、大数据等技术工具,顺应产业园区升级发展需求,实现园区环境、设备、安全、基础管理、资源服…

【Linux】进程间通信——命名管道

文章目录 命名管道1. 见一见管道文件mkfifo函数管道文件的使用 2. 命名管道原理如何保证两个毫不相关的进程,看到的是同一个文件,并打开? 3. 用命名管道实现server&client通信如何使用makefile连续生成可执行程序comm.hpp文件server.cc 服…

如何通过 Baklib 平台实现知识共享(内含案例介绍)

在这个信息时代,知识被认为是最重要的资源之一。企业要想保持发展,就必须善于利用和管理知识。而知识管理则是一种涵盖人、过程和技术的活动,它通过收集、整理、传递和应用知识,使组织获得更高的效率、创造力和竞争力。本文将以知…

【Linux】八、Linux进程信号详解(一)

目录 一、认识信号 1.1 生活中的信号 1.2 将1.1的概念迁移到进程 1.3 信号概念 1.4 查看系统定义信号列表 1.5 man 7 signal 1.6 解释1.2的代码样例 1.7 信号处理常见方式概览 二、产生信号 2.1 signal函数 2.2 通过终端按键产生信号 2.3 调用系统函数向进程发信号…

前后端的身份认证【Node.js】

1. 前后端的身份认证 1.1 Web 开发模式 目前主流的 Web 开发模式有两种,分别是: (1)基于服务端渲染的传统 Web 开发模式 (2)基于前后端分离的新型 Web 开发模式 服务端渲染的传统 Web 开发模式 服务端渲染…

力扣面试题 08.06. 汉诺塔问题:思路分析+图文详解+代码实现

文章目录 第一部分:问题描述1.1 题目1.2 示例🍀 示例一🍀 示例二 1.3 提示 第二部分:思路分析第三部分:代码实现 第一部分:问题描述 1.1 题目 🏠 链接:面试题 08.06. 汉诺塔问题 -…