实例分割12篇顶会论文及代码合集,含2023最新

news2024/9/23 1:21:39

同学们,你们觉得视觉经典四个任务中哪个最难?我个人觉得是实例分割

因为它既具备语义分割的特点,需要做到像素层面上的分类,也具备目标检测的一部分特点,即需要定位出不同实例,即使它们是同一种类。

但尽管实例分割的复杂性和挑战性较高,它仍然是计算机视觉领域一个很重要的研究主题,对地理信息系统、医学影像、自动驾驶、机器人等领域有着很重要的应用技术支持作用。

为了帮助同学们学习这一重要主题,今天我就来和大家分享各大顶会中实例分割方向的12篇高分论文,包含今年最新的研究成果,希望能帮助同学们更轻松地理解并掌握实例分割。

论文原文及代码需要的同学看文末

1.PatchDCT: Patch Refinement for High Quality Instance Segmentation 【ICLR2023】

PatchDCT:用于高质量实例分割的Patch细化

简述:PatchDCT是一种用于高质量实例分割的方法,它通过将解码自DCT向量的掩码分解为多个补丁,并使用分类器和回归器对每个补丁进行细化来提高分割质量。在实验中,PatchDCT方法比Mask-RCNN和DCT-Mask方法表现更好,也与其他最先进的方法相当。

2.Recurrent Contour-based Instance Segmentation with Progressive Learning 【TPAMI2023】

渐进式学习的循环轮廓基础实例分割

简述:论文提出了一种名为PolySnake的新颖深度网络架构,用于轮廓基础实例分割。通过迭代和渐进式轮廓细化策略实现了卓越而稳健的分割性能。具体来说,PolySnake引入了循环更新操作符来迭代地估计物体轮廓,并逐渐将其变形朝向物体边界。在每次迭代中,PolySnake为当前轮廓构建了一个语义丰富的表示形式,并将其输入到循环操作符中进行进一步的轮廓调整。

3.Instance Segmentation in the Dark 【IJCV2023】

暗光实例分割

简述:论文发现低光图像中的噪声会引入高频率干扰到神经网络的特征图中,从而降低性能。为了解决这个问题,作者提出了一种新的学习方法,通过自适应加权下采样层、平滑面向卷积块和干扰抑制学习来减少特征噪声。此外,作者还发现使用高比特深度RAW图像可以更好地保留低光场景信息。通过采集现实世界的低光实例分割数据集并利用低光RAW合成管道生成逼真的低光数据,该方法在无需任何图像预处理的情况下实现了令人满意的性能。

4.OpenMask3D:Open-Vocabulary 3D Instance Segmentation 【NeurIPS2023】

开放词汇表的3D实例分割

简述:论文介绍了一种名为OpenMask3D的开放词汇表的3D实例分割方法。现有的3D实例分割方法只能识别预先定义的封闭类别集合中的物体,而OpenMask3D通过学习场景中每个点的可查询特征来解决这一问题。该方法使用基于CLIP的图像嵌入的多视角融合来聚合每个掩码的特征,并通过预测的类无关3D实例掩码指导模型。实验表明,OpenMask3D优于其他开放词汇表方法,尤其是在长尾分布上。

5.ISBNet: a 3D Point Cloud Instance Segmentation Network with Instance-aware Sampling and Box-aware Dynamic Convolution 【CVPR2023】

一种具有实例感知采样和框感知动态卷积的3D点云实例分割网络

简述:该文介绍了一种新的无聚类3D实例分割方法ISBNet,它将实例表示为内核并通过动态卷积解码实例掩码。该方法采用实例感知最远点采样策略来高效地生成高召回率和有区别性的内核,并利用局部聚合层编码候选特征。此外,作者还展示了在动态卷积中预测和利用3D轴对齐边界框可以进一步提高性能。

6.Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation 【ICCV2023】

开放词汇实例分割的联合标题基础和生成

简述:作者提出了一种名为Caption Grounding and Generation(CGG)的框架,用于开放词汇实例分割,以扩展分割模型来分类和分割新的实例级别类别。CGG通过仅关注匹配对象名词的基础损失函数提高学习效率,并引入标题生成头提供额外的监督和上下文建模。实验结果表明,基础和生成组件相互补充,显著提高了新类别的分割性能。

7.DVIS: Decoupled Video Instance Segmentation Framework 【ICCV2023】

解耦的视频实例分割框架

简述:论文介绍了一种名为DVIS的解耦视频实例分割框架,将VIS分为三个子任务:分割、跟踪和细化。作者引入了一个新颖的引用跟踪器和时序细化器来构建DVIS框架,以解决现有方法在复杂和长视频上表现不佳的问题。DVIS在VIS和VPS上都取得了新的最先进的性能,并具有轻量级的优点,允许在单个GPU上进行高效训练和推理。

8.FastInst: A Simple Query-Based Model for Real-Time Instance Segmentation 【CVPR2023】

一种用于实时实例分割的简单查询模型

简述:论文提出了一种用于实时实例分割的简单查询模型框架FastInst,它可以在不使用非最大抑制(NMS)的情况下以端到端的方式执行,并在COCO测试集上达到超过40的AP和32.5 FPS的实时速度。作者提出了三个关键设计:实例激活引导查询、双路径更新策略和真实掩码引导学习,这些设计使得我们可以使用更轻量级的像素解码器和更少的Transformer解码器层,同时实现更好的性能。

9.E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation【CVPR2022】

一种基于端到端轮廓的高质量高速实例分割方法

简述:E2EC是一种全新的端到端轮廓基础的实例分割方法,它通过使用可学习的轮廓初始化、多方向对齐标签采样和动态匹配损失,实现了高质量的高速实例分割。在这种方法中,首先应用了一种新的可学习轮廓初始化架构来替代手动设计的轮廓初始化,该架构包括一个轮廓初始化模块用于构建更明确的学习目标,以及一个全局轮廓变形模块,可以更好地利用所有顶点的特征。其次,该方法还提出了一种名为多方向对齐的新型标签采样方案,以降低学习难度。最后,为了提高边界细节的质量,动态匹配预测的地面真实顶点对,并提出了相应的动态匹配损失函数。

10.Mask Transfiner for High-Quality Instance Segmentation【CVPR2022】

基于Transformer的高质量实例分割方法

简述:Mask Transfiner是一种用于高质量实例分割的方法,它将图像区域表示为四叉树,并使用Transformer处理易出错的节点。该方法可以以低计算成本预测高度准确的实例掩码,并在三个基准测试中优于当前实例分割方法。

11.SoftGroup for 3D Instance Segmentation on Point Clouds 【CVPR2022】

用于点云的三维实例分割SoftGroup

简述:作者提出了一种新的三维实例分割方法SoftGroup,它通过自底向上的软分组和自上而下的细化来解决现有方法中的问题。现有的最先进方法通常先进行语义分割,然后将每个点与单个类别相关联,但这些硬预测在执行语义分割时会产生误差,导致预测的实例与地面真实值之间的重叠度低,以及大量的误报。SoftGroup允许每个点与多个类别相关联,以减轻语义预测错误带来的问题,并通过学习将误报实例分类为背景来抑制误报实例。

12.OGC: Unsupervised 3D Object Segmentation from Rigid Dynamics of Point Clouds 【NeurIPS2022】

基于点云刚体动力学的无监督三维物体分割

简述:论文介绍了一种名为OGC的无监督三维物体分割方法,可以从原始点云中同时识别多个三维物体。该方法利用动态运动模式作为监督信号来自动发现刚体对象,不需要大量的人工注释来进行完全监督。该方法由三个主要组件组成:对象分割网络、辅助的自我监督场景流估计器和核心的对象几何一致性组件。通过精心设计一系列损失函数,该方法有效地考虑了多对象刚体一致性和对象形状不变性在时间和空间尺度上的影响。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“实例分割”领取论文原文及源码

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1249145.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# 时间计算(二)

目录 五、时间比较 六、时间数据转换 七、时间间隔计算 八、获取网络时间 九、时间戳 十、时区时间 结束 概述 在 C# 中,DateTime 用于处理日期和时间的内置类,其值范围为 00:00:00 (午夜) , 0001年1月1日&…

高压放大器应用领域分享:关于电磁波的极化,看这篇文章就够了!

谈到电磁波,除了频率和幅度之外,还有一个比较重要的方面就是:极化。极化,就是指波振动的平面,电磁波的传播是由相互垂直的电场和磁场产生的。因此存在电场和磁场两个相互垂直的振荡平面,所以呢,…

力扣 3. 无重复字符的最长子串

题目 题解 方法 public static int lengthOfLongestSubstring(String s) {HashSet<Character> charSet new HashSet<Character>();int i 0,l0,max0;for (int j 0; j < s.length(); j) {while (charSet.contains(s.charAt(j))) {charSet.remove(s.charAt(l…

一个干净的前端架构是什么样的?

干净的前端架构,围绕这个话题有很多原则&#xff1a; SOLID、KISS&#xff08;保持简单明了&#xff09;、DRY&#xff08;不要重复自己&#xff09;、DDD&#xff08;领域驱动设计&#xff09;等等。 为什么需要前端架构&#xff1f; 功能性和非功能性的要求不仅应该在后端…

如何处理git多分支

本篇文章主要处理以下两种多分支问题 如何将自己在本地的修改上传到一个新的Git分支&#xff08;比如用于测试&#xff0c;不合并进main分支&#xff09;&#xff1f;如何在一个新的本地仓库拉取一个项目的非main分支&#xff0c;并处理他们关联关系&#xff1f; 1. 将自己在…

智能条件单具体操作步骤,解放你投资双手!

一般我们说到量化交易都觉得很困难&#xff0c;写策略难&#xff0c;看python难&#xff0c;不会使用程序难&#xff0c;电脑交易不方便难&#xff0c;今天我们来看看手机电脑都可以使用的量化基础条件单的操作。迈入量化第一步&#xff0c;条件单的使用。 很多投资者不清楚条件…

C语言——输入一个4位正整数,输出其逆数。

#define _CRT_SECURE_NO_WARNINGS 1#include<stdio.h> int main() {int i,j 0;int a1,a2,a3,a4;printf("输入一个4位正整数&#xff1a;\n");scanf("%d",&i);a1 i/1000; a2 i/100%10; a3 i/10%10; a4 i%10; printf("千位a1%d,百位a…

SQL 语句 UNION 连接,查询字段数量必须一致

MySQL&#xff1a;The used SELECT statements have a different number of columns 执行SQL报错&#xff1a;The used SELECT statements have a different number of columns 以上翻译&#xff1a;使用的SELECT语句具有不同数量的列 原因&#xff1a;我们在 SQL 语句中使用…

Java 简单配置环境变量,切换多个jdk版本

文章目录 前言一、jdk下载二、配置环境变量三、查看jdk版本四、配置多个jdk五、切换jdk 前言 windows 配置jdk环境变量&#xff0c;如果项目没有规定使用的jdk版本的话&#xff0c;建议使用jdk8&#xff0c;这是最常用也是最稳定的版本 一、jdk下载 https://www.oracle.com/ja…

APP软件线上排查方法

在线上环境中排查APP软件的问题是一项关键任务&#xff0c;需要使用一系列方法和工具来识别、定位和解决问题。以下是一些建议的排查方法&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1.监控和日志…

38 关于 redo 日志

前言 undo 和 redo 是在 mysql 中 事务, 或者 异常恢复 的场景下面 经常会看到的两个概念 这里 来看一下 redo, redo 主要是用于 异常恢复 的场景下面 测试表结构如下 CREATE TABLE tz_test (id int(11) unsigned NOT NULL AUTO_INCREMENT,field1 varchar(128) DEFAULT NULL…

2023年【山东省安全员C证】考试试卷及山东省安全员C证考试试题

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2023年【山东省安全员C证】考试试卷及山东省安全员C证考试试题&#xff0c;包含山东省安全员C证考试试卷答案和解析及山东省安全员C证考试试题练习。安全生产模拟考试一点通结合国家山东省安全员C证考试最新大纲及山东…

测绘资质工程测量乙级资质办理条件

新测绘资质分为10个专业&#xff1a; 1.大地测量 2.测绘航空摄影 3.摄影测量与遥感 4.工程测量 5.海洋测绘 6.界线与不动产测绘 7.地理信息系统工程 8.地图编制 9.导航电子地图制作 10.互联网地图服务。 新《测绘资质管理办法》和《测绘资质分类分级标准》&#xff…

HTML5+CSS3+JS小实例:蜂巢里的小蜜蜂光标特效

实例:蜂巢里的小蜜蜂光标特效 技术栈:HTML+CSS+JS 效果: 源码: 【HTML】 <!DOCTYPE html> <html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"><meta name="viewport" conten…

quickapp_快应用_DOM是否显示只能通过if指令!

目录 官网概念语法拓展使用三元表达式控制示例 官网 if指令 概念 if条件指令用于控制是否增加或者删除组件。 语法 <组件名 ifbol><组件名>上述语法中只要bol值为ture则显示该组件&#xff0c;若是bol值为false则不显示该组件(并将其从DOM结构中移除)。 拓展…

软件测试工程师如何从功能测试转自动化测试?

一、学习自动化之前&#xff0c;大家需要先知道自动化测试是啥&#xff1f; 自动化测试是将人为测试情形转化为机器执行的过程。一般说来&#xff0c;测试用例设计后&#xff0c;由测试员根据测试用例中描述的规则一步步地进行测试&#xff0c;得到测试结果和预期结果的行为。…

9.9 Windows驱动开发:内核远程线程实现DLL注入

在笔者上一篇文章《内核RIP劫持实现DLL注入》介绍了通过劫持RIP指针控制程序执行流实现插入DLL的目的&#xff0c;本章将继续探索全新的注入方式&#xff0c;通过NtCreateThreadEx这个内核函数实现注入DLL的目的&#xff0c;需要注意的是该函数在微软系统中未被导出使用时需要首…

Redis之高并发超卖问题解决方案

目录 1. Redis高并发超卖问题解决方案 1.1 高并发场景超卖bug解析 1.2 Redisson 1. Redis高并发超卖问题解决方案 在高并发的秒杀抢购场景中&#xff0c;常常会面临一个称为“超卖”&#xff08;Over-Selling&#xff09;的问题。超卖指的是同一件商品被售出的数量超过了实…

Guacamole简介及centos7下搭建教程

简介 Guacamole是一款开源的远程桌面框架&#xff0c;它允许用户通过Web浏览器远程访问计算机资源。 官网地址&#xff1a;Apache Guacamole™ 官方文档&#xff1a;Installing Guacamole natively — Apache Guacamole Manual v1.5.3 架构 组件描述客户端浏览器用户通过支…

WebSocket 鉴权策略与技巧详解

WebSocket 作为实时通信的利器&#xff0c;越来越受到开发者的青睐。然而&#xff0c;为了确保通信的安全性和合法性&#xff0c;鉴权成为不可或缺的一环。本文将深入探讨 WebSocket 的鉴权机制&#xff0c;为你呈现一揽子的解决方案&#xff0c;确保你的 WebSocket 通信得心应…