2023年4月份上新的视频领域分割模型设计系列论文(附下载链接)

news2024/11/24 21:04:23

来源:投稿 作者:王老师
编辑:学姐

论文1

论文标题:
Boosting Video Object Segmentation via Space-time Correspondence Learning

论文链接: https://arxiv.org/pdf/2304.06211v1.pdf
代码链接:暂未开源

作者单位:上海交通大学 & 浙江大学

发表于CVPR2023

当前领先的视频对象分割(video object segmentation,VOS)解决方案通常遵循基于匹配的机制:对于每个查询帧,根据其与先前处理的帧和第一个注释帧的对应关系来推断分割掩码。他们只是简单地利用来自地面实况掩码的监督信号来学习掩码预测,而不对时空对应匹配构成任何约束,然而,时空对应匹配是这种机制的基本组成部分。为了缓解这一关键但通常被忽视的问题,我们设计了一个感知对应关系的训练框架,该框架通过明确鼓励网络学习过程中的鲁棒对应关系匹配来促进基于匹配的VOS解决方案。通过在像素和对象级别上全面探索视频中的内在连贯性,我们的算法通过无标签的对比对应学习加强了掩码分割的标准、完全监督的训练。在训练过程中既不需要额外的注释成本,也不需要在部署过程中造成速度延迟,也不引起架构修改的情况下,我们的算法在四个广泛使用的基准测试上提供了坚实的性能提升,即DAVIS20162017,以及YouTube-VOS20182019,在著名的基于匹配的VOS解决方案之上。

论文2

论文标题: Two-shot Video Object Segmentation

论文链接: https://arxiv.org/abs/2303.12078
代码链接:https://github.com/yk-pku/Two-shot-Video-Object-Segmentation

作者单位:北京大学 & 微软亚洲研究院

发表于CVPR2023

先前关于视频对象分割(video object segmentation VOS)的工作是在密集注释的视频上进行训练的。然而,获取像素级别的注释是昂贵且耗时的。在这项工作中,我们证明了在稀疏注释的视频上训练令人满意的VOS模型的可行性——我们只需要每个训练视频两个标记的帧,同时保持性能。我们将这种新的训练范式称为两镜头视频对象分割,简称两镜头VOS。其基本思想是在训练期间为未标记的帧生成伪标签,并在标记和伪标记数据的组合上优化模型。我们的方法非常简单,可以应用于大多数现有框架。我们首先以半监督的方式在稀疏注释的视频上预训练VOS模型,第一帧总是标记的。然后,我们采用预训练的VOS模型为所有未标记的帧生成伪标签,然后将其存储在伪标签库中。最后,我们在标记和伪标记数据上重新训练了VOS模型,对第一帧没有任何限制。我们首次提出了一种在两次VOS数据集上训练VOS模型的通用方法。通过使用YouTube VOS和DAVIS基准的7.3%和2.9%的标记数据,我们的方法与在完全标记集上训练的方法相比,获得了可比的结果。

论文3

论文标题: Under Video Object Segmentation Section

论文链接: https://arxiv.org/abs/2303.07815
代码链接:暂未开源

作者单位:英国三星研究院

发表于CVPR2023

本文解决了在资源受限的设备(如手机)上进行半监督视频对象分割的问题。我们将这个问题公式化为一个蒸馏任务,从而证明具有有限内存的小型时空存储网络可以实现与现有技术相竞争的结果,但计算成本很低(在三星Galaxy S22上每帧32毫秒)。具体来说,我们提供了一个理论基础框架,将知识提取与监督对比表示学习相结合。这些模型能够共同受益于像素对比学习和来自预训练教师的提炼。我们通过在标准DAVIS和YouTube基准上实现具有竞争力的J&F以达到最先进水平来验证这一损失,尽管运行速度更快,且参数更少。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR”获取CV方向顶会必读论文

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/460288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

QGIS数据可视化学习笔记02——CSV数据和表连接

在其他的GIS软件中,表的连接操作是十分常用的操作,在QGIS中也是一样的,接下来我们介绍QGIS中属性表之间的连接以及如何添加CSV数据到属性表中。 1、表的连接 &emsp如关系型数据库一样,两表连接的前提是,两个表中都…

使用大模型进行代码阅读——关于LLaMA模型代码的一些思考

使用大模型进行代码阅读 关于LLaMA模型代码的一些思考 关于这个模型的代码其实挺简单的,如果了解transformer decoder的代码,这个代码理解起来相对会比较容易一些,但是在这个代码里面有几个问题,是自己的一些思考或者是疑问点吧…

【NLP教程】用python调用百度AI开放平台进行情感倾向分析

一、背景 Hi,大家!我是 马哥python说 ,一名10年程序猿。 今天我来演示一下:通过百度AI开放平台,利用python调用百度接口进行中文情感倾向分析,并得出情感极性分为积极、消极还是中性以及置信度结果。 二…

HTB-Cache

HTB-Cache 信息收集80端口 立足www-data -> ashash -> luffyluffy -> root 信息收集 80端口 主页是一些hacker的介绍。 作者介绍能收集可能的用户名ASH以及有一个其他项目可能有用,如下: “Check out his other projects like Cache:HMS(Hosp…

【Python小技巧】使用Gradio 构建基于ChatGPT的AI绘图 Web 应用(附源码)

文章目录 前言一、Gradio是什么?二、使用Gradio构建基于ChatGPT的 Web 应用1. 安装gradio库2. 安装openai库(ChatGPT的python库)3. Web 应用示例(源代码) 总结 前言 都说ChatGPT也可以生成图片,好奇的我也…

母婴市场竞争激烈,如何通过软文营销脱颖而出

如今,随着宝宝数量增加以及人们对孩子的重视程度的增加,母婴市场愈发火爆。然而,母婴行业的竞争也越来越激烈,企业需要不断开拓新市场才能生存。在这样的情况下,软文营销成为了母婴企业拓展市场的一种有效方式。 首先&…

Docker Compose的安装教程、使用教程示例

Docker Compose的安装教程、使用教程示例 安装教程下载修改权限创建软链测试是否安装成功 使用教程1: 定义python应用2.创建容器的Dockerfile文件3.定义docker-compose脚本web容器:redis容器: 4.使用Compose构建并运行您的应用程序5.访问浏览器 安装教程…

【人体姿态估计】(一)原理介绍

【人体姿态估计】(一)原理介绍 一、背景 人体姿态估计本质上是一个关键点检测的项目; 关键点检测在生活中的应用十分广泛,包括人脸识别、手势识别,而人体姿态估计则是对身体的关键点进行检测; 本文将介…

Python学习中更适合中国宝宝的报错整理~

人生苦短,我用python 最近有很多小伙伴说实在是看不懂报错的类型, 这次就给大家整理好了基本上玩python会遇到的报错问题 更适合中国宝宝体制喔~ python 安装包资料:点击此处跳转文末名片获取 在python中不同的异常可以用不同的类型 (pyt…

【Python小技巧】使用Gradio构建基于ChatGPT的 Web 应用(附源码)

文章目录 前言一、Gradio是什么?二、使用Gradio构建基于ChatGPT的 Web 应用1. 安装gradio库2. 安装openai库(ChatGPT的python库)3. Web 应用示例(源代码) 总结 前言 随着人工智能的不断发展,各种智能算法越…

爆料一家互联网中厂的年终奖,真香。

前不久刷到宇宙条32岁员工14万的月薪截图,突然想起来已经快四月底了,正是各大互联网公司年终奖开奖的时候,但相比以往,今年互联网圈好像安静了很多。各种“凡尔赛”的年终奖金额刷屏的情况不复存在。 各家大厂都暗戳戳地分完了奖…

js实现iframe框架的面包屑功能

js实现iframe框架的面包屑功能 什么是iframe框架什么是面包屑面包屑的js实现思路代码实现小结 什么是iframe框架 iFrame全称Inline Frame是HTML中的一个标签,用于在一个HTML文档中嵌入另一个HTML文档。iFrame框架可以将一个HTML文档嵌入到另一个HTML文档中的一个独…

后代选择器

知识点&#xff1a; 代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <meta http-equiv"X-UA-Compatible" content"IEedge"> <meta name"viewport" c…

深度学习入门到实践:相关基础概述

绪论 深度学习&#xff08;Deep Learning&#xff09;是近年来发展十分迅速的研究领域&#xff0c;并且在人工智能的很多子领域都取得了巨大的成功。从根源来讲&#xff0c;深度学习是机器学习的一个分支&#xff0c;是指一类问题以及解决这类问题的方法。     深度学习问题…

【Arduino SD卡和数据记录教程】

【Arduino SD卡和数据记录教程】 1. 前言2. 工作原理3. Arduino SD 卡模块代码4. Arduino SD卡数据记录1. 前言 在本Arduino教程中,我们将学习如何将SD卡模块与Arduino板一起使用。此外,结合DS3231实时时钟模块,我们将制作一个数据记录示例,将温度传感器的数据存储到SD卡中…

分布式消息队列Kafka(一)

一.kafka基础架构 &#xff08;1&#xff09;Producer&#xff1a;消息生产者&#xff0c;就是向 Kafka broker 发消息的客户端。 &#xff08;2&#xff09;Consumer&#xff1a;消息消费者&#xff0c;向 Kafka broker 取消息的客户端。 &#xff08;3&#xff09;Consumer…

每日一个小技巧:1分钟告诉你截图翻译软件哪个好用

随着互联网的发展&#xff0c;我们对各种语言文字的翻译需求越来越高。在翻译时&#xff0c;大家经常会遇到一些生词或专业术语&#xff0c;这时候我们就需要使用翻译软件来帮助理解。但是&#xff0c;有些时候大家需要翻译的内容并不是一段文本&#xff0c;而是一张图片或截图…

《前端bug齁逼多,真假开发说》2023/4/10-2023/4/18问题汇总

1 高德地图 运行抱错 INVALID_USER_SCODE 这里是错误信息对应原因 错误信息列表-参考手册-地图 JS API | 高德地图API 这里是高德地图api设置说明 准备-入门-教程-地图 JS API | 高德地图API 如果你自己能排查出错误 那不用看我的&#xff0c;如果都写的对还是抱错…

最常用的从A到Z的Linux命令,真的很好记,三分钟刷完!

Linux的命令行是一个非常强大的工具。如果你知道如何利用Linux命令&#xff0c;你可以轻松地在Linux系统中执行各种任务。在这篇文章中&#xff0c;我们将介绍从A到Z的Linux命令。 alias alias命令允许你为常用的命令设置一个短的别名&#xff0c;以节省时间和减少敲击。例如&…

界面开发框架Qt新手入门 - 自定义排序/筛选模型示例(一)

Qt 是目前最先进、最完整的跨平台C开发工具。它不仅完全实现了一次编写&#xff0c;所有平台无差别运行&#xff0c;更提供了几乎所有开发过程中需要用到的工具。如今&#xff0c;Qt已被运用于超过70个行业、数千家企业&#xff0c;支持数百万设备及应用。 自定义排序/筛选模型…