【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(7 月 3 日论文合集)

news2025/1/22 20:02:05

文章目录

  • 一、分割|语义相关(4篇)
    • 1.1 SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs
    • 1.2 Achieving RGB-D level Segmentation Performance from a Single ToF Camera
    • 1.3 Topological Data Analysis Guided Segment Anything Model Prompt Optimization for Zero-Shot Segmentation in Biological Imaging
    • 1.4 ReMaX: Relaxing for Better Training on Efficient Panoptic Segmentation

一、分割|语义相关(4篇)

1.1 SPAE: Semantic Pyramid AutoEncoder for Multimodal Generation with Frozen LLMs

SPEA:用于冷冻LLMS多模式生成的语义金字塔自动编码器

论文地址:

https://arxiv.org/abs/2306.17842

在这里插入图片描述
在这项工作中,我们介绍语义金字塔自动编码器(SPAE),使冻结的LLM执行理解和生成任务涉及非语言形式,如图像或视频。SPAE在原始像素和从LLM的词汇表中提取的可解释词汇标记(或词)之间进行转换。由此产生的令牌捕获视觉重建所需的语义含义和细粒度的细节,有效地将视觉内容翻译成LLM可理解的语言,并使其能够执行广泛的多模态任务。我们的方法是验证通过上下文学习实验冻结PaLM 2和GPT 3.5对一组不同的图像理解和生成任务。我们的方法标志着第一次成功的尝试,使冻结的LLM生成图像内容,同时超越最先进的性能,在图像理解任务,在相同的设置下,超过25%。

1.2 Achieving RGB-D level Segmentation Performance from a Single ToF Camera

在一台TOF摄像机上实现RGB-D级分割性能

论文地址:

https://arxiv.org/abs/2306.17636

在这里插入图片描述
深度是计算机视觉中非常重要的模态,通常用作RGB的补充信息,由RGB-D相机提供。在这项工作中,我们表明,它是可能的,以获得相同水平的准确性RGB-D相机的语义分割任务,使用红外(IR)和深度图像从一个单一的飞行时间(ToF)相机。为了融合ToF相机的IR和深度模态,我们引入了一种在多任务学习框架中利用深度特定卷积的方法。在我们对车内分割数据集的评估中,我们证明了我们的方法与成本更高的RGB-D方法的竞争力。

1.3 Topological Data Analysis Guided Segment Anything Model Prompt Optimization for Zero-Shot Segmentation in Biological Imaging

拓扑数据分析引导下的分割任意模型生物成像中Zero-Shot分割的即时优化

论文地址:

https://arxiv.org/abs/2306.17400

在这里插入图片描述
机器学习中新兴的基础模型是在大量数据上训练的模型,这些数据已被证明可以很好地推广到新任务。通常,这些模型可以通过多模态输入来提示,这些输入范围从图像上的自然语言描述到点云。在本文中,我们提出了拓扑数据分析(TDA)引导的即时优化分段任何模型(SAM),并显示了初步的结果,在生物图像分割域。我们的方法取代了标准的网格搜索方法,在原来的实现中使用,并发现点的位置,基于它们的拓扑意义。我们的研究结果表明,TDA优化的点云更适合于寻找小对象,并大规模降低了计算复杂性,尽管需要许多分割的场景中的额外步骤。

1.4 ReMaX: Relaxing for Better Training on Efficient Panoptic Segmentation

REMAX:放松以获得更好的有效全景分割训练

论文地址:

https://arxiv.org/abs/2306.17319

在这里插入图片描述
本文提出了一种新的机制,以促进有效的全景分割,民主化其部署的掩模Transformers的培训。我们观察到,由于其高复杂性,全景分割的训练目标将不可避免地导致更高的假阳性惩罚。这种不平衡损耗使得基于端到端掩模变压器的架构的训练过程变得困难,特别是对于高效模型。在本文中,我们提出了ReMaX,它在全景分割的训练过程中为掩模预测和类预测添加了松弛。我们证明,通过这些简单的放松技术在训练过程中,我们的模型可以不断提高一个明确的保证金\textbf{没有}任何额外的计算成本的推断。通过将我们的方法与MobileNetV 3-Small等高效骨干相结合,我们的方法在COCO,ADE 20 K和Cityscapes上实现了高效的全景分割的最新结果。代码和预先训练的检查点将在\url{https://github.com/google-research/deeplab2}上提供。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/718243.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++笔记之各种sleep方法总结

C笔记之sleep总结 —— 2023年4月9日 小问 上海 code review 文章目录 C笔记之sleep总结1.std::this\_thread::sleep\_for()附:std::this\_thread::sleep\_for(std::chrono::duration) 2.std::this\_thread::sleep\_until()附:std::this\_thread::sleep\…

c# 与单片机之间 float与byte的相互转化

该章作为 串口调试助手及结构体的收发的补充,主要用于自定义协议中的负数,浮点数等的收发(我们以前用的浮点数等,是直接使用的字符串的收发,从字符串中进行解析的,这里主要使用十六进制,对其收发原理及使用操作进行剖析)。 虚拟串口调试助手 一般来说,电脑的外部设备…

杂记 | 使用keycloak实现SSO单点登录(新手向,概念、原理、逻辑、详细步骤、难点解释)

文章目录 01 单点登录的概念02 keycloak的中的相关概念2.1 概念之间的关系2.2 案例说明 03 如何使用keycloak实现单点登录3.1 步骤与效果说明3.2 环境说明 04 操作步骤4.1 在服务器上创建并启动keycloak服务4.2 创建一个领域4.3 创建一个客户端4.4 获取客户端适配器配置4.5 创建…

C. Logo Turtle (DP,思维)

传送门 题意: 给一个含有T、F的字符串,T表示转向,F表示前进1格。现在可以把其中的T改为F,或F改为T,改变n次(可重复改变某一位置的字母),问相对于起点最远能走多远。 思路&#xff…

quilt data 安装 数据包 框架

安装 Quilt 有两个用户可见的组件: 一个 Python 客户端一个 Web 目录 Python 客户端 需要 Python 3.7 或更高版本。 $ pip install quilt3[pyarrow]Mental Model Quilt 数据包的思维模型 Quilt 将数据集表示为数据包。一个数据包是一个不可变的相关文件集合&a…

Redis的主从复制、哨兵、cluster集群

Redis 主从复制 主从复制,是指将一台Redis服务器的数据,复制到其他的Redis服务器。前者称为主节点(Master),后者称为从节点(Slave);数据的复制是单向的,只能由主节点到从节点。 默认情况下,每台Redis服务…

JAVA关于多线程的学习

1.创建线程的方法(这里不考虑继承Thread类) 通过实现Runnable接口的方式实现 public class MyRunnable implements Runnable{Overridepublic void run() {for (int i 0; i < 5; i) {System.out.println(Thread.currentThread().getName()"执行了....");}} }pub…

基于.Net Core微服务-第1章:说明及技术栈

微服务是一种架构模式&#xff0c;提倡将单一应用程序划分为一组小的服务&#xff0c;服务相互协调、互相配合&#xff0c;为用户提供最终价值。

vulnhub-ripper(易)

打靶练习Ripper&#xff0c;这是一个中低的靶场 0x00 部署0x01 信息收集&#xff1a;端口扫描、服务发现0x02路径扫描0x03 总结 0x00 部署 靶机&#xff1a;下载地址 宿主机&#xff1a;kali2021版本 0x01 信息收集&#xff1a;端口扫描、服务发现 sudo arp-scan -l #探测存…

【每日随笔】摩托车驾驶 ④ ( 德州增驾摩托车 D 本记录 | 考场位置 “ 德州市公安局交警支队直属四大队车辆管理所 “ )

文章目录 一、进入考场二、科目一三、科目二1、推车 ( 找准车辆停放位置 )2、上车前检查 ( 开始考试前准备 )3、科目二考试开始4、科目二路线要求5、坡起6、绕桩7、单边桥 四、科目三教学1、推车 ( 找准车辆停放位置 )2、上车前检查 ( 开始考试前准备 )3、科目三考试开始4、科目…

NSS [SWPUCTF 2021 新生赛]Do_you_know_http

NSS [SWPUCTF 2021 新生赛]Do_you_know_http 先看题目&#xff0c;应该是伪造XFF&#xff0c;UA等东西。 postman一把梭。

Bootloader Design of PIC18 series MCU

注意&#xff1a;下列描述是在PIC单片机上启用Bootloader的一个相关知识的近似完备集。所有需要了解的&#xff0c;bootloader与用户态程序交互的理论知识都已给出。 1.概述 嵌入式产品化后&#xff0c;需要考虑现场升级&#xff0c;单片机如果需要添加现场升级功能&#xff…

linux+win——嵌套虚拟机性能测试

参考博文&#xff1a;CSDN-Violent-Ayang&#xff08;作者&#xff09;-UNIX BENCH详细安装及使用步骤 unix bench wget http://175.6.32.4:88/soft/test/unixbench/unixbench-5.1.2.tar.gz tar -xzvf unixbench-5.1.2.tar.gz cd unixbench-5.1.2 vim Makefile # 将 Makefile 中…

虹科方案 | Redis Enterprise:适用于任何企业的矢量数据库解决方案

用户希望他们遇到的每个应用程序和网站都具有搜索功能。然而&#xff0c;超过80%的业务数据是非结构化的&#xff0c;以文本、图像、音频、视频或其他格式存储。因此&#xff0c;我们需要一种跨非结构化数据的搜索方式。 什么是矢量数据库&#xff08;vector database&#xff…

【自动化测试教程】 —— pytest 框架详解 ~

pytest框架 特点: 容易上手, 入门简单, 文档丰富, 文档中有很多参考案例支持简单的单元测试和复杂的功能测试支持参数化执行测试用例过程中, 支持跳过操作支持重复失败的case支持运行Nose, unittest编写测试用例pytest支持很多第三方插件方便和持续集成工具集成 1. pytest断…

如何搭建独享的IP代理池?

随着互联网技术的日趋成熟&#xff0c;爬虫已经成为一种常见的数据获取方法。在采集业务中&#xff0c;建立本地IP代理池是非常重要的。今天将与您探讨IP代理池的选择以及如何搭建独享的IP代理池。 独享IP代理池是指由客户单独使用的IP池&#xff0c;优点是客户可以享受池中所…

关于opencv中cv2.imread函数读取的图像shape问题

图像坐标系是&#xff08;w,h&#xff09;,w为x轴&#xff0c;h为y轴,(x,y) 但opencv读出来的数组却正好相反&#xff0c;是&#xff08;h,w,3&#xff09;,(y,x,3) 所以这里会有一个转换 image cv2.imread(1.jpg) print(image.shape[0:2]) ##输出&#xff08;365,500&#x…

【操作系统】Linux编程 - 多线程的创建和使用 II (临界区 、互斥量、信号量的使用)

临界区的概念 之前的实例中我们只尝试创建了1个线程来处理任务&#xff0c;接下来让我们来尝试创建多个线程。 不过&#xff0c;还是得先拓展一个概念——“临界区” 临界区指的是一个访问共用资源&#xff08;例如&#xff1a;共用设备或是共用存储器&#xff09;的程序片段&…

哈工大计算机网络课程网络层协议详解之:Internet路由BGP协议详解

哈工大计算机网络课程网络层协议详解之&#xff1a;BGP协议详解 在之前的网络层协议中&#xff0c;我们介绍了Internet网络两个自治系统内的路由协议&#xff1a;RIP协议和OSPF协议。这两个协议应该来说是自治系统内协议的两个代表性协议&#xff0c;前一个基于距离向量路由算…

优化内存利用:深入了解垃圾回收算法与回收器

&#x1f52d; 大家好&#xff0c;我是 vnjohn&#xff0c;在互联网企业担任 Java 开发&#xff0c;CSDN 优质创作者 &#x1f4d6; 推荐专栏&#xff1a;Spring、MySQL、Nacos、Java&#xff0c;后续其他专栏会持续优化更新迭代 &#x1f332;文章所在专栏&#xff1a;JVM &am…