Paper reading: segment anything in high quality NIPS2023

news2025/3/1 15:57:35

最近发展起来的SAM模型,表示分割模型的一个大的跃进,尤其是在零样本的能力和灵活提升方面。尽管利用1.1bollion的mask,SAM在掩码预测方面已经存在很大的问题,尤其是目标有着复杂结构的时候。

我们提出一个HA-SAM。

设计学习一个高质量的输出token,插入到SAM的掩码解码器中,来预测高质量的掩码。

SAM的各种变种模型,性能、速度、模型大小:

SAM模型包含三部分的组件:1) image encoder; 2) Prompt encoder; 3) Mask decoder

改进的HQ-SAM框架如下:

HQ-SAM引入HQ-Output Token and Global-local feature fusion to SAM来生成高质量的掩码图。

       通过利用和固定SAM的掩码decoder,一个新的可学习的HQ-Output Token (1-256)和SAM原有的SAM output Token(4*256)+prompt token (N*256), 三者联合在一起,输入到mask decoder中,更新HQ-Output Token。 利用三层MLP来生成动态卷积核,与那些融合的HQ-feature进行点乘,生成高质量的掩码。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1157980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2023腾讯云双11优惠价格表发布:轻量云服务器和CVM云服务器的优惠价格

双十一购物狂欢节即将来临,作为IT行业的从业者或企业用户,我们也可以享受到腾讯云在这个节日里带来的超值优惠。近日,腾讯云发布了2023年双十一优惠价格表,其中包括了轻量云服务器和CVM云服务器的各项优惠价格。本文将为您详细介绍…

labelme安装后无法启动

问题 labelme安装后无法启动,输入labelme后出现了如下错误信息: labelme : 无法将“labelme”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次。 所…

2023年10月文章一览

2023年10月编程人总共更新了6篇文章: 1.2023年9月文章一览 2.Programming abstractions in C阅读笔记:p161-p165 3.Programming abstractions in C阅读笔记:p166-p175 4.Programming abstractions in C阅读笔记:p176-p178 5.…

冒泡与捕获事件

一.冒泡与捕获 1.概念。 冒泡事件:微软公司提出的,事件由子元素传递到父元素的过程叫做冒泡(false)。 捕获事件:网景公司提出的,事件由父元素传递到子元素的过程叫做事件捕获(ture&#xff09…

晃电的原因以及如何治理?

安科瑞 须静燕 晃电的定义 国标GB/T 30137-2013 中定义:工频电压方均根值突然降至额定值的90%~10%,持续时间为10ms~ 1min后恢复正常的现象 晃电的原因 短路故障 绝缘闪络 大功率电机启动 雷击浪涌 进线失电时备自投或快切 晃电的危害 对公共用户影响较小 …

如何看待阿里云99元服务器新老用户同享?

如何看待阿里云99元服务器老用户可买?阿里云急了,阿里云老用户与狗的营销策略要被打破了吗?并且续费不涨价,依旧是99元,阿里云急了? 2023阿里云服务器优惠活动来了,以前一直是腾讯云比阿里云优…

2023年十大地推网推拉新接单平台,都是一手单和官方渠道

2023年做拉新推广的地推人员,一定不要错过这十个接单平台,助你轻松找到一手单,这10个平台分别是: (主推:聚量推客) 我们也拿到了一手邀请码:000000 1:聚量推客 “聚量推…

jsoncpp fatal error C1083: 无法打开编译器生成的文件

使用jsoncpp库的时候,在Debug模式下正常,但是release却报错,开始以为是开发项目设置问题,于是网络搜索,发现是jsoncpp的编译选项问题。 修改生成静态库文件的工程的属性:路径为:菜单&#xff0…

霍尔效应测试系统

霍尔效应是电磁效应的一种,这一现象是美国物理学家霍尔(E.H.Hall,1855—1938)于1879年在研究金属的导电机制时发现的。当电流垂直于外磁场通过半导体时,载流子发生偏转,垂直于电流和磁场的方向会产生一附加…

pytorch复现_IOU

定义了一个compute_iou函数,用于计算两个矩形框(boxA和boxB)之间的交并比(IOU,Intersection over Union)。IOU是一种常用的度量,用于评估两个矩形框的重叠程度。 在代码中,函数的输入…

网络安全漏洞管理与修复: 深入研究漏洞管理流程,包括漏洞扫描、评估、修复和验证。

网络安全是当今数字时代的重要议题,随着技术的不断发展,网络攻击和漏洞问题也日益复杂。在这篇文章中,我们将深入研究网络安全漏洞管理与修复的流程,包括漏洞扫描、评估、修复和验证。通过理解和实施这一流程,组织可以…

2023-10-31 LeetCode每日一题(每棵子树内缺失的最小基因值)

2023-10-31每日一题 一、题目编号 2003. 每棵子树内缺失的最小基因值二、题目链接 点击跳转到题目位置 三、题目描述 有一棵根节点为 0 的 家族树 ,总共包含 n 个节点,节点编号为 0 到 n - 1 。给你一个下标从 0 开始的整数数组 parents &#xff0…

Vue:实现输入vue组件名称,就可以从网页上加载出组件

作者:CSDN @ _乐多_ 本文记录了使用动态组件实现在网页上输入vue组件名称,就可以从网页上直接加载组件的功能的代码。 实现效果如下所示, 在许多Vue.js应用中,我们有大量的组件,但并不是每个组件都需要在应用初始化时加载。动态加载组件的好处包括: 减小初始加载时间:…

[已解决]Mysql想删掉一个表里所有的数据,直接删总是卡住

问题 产生"假锁" Mysql想删掉一个表里所有的数据,直接删总是卡住 思路 产生"假锁"原因 MySQL如果频繁的修改一个表的数据,那么这么表会被锁死。造成假死现象。在网上试过很多种解决方法,重启mysql服务,重连数据库都没有用。 温馨…

谷歌野心真不小!斥巨资扩张在人工智能界的战略地位,Anthropic公司成为跳板

原创 | 文 BFT机器人 近日,谷歌宣布对Anthropic进行重大投资,此举突显了谷歌这家科技巨头对人工智能 (AI) 的不断深化的承诺。此次,谷歌20亿美元的注资不仅增强了自身在快速发展的人工智能领域的立足点,而且标志着该行业动态的深…

[nodejs] 爬虫加入并发限制并发实现痞客邦网页截图

今晚想给偶像的相册截个图,避免某一天网站挂了我想看看回忆都不行,用的是js的木偶师来爬虫台湾的部落格,效果图大概是这样,很不错 问题来了.我很贪心, 我想一次性把相册全爬了,也就是并发 ,这个人的相册有19个!!我一下子要开19个谷歌浏览器那个什么进程, 然后程序就崩了, 我就想…

题号1577 E.迷宫plus (有趣的BFS练习)

题目:样例: 输入 1 5 5 LRLRL LLLLL RRRRR UUUUU UUUUD 输出 4 思路: 一般遇到坐标迷宫,基本上都是DFS 或者 BFS ,这里多了一个条件就是要最少修改操作数,所以我们DFS很难控制这一条件,通过 BF…

堆排序之“TOP-K”问题

目录 一、什么是TOP-K问题 二、解决思路 一般的正常思路: 最优的解决思路: 三、文件流中实践TOP-K方法 创建包含足够多整数的文件: 找出最大的K个数 完整版代码: 前面我已经学习过使用“堆排序”对数组排降序了&#xf…

Goby 漏洞发布|F5 BIG-IP AJP 身份认证绕过漏洞(CVE-2023-46747)

漏洞名称:F5 BIG-IP AJP 身份认证绕过漏洞(CVE-2023-46747) English Name:F5 BIG-IP AJP authentication bypass vulnerability (CVE-2023-46747) CVSS core: 10 影响资产数: 307282 漏洞描述: Cisco …