Segment-Anything的一些相关论文总结

news2024/11/17 11:25:19

1、 Segment Anything Model (SAM) Enhanced Pseudo Labels for Weakly Supervised Semantic Segmentation

Tianle Chen, Zheda Mai, Ruiwen Li, Wei-lun Chao

https://arxiv.org/abs/2305.05803

图像级监督的弱监督语义分割(WSSS)由于其标注成本较像素级标注低而受到越来越多的关注。大多数现有方法依赖于类激活图(Class Activation Maps, CAM)来生成像素级的伪标签进行监督训练。但是CAM经常会遇到部分激活——激活最具辨别性的部分而不是整个对象区域,以及错误激活——不必要地激活对象周围的背景。这篇论文引入了一种简单而有效的方法来解决这些限制,利用最近发布的SAM来生成更高质量的伪标签。SAM是一种分割基础模型,它在将图像分割成片段方面表现出较强的零样本能力,但缺乏对这些区域的语义标记。所以论文使用特定类的伪标签作为选择最相关掩码的信号,并标记它们以生成该类的精细伪标签。SAM生成的片段非常精确,从而大大改善了部分激活和错误激活。

2、Personalize Segment Anything Model with One Shot

Renrui Zhang, Zhengkai Jiang, Ziyu Guo, Shilin Yan, Junting Pan, Hao Dong, Peng Gao, Hongsheng Li

https://arxiv.org/pdf/2305.03048.pdf

SAM已经被证明是一个强大而快速的框架,彻底改变了分割模型。虽然SAM具有普遍性,但在没有人工提示的情况下为特定的视觉概念定制SAM仍然有待研究中。这篇论文提出了一种无需训练的SAM微调方法,称为PerSAM。只要给定一张带有参考掩码的图像,PerSAM首先通过位置先验定位目标概念,并通过三种技术将其分割到其他图像或视频中:目标引导注意力,目标语义提示和级联后细化。这样就可以在没有任何训练的情况下有效地将SAM进行定制化。

代码和演示发布在https://github.com/ZrrSkywalker/Personalize-SAM

3、Zero-shot performance of the Segment Anything Model (SAM) in 2D medical imaging: A comprehensive evaluation and practical guidelines

Christian Mattjie, Luis Vinicius de Moura, Rafaela Cappelari Ravazio, Lucas Silveira Kupssinskü, Otávio Parraga, Marcelo Mussi Delucis, Rodrigo Coelho Barros

https://arxiv.org/abs/2305.00109

医学成像中的分割是诊断、监测和治疗各种疾病和医疗条件的关键组成部分。医学分割领域由许多专门的深度学习模型主导,每个模型都针对特定的分割任务和图像模式进行了微调。SAM采用了ViT神经架构,并利用大量的训练数据集来分割几乎任何对象;但是其在医学领域的适用性尚未得到研究。这篇论文通过在四种成像方式(包括x射线、超声、皮肤镜和结肠镜)的六个数据集上实施八种不同的提示策略,探索了SAM在医学成像中的零样本性能

源代码以及演示:https://github.com/Malta-Lab/SAM-zero-shot-in-Medical-Imaging

4、Customized Segment Anything Model for Medical Image Segmentation

Author : Kaidong Zhang, Dong Liu

https://arxiv.org/abs/2304.13785

论文提出了医学图像分割的通用解决方案SAMed。SAMed以大规模图像分割模型segmentation Anything model (SAM)为基础,探索针对医学图像分割的定制化大规模模型的研究新范式。SAMed将低秩调优策略应用于SAM图像编码器,并在标记医学图像分割数据集上与提示编码器和掩码解码器一起进行调优。由于SAMed只更新SAM参数的一小部分,因此在实际使用中,它的部署成本和存储成本非常小。

SAMed的代码 https://github.com/hitachinsk/SAMed

5、An Empirical Study on the Robustness of the Segment Anything Model (SAM)

Yuqing Wang, Yun Zhao, Linda Petzold

https://arxiv.org/abs/2305.06422

SAM)是一般图像分割的基础模型,它主要在自然图像上表现出令人印象深刻的性能,但了解其对各种图像扰动和域的稳健性对于经常出现此类挑战的实际应用至关重要。这篇论文在不同的现实世界条件下对SAM进行了全面的稳健性调查。实验包含了大范围的图像扰动。并且实验结果表明,在扰动图像下,SAM的性能普遍下降,并且在不同的扰动下具有不同程度的脆弱性。但是通过定制提示技术和利用基于每个数据集独特特征的领域知识,可以增强模型对这些扰动的弹性,解决数据集特定的挑战。

6、A Comprehensive Survey on Segment Anything Model for Vision and Beyond

Chunhui Zhang, Li Liu, Yawen Cui, Guanjie Huang, Weilin Lin, Yiqian Yang, Yuehong Hu

https://arxiv.org/abs/2305.08196

SAM在打破分割边界方面取得了重大进展,极大地促进了计算机视觉基础模型的发展。为了充分理解SAM,论文进行了一项调查研究。作为第一个全面回顾基于SAM基础模型的任何视觉及其他任务分割进展的工作,通过讨论其历史发展,最新进展以及对广泛应用的深刻影响,重点关注其在各种任务和数据类型中的应用。首先介绍了包括SAM在内的基础模型的背景和术语,以及与SAM同时代的最先进的方法,这些方法对于分割任何任务都很重要。然后,分析和总结了SAM在各种图像处理应用中的优势和局限性,包括软件场景、现实场景和复杂场景。

https://avoid.overfit.cn/post/92f50aa2951d4dd89cfc4fe71e0531ef

作者:Monodeep Mukherjee

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/636908.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于react18.x和router v6创建一个简单的静态页面

基于react18.x和router v6创建一个简单的静态页面 效果示例图README.md学习网站创建项目安装react-router-dom v6依赖安装scss 项目目录路由router/index.jsApp.jsindex.js路由地址错误,打开404页面页面docs/index.jsx页面tutorial/index.jsx 效果示例图 README.md …

fio下发的请求大小不确定

fio下发的请求大小不确定 问题描述调用栈回顾nvme_set_queue_limits函数研究内核调用栈 问题描述 fio --filename/dev/xxx_dev --direct1 --rwwrite --bs1M --ioenginelibaio --iodepth1 --runtime60 --numjobs1 --time_based --group_reporting --name"test xxx" -…

第一课 django后端框架初始和安装

这里写目录标题 django是什么django 发展历史:django主要组件django的应用场景django的官网如下django的安装 django是什么 Django 是一个由 Python 编写的一个开放源代码的 Web 应用框架。 django 发展历史: Django 是从真实世界的应用中成长起来的,它是由堪萨斯…

你知道微信的转账是可以退回的吗

微信作为当今最受欢迎的即时通讯软件之一,其转账功能得到了广泛的应用。在使用微信转账时,我们可能会遇到一些问题,例如误操作、支付失败或者需要退款等等。 首先需要注意的是,微信转账退回的操作只能在“一天内未确认”时进行。如…

亚马逊美国站 幼儿床CPC认证 亚马逊审核标准ASTM F1821检测报告

婴儿床的作用 1、孩子单独睡觉可以锻炼他的独立能力; 2、与父母分开睡对孩子的呼吸好,空气流通的好,比较清新; 3、晚上睡觉时大人会压到宝宝,或者大人盖被子时可能不小心蒙住孩子的头,这都是非常危险的&…

数据存储:MySQL之MVCC

MVCC(Mutil-Version Concurrency Control),中文翻译为多版本并发控制。 MVCC只在repeatable read和read committed两个隔离级别下工作。其他两个隔离级别和MVCC不兼容。因为READ UNCOMMITTED 总是读取最新版本的数据,而不是符合当前事务版本的数据快照。…

势不可挡!实景三维新技术“踏足”新疆热土!

6月6日,众所瞩目的“全自主、全流程、全覆盖”2023实景三维新技术报告会乌鲁木齐站重磅召开。来自传统测绘、应急管理、水利、建筑工程等行业200多位专家、同仁、行业精英齐聚祖国西北边陲热土,共同交流实景三维新技术发展新趋势。 新疆维吾尔自治区测绘…

【Android开发基础】SQLite开发复刻通讯录、记事本、计算机

文章目录 一、引言二、设计1、通讯录(1)效果(2)思路(3)实现 2、记事本(1)效果(2)思路(3)实现 三、附件1、计算器UI界面设计2、源代码 …

这是国内“颜值最高”的大学生知识交流社区

【WRITE-BUG数字空间】要“颜值”有“颜值”,要“内涵”有“内涵”😎 界面UI紧随潮流、符合大学生的审美,功能更是完备: 👉 提供聊天大厅,即时群聊、畅所欲言 👉 提供协同编辑的云文档&#xff…

代码随想录| day11|栈与队列part02 ● 20. 有效的括号● 1047. 删除字符串中的所有相邻重复项● 150. 逆波兰表达式求值

20. 有效的括号 链接&#xff1a;代码随想录 阅读答案并二刷。 class Solution { public:bool isValid(string s) {int ns.size();int i0;//建立括号栈stack<char>sta;while(i<n){char temps[i];if(temp(||s[i]{||s[i][){sta.push(temp);}else{if(sta.empty()){return…

Halcon 光盘一维码识别 曲面一维码识别 识别光盘上的条形码(极坐标变换,将曲面的一维码转成矩形的一维条码)

文章目录 1 问题描述2 关键代码演示2.1 分割CD上包含条形码的环2.2 极坐标变换 将环状条码转成矩形条码3 完整代码1 问题描述 如图 识别光盘上的条形码 图片路径 C:\Users\hp\AppData\Roaming\MVTec\HALCON-22.11-Steady\examples\images2 关键代码演示 2.1 分割CD上包含条形…

项目管理专业人员能力等级评价CSPM(国标评级)你想知道的这都有

2021年10月&#xff0c;中共中央、国务院发布的《国家标准化发展纲要》明确提出构建多层次从业人员培养培训体系&#xff0c;开展专业人才培养培训和国家质量基础设施综合教育。建立健全人才的职业能力评价和激励机制。由中国标准化协会&#xff08;CAS&#xff09;组织开展的项…

Vue中如何进行文件预览与打印?

Vue中如何进行文件预览与打印&#xff1f; 在Vue应用中&#xff0c;有时我们需要实现文件预览和打印的功能。比如&#xff0c;我们可能需要预览并打印PDF文件、图片文件等。本文将介绍如何在Vue中实现文件预览和打印的功能&#xff0c;并提供相应的代码示例。 文件预览 PDF文…

“混战”大模型,知乎、小红书、快手各有所长

配图来自Canva可画 一直以来&#xff0c;追逐风口都是互联网企业的天性。因此&#xff0c;继元宇宙风口之后&#xff0c;横空出世并火遍全国的AIGC和ChatGPT&#xff0c;便又成为了各行业企业追逐的焦点。在此背景下&#xff0c;无论是国内互联网大厂&#xff0c;还是科技公司…

力扣笔记(每日随机一题)—— 打强整数

问题&#xff08;中等&#xff09; 给定三个整数x 、 y 和 bound &#xff0c;返回 值小于或等于 bound 的所有 强整数 组成的列表 。 如果某一整数可以表示为 x i y j x^i y^j xiyj &#xff0c;其中整数 i > 0 且 j > 0 i > 0 且 j > 0 i>0且j>0&a…

jmeter009:用户自定义变量

添加路径&#xff1a;线程组>配置元件>用户自定义变量 (用户自定义变量)元件的使用&#xff1a;

vue 打开重复页签

先上图 这两个红色框线实际都是产品详情页面&#xff0c;用产品名称替代了页面的title 1、首先在router/index.js配置路由 {path: /productDetail,component: Layout,hidden: true,children: [{path: productDetail/:productId(\\d), //必须该种方法传递参数component: () &…

超高频工业rfid读头对比高频读头有哪些优势?

超高频的工作频段主要在860MHz~960MHz之间&#xff0c;对比高频RFID来说&#xff0c;超高频技术的传输速度更快&#xff0c;读取距离也更远&#xff0c;批量群读的性能也更好&#xff0c;因此在工业、物流与供应链等领域都有非常广泛的应用。 超高频工业rfid读头对比高频读头有…

Java通过jni调用C语言函数,IntelliJ IDEA,CLion,动态链接库dll,本地方法,native

Java通过jni调用C语言函数 使用的工具 IntelliJ IDEACLion 开始之前的注意事项 确保安装了mingw并配置了环境变量&#xff08;下载地址&#xff1a;https://udomain.dl.sourceforge.net/project/mingw-w64/Toolchains%20targetting%20Win64/Personal%20Builds/mingw-builds…

【2023】华为OD机试真题Java CC++ Python JS Go-题目0245-信号发射和接收

题目0245-信号发射和接收 题目描述 有一个二维的天线矩阵,每根天线可以向其他天线发射信号,也能接收其他天线的信号,为了简化起见,我们约定每根天线只能向东和向南发射信号,换言之,每根天线只能接收东向或南向的信号。 每根天线有自己的高度anth,每根天线的高度存储在…