SAM Segment Anything

SAM Segment Anything

news2025/4/17 3:44:25

https://arxiv.org/pdf/2304.02643v1.pdf

包含三个主题：Task、Model、Data

Task（任务）：

需要定义一个足够通用的图像分割任务，可以提供一个强大的预训练目标，并支持广泛的下游应用程序。

Model（模型）：

模型一共包含三个部分：image encoder, prompt encoder, mask decoder

data（数据集）：

SA-1B

上述三者之间的关系：先定义了图像分割任务之后，需要用模型来演绎，但是训练模型又需要数据集，然后没有现成的具有很多mask的数据集，就干脆用 data engine 来边生成数据边改进模型。

模型架构

image encoder为图像生成一次性的embedding，而 prompt encoder 将 prompt 实时的转换为嵌入向量。然后将这两个信息源组合在一个预测分割mask的轻量级mask解码器中。计算之后，SAM就可以在50ms内根据浏览器中的任何提示生成一个分割。

数据集

标注者使用 SAM 交互地注释图像，之后新注释的数据又反过来更新 SAM，可谓是相互促进。

使用该方法，交互式地注释一个掩码只需大约 14 秒。与之前的大规模分割数据收集工作相比，Meta 的方法比 COCO 完全手动基于多边形的掩码注释快 6.5 倍，比之前最大的数据注释工作快 2 倍，这是因为有了 SAM 模型辅助的结果。

最终的数据集超过 11 亿个分割掩码，在大约 1100 万张经过许可和隐私保护图像上收集而来。SA-1B 的掩码比任何现有的分割数据集多 400 倍，并且经人工评估研究证实，这些掩码具有高质量和多样性，在某些情况下甚至在质量上可与之前更小、完全手动注释的数据集的掩码相媲美。

我认为这篇文章比较厉害的点：

Data Engine

可以边生成数据，边用这个数据改进模型，然后在用这个模型生成数据，迭代迭代迭代……

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/449373.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

mybatis的参数处理详解

mybatis的参数处理详解

mybatis的参数处理详解 parameterType配置参数 1、参数的使用说明使用标签的 parameterType 属性来设定。该属性的取值可以是基本类型，引用类型（例如:String 类型），还可以是实体类类型（POJO 类）。同时也…

阅读更多...

C++学习：类和对象(上)

C++学习：类和对象(上)

类和对象这是C这样的面向对象的语言具有的特性，相较于C语言来说，更加方便的去编写代码，调用代码。当需要大量重复的调用同一个函数的时候，我们每创建一个函数，就会建立一个栈帧，这样对于空间来讲不友好…

阅读更多...

【南京大学PA】 PA0 环境配置 lab （vim | gcc | lab）

【南京大学PA】 PA0 环境配置 lab （vim | gcc | lab）

本文章学习NJU 的 PA 课程记的笔记南大PAWLS空间管理注意事项 whoami 指令显示你当前的用户IDsudo whoami linux配置 cpp 环境 apt-get install build-essential # build-essential packages, include binary utilities, gcc, make, and so on apt-get install man …

阅读更多...

高效办公——Excel表格-03篇（Excel常用快捷键以及 Excel快捷键结合公式的各种常见的办公例子）

高效办公——Excel表格-03篇（Excel常用快捷键以及 Excel快捷键结合公式的各种常见的办公例子）

高效办公——Excel表格-03篇（Excel常用快捷键以及 Excel快捷键结合公式的各种常见的办公例子） 1. commandE（Windows系统：ctrlE）——快速分列/重组2. 高效复制的快捷键2.1 command D（快速复制上一单元格的…

阅读更多...

面试篇：MySQL

面试篇：MySQL

一、如何定位慢查询 1、慢查询原因： 聚合查询多表查询表数据量过大查询深度分页查询表现：页面加载慢、接口无响应，或者响应时间过长（超过1s） 2、如何定位慢查询 3、面试官：MySQL中，如何定…

阅读更多...

Leetcode-day4【88】【167】【125】【345】

Leetcode-day4【88】【167】【125】【345】

文章目录 88. 合并两个有序数组题目解题思路解题思路【学习】尾插入法 167. 两数之和 II - 输入有序数组题目解题思路 125. 验证回文串题目解题思路 345. 反转字符串中的元音字母题目解题思路 88. 合并两个有序数组题目给你两个按非递减顺序排列的整数数组 nums1 和 nums…

阅读更多...

Nacos封装通用HttpClient

Nacos封装通用HttpClient

一、Nacos下Http请求设计众多处理模块处理，包括更新、Prometheus监控等众多功能，Nacos对这块做了统一封装，扩展性也很好，有新旧版本和同步和异步版本. 二、具体封装模块. 1、引入依赖如下. <dependency><groupId>co…

阅读更多...

C++ STL学习之【反向迭代器】

C++ STL学习之【反向迭代器】

✨个人主页： 夜默 🎉所属专栏： C修行之路 🎊每篇一句： 图片来源 A year from now you may wish you had started today. 明年今日，你会希望此时此刻的自己已经开始行动了。文章目录 🌇前言&a…

阅读更多...

[持续更新]mac使用chatgpt的几种方法~

[持续更新]mac使用chatgpt的几种方法~

1. monica 使用edge浏览器或者chrome浏览器，直接在官网下载即可，网址直通： bing: https://www.microsoft.com/zh-cn/edge/download?formMA13FJ google： Google Chrome 网络浏览器备注：你需要先搭上梯子哈安装打…

阅读更多...

【数据库多表操作】sql语句基础及进阶

【数据库多表操作】sql语句基础及进阶

常用数据库： 数据库（Database）是按照数据结构来组织、存储和管理数据的仓库，它是长期存储在计算机内、有组织、有结构的数据集合。数据库是信息系统的核心部分，现代软件系统中大量采用了数据库管理系统（DBM…

阅读更多...

Windows下 influxdb 数据库安装和简单使用

Windows下 influxdb 数据库安装和简单使用

步骤 1：安装 InfluxDB 你可以从 InfluxDB 的 InfluxDB官网winndows二进制安装包下载适用于不同操作系统的 InfluxDB 安装包。在本教程中，我们将介绍在 Windows上安装 InfluxDB 的步骤。如果所示，可以点击下载windows版本的安卓版&#xff…

阅读更多...

VSCode编译器环境下，基于vite+vue调试Cesium

VSCode编译器环境下，基于vite+vue调试Cesium

VSCode编译器环境下，基于vitevue调试Cesium 1.创建一个vite项目以官网作为参考：创建项目 # npm 6.x npm create vitelatest my-vue-app --template vue# npm 7, extra double-dash is needed: npm create vitelatest my-vue-app -- --template vue#…

阅读更多...

https页面加载http资源的解决方法

https页面加载http资源的解决方法

文章目录 1.报错如图2.项目背景3.网上的解决方案4.我的最终解决方案 1.报错如图 2.项目背景我们的项目采用的全是https请求，而使用第三方文件管理器go-fastdfs，该文件管理器返回的所有下载文件的请求全是http开头的，比如http://10.110.38.25…

阅读更多...

计算机组成原理/数据库补充存储器第四章---虚拟内存

计算机组成原理/数据库补充存储器第四章---虚拟内存

刚刚数据库下课讲了很多有关虚拟内存的东西感觉很多都忘了，现在写这篇文章来复习一下为什么要引入虚拟内存在计算机系统中，多个进程共享CPU和内存， 如果太多的进程需要过多的内存空间，那么其中一部分进程就会无法或得足够得空…

阅读更多...

2023年网络安全比赛--Windows渗透测试中职组（超详细）

2023年网络安全比赛--Windows渗透测试中职组（超详细）

一、竞赛时间 180分钟共计3小时二、竞赛阶段 1.通过本地PC中渗透测试平台Kali对服务器场景20221219win进行系统服务及版本扫描渗透测试，并将该操作显示结果中1433端口对应的服务版本信息作为Flag值（例如3.1.4500）提交； 2.通过本地PC中渗透测试平台Kali对服务器场景202212…

阅读更多...

chatgpt智能提效职场办公-ppt怎么全屏

chatgpt智能提效职场办公-ppt怎么全屏

作者：虚坏叔叔博客：https://xuhss.com 早餐店不会开到晚上，想吃的人早就来了！😄 在PowerPoint中，可以通过以下几种方法将演示文稿切换到全屏模式： 方法1：按F5键在编辑演示文稿的状…

阅读更多...

基于LS1028 TSN 交换机硬件系统设计与实现(二）

基于LS1028 TSN 交换机硬件系统设计与实现(二）

3.1 LS1028A 芯片研究目前市面上支持 TSN 系统的芯片较少，其中两家较大的公司之一博通 （ Broadcom ） 2017 年推出了 StrataConnect BCM53570 系列的以太网交换机，该系列支持的新技术旨在帮助用户应对物联网、汽车网络和…

阅读更多...

mybatis的原理详解

mybatis的原理详解

mybatis的原理详解原理图执行的原理图如下图所示： 配置文件分析 config.xml: <?xml version"1.0" encoding"UTF-8"?> <!DOCTYPE configurationPUBLIC "-//mybatis.org//DTD Config 3.0//EN""http://mybatis.or…

阅读更多...

PTA L1-091 程序员买包子 (10 分)

PTA L1-091 程序员买包子 (10 分)

这是一条检测真正程序员的段子：假如你被家人要求下班顺路买十只包子，如果看到卖西瓜的，买一只。那么你会在什么情况下只买一只包子回家？ 本题要求你考虑这个段子的通用版：假如你被要求下班顺路买 N N N 只包子&#x…

阅读更多...

华为云上云实践（二）：Linux 环境下对云硬盘 EVS 的创建、挂载和初始化

华为云上云实践（二）：Linux 环境下对云硬盘 EVS 的创建、挂载和初始化

本文主要讲解华为云云硬盘 EVS 的在 Linux 操作系统 EC2 服务器上创建、挂载及云硬盘初始化等基本操作，快速掌握华为云云硬盘 EVS 操作方法。 How to attach new Huawei EVS Volume 文章目录一、前言二、环境准备与造作步骤2.1 本文实践操作的环境2.2 本文实践操作…

阅读更多...

推荐文章

最新文章