万物分割SAM家族越发壮大！HQ-SAM、FastSAM 和 FasterSAM(MobileSAM)

news2025/1/10 16:57:12

卧剿，6万字！30个方向130篇！CVPR 2023 最全 AIGC 论文！一口气读完。

1、（更高质量）Segment Anything in High Quality

最近的 Segment Anything Model (SAM) 代表了分割模型的一大飞跃，有强大的零样本功能和灵活的提示。尽管11亿个掩码的训练，但 SAM 的掩码预测质量在许多情况下仍不尽如人意，尤其是在处理具有复杂结构的物体时。本文提出 HQ-SAM，使 SAM 具备准确分割任何对象的能力，同时保持 SAM 原有的提示设计、效率和零样本泛化能力。代码：https://github.com/SysCV/SAM-HQ

一分钟讲解SAM-HQ视频：

2、（加快）Fast Segment Anything

最近提出的万物分割模型(SAM)在许多计算机视觉任务中产生了重大影响。它正在成为许多高级任务的基础步骤，如图像分割、图像描述和图像编辑。然而，其巨大的计算成本阻碍了其在工业场景中的广泛应用。计算主要来自高分辨率输入的Transformer架构。

本文提出一种加速替代方法。发现具有实例分割分支的常规CNN检测器也可以很好地完成该任务。具体而言，将该任务转换为研究得很好的实例分割任务，并仅使用SAM作者发布的SA-1B数据集的1/50直接训练现有的实例分割方法。方法以高50倍的运行时速度实现了与SAM方法相当的性能。代码在https: //github.com/CASIA-IVA-Lab/FastSAM

一分钟讲解FastSAM视频：

3、（更快++）FASTER SEGMENT ANYTHING: TOWARDS LIGHTWEIGHT SAM FOR MOBILE APPLICATIONS

分割任何模型（SAM）是一种基于提示prompt的视觉基础模型，用于从其背景中剪切出感兴趣的对象。自Meta研究团队发布以来，SAM以其出色的零样本迁移性能和与其他模型的高度兼容性引起了广泛关注，用于高级视觉应用程序，如具有细粒度控制的图像编辑。这样的许多用例需要在资源受限的边缘设备上运行，如移动应用程序。这项工作通过用轻型图像编码器替换笨重高消耗图像编码器来使SAM对移动设备友好。

https://github.com/ChaoningZhang/MobileSAM

一分钟讲解MobileSAM视频：

关注公众号【机器学习与AI生成创作】，更多精彩等你来读

深入浅出stable diffusion：AI作画技术背后的潜在扩散模型论文解读

深入浅出ControlNet，一种可控生成的AIGC绘画生成算法！

经典GAN不得不读：StyleGAN

戳我，查看GAN的系列专辑~！

一杯奶茶，成为AIGC+CV视觉的前沿弄潮儿！

最新最全100篇汇总！生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

ICCV 2021 | 35个主题GAN论文汇总

超110篇！CVPR 2021最全GAN论文梳理

超100篇！CVPR 2020最全GAN论文梳理

拆解组新的GAN：解耦表征MixNMatch

StarGAN第2版：多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云：独学而无友，则孤陋而寡闻

点击一杯奶茶，成为AIGC+CV视觉的前沿弄潮儿！，加入 AI生成创作与计算机视觉 知识星球！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/709111.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

从零实现深度学习框架——Seq2Seq机器翻译实战

从零实现深度学习框架——Seq2Seq机器翻译实战

引言本着“凡我不能创造的，我就不能理解”的思想，本系列文章会基于纯Python以及NumPy从零创建自己的深度学习框架，该框架类似PyTorch能实现自动求导。 💡系列文章完整目录： 👉点此👈 要深入理解…

阅读更多...

【你哥电力电子】 THE BUCK-BOOST 升降压斩波电路2

【你哥电力电子】 THE BUCK-BOOST 升降压斩波电路2

BUCK-BOOST电路2 2023年1月30日 nige in Tongji University #elecEngeneer 上链文章目录 BUCK-BOOST电路26. CCM非理想能量守恒平均分析6.1 CCM非理想大信号平均模型6.2 CCM等效大信号平均模型6.3 CCM的DC电路模型6.4 CCM的小信号线性电路模型6.5 CCM非理想小信号传递函数6.…

阅读更多...

【SaaS】多租户系统设计

【SaaS】多租户系统设计

文章目录多租户系统设计一、SaaS 的系统分级二、应用程序必须支持多租户三、数据隔离方案3.1、独立应用独立库3.2、同一个应用程序，每个租户一个库3.3、同一个应用程序，同一个数据库3.4、分片多租户四、我们的模型选择4.1、开发实践4.2、元数据/配置驱…

阅读更多...

vue路由传参+案例（使用mock模拟后端数据）

vue路由传参+案例（使用mock模拟后端数据）

路由传参跳转路由时，可以给路由对应的组件内传参声明式导航 /path?参数名值 /path/值 —需要路由对象提前配置 path: ‘/path/:参数名’ 对应的页面组件接收传递过来的值 $route.query.参数名 $route.params.参数名 router/index.js import Vue from vue // 1. …

阅读更多...

解析matlab的audioread()输入输出参数

解析matlab的audioread()输入输出参数

目录一、API简介二、实验 1. matlab 2. C语言一、API简介链接如下： 读取音频文件 - MATLAB audioread- MathWorks 中国也可以浏览最新的英文版API说明： 简单说明如下： 1. 读取wav格式的文件，会自动跳过44个字节的文件…

阅读更多...

初识React/JSX/组件/state/受控组件

初识React/JSX/组件/state/受控组件

JSX 推荐使用小括号包裹jsx 使用函数创建组件使用类创建组件抽离组件事件绑定事件对象有状态和无状态组件/state 抽离事件处理程序表单元素受控组件多表单优化非受控组件(了解即可)

阅读更多...

vhost-net-原理-初始化流程-数据传输流程-vhost-net后端

vhost-net-原理-初始化流程-数据传输流程-vhost-net后端

文章目录 1.vhost net2.vhost-net的初始化流程vhost net设置vhost dev设置vhost vring设置 3.数据收发流程分析3.1 数据发送3.2 数据接收 4ioventfd和irqfd的通知机制4.1ioeventfdqemu侧kvm侧总体效果 4.2irqfdqemu侧kvm侧总体效果参考： 1.vhost net 传统的virtio…

阅读更多...

ChatGPT Plugins内幕、源码及案例实战（一）

ChatGPT Plugins内幕、源码及案例实战（一）

ChatGPT Plugins内幕、源码及案例实战 6.1 ChatGPT Plugins的工作原理本节主要跟大家谈ChatGPT的插件（Plugins），这个内容非常重要。现在很多企业级的开发，一般都会基于ChatGPT 插件进行一些服务的封装，相当于开发了一个代理（Agent），把一些服务或者API封装在里面，然后…

阅读更多...

eclipse编辑器汉化；eclipse安装中文插件

eclipse编辑器汉化；eclipse安装中文插件

eclipse IDE默认是英文环境，使用起来略微不便，汉化还是很有必要的；下面记录一下安装中文插件的过程: 文章目录一、选择安装包地址二、在eclipse安装中文插件2.1 在线安装2.2 手动下载安装包2.3 导入到eclipse 三、汉化插件介绍一、选择安…

阅读更多...

实例005 可以拉伸的菜单界面

实例005 可以拉伸的菜单界面

实例说明如果管理程序功能菜单非常多，而用户只使用一些常用菜单，这时，可以将主菜单项下的不常用菜单隐藏起来。此种显示方式类似于对菜单进行拉伸。使用时，只需单击展开菜单，即可显示相应菜单功能。运行本例&#xf…

阅读更多...

python matplotlib中colorbar的位置设置

python matplotlib中colorbar的位置设置

colorbar单独设置一个轴对象，再对轴对象进行灵活设置 import numpy as np import matplotlib.pyplot as plt# 创建一个二维随机数组 data np.random.rand(10, 10)# 创建一个图形和一个子图 fig, ax plt.subplots()# 绘制热力图 heatmap ax.imshow(data, cmaphot…

阅读更多...

在linux中快速安装Redis数据库

在linux中快速安装Redis数据库

Redis中文网点击该链接下载最5.0.4版本的Redis的压缩包使用Xftp工具将Redis安装包上传到linux中 1.将压缩包解压到/opt目录下: tar -zxvf redis-5.0.4.tar.gz 2. 更新yun: sudo yum makecache fast 3.安装gcc: yum -y install gcc 4.安装完成通过输入 : gcc -v …

阅读更多...

tiny tool - get_file_path_name_by_drop_file

tiny tool - get_file_path_name_by_drop_file

文章目录 tiny tool - get_file_path_name_by_drop_file概述工程效果收获的知识点vs2022工程, 必须自己设置对话框可以接受文件的风格vs2022建立的工程, 默认是unicode编码, 设置剪贴板数据时, 必须要设置为unicode的格式, 否则剪切板中只有第一个字符工程主要实现END tiny too…

阅读更多...

短信压力测试系统,支持自定义接口

短信压力测试系统,支持自定义接口

短信压力测试系统,支持自定义接口支持卡密充值，短信压力测试系统，解决一切骚扰电话，教程在压缩包里面可多个服务器挂脚本分担压力，套了cdn导致无法正常执行脚本可以尝试添加白名单这边建议使用MySQL方式同服务器下直接配置…

阅读更多...

MySQL生产环境高可用架构实战

MySQL生产环境高可用架构实战

分布式技术MongoDB 1. MySQL高可用集群介绍1.1 数据库主从架构与分库分表1.2 MySQL主从同步原理 2. 动手搭建MySQL主从集群2.1 基础环境搭建2.2 安装MySQL服务2.2.1 初始化MySQL2.2.2 启动mysql2.2.3 连接MySQL 2.3 搭建主从集群2.3.1 配置master主服务2.3.2 配置slave从服务主…

阅读更多...

Radzen Blazor Studio 1.12 Crack

Radzen Blazor Studio 1.12 Crack

Radzen Blazor Studio 是一款桌面工具，使开发人员能够创建精美的商业 Blazor 应用程序。快速地。开放技术栈没有供应商锁定。生成的源代码是人类可读的，您可以使用免费工具构建它。 Radzen 由流行的开源技术 - ASP.NET Core、Blazor、Bootstrap 提供…

阅读更多...

较少的分区也报错too many range table entries

较少的分区也报错too many range table entries

问题现象 postgresql中update执行语句报错too many range table entries 源sql with t as (select id from LZLTAB where id8723 limit 100 ) update LZLTAB setSTATUS 00,FILE_ID null,DATE_UPDATED localtimestamp(0) where id in (select id from t)如果把update改写成…

阅读更多...

碳排放预测模型 | Python实现基于机器学习的碳排放预测模型——数据清理和可视化

碳排放预测模型 | Python实现基于机器学习的碳排放预测模型——数据清理和可视化

文章目录效果一览文章概述研究内容源码设计参考资料效果一览文章概述碳排放预测模型 | Python实现基于机器学习的碳排放预测模型——数据清理和可视化研究内容碳排放被认为是全球变暖的最主要原因之一。该项目旨在提供各国碳排放未来趋势的概述以及未来十年的全球趋势预测…

阅读更多...

三维空间刚体运动之旋转矩阵与变换矩阵

三维空间刚体运动之旋转矩阵与变换矩阵

1. 旋转矩阵 1.1 点、向量和坐标系点：点是空间中的基本元素，没有长度，没有体积； 向量：把两个点连接起来，就构成了向量，向量可以看成从某点指向另一点的一个箭头；只有当我们指定这…

阅读更多...

threejs精灵和粒子系统

threejs精灵和粒子系统

个人博客地址: https://cxx001.gitee.io 前面我们了解到了场景中的网格对象由几何体和材质组成，并且分别系统学习了它们。这节我们将学习一个特殊的网格对象-----粒子(精灵)。了解粒子一个粒子(新版叫精灵)是一个二维平面(小方块) ，它总是面向摄像…

阅读更多...

推荐文章

最新文章