“分割一切”大模型SAM、超轻量PP-MobileSeg、工业质检工具、全景分割方案,PaddleSeg全新版本等你来体验!

news2025/1/24 14:59:18

图像分割是计算机视觉的一项基础技术,其目标是将图像中的像素按内容分成不同的类别。它在许多领域有重要应用,比如自动驾驶、工业质检、医疗图像分析、遥感图像解译等。

导读

PaddleSeg 是飞桨高性能图像分割开发套件,在图像分割领域做了大量的开源工作,致力于帮助企业在实际场景中落地 AI 应用,也帮助初学者快速入门直到精通。

在广大开发者的使用、反馈和贡献之下,PaddleSeg 持续迭代升级,整体架构设计更加合理优雅,集成的模型日益丰富,在语义分割、交互式分割、深度抠图、人像分割、医学图像分割等重点场景也逐步形成了独具特色的功能。现在,我们非常高兴地宣布,PaddleSeg 2.8 版本正式发布啦!希望新版本的特性能给广大开发者带来实打实的便利,更好地让图像分割技术应用到实际场景中去,创造更大的价值!

接下来,就让我们来看看 PaddleSeg 2.8 版本都带来了哪些新功能与特性吧~

🔥开源飞桨版本视觉大模型 Segment Anything Model (SAM) 和演示Demo。由 META AI 发表的 SAM 具有强大的 zero-shot 能力,可以分割任意物体和图像,也可以使用提示输入分割特定目标。

🔥 发布超轻量级语义分割模型 PP-MobileSeg :在 ADE20K 数据集上对比 SOTA 模型,PP-MobileSeg 的速度提升 42.3%、精度提升 1.5%、参数量减少 34.9%

🔥 发布工业质检工具 QualityInspector v0.5 :提供统一可配置的算法 Pipeline,集成检测和分割模型库,支持 3 种无监督异常检测算法,支持工业级指标评测、分析、调优等功能。

🔥 发布全景分割解决方案 PanopticSeg v0.5 :提供全景分割的全流程开发功能,集成 2 个前沿高精模型,具备灵活的二次开发能力。

🔥 新增了七个前沿语义分割模型:MaskFormer、HRFormer、ViT-Adapter、CAE、SegNeXt、K-Net和LPSNet。

⭐️此外还有很多新功能和特性,比如 FastDeploy 全场景部署能力的集成、EISeg V1.1 版本、视频抠图模型 RVM、人像抠图.NET部署教程等。想要了解更多详情,可至文末加入 PaddleSeg 技术交流群,同时欢迎大家点击 star关注。

https://github.com/PaddlePaddle/PaddleSeg

PaddleSe g 2.8 版本详细解析

“分割一切”大模型 SAM

Segment Anything Model(SAM)是 META AI 最近发表的研究成果,提出了图像分割的新任务、模型和数据集。它效仿了生成式 LLM(Large Language Model, 大语言模型)的 prompt 范式,可以从不同类型的提示中产生高质量的对象掩码,提示类型包括点、框、掩码和文本。SAM 在各种图像分割任务上表现出了极强的泛化能力,并且精度上不输针对各领域数据集专门训练的传统模型。

在飞桨版本 SAM 中,我们提供了 ViT-B、ViT-L、ViT-H 三种 Backbone 的 SAM 模型,大家可以灵活选择、进行推理测试。SAM 模型可以和其它模型配合,做一些有意思的应用,比如任意一个目标检测模型+ SAM =实例分割模型。我们已经将 SAMCLIP 算法进行了结合,提供了基于飞桨 CLIP 算法的 ViT-B 模型权重文件,通过 CLIP 计算文本提示与 SAM 分割结果的匹配得分,从而具有通过本文提示对特定目标进行分割的能力。在接下来的工作中,我们将逐步补全 SAM 模型的微调能力,并进行部署侧的优化,方便大家落地应用!

另外,为了方便大家测试效果,我们还提供了基于 gradio 的 WebUI 应用,以及多种 prompt 方式下的预测脚本。WebUI 应用可以部署在自己的机器上使用,同时,我们也在 AI Studio 中部署了在线版本,方便大家体验。

飞桨版 SAM 传送门

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.8/contrib/SegmentAnything

超轻量级语义分割模型 PP-MobileSeg

相较于 CNN 模型架构,Transformer 模型架构有更好的精度优势。但是 Transformer 结构对算力要求高,限制了它在移动端的广泛应用。针对这个问题,我们提出了一个针对移动端设备的语义分割模型 PP-MobileSeg。在 ADE20K 数据集上,PP-MobileSeg 和此前最佳方法相比,速度提升 42.3%、精度提升 1.5%、参数量减少 34.9%,实现了速度-精度-参数量之间的 SOTA 平衡。

PP-MobileSeg 与其它模型的对比情况以更好地平衡精度、速度和参数量为目标,我们为 PP-MobileSeg 模型提出了三个创新组件:StrideFormer 骨干网络、Aggregated Attention Module (AAM) 聚合注意力模块,和 Valid Interpolate Module (VIM) 有效插值模块。

  • StrideFormer 骨干网络

我们使用 MobileNetV3 block 设计了一个四阶段的骨干网络,可以在减少了参数冗余的情况下,高效提取不同感受野的特征。在骨干网络的后两个阶段,我们还使用了 Strided Attention Module 为特征赋予全局视野。

  • AAM 聚合注意力模块

为了有效融合特征,我们使用集成投票的形式过滤细节特征。实验证明语义信息的提升至关重要,因此我们在融合特征最后环节添加语义特征,以最大程度保留语义信息。

  • VIM 有效插值模块

我们使用 VIM 替换原有的上采用模块,从而显著减少模型推理阶段的延迟。在类别数很多的数据集中,单张图片中存在的语义类别数占数据集类别总数的比例是很小的,例如在 ADE20K 数据集中这个比例大约只有 10%。因此通常做法会导致大量算力用于无用类别的上采样,而 VIM 通过只插值最终预测中存在的类别,显著降低了上采样的延时。

基于三个创新组件,PP-MobileSeg 的网络架构图如下所示:首先通过骨干网络提取并增强语义特征和细节特征,然后通过 AAM 特征融合模块产出最适合语义分割的特征,最后以一个简单的分割头和专注性能优化的 VIM 上采样模块得到分割结果。其中 AAM 和 VIM 的细节展示分别在下图的左上角和右下角,详细说明可以参考 PP-MobileSeg 论文。

PP-MobileSeg 模型架构图

PP-MobileSeg 论文

https://arxiv.org/abs/2304.05152

PP-MobileSeg 传送门

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.8/configs/pp_mobileseg

工业质检工具 QualityInspector

在 3C 电子、汽车、纺织化纤、金属、建筑、食品、日用消费品等生产制造行业,质量检测是保障产品质量的重要一环,是企业确保产品符合标准,满足客户需求,提高竞争力的关键步骤。在深度学习时代,使用视觉技术对零件图像进行质检检测,相比人工或传统的质检方法,能够显著提升精度和效率。因此,我们开发了工业质检工具 QualityInspector,希望帮助开发者快速完成算法的研发、验证和调优,助力从数据标注到模型部署的全流程工业质检应用实践。目前,我们发布了 QualityInspector V0.5 预览版本,主要特性如下:

  • 统一可配置的解决方案

支持检测、分割单模型、检测 +RoI 分割串联结合后处理的解决方案,简单修改配置即可轻松组合视觉套件的模型。

  • 工业级指标评估和调优

评估工业质检项目实际落地指标,并可直接调节后处理规则参数进行指标一键调优,方便易用。

  • 丰富的视觉算法库

新增支持无监督异常检测算法,同时集成飞桨视觉套件的成熟算法库,覆盖图像分割、目标检测等任务。

  • 可快速上手的工具

支持数据格式转化工具,快速完成检测,分割 /RoI 分割任务数据格式转化,同时支持数据分析工具和 EISeg 数据标注工具。

QualityInspector 缺陷检测效果

欢迎广大开发者试用并反馈宝贵意见!

QualityInspector 传送门

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.8/contrib/QualityInspector

全景分割解决方案

PanopticSeg全景分割是一项图像解析任务,该任务结合了语义分割(为图像中每个像素赋予一个标签)和实例分割(检测并分割出图像中每一个对象实例)。PaddleSeg 2.8 版本全新推出全景分割解决方案 PanopticSeg ,旨在提供全景分割模型训练、验证与部署的全流程开发解决方案。

  • 高精度

提供高质量的前沿全景分割模型,开箱即用,目前已经支持的模型包括 Mask2Former、Panoptic-DeepLab ;

  • 全流程

提供全流程开发能力,打通数据集准备、模型训练、模型推理、可视化分析等功能,助力用户完成一站式开发工作;

  • 高性能

使用多进程异步 I/O 、多卡并行训练等加速策略,结合飞桨核心框架的显存优化功能,让开发者以更低成本、更高效地完成全景分割模型训练。

使用 PanopticSeg 在 Cityscapes 数据集中的可视化效果,依次为原图、语义分割结果、实例分割结果、全景分割结果

PanopticSeg 传送门

https://github.com/PaddlePaddle/PaddleSeg/blob/release/2.8/contrib/PanopticSeg

集成 FastDeploy 部署能力

大家训练完成分割模型后,经常需要花费大量的时间精力,为不同硬件开发部署程序。为了解决这个痛点,PaddleSeg 2.8 版本深入对接了飞桨全场景 AI 推理部署工具 FastDeploy 。大家使用 FastDeploy,可以快速在 X86 CPU、NVIDIA GPU、飞腾 CPU、ARM CPU、Intel GPU、昆仑、昇腾、瑞芯微、晶晨、算能等 10+ 款硬件上部署 PaddleSeg 模型,并且支持灵活选择 Paddle Inference、Paddle Lite、TensorRT、OpenVINO、ONNXRuntime、RKNPU2、SOPHGO  等多种推理后端!此外,FastDeploy 针对分割模型进行了深度优化,开发了高效的图像前处理、结果后处理等功能模块,支持 FlyCV 和 CVCUDA 图像加速库,提供简易的上手体验、极致的端到端推理性能。

语义分割模型地硬件支持列表如下:

Matting 模型硬件支持列表如下:

FastDeploy 部署教程传送门

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.8/deploy/fastdeploy

其它新功能与特性

深受开发者欢迎的智能交互式分割标注工具 EISeg 迎来了 V1.1 版本的升级:

  • 新增对检测目标的手工标注功能;
  • 新增对检测目标的预标注功能,支持修改预标注的标签对应关系;
  • 支持 3 种常用的检测标注保存格式:COCO、VOC 和 YOLO。

Matting 人像抠图解决方案的升级:

  • 新增视频抠图模型 RVM,支持视频预测和背景替换;
  • 新增人像抠图.NET 部署教程(由外部开发者 @raoyutian 贡献)。

基于.NET 部署的 PaddleSeg C# 应用 demoPaddleSeg 2.8 版本也完成了一些代码重构与升级的工作,例如支持自定义 Optimizer 组件,可灵活配置训练超参;解耦 Config 和 Builder ,严格校验配置信息;新增支持指数滑动平均 EMA ,助力训练过程稳定收敛。此外,在广大开发者的积极反馈之下,发现并修复了若干漏洞,在此对参与 PaddleSeg 项目贡献的开发者们表示衷心的感谢!❤️

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/433791.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分类预测 | MATLAB实现BO-CNN-BiLSTM贝叶斯优化卷积双向长短期记忆网络多输入分类预测

分类预测 | MATLAB实现BO-CNN-BiLSTM贝叶斯优化卷积双向长短期记忆网络多输入分类预测 目录 分类预测 | MATLAB实现BO-CNN-BiLSTM贝叶斯优化卷积双向长短期记忆网络多输入分类预测效果一览基本介绍模型搭建程序设计参考资料 效果一览 基本介绍 MATLAB实现BO-CNN-BiLSTM贝叶斯优…

上海车展:深蓝汽车首次亮相,全场景电动出行实力圈粉

4月18日,2023上海国际车展如约而至。 作为疫情结束后的首个国际车展,本届上海车展自然吸睛无数,光是首个媒体日进场时的阵仗,就让无数媒体人高呼“人潮汹涌”。 而在本次参展的众多汽车品牌中,刚刚成立一周年的深蓝汽车…

【IEEE期刊专区】这本IEEE旗下期刊中科院升级为1区(TOP),什么来头?(附IEEE在检SCI目录)

近期国自然也提交等待审核了,放榜等到7、8月份了,祝愿各位科研人有好运!现在的节点正是发表评职代表作的好时机,本期小编带来IEEE旗下高分区、高影响因子SCI期刊推荐,是不可多得的好刊代表,有意向作者切不可…

组件封装v-model .sync在父子组件中实现双向数据绑定 如何处理单向数据流 封装表单组件

使用watch监听 父组件使用.sync进行数据的绑定 传值子组件时 把值赋值到data的变量中 然后监听该数据的变化 $emit抛出 父组件demo <template><div><Son :model-value.sync"modelValue" :select-value.sync"selectValue" /></div>…

stata简单回归与检验

stata简单回归与检验 – 潘登同学的stata笔记 文章目录 stata简单回归与检验 -- 潘登同学的stata笔记 OLS回归系数的t检验异方差稳健型标准误计算拟合值和残差残差分析 相关系数矩阵相关矩阵散点图Pearson 相关系数Spearman 相关系数 t检验单变量t检验多变量t检验变量在多组之间…

史上最详细的八大排序详解!(建议收藏)

&#x1f680;write in front&#x1f680; &#x1f4dc;所属专栏&#xff1a;初阶数据结构 &#x1f6f0;️博客主页&#xff1a;睿睿的博客主页 &#x1f6f0;️代码仓库&#xff1a;&#x1f389;VS2022_C语言仓库 &#x1f3a1;您的点赞、关注、收藏、评论&#xff0c;是对…

Babel的深度解析

在开发中我们很少直接去接触babel&#xff0c;但是babel对于前端开发来说&#xff0c;目前是不可缺少的一部分&#xff1a; 开发中&#xff0c;我们想要使用ES6的语法&#xff0c;想要使用TypeScript&#xff0c;开发React项目&#xff0c;它们都是离不开Babel的&#xff1b; B…

性能测试分析-Java内存溢出定位案例(1)

Java内存溢出分析案例 Java常见内存溢出类型&#xff1a;堆内存溢出现象内存溢出分析下载安装分析软件下载 hprof 文件MAT 分析定位问题Shortest Paths To the Accumulation Point 内存溢出分析参考文档&#xff1a; Java常见内存溢出类型&#xff1a; 常见的内存溢出主要有以…

90、Neural Residual Radiance Fields for Streamably Free-Viewpoint Videos

简介 主页&#xff1a;https://aoliao12138.github.io/ReRF/ 前提知识&#xff1a;DeVRF&#xff1a;https://jia-wei-liu.github.io/DeVRF/ 先利用多台固定相机拍摄动态场景&#xff0c;在第一帧利用DVGO重建好半显示场景&#xff0c;后续则是通过预测体素x,y,z三个方向的运…

crontab -e 系统定时任务

crontab -e解释 crontab 是由 “cron” 和 “table” 两个单词组成的缩写。其中&#xff0c;“cron” 是一个在 Linux 和类 Unix 操作系统中用于定时执行任务的守护进程&#xff0c;而 “table” 则是指一个表格或者列表&#xff0c;因此 crontab 就是一个用于配置和管理定时任…

PHP 单笔转账到支付宝账户,支付宝公钥证书实现版本

支付宝某些业务只能使用公钥证书方式来验签 如&#xff1a;即使转账 红包等 笔者就要实现这样一个功能&#xff0c;【单笔转账到支付宝账户】&#xff0c;采用支付宝公钥证书签名来实现。 话不多说&#xff0c;流程先走起 第一步&#xff1a;下载支付宝秘钥生成器 由于我们使…

手把手教你 DVOL

分享本文在朋友圈的读者可获得本文数据和 Python 代码。留个言说已分享&#xff08;不用截屏&#xff09;我相信你&#xff0c;我会发给你百度盘下载链接。 本文长度为 6393 字&#xff0c;建议阅读 32 分钟 题图&#xff1a;SignalPlus Dashboard 0 引言 Deribit volatility (…

基于 VITA57.1 的 2 路 2GSPS/2.6GSPS/3GSPS 14bit AD 采集 FMC 子卡模块

板卡概述 FMC152 是一款基于 VITA57.1 标准的&#xff0c;实现 2 路 14-bit、2GSPS/2.6GSPS/3GSPS AD 采集 FMC 子卡模块。该模块可直接与 FPGA 载卡配合使用&#xff0c;板卡 ADC 器件采用 ADI 公司的 AD9208 芯片&#xff0c; 与 ADI 公司的 AD9689 可以实现 PIN 脚兼容。该…

URI URL URN定义

1 定义 URI&#xff1a;全称Uniform Resource Identitfier&#xff0c;也就是统一资源标识符&#xff0c;可以标识互联网上某一资源&#xff0c;用来标识抽象或物理资源的一个紧凑字符串。 URL&#xff1a;全称Uniform Resource Locator&#xff0c;统一资源定位符&#xff0c…

【hello Linux】进程程序替换

目录 1. 程序替换的原因 2. 程序替换原理 3. 替换函数 4. 函数解释 5. 命名理解 6.简陋版shell的制作 补充&#xff1a; Linux&#x1f337; 1. 程序替换的原因 进程自创建后只能执行该进程对应的程序代码&#xff0c;那么我们若想让该进程执行另一个“全新的程序”这 便要用…

JVM系列(八) JVM 垃圾收集算法

前面我们了解了很多JVM配置垃圾回收的方式&#xff0c;但是具体垃圾是如何被回收的&#xff0c;或者说垃圾回收算法有哪些&#xff1f;今天我们文章主要讲解一下垃圾回收算法 1.分代收集理论 我们都知道 很早的JVM会把堆分为几个区域&#xff0c;新生代&#xff0c;老年代&am…

pandas读取Excel核心源码剖析,面向过程仿openpyxl源码实现Excel数据加载

&#x1f4e2;作者&#xff1a; 小小明-代码实体 &#x1f4e2;博客主页&#xff1a;https://blog.csdn.net/as604049322 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 欢迎讨论&#xff01; 今天我们将研究pandas如何使用openpyxl引擎读取xlsx格式的Excel的…

el-tabs嵌套el-upload使用

需求&#xff1a;1 .第一个标签展示固定字样&#xff0c;且不能删除&#xff0c;最少上传三张图片。 2. 其余标签双击可编辑字样&#xff0c;10字以内&#xff0c;可删除&#xff0c;均可上传图片。 3. 号按钮可点击添加标签&#xff0c;标签数量控制在10个以内。 4. 当标签下无…

一文学会VSCode代码同步至GitHub

一、上手GitHub 1. 了解GitHub 上手GItHub之前首先要了解一下GItHub的关键词&#xff0c;如下&#xff1a; (1) 仓库 (Repository) 仓库是用来存放项目代码&#xff0c;每一项目对应一个仓库。(2) 收藏 (Star) 收藏别人的仓库&#xff0c;方便自己查找。(3) 复制/克隆项目 (…

忆暖行动|“以前的住宿也没有这么好的环境,住的都是土房子,一下雨就哗哗掉墙皮”

常忆旧时苦 方思今日甜 新年将至&#xff0c;彩灯与烟火闪烁。值此佳节&#xff0c;我们去看望了一位65岁的退休教师&#xff0c;并与她进行了交谈&#xff0c;从奶奶的讲述中&#xff0c;我们了解到过去生活的不易&#xff0c;珍惜当下的美好生活。 迎接新年 为迎接新年&am…