图像分割模型实际分隔效果测试（Clipseg + GroundingDINO + Yoloworld）

图像分割模型实际分隔效果测试（Clipseg + GroundingDINO + Yoloworld）

news2026/2/14 11:55:30

✨背景

对于设计的工作流来说，智能图像分割也是一个很重要的课题，尤其是像照片换脸、照片高清写真等等的工作流，可能要多次把人物的脸部或者手部抠图出来进行合成，工作流如果可以直接智能分割图像并合成，就可以避免自己再到ps中去抠图了，目前也的确有不少的模型和节点是用来做这个事情的，比如说ComfyUI中的Clipseg节点、GroundingDINO还有Yoloworld模型相关的节点等等。这里就简单测试下这三个模型，看下具体的效果如何。

（如果大家觉得有帮助的话，记得点点赞啊~🏃‍♀️）

🎡测试方法及结果

我们拿到这样一张原图：

（避免版权问题，这张图其实是midjourney直接生成的。）

然后搭建一个三种分割算法的工作流，并写提示词（比如说“face”）把面部分割出来，形成蒙版，然后把蒙版和原图进行合成，这样比较容易看出效果；

工作流截图：

🙋‍♂️测试结果

face的分割效果：

girl 的分割效果：

如果说AI生成的图像可能会有偏差，我们再从pixabay上找到一张图做一下测试：

还是用girl来做过滤：

再试验下组合词：hand,arm

dresses:

简单可以得出一个结论：

clipseg基本完败，这也是为什么用这个节点的时候，经常角色周围会有一圈很难处理干净，需要处理蒙版向内缩小一圈才能用；

GroundingDINO效果还可以，但是仔细看的话，经常会有一些莫名其妙的地方处理不干净，比如说人物面部：

综合来看，yoloworld-efficientSAM这个节点的效果最好。

（而且安装起来并不会比clipseg这个节点更复杂...）

🤶YoloWorld-EfficientSAM节点地址：

GitHub - ZHO-ZHO-ZHO/ComfyUI-YoloWorld-EfficientSAM: Unofficial implementation of YOLO-World + EfficientSAM for ComfyUI

👨测试工作流下载

下载地址：https://pan.quark.cn/s/16227e56e2a4

🎉写在最后~

去年的时候写了两门比较基础的Stable Diffuison WebUI的基础文字课程，大家如果喜欢的话，可以按需购买，在这里首先感谢各位老板的支持和厚爱~

✨StableDiffusion系统基础课（适合啥也不会的朋友，但是得有块Nvidia显卡）：

https://blog.csdn.net/jumengxiaoketang/category_12477471.html

🎆综合案例课程（适合有一点基础的朋友）：

https://blog.csdn.net/jumengxiaoketang/category_12526584.html

这里是聚梦小课堂，就算不买课也没关系，点个关注，交个朋友😄

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1640836.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

20240503安装HEVC解码器播放H265格式的8K视频

20240503安装HEVC解码器播放H265格式的8K视频

20240503安装HEVC解码器播放H265格式的8K视频 2024/5/3 9:55 缘起：由于youtube支持8K视频了，想尝尝鲜！ 主摄像头当然是选择SONY的【夜摄/弱光场景】，根据优选，小米（MI）13Ultra 最佳了。在开始播…

阅读更多...

设计模式动态代理

设计模式动态代理

什么是设计模式? 一个问题通常有n种解法，其中肯定有一种解法是最优的，这个最优的解法被人总结出来了，称之为设计模式。设计模式有20多种，对应20多种软件开发中会遇到的问题。关于设计模式的学习，主要学什么&#…

阅读更多...

项目管理-项目范围管理2/2

项目管理-项目范围管理2/2

项目管理：每天进步一点点~ 活到老，学到老ヾ(◍∇◍)ﾉﾞ 何时学习都不晚，加油项目范围管理，过程 6个，包括“规收定创确控”： 规划范围管理收集需求定义范围创建WBS确认范围控制…

阅读更多...

JS 笔记9 认识JavaScript

JS 笔记9 认识JavaScript

相关内容：JS对象、属性、常用事件处理过程、运算符、if...else、for、…… <script type"text/javascript"></script> type属性用来指定MIME(Multipurpose Internet Mail Extension)类型，主要是告诉浏览器目前使用的是哪一种Scri…

阅读更多...

先电2.4的openstack搭建

先电2.4的openstack搭建

先电2.4版本的openstack，前期虚拟机部署参考上一篇2.2版本，基本步骤是一样的，准备两个镜像文件CentOS-7.5-x86_64-DVD-1804.iso，XianDian-IaaS-V2.4.iso [rootcontroller ~]# cat /etc/sysconfig/network-scripts/ifcfg-eno16777…

阅读更多...

【软件测试】软件测试基础

【软件测试】软件测试基础

1. 需求1.1. 需求的概念1.2. 为什么要有需求1.3. 测试人员眼中的需求 2. 测试用例2.1. 为什么需要测试用例2.2. 什么是测试用例2.3. 一个简单的测试用例 3. 软件测试的整体流程4. bug4.1. 如何描述一个bug4.2. bug的级别4.3. bug生命周期 1. 需求 1.1. 需求的概念简单的来说…

阅读更多...

如何在iOS设备（iPhone，iPad等）上恢复丢失的照片

如何在iOS设备（iPhone，iPad等）上恢复丢失的照片

如果你像现代90%的人一样拥有智能手机，那么你很可能使用口袋里的微型电脑拍摄大部分（如果不是全部）照片，而不是标准的傻瓜相机或数码单反相机。像任何数字设备一样，存储和保存这些照片可能是一个变化无常的过程&…

阅读更多...

nvm 切换 Node 版本失败

nvm 切换 Node 版本失败

创建vue3项目时，需要切换到更高版本的 node，于是使用 nvm (node 包版本管理工具)进行版本切换切换版本时，显示成功，但再次查看当前 node 版本时，发现没切换过来。解决方法： where node 查看node的安装…

阅读更多...

spring高级篇（七）

spring高级篇（七）

1、异常处理在DispatcherServlet中，doDispatch(HttpServletRequest request, HttpServletResponse response) 方法用于进行任务处理： 在捕获到异常后没有立刻进行处理，而是先用一个局部变量dispatchException进行记录，然后统一由…

阅读更多...

找不到msvcr110.dll的多种解决方法，轻松解决dll问题

找不到msvcr110.dll的多种解决方法，轻松解决dll问题

在日常使用计算机的时候，突然提示：“由于找不到msvcr110.dll，无法继续执行代码”。这个错误通常发生在运行某些程序时，系统无法找到所需的动态链接库文件。这个问题可能会给用户带来困扰，但是不用担心，下面…

阅读更多...

ReentrantReadWriteLock(可重入读写锁)源码解读与使用

ReentrantReadWriteLock(可重入读写锁)源码解读与使用

🏷️个人主页：牵着猫散步的鼠鼠 🏷️系列专栏：Java源码解读-专栏 🏷️个人学习笔记，若有缺误，欢迎评论区指正目录 1. 前言 2. 读写锁是什么 3. ReentrantReadWriteLock是什么 4. 源码解…

阅读更多...

每日OJ题_贪心算法二⑥_力扣409. 最长回文串

每日OJ题_贪心算法二⑥_力扣409. 最长回文串

目录力扣409. 最长回文串解析代码力扣409. 最长回文串 409. 最长回文串难度简单给定一个包含大写字母和小写字母的字符串 s ，返回通过这些字母构造成的最长的回文串。在构造过程中，请注意区分大小写。比如 "Aa" 不能当做一个…

阅读更多...

spring框架学习记录(1)

spring框架学习记录(1)

前半个月一直在应付期中考试，快被折磨似了orz 文章目录 SpringIoC(Inversion of Control) 控制反转与DI(Dependency Injection)依赖注入bean相关bean配置bean实例化bean的生命周期依赖注入相关依赖注入方式依赖自动装配容器创建容器获取bean Spring IoC(Inversi…

阅读更多...

场景文本检测识别学习 day08（无监督的Loss Function、代理任务）

场景文本检测识别学习 day08（无监督的Loss Function、代理任务）

无监督的Loss Function（无监督的目标函数） 根据有无标签，可以将模型的学习方法分为：无监督、有监督两种。而自监督是无监督的一种无监督的目标函数可以分为以下几种： 生成式网络的做法，衡量模型的输出和固…

阅读更多...

网络安全审计

网络安全审计

一、什么叫网络安全审计网络安全审计是按照一定的安全策略，利用记录、系统活动和用户活动等信息，检查、审查和检验操作时间的环境及活动，从而发现系统漏洞、入侵行为或改善系统性能的过程，它是提高系统安全性的重要手段。系统…

阅读更多...

巨人网络发布2023年年报：全力拥抱AI浪潮，开启游戏产业新篇章

巨人网络发布2023年年报：全力拥抱AI浪潮，开启游戏产业新篇章

易采游戏网5月3日消息，国内知名游戏公司巨人网络发布了其2023年度财务报告，报告显示，公司在过去一年中积极拥抱AI技术，实现了业绩的稳步增长，为游戏产业带来了新的活力与机遇。在报告中，巨人网络详细阐述了…

阅读更多...

XYCTF2024 RE Trustme 复现

XYCTF2024 RE Trustme 复现

但是只得到用户名 admin 法一：猜Sql注入，直接万能密码法二：正常逆向 jadx中的AndroidManifest.xml有奇怪之处怀疑有加壳，进ProxyApplication看看大量安卓一代壳的特征 Android第一代壳加固原理及实现 - 知乎 GitHub - Huye…

阅读更多...

零基础学习数据库SQL语句之定义数据库对象的DDL语句

零基础学习数据库SQL语句之定义数据库对象的DDL语句

DDL语句 DDL Date Definition Language 数据定义语言，用来定义数据库对象（数据库，表，字段） 基本操作数据库操作查询所有数据库 SHOW DATEBASES查询当前数据库 SELECT DATEBASE() 创建 CREATE DATEBASE [IF …

阅读更多...

张大哥笔记：付费进群创业项目玩法及详细操作教程

张大哥笔记：付费进群创业项目玩法及详细操作教程

今天给大家分享一个赚钱小项目，它就是付费进群系统，这个项目应用范围很广。比如表情包，知识付费，美女写真，虚拟资料，交友扩列等都可以。今天我们就来说一下最近爆火的交友搭子付费进群做个演示案例&#xf…

阅读更多...

你不可不知的数字可视化的未来。

你不可不知的数字可视化的未来。

10年UI设计和前端开发接单经验，完工项目1000，持续为友友们分享有价值、有见地的干货观点，有项目外包需求的老铁，欢迎关注发私信。数据可视化是一个不断发展和创新的领域，未来的发展方向可能包括以下几个方面&#xff…

阅读更多...

推荐文章

最新文章