分享两个虚拟试衣工具,一个在线,一个离线,还有ComfyUI插件

news2024/9/23 21:20:37

SAM ,对不住了!

ecd8196291af4d71bdb0a18ee23a279b.png

 

我没记错的话,OpenAI CEO,性别男,取向男,配偶男。

这又让我联想到了苹果CEO库克...

所以OpenAI和Apple可以一啪即合。        

钢铁直男老马就和他们都不对付~~

开个玩笑,聊回正题!

我之前分享过一个叫IDM-VTON的虚拟试衣软件,效果挺不错,后来又出了一个叫Kolors的,看起来也是不错。最近使用了一下IDM-VTON的升级版,所以就放在一起发一下。

下面就先介绍一下Kolors,然后给大家一个IDM-VTON的升级包,还有一个ComfyUI的插件,全套了。

45ec6689d4d3485996c9da71d24f2d38.png

 

Kolors Virtual Try-On 是快手可灵发布的一个网页Demo,托管在HuggingFace上面。

只要上传一个模特的照片,上传一件衣服的照片,点一下RUN,几秒钟内就可以实现换装。

487724a2b31b476c8abcbd6cadbab505.png

 

Demo里面内置了一些AI生成的模特素材,可以通过点击预设素材,快速体验。

从实际操作来看,可以换衣服,也可以换套装,但是下半身不是100%能换,比如开头的奥特曼,就只换了一半。这套衣服基本就没成功的...哈哈~

eb1db670a5634f9f9acaf26cdacd195d.pngKolors可以保持服装的整体风格,但是细节上会有一些变化。另外换上衣的时候,会自动给你匹配裤子。7f6e40d5fe3149639e2a5402a206ef36.png  

另外它也可以处理不同比例的模特照片,比如竖屏横屏都可以。

我大致看了一下源代码,这应该并不算完全的开源软件。代码里是通过调用API来生成图片的,HuggingFace上显示运行在CPU上,也印证了这一点。目前只要能打开网页就能使用,用起来挺方便,效果也挺不错。

说完Kolors,再说说IDM-VTON。

这是第一个效果惊艳的虚拟试衣项目,而且是全部开源。

IDM-VTON(Image-Based Virtual Try-On Network)是一种基于深度学习的图像虚拟试衣系统,其运作方式主要依靠对衣物和人体图像进行融合,从而实现虚拟试衣效果。IDM-VTON 采用的是 2D 图像处理技术,专注于将用户上传的正面照与衣物图片合成在一起,给用户一个视觉上的衣物穿戴效果。 

这个项目发布已经有一段时间了,项目刚出的时候,我做过一个软件包。但是当时的版本只能换上衣。最近我回过头去看,发现很早就支持裤子和套装了。

但是,网上搜了一圈,要下载到更新版还是有点麻烦。所以,自己动手丰衣足食。

官方项目应该本身就支持全套换装,但是给出来的代码和网页都只支持换上衣。后来发现有一个叫IDMVTON_CN的项目做的不错,就基于这个项目做了一个软件包。

下面就简单说一下,软件包的实用方法。

首先是下载软件包。这个软件包大概20G左右(猜猜我配置,打包,上传花了多久)。

下载解压打开文件夹,然后找到启动2.exe1783ce975beb4361bbac57055f3a8a5d.png

 

首次启动,会有两个选项。根据你的硬件配置来选择就好了。最低应该能支持到6G显存。启动之后会自动调用浏览器,打开本地网页。然后只要按下面的步骤设置运行即可。cbd11c157c324ae4b34c04dcc8b94c5b.png

 

①选择模特

②选择服装

③点击启动

④⑤是运行结果。

如果替换的服装和原来的服装匹配度比较高的情况下,换装效果一般都相当出色,完全达到了可用的程度。

如果故意把不同性别,不同款式的服装混合在一起替换,就会出现下面的情况。7ec372ddd82b47c9a098494473e47f1e.png

 

身材还不错,这肤色,也很“正确”。当然这个例子也说明了,这个版本可以替换全套。只要在成衣类型里面做一个选择就可以了。目前有三个选项,分别是:upper_body 上身

lower_body  下身

dresses 全身

这么说应该很好理解吧。从实际测试来说,下半身表现不如上半身好。

可能和训练素材有一定的关系。另外这个项目限制了模特图片的比例,可能也和素材有关,我也没有深入研究。

另外还有一点,这个项目可以自己画遮罩。

 23f1695adbeb4efab64806e6fc3b16b7.png

 

只要点击画笔,涂抹想要替换的区域就可以了。

手动遮罩,可以解决自动遮罩不准确的问题。当手动画遮罩之后,记得把自动上蒙版(遮罩)的勾选去掉。

拔出萝卜带出泥,无意中有发现一个ComfyUI的IDM插件(节点),也挺不错。

ComfyUI这种复杂又简洁的设计,确实太迷人了,看到了我就想搞一搞,花了不少时间安装了,三个插件,终于跑起来了。

e732ca3f27bd4a96ab57ee9b9b62e10c.png工作流制作完成之后,用起来就非常丝滑了。S·A·M自动切割实在是太精准了,牛。不过有时候反而成为一个缺点了,比如在换装这个场景,切割完成后,外扩一点的的遮罩会更好一点。

 

为了把这流程跑起来,需要安装三个插件:ComfyUI-IDM-VTON (换装)

ComfyUI Segment Anything (分割)

ComfyUI's ControlNet Auxiliary Preprocessors.(姿态)

限于篇幅,就不具体讲如何安装了。这个工作流,我分享在网盘里,有需要的自取。ComfyUI的基本用法可以参考之前的文章。软件和工作流,可以评论或私信发送idm获取。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2158476.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

以数赋能实景三维创新“科技+文旅”

在数字化时代,科技与文化的融合为我们带来了无限可能。今天,我们将探讨如何利用实景三维技术,推动“科技文旅”的创新发展。 1. 实景三维技术概述 实景三维技术,是一种集成了遥感、地理信息系统(GIS)、三…

量子计算如何引发第四次工业革命——解读加来道雄的量子物理观

在科技的历史长河中,人类经历了多次重大的技术变革:从第一次工业革命的蒸汽机到第三次计算机革命的互联网与半导体技术,每次技术革命都彻底改变了我们的生活。而如今,我们正处在第四次工业革命的前夕,其核心驱动力是量…

mybatis 配置文件完成增删改查(一):直接查询所有信息

文章目录 编写三步走查询所有编写接口方法编写sql语句执行方法,测试结果数据库字段名和实体类变量名不一致:ResultMap数据库字段名和实体类变量名不一致:方法二 编写三步走 编写接口方法:Mapper接口 参数有无 结果类型编写sql语句…

【Python】PythonRobotics:机器人算法的 Python 实现

在机器人技术的研究和开发中,理解和实现各种机器人算法是至关重要的。PythonRobotics 是一个开源项目,它提供了大量机器人算法的 Python 实现,这些算法覆盖了机器人科学的多个领域,包括定位、建图、导航、路径规划等。 ⭕️宇宙起…

nicegui标签组件lable用法深度解读和示例,源代码IDE运行和调试通过,截图为证

传奇开心果微博文系列 序言一、标签组件lable最基本用法示例1.在网页上显示出 Hello World 的标签示例2. 使用 style 参数改变标签样式示例 二、标签组件lable更多用法示例1. 添加按钮动态修改标签文字2. 点击按钮动态改变标签内容、颜色、大小和粗细示例代码3. 添加开关组件动…

美版iPhone 16 Pro完美改卡,15 Pro再见了

资深果粉应该都知道,从iPhone 14起,所有美版的iPhone,都从eSIM实体SIM,改成了全eSIM方案,彻底放弃了实体卡槽,这就给卡贴机这一行业造成了毁灭性的打击。 因为国内无法使用eSIM,即使有低价的美版…

什么是上层封禁海外流量

上层封禁海外流量(Upper-layer Blocking of Overseas Traffic)是一种网络安全策略,旨在通过在网络传输的上层进行流量控制和过滤,从而阻止来自海外的恶意流量或不必要的访问。这一措施主要用于防止分布式拒绝服务(DDoS…

C++笔记---set和map

1. 序列式容器与关联式容器 前面我们已经接触过STL中的部分容器如:string、vector、list、deque、array、forward_list等,这些容器统称为序列式容器,因为逻辑结构为线性序列的数据结构,两个位置存储的值之间一般没有紧密的关联关…

数据驱动农业——农业中的大数据

橙蜂智能公司致力于提供先进的人工智能和物联网解决方案,帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。 橙蜂智农的智慧农业产品涵盖了多方面的功能&…

win操作系统各个版本下载

MSDN, 我告诉你 - 做一个安静的工具站 (itellyou.cn) 下载地址链接转换工具 - 在线工具 (tool.lu) 通过这个网站可以再将ed2k转换成别的下载工具链接

LLM安全风险及应对

LLM安全风险主要从四个维度分析:用户输入、训练数据、模型本身以及工具和插件。 风险类别具体风险风险解释应对措施具体举例用户输入相关风险提示注入(Prompt Injection)攻击者通过设计特定输入,使模型生成恶意或不安全的输出。- …

进度调度切换

tips: 进程=内核数据结构(PCB/task_struct)+代码和数据 UID:每个用户对应的id 进程分类 & 进程关系 僵尸进程 父在子死 进程退出 代码不会再执行了,系统可以立即释放对应代码和数据进程…

推荐一款开源的Redis桌面客户端

TinyRDM 是一个现代化的、轻量级的跨平台 Redis 桌面客户端,能在 Mac、Windows 和 Linux 系统上使用。它有着现代化的设计风格,界面既简洁又清晰,操作起来方便又高效。不管是刚开始接触的新手,还是经验丰富的开发者,都…

【安装教程】Windows环境下Neo4j的安装与配置

【安装教程】Windows环境下Neo4j的安装与配置 Neo4j的概念一、安装前准备——JDK二、Neo4j的安装三、Neo4j的环境配置四、安装验证 Neo4j的概念 Neo4j 是一个高性能的图形数据库管理系统,它使用图形模型来存储和处理数据。Neo4j 的图形模型由节点和边组成&#xff0…

WebLogic 漏洞复现

1、后台弱⼝令GetShell 默认账号密码:weblogic/Oracle123 weblogic常⽤弱⼝令:https://cirt.net/passwords?criteriaweblogic 这⾥注意, 单个账号错误密码5次之后就会⾃动锁定。 http://47.121.212.195:7001/console 2、登录后台后&#…

矩阵分析 线性空间和线性变换 笔记手稿

1线性空间的概念 数域 线性空间 证明 线性相关和线性无关 线性空间的基 基的性质 基变换和坐标变换 子空间和维数定理 两个子空间的交和和都是子空间 维数公式 子空间扩充定理 维数公式及其证明 直和 证明 线性空间的同构 注意:映射的概念 同构的性质 线性变换的…

前端组件库Element UI 的使用

一、准备工作 1.确保安装了开发软件 VS Code(此处可查阅安装 VS Code教程),确保相关插件安装成功 2.安装Node.js 和创建Vue项目(此处可查阅安装创建教程) 3.成功在VS Code运行一个Vue项目(此处可查阅运行…

HTML+CSS学习笔记

目录 HTML 1.开发环境 2.创建HTML文件 3.HTML元素 3.1HTML文件结构 3.2HTML标签 3.3HTML属性​编辑​编辑 3.4HTML区块 3.4.1块元素 3.4.2行内元素 3.5HTML表单 CSS 1.CSS简介 2.CSS语法​编辑 3.CSS三种导入方式 内联样式 内部样式 外部样式 4.选择器​ 5.C…

老挝语方言那么多,怎么沟通交流?可以用《老挝语翻译通》app

准备前往老挝探险,却担心语言不通?《老挝语翻译通》App来帮忙,专为老挝语学习者和旅行者设计,让你轻松掌握老挝语,无需打字,说话即可翻译。 应用特色: 中老互译:实时中文与老挝语互…

xlsx单元格宽度自适应内容宽度

xlsx单元格宽度自适应内容宽度 全选内容区域。参考 按下图操作