最新XL换脸术!EcomID,更像更强,结合InstantID和PuLID优点,200万训练集,6.6显存占用,ComfyUI

news2024/11/29 2:50:27

由阿里妈妈最新开源的换脸工具:EcomID,结合了InstantID和PuLID优点,以获得更好的背景一致性、面部关键点控制、更真实的面部以及更高的相似度。旨在从单个ID参考图像生成定制的保ID图像,优势在于很强的语义一致性,同时受人脸关键点控制。
在这里插入图片描述

该模型在 200 万张淘宝图像上进行训练,其中人脸比例大于 3%。图像分辨率大于800,且美学评分超过 5.5。

混合精度:fp16

学习率:1e-4

批量大小:2

图像大小:1024x1024

结构如下:

在这里插入图片描述

PuLID 的 IP-Adapter:EcomID 借鉴了 PuLID 的 ID-Encoder 和交叉注意力组件,其使用对齐损失训练而成。故而该方法有效减少了 ID embedding 对交叉注意力部分的文本 embedding的干扰,最小化对底层模型文本到图像

InstantID 的 IdentityNet 架构:利用 200 万张美观的人像图像数据集,训练了IdentityNet,增强了关键点控制,提高了 ID 一致性和面部真实感。在训练过程中,IP-adapter 被冻结,只有 IdentityNet 被训练。面部Keypoint用作条件输入,同时面部嵌入通过交叉注意力集成到 IdentityNet 中。

1、保留的文本到图像功能
保留了背景生成功能,同时最大限度地减少了风格化,从而大大增强了真实感。可视化效果突出了更真实的肖像,并提高了背景语义的一致性,展示了 EcomID 在生成逼真图像方面的优势。

2、提高面部控制和一致性
EcomID 使用关键点作为训练的条件输入,允许精确调整面部位置、大小和方向。此功能可确保生成的肖像更易于控制,同时进一步增强面部相似度和图像的整体质量。

对比InstantID:

在这里插入图片描述

对比InstantID、PuLID

在这里插入图片描述

更多官方对比示例

不同基础模型、分辨率和风格对比:

感觉效果是非常不错的

  • 除非特别说明,大部分展示案例使用基础模型 EcomXL 生成;同时EcomID与其他基于 SDXL 的模型也高度兼容,例如 leosams-helloworld-xl[https://civitai.com/models/43977/leosams-helloworld-xl]、dreamshaper-xl[https://civitai.com/models/112902/dreamshaper-xl]、stable-diffusion-xl-base-1.0[https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0] 等。

  • 它与 SDXL Turbo/Lighting、EcomXL Inpainting ControlNet[https://huggingface.co/alimama-creative/EcomXL_controlnet_inpaint] 和 EcomXL Softedge ControlNet[https://huggingface.co/alimama-creative/EcomXL_controlnet_softedge] 的兼容性非常好。

官方还贴心的为大家准备好了 ComfyUI 的插件:https://github.com/alimama-creative/SDXL_EcomID_ComfyUI

EcomID 在ComfyUI中的安装使用

该插件还未收录到Manager中,需要通过Git地址来安装。

  • 1

  • 2

cd comfyui/custom_nodes  
git clone https://github.com/alimama-creative/SDXL_EcomID_ComfyUI  

下载所需模型:

  • 下载原始PuLID的预训练模型:放到:ComfyUI/models/pulid 目录,国内下载地址:PuLID pre-trained model[https://hf-mirror.com/huchenlei/ipadapter_pulid/resolve/main/ip-adapter_pulid_sdxl_fp16.safetensors?download=true]

  • 安装facexlib 依赖,会下载模型。

  • 下载模型(国内可用):AntelopeV2[https://hf-mirror.com/MonsterMMORPG/tools/tree/main] ,并解压到:ComfyUI/models/insightface/models/antelopev2 目录下。

  • 下载原始InstantID的预训练模型,放到:ComfyUI/models/instantid 目录,国内下载地址:HuggingFace Mirror[https://hf-mirror.com/InstantX/InstantID/resolve/main/ip-adapter.bin?download=true]

  • 最后下载:EcomID Controlnet, 放到:ComfyUI/models/controlnet 目录,国内下载地址:https://hf-mirror.com/alimama-creative/SDXL-EcomID/resolve/main/diffusion_pytorch_model.safetensors?download=true

基础工作流

如果需要参考姿势图,请添加:image_kps,如下图工作流:

注意:
底模推荐用:helloworld-xl[[leosams-helloworld-xl](https://civitai.com/models/43977/leosams-helloworld-xl)]、dreamshaper-xl[https://civitai.com/models/112902/dreamshaper-xl]
它与 SDXL Turbo/Lighting、 EcomXL-Inpainting-ControlNet[https://huggingface.co/alimama-creative/EcomXL_controlnet_inpaint] 和 EcomXL-Softedge-ControlNet[https://huggingface.co/alimama-creative/EcomXL_controlnet_softedge]配合得很好。
推荐CFG为:6

生成效果图:


除。

资料软件免费放送

次日同一发放请耐心等待

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

需要的可以扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

**一、AIGC所有方向的学习路线**

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2227367.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

情感咨询小程序的市场需求大吗?

情感咨询小程序的市场需求较大,主要体现在以下几个方面: 情感问题普遍存在5: 恋爱关系困扰:在恋爱过程中,人们经常会遇到诸如沟通不畅、争吵频繁、信任危机等问题。例如,年轻人在恋爱初期可能会因为不了解…

技术分享 | 大语言模型增强灰盒模糊测试技术探索

大语言模型凭借其庞大的参数规模,能够通过无监督学习从海量文本中获取知识,从而不仅能够深刻理解文本语义,还能准确识别文本的格式和结构。凭借对不同数据结构的深度理解,大语言模型已在众多领域得到广泛应用。其中,尤…

Cmake Error:could not find any instance of Visual Studio.

出现以下错误 解决方案: 安装visual stuido 2017。 检查是否安装“使用C的桌面开发” 检查是否安装了扩展开发 点开“单个组件”是否安装了以下组件 编辑计算机环境变量,

linux查看文件命令

查看文件命令 显示命令 cat 语法:cat 【选项】 文件 选项 命令含义n显示行号包括空行b显示行号不包括空行s压缩空行为一行A显示隐藏字符 cat -n 文件:显示行号包括空行 cat -b 文件 cat -s 文件 cat -A 文件 more和less是 分页查看 tac和rev都…

使用Python统计目录下所有.txt文件中的字符数

前言 在日常开发或数据处理中,我们经常需要对大量文本文件进行各种统计操作,比如计算总字数。本文将介绍一种简单的方法,通过Python脚本遍历指定目录下的所有.txt文件,并统计这些文件中的字符总数。这个过程可以帮助开发者更好地…

【Kaggle | Pandas】练习2:索引,选择和分配

文章目录 数据总表1、读取列2、读取某列的第几行的值3、第一行数据4、读取列中前10个值5、读取索引标签为1 、 2 、 3 、 5和8的记录6、包含索引标签为0 、1 、10和100的记录的country 、province 、 region_1和region_2列7、 前 100 条记录的country和variety列8、包含Italy葡…

三款计算服务器配置→如何选择科学计算服务器?

科学计算在众多领域都扮演着关键角色,无论是基础科学研究还是实际工程应用,强大的计算能力都是不可或缺的。而选择一台合适的科学计算服务器,对于确保科研和工作的顺利进行至关重要。 首先,明确自身需求是重中之重。要仔细考虑计算…

【ceral】c++轻量的序列化库

背景 在开发硬件产品时,会有一些参数配置文件,为了保密性或者传输,需要对其序列化处理,待到产品读取文件时,进行反序列化解码转化为设定的参数类型。 简介 ceral是一个仅包含头文件的C序列化库,可以将任…

前后端请求、返回数据的多种方式

Springboot项目的业务逻辑 🌙项目基本结构: 通常情况下,我们在搭建后端项目的时候,处理业务逻辑我们需要用到Controller,Service,Mapper(mybatis,mybatis-plus),Entry各层之间的相互调用来完成,还有就是我…

计算机网络-MSTP的基础概念

前面我们大致了解了MSTP的由来,是为了解决STP/RSTP只有一根生成树导致的VLAN流量负载分担与次优路径问题,了解MSTP采用实例映射VLAN的方式实现多实例生成树,MSTP有很多的理论概念需要知道,其实与其它的知识一样理论复杂配置还好的…

php伪协议和move_uploaded_file、rename、copy等文件操作

move_uploaded_file、rename、copy 三个函数的区别: move_uploaded_file 函数是专门用于将通过 HTTP 上传的临时文件移动到指定位置的。如果你想要将一个已经存在的文件移动到另一个位置,而不是上传的文件,那么你应该使用 rename 函数或 co…

Lucas带你手撕机器学习——套索回归

好的,下面我将详细介绍套索回归的背景、理论基础、实现细节以及在实践中的应用,同时还会讨论其优缺点和一些常见问题。 套索回归(Lasso Regression) 1. 背景与动机 在机器学习和统计学中,模型的复杂性通常会影响其在…

完全透彻了解一个asp.net core MVC项目模板1

当我们使用Visual Studio 2022去新建一个基于asp.net core Web项目的时候,一般有三种选择,一种是空项目,一种是基于MVC的项目、再有一种就是基于包含Razor Pages实例的web应用。如下图: 今天,我们打算选择基于MVC模…

【无标题】2024年第五届 MathorCup 数学应用挑战赛——大数据竞赛赛题

2024年第五届 MathorCup 数学应用挑战赛——大数据竞赛赛题已发布~,本届初赛时间为:2024年10月25日18:00至2024年11月1日20:00。本次赛题分为A,B两道,所有参赛队从赛道 A、B 中任选一题作答。在报名系统内选择自己队伍的赛道时&am…

离散化算法简介

【离散化简介】 ★ 离散化是一种数据处理的技巧,本质上可以看成是一种“哈希”,其保证数据在哈希以后仍然保持原来的“全/偏序”关系。用来离散化的可以是大整数、浮点数、字符串等等。★ 离散化的本质,是映射。原理是将间隔很大的元素&#…

毫米波技术基础

什么是毫米波? 顾名思义,毫米波是波长 (λ) 约为 1 毫米(更准确地说是 1 至 10 毫米)的电磁波。使用方程式f c /λ 将该波长转换为频率,其中c是光速 (3 x 10 8 m/s),得出 30-300 GHz 的频率范围。国际电信…

【STM32】内存管理

首先问个问题,你知道如何在LCD上显示SD卡文件浏览?-----需要读取所有文件名到内存,然后才能显示到LCD上。 一般的方法:是定义一个数组来存储文件名 1:需要知道最大文件名的长度 2:需要知道文件的个数。1…

OpenCV图像处理方法:腐蚀操作

腐蚀操作 前提 图像数据为二值的(黑/白) 作用 去掉图片中字上的毛刺 显示图片 读取一个图像文件,并在一个窗口中显示它。用户可以查看这个图像,直到按下任意键,然后程序会关闭显示图像的窗口 # cv2是OpenCV库的P…

使用Python中的jieba库进行简单情感分析

在自然语言处理(NLP)领域,情感分析是一项重要的任务,它可以帮助我们理解文本背后的情感倾向。本文将通过一个简单的例子来介绍如何使用Python的jieba库对中文文本进行基本的情感分析。 1. 环境准备 首先,确保已经安装…

图像分割从基础到进阶:阈值化、K-means和Mean-Shift算法的应用

图像分割是计算机视觉中的一项关键技术,用来将图像划分为若干个 有意义 的区域,以便后续的图像处理和分析工作。根据任务的不同,图像分割可以进一步细分为语义分割、实例分割和全景分割: 语义分割 (Semantic Segmentation) 对图像…