AI绘画Stable Diffusion换脸插件ReActor 不香了,新一代换脸神器 InstantID!

news2025/1/22 16:01:36

前 言

之前我介绍了 SD 中的一款换脸插件 ReActor,虽然好使,但是安装还是有些许麻烦的。

今天给小伙伴们介绍一款新型的换脸插件:InstantID,主要是使用 ControlNet 和 IP-Adapter 的组合来控制扩散过程中的面部特征。

一句话,安装简单又好使。

InstantID 同时支持 WebUI 和 ComfyUI。

好了,闲话少说,我们直接开整。


我们先来介绍 InstantID 在 SD WebUI 中的使用

不需要安装插件,只需要更新我们的 ControlNet 版本到最新版本,然后下载对应的模型放入对应的目录下就可以了,模型文件我会放在网盘中,感兴趣的小伙伴可以自取。

把网盘中 WebUI 目录下的文件放入我们本地 SD 的 ControlNet 目录下,大家按自己的目录来哈:

\sd-webui-aki-v4.1\models\ControlNet

然后我们重启我们的 SD 就可以了。

重启以后,我们可以在 ControlNet 看到一个新的控制类型:Instant_lD。

操作也蛮简单的,就按文生图的正常流程走就行,这里需要注意一下,大模型需要选择 SDXL 版本的大模型。

CFG 官方推荐是在 4~5 之间,效果最好。当然大模型不一样也可能会有区别,出图效果不好的时候,大家可以调整试试。

Instant_lD 总共需要用到两个 ControlNet,第一个 ControlNet 主要是上传我们想要换脸的脸部照片,越清晰越好;

第二个 ControlNet 主要是用来上传一张可以识别面部的人物图片,主要用来判断最终生成的图片的人物脸部出现在哪个位置。

我们先来配置第一个 ControlNet,上传我们想要换脸的照片,勾选启用、完美像素模式可勾可不勾,然后选中 Instant_lD 控制类型,这样预处理器和模型就比较好选了。

预处理器选择:instant_id_face_embedding

模型选择:ip-adapter_instant_id_sdxl

接下来我们来配置第二个 ControlNet,启用肯定是要勾选的,完美像素模式可勾可不勾。

允许预览也可以不勾选,听雨这里勾选是让小伙伴们看下第二个 ControlNet 的效果,主要是用来识别上传的图像中的脸部的位置,也就是最终生成的图片的脸部位置。

如果我们这里只上传一张脸部图片的话,生成的图片大概率也是一张脸部图片,上传一张半身照,大概率生成的也是一张半身照。

预处理器选择:instant_id_face_keypoints

模型选择:control_instant_id_sdxl

不知道大家可以看清不,这换脸还是很成功哒,效果相当可以。脸部的位置也和我们上传的第二张图片相符。

WebUI 安装和操作是不是很简单,小伙伴们玩起来吧!


接下来我们来讲讲 ComfyUI 中如何使用 InstantID 吧!在 ComfyUI 管理器中搜索 「InstantID」,然后选择第一个安装。

接下来把我网盘中 comfyUI 目录下的文件下载下来(需要的小伙伴看下方扫描获取),这里和 WebUI 中的模型其实是一样的,改了一个名字而已。

文件下载下来以后,放入 InstantID 的插件目录下,小伙伴们看自己的插件目录在哪哈:

\ComfyUI\custom_nodes\ComfyUI-InstantID\checkpoints

然后我们重启 ComfyUI 就可以了。

我们直接上工作流,效果还可以哈。这边上传图片的操作和 WebUI 中也是一样的,第一张图是换脸的图,第二张图是实际头像所在位置的图。

这里有些模型默认出来的可能就是下图这种类似黑白的图片,小伙伴们可以在提示词中加一些颜色的提示词就可以了,听雨是觉得这张好看,就截这张图了。

这里要说一下,预览图像是不会保存图片的。好的图,小伙伴们记得手动保存哦!当然也可以把预览图像节点换成保存图像节点就没这个问题了。这个大家自己考虑哈!

其他参数没什么好介绍的,我们主要来介绍最前边的三个加载器。之前我们不是把下载的模型放在指定目录下了么,这里就需要把我们指定模型的路径拷贝过来。

第一个加载器,主要是我们刚才放置 controlnet 模型的位置,以下是听雨的文件位置,小伙伴参考一下哈:

D:\Programs\ComfyUI-aki\ComfyUI-aki-v1.1\custom_nodes\ComfyUI-InstantID\checkpoints\controlnet

第二个加载器没啥好说的,就是我们大模型,选择 SDXL 版本的模型即可。

第三个加载器是 ip-adapter 的加载器,听雨的文件路径是,大家改成自己的哈,不要照抄听雨的:

D:\Programs\ComfyUI-aki\ComfyUI-aki-v1.1\custom_nodes\ComfyUI-InstantID\checkpoint

还有一个提示词风格化节点,风格选项可以选择不同的风格。


以上的基础工作流节点就介绍完了,我们再介绍一个在 Instant ID 基础上添加风格化节点的工作流,大家刚加载工作流的时候可能会出现以下这种情况,这说明有缺失的节点。

我们打开 ComfyUI 管理器,然后点击安装缺失节点。

弹出的节点安装界面中会显示缺失的节点,我们点击安装即可。

我们可以看到工作流中多了一个可视化风格节点。

这里只需要关注 1 和 2 就可以了,和之前的一样,把我们本地的路径同步过来。

中间的模型加载器不用管,这里是默认去网上下载的,当然也可以把这个节点换成从本地模型库去取。

再看下我们的可视化的风格化节点,总共有两个节点,第一个节点代表的是艺术家风格,我们可以尝试不同的艺术家风格类型。

第二个节点是艺术运动,这个就比较抽象了,听雨也不知道应该咋形容,小伙伴们自己去了解一下吧,节点上还能选择当前风格的权重,设为 0 那就是忽略了。

今天的分享就到这里啦,感兴趣的小伙伴快去试试吧!

模型以及工作流都已经放在网盘里了,需要的小伙伴可以扫描获取哦

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1673671.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

「JavaEE」多线程案例分析2:实现定时器

🎇个人主页:Ice_Sugar_7 🎇所属专栏:JavaEE 🎇欢迎点赞收藏加关注哦! 实现定时器 🍉简介🍉模拟实现定时器 🍉简介 定时器类似一个闹钟,时间到了之后就会执行…

【全开源】JAVA国际版多语言语聊大厅语音聊天APP系统源码

JAVA国际版多语言语聊大厅语音聊天APP系统源码——深度解析市场需求,打造全球化语音社交平台 随着全球化的推进和移动互联网的普及,人们对于语音聊天的需求日益增长。尤其是在国际交流日益频繁的今天,一个支持多语言、覆盖全球用户的语音聊天…

分布式搜索-elaticsearch基础 概念

什么是elaticsearch: 倒排索引:就是将要查询的内容分成一个个词条,在将词条文档id存入,词条是唯一的。 文档词条总结: mysql和Elasticsearch概念对比: 架构: 基本概念总结:

互联网盲盒小程序开发,提高商家在市场中的竞争力

随着人们生活水平的提高,对娱乐消费需要也在慢慢增加,潮玩市场也因此得到了快速发展,尤其是盲盒,深受大众的喜爱,现在在各大商场以及各种社交平台上都能看到盲盒的身影,市场影响力非常大! 在当…

FastAPI:Python打造高效API的终极武器

在Python的世界里,如果你想要一个既快速又现代的方式来构建API,那么FastAPI可能是你的首选。这个库基于Starlette(用于Web编程)和Pydantic(用于数据验证),专门为速度和易用性设计。 什么是FastA…

搞懂Docker(九)- 使用Docker Compose

获取示例程序 示例程序 或者 示例程序 获取示例程序程序结构如下├── getting-started-app/ │ ├── package.json │ ├── README.md │ ├── spec/ │ ├── src/ │ └── yarn.lock使用Docker Compose Docker Compose是一个帮助你定义和共享多容器应用程序的工具…

Linux系统编程:进程控制

1.进程创建 1.1 fork函数 fork()通过复制调用进程来创建一个新进程。新进程称为子进程,是调用进程的精确副本 进程,但以下几点除外: 子进程有自己的PID,此PID与任何现有进程组的ID不匹配子进程的父进程ID…

qt: undefined reference to `vtable for aaa‘

版本qt4.8.6&#xff0c;编译报错“main.cpp:(.text0x3b): undefined reference to vtable for aaa” 就一个main.cpp #include <QApplication> #include <QTimer> #include <QCursor> #include <QMouseEvent> #include <QDesktopWidget> #inc…

代驾+顺风车+货运app功能介绍

代驾货运顺风车同城拼车打车网约车系统源码app小程序是一个功能丰富的平台&#xff0c;支持二次开发和定制&#xff0c;以满足不同运营商的需求。以下是关于该系统的功能详情介绍&#xff1a; 一、核心功能 会员管理&#xff1a;包括用户注册、登录、个人信息管理等功能&…

yarn 安装以及报错处理

前一种报错是由于没有安装yarn导致的&#xff0c;使用以下命令即可安装&#xff1a; npm install -g yarn 如果成功安装&#xff0c;将显示Yarn的版本号。 yarn --version 第二种报错是因为系统上的执行策略限制导致的。执行策略是一种安全功能&#xff0c;用于控制在计算机…

第15节 编写shellcode加载器

我最近在做一个关于shellcode入门和开发的专题课&#x1f469;&#x1f3fb;‍&#x1f4bb;&#xff0c;主要面向对网络安全技术感兴趣的小伙伴。这是视频版内容对应的文字版材料&#xff0c;内容里面的每一个环境我都亲自测试实操过的记录&#xff0c;有需要的小伙伴可以参考…

HCIP的学习(17)

BGP基础配置 使用直连接口IP地址来建立EBGP对等体关系 1、启动BGP协议 [r1]bgp 100 ----启动BGP协议&#xff0c;并且规定其AS号2、配置设备的RID数值&#xff0c;一般选择设备的loopback接口的IP地址 [r1-bgp]router-id 1.1.1.13、配置BGP对等体信息&#xff0c;包含了对等体…

【声呐仿真】学习记录3-待续

【声呐仿真】学习记录3-后续 第五阶段-获取数据1.运行赫尔库勒斯沉船的世界&#xff1a;2.键盘操纵rov至合适的位置&#xff0c;调整Image topic&#xff0c;查看输出图像3.RVIZ SONAR 图像查看器插件&#xff08;没有对应的topic&#xff09;4.点云5.录制rosbag 第六阶段-查看…

问题—前端调用接口url多加一个/,本地可以调通,测试环境报错302,分开调两个接口

问题背景 接口url前面多加一个/ &#xff0c;npm run serve 起项目&#xff0c;本地调用正常 npm run build 打包到测试环境&#xff0c;接口出现问题&#xff0c;分开调用接口&#xff0c;且报302错误 问题原因&#xff1a; 本地开发环境和测试环境的URL处理方式不同 本地使…

专业的服贸会服务团队-媒体邀约宣传

传媒如春雨&#xff0c;润物细无声&#xff0c;大家好&#xff0c;我是51媒体网胡老师。 2024服贸会开展在即&#xff0c;许多企业都做好了的参展的准备&#xff0c;北京麦塔文化提供专业的展览展会服务&#xff0c;下面做个简单介绍。 、会场搭建团队&#xff1a; 负责整个活…

Ansys Zemax|HUD 设计实例

说明 本文介绍了HUD设计实例。 实例说明 规格如下&#xff1a; 显示器尺寸&#xff1a;24*8mm 眼盒尺寸&#xff1a;100*40mm 放大倍率&#xff1a;5 &#xff08;虚像尺寸 120*40mm&#xff09; 虚像距离&#xff1a;1.8m 最终光学系统的整体布局如下图所示。 从HUD发出的…

478.8-480W 宽电压输入 AC/DC 导轨式开关电源——TPR/SDR-480-XS 系列

TPR/SDR-480-XS 系列导轨式开关电源&#xff0c;额定输出功率为478.8-480W&#xff0c;产品输入范围&#xff1a;85-264VAC。提供24V、36V、48V输出&#xff0c;具有短路保护&#xff0c;过载保护等功能&#xff0c;并具备高效率&#xff0c;高可靠性、高寿命、更安全、更稳定等…

GRFB-UNet:一种新的多尺度注意力网络,用于铺路分割

不同场景下的带注释的触觉铺装示例: GRFB-UNet网络结构: GRFB模块的结构: 铺路在视障人士的旅行中起着至关重要的作用。因此,识别铺装的形状和位置以支持视障人士的移动性是相当有意义的,而视觉分割技术就适合这项任务。为了有效提高触觉铺装分割的精度和鲁棒性,…

RS485和RS232区别

RS485和RS232接口在物理外观上的区别主要在于连接器的类型和接线方式上。这两种串行通讯接口虽然在功能上有所不同&#xff0c;但外观上也有一些显著的特点。 连接器类型&#xff1a; RS232 接口通常使用DB9或DB25类型的连接器。DB9是较为常见的&#xff0c;拥有9个针脚&#x…

小程序的小组件

进度的组件 文字换行过滤 以及 排序 简单易懂 只为了记录工作 <template><div><ProgressBar :progress"progress" /><button click"increaseProgress">增加进度</button><view class"goods-name">12…