stable diffusion如何确保每张图的面部一致?

news2024/11/25 12:27:21

可以使用roop插件,确定好脸部图片后,使用roop固定,

然后生成的所有图片都使用同一张脸。

这款插件的功能简单粗暴:一键换脸。

如图所示:

任意上传一张脸部清晰的图片,点击启用。

在其他提示词不变的情况下,Stable Diffusion会跑出一张按照提示词的要求的图片,但脸部换成了roop插件里上传的脸。

当然了,AI换脸的能力是有限的,不可能100%无瑕疵,还要结合比较合适的提示词以及模型,但是效果已经很让人震惊了。

看到这个插件的时候,我就去下载,没想到,从下载到调试bug到最终顺利用上,足足花了三天时间。

为了避免入坑,我把安装过程和注意事项给大家写清楚。

一、插件安装前的准备工作。

1、VisualStudio环境

这个插件是移植过来的,目前并不十分完善(所以为0.0.2版本),安装前需要相应的环境。在Windows系统下,安装VisualStudio。

下载地址:

感谢您下载 Visual Studio - Visual Studio​visualstudio.microsoft.com/zh-hans/thank-you-downloading-visual-studio/?sku=Community&channel=Release&version=VS2022&source=VSLandingPage&cid=2030&passive=false正在上传…重新上传取消

安装时,需要选中Python开发和C++开发。

安装完VisualStudio,最好是重启一下电脑。

2、安装插件

https://github.com/s0md3v/sd-webui-roop

需要注意的是,安装roop插件必须科学上网,并且要配置为全局科学上网(这一步大概劝退90%的AI绘画爱好者)... ...

如图,只能说到这里了。

3、重启Stable Diffusion启动器

继续保持全局科学上网的情况下,重启Stable Diffusion启动器。

如果顺利的话(可能有一半的概率不那么顺利),重启Stable Diffusion后,roop插件就能安装成功,安装成功后,会在首页看到roop插件。

第一次运行成功后,可以退出科学上网工具。

大部分故障和科学上网不稳定有关,换个付费稳定的工具能解决90%的故障。

如果依然出现问题,请按照我的教程顺序检查。

比如,我安装完成后,能出现插件,但换脸不生效,出现了这样一个错误提示:

我逐一排查了错误提示里的每一个行代码,最终发现buffalo_l这个参数来自于insightface项目,在该项目里,buffalo_l是一组模型!有五个!

insightface项目提示模型安装路径是.insightface\models,我翻遍了Python所在的硬盘,也没找到这个目录,后来跟踪程序执行情况,发现定位居然是在C盘的用户目录里!

4、检查模型是否安装成功

roop程序不大,但下载了不少模型,并且分散在各个目录里,如果因为网速原因,有些无法正常下载的模型,系统不会出现提示,但画图的时候会失败,只能自行查找原因,下载模型并安装到相应位置。

模型下载地址:https://www.123pan.com/s/ueDeVv-Xp0I.html 提取码:lgyh

(1)基础模型

安装路径:models\roopinswapper_128.onnx

(2)ifnude模型

安装路径:Windows用户所在目录\.ifnude\

举例,我的Windows账号名是“路过银河”,安装路径就是:

C:\Users\路过银河\.ifnude\detector.onnx

C:\Users\路过银河\.ifnude\classes

(3)insightface模型--人脸侦测模型

roop使用了insightface项目的人脸侦测模型,坑爹的是,这几个模型下载地址在谷歌网盘,有300多M,网络不稳定就无法正常下载,下载不成功无任何提示。

我是查了两天才发现这个问题。我从insightface项目找到了对应的模型,下载并安装好,终于解决了。

安装路径:Windows用户所在目录\.insightface\models

C:\Users\路过银河\.insightface\models\buffalo_l

buffalo_l是个压缩包,下载后需解压缩,共五个模型文件,然后安装到.insightface\models\ 下。

如果你的roop安装后不能正常工作,压根不换脸,到上述几个目录排查,是否安装好了模型文件,如果有漏网之鱼,可以手工下载并拷贝过去,然后重启Stable Diffusion启动器,就可以正常使用了!

让我们试一下。

我从网上随便找了一张图片,图侵删。

只需要选中“启用”和“模型”(默认)。

在文生图的提示词框,输入提示词:

1girl, (flowers=1.5), Issuing, plant,sunlight, outdoors, white dress, long hair,((Cinematic Lighting)), hair between eyes,.shallow depth of field, romantic setting, dreamy pastel palette, whimsical details, captured on film,(RAW photo, best quality),(realistic, photo-realistic:1.3), clean, masterpiece,finely detail,masterpiece,ultra-detailed,highres,(best illustration),(best shadow),intricate, bright light,light_smile

然后点击生成就可以了。

需要注意的是,这个插件一键换脸并不是十分完美,而且只能用于真人模型,对脸型的要求也比较苛刻(似乎更适合瓜子脸)。

请勿用于非法用途。

转载:stable diffusion如何确保每张图的面部一致? - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/746822.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LoRA: 大模型快速训练的秘诀

本文是四两拨千斤,训练大模型的PEFT方法的最后一小节,感兴趣读者可以阅读完整版。 LoRA LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 核心思路是对模型参数做低秩分解,仅训练分解后的参数,模型部署也需额外保存低秩参数&…

SIP业务之BLF

BLF(Busy Lamp Field)是SIP应用中的一项重要业务,用来监视目标号码的状态,常用于调度、坐席监控等场景。 一、 BLF原理 BLF功能需要IP终端或话机与SIP服务器协同实现的,主要流程如下: IP话机向SIP服务器发…

如何使用 ChatGP在TTPU(张量处理单元)上训练模型的指令

推荐:将NSDT场景编辑器加入你的3D工具链 3D工具集:NSDT简石数字孪生. ChatGPT 作为您的专家助手 ChatGPT 可以帮助我们学习新的编程语言、课程、技术和技能。它已成为许多寻求改进工作流程或学习新事物的专业人士的首选工具。ChatGPT 专家助手提示可以减…

IntelliJ IDEA安装教程

一、下载安装包 首先进入IDEA官网下载2021.2.1版本的安装包,不要问我为什么不下最新版,后面我会说。 二、安装与配置 打开安装包,安装完成后选择Evaluate for free(免费试用),创建一个项目,进入…

基于单片机空气质量检测二氧化碳 一氧化碳温湿度PM2.5检测系统的设计与实现

功能介绍 以51单片机作为主控系统;对空气空气中有毒有害气体进行监测;使用LCD1602液晶显示,采集到的PM2.5值通过单片机串口传输;通过传感器对室内PM2.5粉尘进行检查;通过按键设置的上限值;当检测到有毒气体…

5.2 基于ROP漏洞挖掘与利用

通常情况下栈溢出可能造成的后果有两种,一类是本地提权另一类则是远程执行任意命令,通常C/C并没有提供智能化检查用户输入是否合法的功能,同时程序编写人员在编写代码时也很难始终检查栈是否会发生溢出,这就给恶意代码的溢出提供了…

网络ping丢包什么原因(附解决方案)

​  数据包丢失是一种网络问题,当通过网络(或设备之间或通过 Internet)传输的数据包在传输过程中丢失或丢弃并且无法到达目的地时,就会发生这种情况。简单来说,数据包丢失是指数据包无法通过互联网从发送者成功传输到接收者。 如何检测数据…

阿里云RockMQ与SpringBoot的整合

前言: 开源版本Rocket和商业版本的RocketMQ有些不同,研究的是商业版本的RocketMQ,阿里云的官方文档,感觉有点乱。看不咋明白,网上虽然有教程,大都还是有点缺少,有时候会突然跳了步骤&#xff0c…

微信小程序开发1

这里写目录标题 一、结构1.项目结构页面结构 3.小程序的通信模型4.小程序运行机制 二、组件视图容器组件 : 一、结构 1.项目结构 页面结构 2.语言结构 WXML与HTML区别 : WXSS与CSS区别 : .Js文件的分类 3.小程序的通信模型 ①他是由渲染层与逻辑层 根据微信客户端进行转…

RPC分布式网络通信框架(三)—— 服务配置中心Zookeeper模块

文章目录 一、使用Zookeeper的意义二、Zookeeper基础1 文件系统2 通知机制3 原生zkclient API存在的问题4 服务配置中心Zookeeper模块 三、Zk类实现Start方法创建节点、get节点值方法 四、框架应用rpc提供端框架rpc调用端(客户端)框架 总结 一、使用Zook…

平均精度 (mAP):常见定义、误区和误解

我们分解并揭开了常见对象检测指标的神秘面纱,包括平均精度 (mAP) 和平均平均召回率 (mAR)。 这篇文章深入介绍了如何正确计算和使用平均平均精度 (mAP) 和平均平均召回率 (mAR) 进行对象检测,同时消除对 AP、mAP 和第三方库(例如 TorchMetrics 或 pycocotools)的常见误解。…

基于冻土水文模拟的松花江流域水资源演变规律

原文信息 题目:基于冻土水文模拟的松花江流域水资源演变规律 作者:刘水清 周祖昊 刘佳嘉 李佳 谢新民 贾仰文 王浩 期刊:《南水北调与水利科技(中英文)》23年1期 摘要 为分析松花江流域水资源的演变规律&#…

基于SpringCloud微服务图书管理系统设计与实现

一、引言 本次设计基于JavaEE和SpringCloud微服务的图书馆管理系统。利用当前计算机技术的快速发展来构建图书馆管理系统。 随着计算机技术和网络的飞速发展,互联网与互联网加的程序应用在世界范围内越来越流行,当今社会正迅速进入信息社会,信息自动化的作用也日益增强。…

MySQL基础篇第7章(单行函数)

文章目录 1、函数的理解1.1 什么是函数1.2 不同DBMS函数的差异1.3 MySQL的内置函数分类 2、数值函数2.1 基本函数2.2 角度与弧度互转函数2.3 三角函数2.4 指数和对数2.5 进制间的转换 3、字符串函数4、日期和时间函数4.1 获取日期、时间4.2 日期与时间戳的转换4.3 获取月份、星…

815. 打印字符串

链接: 链接 题目: 给定一个字符串,请你编写一个函数,void print(char str[]),将这个字符串打印出来。 输入格式 共一行,包含一个字符串。 输出格式 共一行,表示打印出的字符串。 数据范围 1≤字…

STM32 Proteus仿真ili9341 TFT2048小游戏 -0067

STM32 Proteus仿真ili9341 TFT2048小游戏 -0067 Proteus仿真小实验: STM32 Proteus仿真ili9341 TFT2048小游戏 -0067 功能: 硬件组成:STM32F103R6单片机 ili9341 TFT显示器上下左右方向键赢了按键输了按键 1.标准2048经典游戏玩法&#…

LayUI之动态选项卡Tabiframe使用

目录 一.LayUI之动态选项卡 1.什么是LayUI之选项卡? 1.2layui选项卡使用语法 2. 在企业中LayUI选项卡的使用 二.将layui选项卡部署在web项目中 1.首先查看layui官方文档 2.加入Jsp 3.加入数据,并进行bug修复 3.1首先在我们的二级菜单添加一个点击…

GPT-4的详细信息已经泄露

这位作者说GPT-4的详细信息已经泄露,不知道可信度如何。一些关键信息:- GPT-4的大小是GPT-3的10倍以上。我们认为它在120层中总共有大约1.8万亿个参数。- GPT-4是多个专家模型混合在一起,但不是之前说的8个专家,而是16个。研究人员…

Linux获取文件夹下的所有文件名称

用shell脚本的方式实现 新建脚本文件 fapiao.sh [rootiZbp1bjm0o6frv1c7pp8uaZ home]# vim fapiao.sh编写脚本内容 #!/bin/bash# path文件夹路径 path/home/发票文件 #列出文件名 files$(ls $path)for filename in $files do#将文件名打印至filename.txt 或者路径文件 /hom…

Java找实习经历

Java实习 我开始找实习的时间是2023.7.7,第一个面试是2023.7.11,话不多说,先上图 boss 沟通了300个投递简历也就18份,也就说差不多有20个回复了我,其中约面试的又很少 51job 申请了65份,其中查看的大概10…