使用【SD-WEBUI】插件生成单张图包含多个人物:分区域的提示词

news2025/1/12 2:59:30

文章目录

  • (零)前言
  • (一)潜变量成对(Latent Couple)
    • (1.1)可自组LoRA(Composable LoRA)
  • (二)分区扩散(Multi Diffusion)
    • (2.1)区域提示控制(Region Prompt Control)
  • (三)分区域提示词(Regional Prompter)
    • (3.1)蒙版分割+提示词分割
  • (四)总结

(零)前言

本篇主要提到几个插件,可以让一张图中包含多个人物,我也企图包含多个LoRA模型人物,但目前并不完美。
更多不断丰富的内容参考:🔗《继续Stable-Diffusion WEBUI方方面面研究(内容索引)》

(一)潜变量成对(Latent Couple)

参考:https://github.com/ashen-sensored/stable-diffusion-webui-two-shot
可以从WEBUI中直接安装。

其实它的仓库名字是“双人特写”,用法参考官网。
也可以看看这位同学的 Bilibili的教程视频,我觉得写得很详细了。

简单说大概是用参数:

  • 分割(Divisions),比如:1:1,1:2,1:2,意思:整体区域,一半区域,一半区域
  • 位置(Positions),比如:0:0,0:0,0:1,各个区域(这里3个区域)的起始位置坐标x:y
  • 权重(Weights),比如:0.2,0.8,0.8,各个区域提示词的权重。
  • 迭代止步于(end at this step),分区迭代多少步数。

哦,对了,它可以把你写的参数转换为区域的预览图(方便检查是否正确):
请添加图片描述

再配合提示词写为{全局提示词} AND {区域1提示词} AND {区域2提示词}来配对上面的区域划分。比如:

2girls, upper body, outdoors, blurry background
AND 2girls, upper body, outdoors, blurry background, <lora:FBB_v1.0:0.7>
AND 2girls, upper body, outdoors, blurry background, <lora:XYJY_v1.0:0.7>

再配合下面的【可自组LoRA】插件,画出了下面的2者都不像图片😓,嗯?:
请添加图片描述

(1.1)可自组LoRA(Composable LoRA)

参考:https://github.com/opparco/stable-diffusion-webui-composable-lora
可以从WEBUI中直接安装。

不装这个插件的话【潜变量成对】也能用,但是不能处理LoRA模型。
装了它以后,虽然看别人的二次元动漫很完美,可是真人LoRA画出来就是不像。

选项就启动第一个,不需要截图了吧。

(二)分区扩散(Multi Diffusion)

参考:https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111
可以从WEBUI中直接安装。

参考官网,它的功能其实不只是分区域的提示词,主要功能包括:

  • 生成大型图像(以及放大图像)
  • 极大降低VAE编解码大图所需的显存开销
  • 区域提示控制

(2.1)区域提示控制(Region Prompt Control)

其他部分功能参考官网吧,这里不提了。

这个区域提示控制部分的特点是,你可以画区域,而不是写参数,所以非常直观,如下图:
第一个区域设置为背景(红框)
第二个区域设置为前景(橙框)
第三个区域设置为前景(黄框)
请添加图片描述

提示词和前面一样,只是需要分别写入你激活区域对应地方就OK。生成结果如下:
人物甚至背景总是分得很开(依然不像)。
请添加图片描述

(三)分区域提示词(Regional Prompter)

参考:https://github.com/hako-mikan/sd-webui-regional-prompter
可以从WEBUI中直接安装。

用法稍微复杂一点点,之前也是用参数控制区域,分横竖方向和进阶的网格区域。
官方的例子详细解释了怎么分区的。
提示词:

(blue sky:1.2) ADDCOL
green hair twintail ADDCOL
(aquarium:1.3) ADDROW
(messy desk:1.2) ADDCOL
orange dress and sofa

分区参数:

Divide mode : Horizontal
Divide Ratio : 1,2,1,1;2,4,6

得到这样的结果:
在这里插入图片描述
那个分割比例设置稍显复杂,好在也是可以预览的。
在这里插入图片描述

回到前面的例子,正常左右1比1分割。
几乎和前面一样的提示词(必须修改一点,2个左右区域至少要个ADDCOL),
生成了下面简单的例子(依然不像):
请添加图片描述

(3.1)蒙版分割+提示词分割

我正在写呢,突然发现它更新了,可以用蒙版和提示词来分割(而不是难以理解的数字)。
蒙版分割可以参考官网。提示词分割很有意思(也可以参考官网),虽然是实验性质的。

如果我想在外套上画草莓,常规的方式根本不画,如果太强调画草莓,则可能凭空出现真实的草莓(很诡异)。
这时候用提示词分割就很有效,比如:

左图常规方式,完全没画出衣服上的草莓,但又不敢加强草莓提示:

1girl, ......, turtleneck sweater, strawberry printed overcoat, outdoors on street, blurry background, ......

右图启用了提示词分割😄:

1girl, ......, turtleneck sweater, overcoat, outdoors on street, blurry background, ......, BREAK
(strawberry printed:1.5) overcoat

在这里插入图片描述
还有个提示词(EX)模式:

在提示词模式中,重复的区域被添加。
而提示词(EX)模式中,重复的区域是按顺序覆盖的。由于它们是按顺序处理的,所以先设置一个大面积的目标,使小面积的效果更容易保持不被削弱。

虽然没看懂,但应该是字面的意思没错啦,哈哈。
像上面简单的草莓外套的例子,因为没有重复和覆盖的问题,所以两个提示词模式生成的图片一样。

这部分和画双人无关。
但是看得出分区域提示词(Regional Prompter)的改进还是很大的。

(四)总结

从直观感觉上,不像的原因是LoRA的特点似乎在相互侵蚀(污染)并没有真的分别被控制在不同的区域中。
有时出图很离谱,需要多调节参数,但无论怎么调也只能让图很自然,就是不像。

PS:你能猜到上面是哪两位LoRA么……

如果去掉LoRA则多试几次基本就能得到描述的样子,比如:

2girls, upper body, outdoors, blurry background, open mouth, crying sad, eyes closed, sky blue hair, long hair,  white shirt,  ADDCOL 
2girls, upper body, outdoors, blurry background, closed mouth, light smile, red hair,  short hair, Asian, blue overcoat, 

得到了:
请添加图片描述

不过很多人的例子里二次元动漫,明明有LoRA。
为什么看上去还是那么完美呢,真是不明白。

当然分区控制不仅是为了画2个人,也可以上有蓝天右边太阳,下有草地左边池塘,这种用法。

所以这篇相当于没有写(吧?)。


🤪 to be continued…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/502150.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

@Configuration(proxyBeanMethods = false) 解析

又是美好的一天呀~ 个人博客地址&#xff1a; huanghong.top 往下看看~ Configuration(proxyBeanMethods false) 解析proxyBeanMethods分析总结 Configuration(proxyBeanMethods false) 解析 最近看一些源码的时候&#xff0c;发现很多Configuration配置类上Configuration(p…

Mysql 学习(九)多表连接原理

连接介绍 为了更加方便的介绍一下连接&#xff0c;我们先创建两个表格 t1 和 t2 CREATE TABLE t1 (m1 int, n1 char(1));CREATE TABLE t2 (m2 int, n2 char(1));INSERT INTO t1 VALUES(1, a), (2, b), (3, c);INSERT INTO t2 VALUES(2, b), (3, c), (4, d);连接的本质是将各个…

GitHub上的AutoGPT神秘的面纱

最近一直在说AutoGPT&#xff0c;有很多的视频介绍&#xff0c;但是本着收藏等于学会的原则&#xff0c;收藏一堆一直没看。 这里用一句话说明白&#xff1a;AutoGPT就是一个用Python套装的壳子&#xff0c;用来更省事的调用OpenAI的API。&#xff08;如果你不明白API&#xf…

WiFi(Wireless Fidelity)基础(二)

目录 一、基本介绍&#xff08;Introduction&#xff09; 二、进化发展&#xff08;Evolution&#xff09; 三、PHY帧&#xff08;&#xff08;PHY Frame &#xff09; 四、MAC帧&#xff08;MAC Frame &#xff09; 五、协议&#xff08;Protocol&#xff09; 六、安全&#x…

ByteBuffer的讲解和使用

1.它其实就是一个数据读取或者写入的一个缓冲区 2.基本的操作步骤&#xff1a; 向buffer写入数据&#xff0c;例如调用channel.read(buffer)调用flip()切换至读模式从buffer读取数据&#xff0c;例如调用buffer.get()调用clear()或者compact()切换至写模式重复以上步骤 3.内部…

企业商务租车为工作提供便利

在当代的忙碌生活中&#xff0c;我们总会遇到各种各样的烦恼。最突出的是企业在商务工作中&#xff0c;常常会因为各种原因而导致耽误时间&#xff0c;如火急火燎的去谈生意&#xff0c;却遇到了堵车的现象&#xff0c;或者车辆出现问题而导致耽误时间&#xff0c;而广州商务租…

ICV:中国车载超声波雷达市场规模预计2024年可达20亿美元

近年来&#xff0c;由于市场对车辆先进安全功能的需求的增加&#xff0c;汽车超声波传感器市场一直保持稳步增长。ICV估计&#xff0c;车载超声波传感器全球市场预计在2022年至2027年之间以11.5&#xff05;的复合年增长率增长&#xff0c;这种增长是由越来越多的高级驾驶辅助系…

python 开发 1 之 拷贝文件

目录 一、需求&#xff1a; 二、python拷贝分析 1、需要的库&#xff0c;及源路径、目标路径定义 2、定义的拷贝数组 3、自定义拷贝函数 1&#xff09; 如果目标路径不存在时&#xff0c;先创建目标路径 2&#xff09;遍历元组数组中的文件 3&#xff09;如果源文件或目…

【JavaEE初阶】多线程进阶(六)JUC 线程安全的集合类

文章目录 JUC&#xff08;java.util.concurrent&#xff09;的常见类Callable接口相关面试题 ReentrantLock(可重入锁)原子类信号量SemaphoreCountDownLatch 线程安全的集合类多线程环境使用 ArrayList多线程使用队列多线程使用哈希表&#xff08;重点&#xff09;相关面试题 J…

2.sql server数据表的管理(实验报告)

目录 一﹑实验目的 二﹑实验平台 三﹑实验内容和步骤 四﹑命令(代码)清单 五﹑运行结果 一﹑实验目的 掌握使用SQL Server管理平台和Transact-SQL语句Create table和Alter table创建和修改表的方法&#xff1b;掌握在SQL Server管理平台中对表进行插入、修改和删除数据操作…

哪种蓝牙耳机戴着最舒服?久戴不痛的蓝牙耳机推荐

很多喜欢跑步或通勤的时候带着耳机听音乐&#xff0c;而现在无线耳机市场规模扩大之后&#xff0c;也开始走向更加细分的市场&#xff0c;以满足越来越不同的差异化需求&#xff0c;但是佩戴的舒适度是很多人关注的&#xff0c;下面整理了几款佩戴舒适度高的蓝牙耳机&#xff0…

国考省考结构化面试:组织管理题,调研题,宣传题,活动题,整治题

国考省考结构化面试&#xff1a;组织管理题&#xff0c;调研题&#xff0c;宣传题&#xff0c;活动题&#xff0c;整治题 2022找工作是学历、能力和运气的超强结合体! 公务员特招重点就是专业技能&#xff0c;附带行测和申论&#xff0c;而常规国考省考最重要的还是申论和行测…

基于python语言dlib库和opencv库的视频眨眼检测

功能说明&#xff1a; 基于python编程语言&#xff0c;使用dlib 和opencv开发的视频眨眼检测。 环境&#xff1a; * python 3.6.8 * opencv 3.4.2.16 * dlib 19.7.0 原理&#xff1a; 1.使用opencv-python读取处理视频图像 2.使用线程机制处理人脸检测关键点 3.根…

Midjourney 5.1震撼更新!逼真到给跪,中国情侣细节惊艳,3D视频大片马上来

来源 | 新智元 作者 | 桃子&#xff0c;拉燕 一个月前&#xff0c;Midjourney V5画的一对中国完美情侣在网上爆火&#xff0c;让许多人纷纷惊呼画师要失业了。 恰在今天&#xff0c;Midjourney官宣V5能免费用了&#xff0c;而且还是最新版本V5.1。 各个大模型的研究测试传送门 …

Android 13 变更及适配攻略

准备工作 首先将我们项目中的 targetSdkVersion和compileSdkVersion 升至 33。 影响Android 13上所有应用 1.通知受限 对新安装的应用的影响&#xff1a; 如果用户在搭载 Android 13 或更高版本的设备上安装您的应用&#xff0c;应用的通知默认处于关闭状态。在您请求新的…

ChatGPT如何生成可视化图表-示例中国近几年出生人口

本教程收集于&#xff1a;AIGC从入门到精通教程汇总 ChatGPT本身不能直接生成可视化图表&#xff0c;但可以配合其他可视化工具或库 方法一&#xff1a;前端可视化开发库 Echarts&#xff08;地址&#xff1a;Apache ECharts &#xff09; 方法二&#xff1a;现有Python库。…

dump_stack分析函数调用关系实例及其实现

dump_stack分析函数调用关系 文章目录 dump_stack分析函数调用关系一、dump_stack实例二、dump_stack实现分析Step 1: dump_stack_print_infoStep 2: show_stack 三、关于堆栈 一、dump_stack实例 在正点原子阿尔法开发板中查看insmod命令使用什么方法&#xff1a; #include …

[蓝帽杯 2022 初赛]之Misc篇(NSSCTF)刷题记录(复现)⑨

NSSCTF-Misc篇-[蓝帽杯 2022 初赛] 计算机取证&#xff1a;[蓝帽杯 2022 初赛]计算机取证_1[蓝帽杯 2022 初赛]计算机取证_2[蓝帽杯 2022 初赛]计算机取证_3[蓝帽杯 2022 初赛]计算机取证_4 手机取证&#xff1a;[蓝帽杯 2022 初赛]手机取证_1[蓝帽杯 2022 初赛]手机取证_2 网站…

使用堆视图创建3个按钮三角摆放

使用堆视图创建3个按钮三角摆放 效果如图&#xff1a; 分析 从效果图看&#xff0c;想要让3个Button呈三角摆放&#xff0c;需要两个堆视图完成。 首先外部一个大的“垂直堆”&#xff0c;垂直堆第一项放一个Button&#xff0c;第二项放一个“水平堆” 水平堆里再放两个But…

刚入职领导就要求做自动化测试?我懵了,从业务到框架设计总结...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 Python自动化测试&…