Stable Diffusion Web UI基础插件推荐

news2024/9/19 9:40:46

通过前面知识的介绍,我们对使用 Web UI 进行绘画有了基本了解,在平时我们使用中,有很多好用的插件,通过这些插件我们创作能够事半功倍,下面我就推荐一下在平时经常使用到的插件,希望这篇文章能够帮助大家更好地了解 Stable Diffusion 插件。

插件安装

界面安装

Web UI 可以通过界面来管理安装,如下图在Extensions中,通过下面的选项卡可以查看不同功能。Installed是查看已经安装好的插件,Avaliable 中是查看可以安装那些可安装的插件,点击Load from: 可以加载已经配置好的插件列表清单,同时下面还可以进行一些过滤等操作,在查询的列表的右侧有Install按钮,点击Install即可安装。

1

同时在Install from URL选项卡中,我们可以输入插件的仓库地址直接安装,平时我们可能在列表中没找到对应的插件可使用该方式直接安装。

2

命令安装

在命令窗口中进入地址stable-diffusion-webui/extensions目录,直接复制仓库地址克隆下来或者下载压缩包,解压到当前目录。比如安装插件sd-webui-prompt-all-in-one

cd stable-diffusion-webui/extensions
git clone https://github.com/Physton/sd-webui-prompt-all-in-one.git

或者下载压缩包,解压到插件文件夹:/extensions/[extension name],比如:/extensions/sd-webui-prompt-all-in-one

推荐插件

sd-webui-prompt-all-in-one

sd-webui-prompt-all-in-one 是一个基于 stable-diffusion-webui 的扩展,旨在提高提示词/反向提示词输入框的使用体验。它拥有更直观、强大的输入界面功能,它提供了自动翻译、历史记录和收藏等功能,它支持多种语言,满足不同用户的需求。

prompt-all-in-one 对于英文不好的用户,可以快速弥补英文短板,可以直接输入中文自动转英文、自动保存使用描述词记录,还有快速修改权重、收藏、翻译等多种功能,是写提示词的必备工具。

3

同时在插件group_tags目录中,我们可以自行选择配置不同的,常用的词汇。

4

配置文件格式如下:

- name: 一级分类名
  groups: 二级分类列表
    - name: 二级分类名
      color: 关键词文本默认颜色(可以为空),CSS颜色代码,例如:#ff0000, red, rgb(255,0,0), rgba(255,0,0,1), hsl(0,100%,50%), hsla(0,100%,50%,1)
      tags: 关键词列表
        - 英文关键词: 本地化翻译
        - 英文关键词: 本地化翻译
        ...

仓库地址:https://github.com/Physton/sd-webui-prompt-all-in-one
配置详情说明:https://aiodoc.physton.com/zh-CN/

multidiffusion-upscaler-for-automatic1111

非常强大的图片放大插件,Tiled Diffusion 可以用于比较低的显存使用率超分2K以上的图片。在highres.fix达到 1.5 或2倍 CUDA 内存限制后,它可以集成到Stable Diffusion的达到高分辨率的图片。

它支持将 Regional Prompt Control、ControlNet、DemoFusion 集成使用,能够按区域进行控制,非常强大,后面会单独介绍一下它的用法。

5

仓库地址:https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111
配置详情说明:https://github.com/pkuliyi2015/multidiffusion-upscaler-for-automatic1111/wiki/%E4%B8%BB%E9%A1%B5

ultimate-upscale-for-automatic1111

Ultimate SD Upscale也是一款目前非常受欢迎的图像放大工具,原理与上面插件Tile Vae 相近,都是先将图像分割为一个个小的图块后分别放大,再拼合在一起,适合低显存的电脑。

在img2img的选项卡中,在配置脚本Script中可以看到 Ultimate SD 选项,如下:

6

比较常用的模型用途介绍一下,其他的可以自行查找,更多的放大模型可以去网站:https://openmodeldb.info/ 查询。

序号名称用法和介绍
1Latent是一种基于 VAE 模型的图像增强算法,通过将原始图像编码成潜在向量,并对其进行随机采样和重构,从而增强图像的质量、对比度和清晰度。一般情况下,这个算法就能得到不错的效果,和4x-UltraSharp、R-ESRGAN等相比,显存消耗比较小,但效果不是最优。
2Lanczos将对称矩阵通过正交相似变换变成对称三对角矩阵的算法。
3ESRGAN增强超分生成对抗网络,是对SRGAN关键部分网络结构、对抗损失、感知损失的增强。从这里开始就不是单纯的图像算法,进入人工智能的领域了。实测确实增加了很多看上去很真实的纹理,但是有时又会把一张图片弄得全是锯齿或怪异的纹理。可能对待处理的图片类型有要求。
44x-UltraSharp基于ESRGAN做了优化模型,更适合常见的图片格式。真人模型最佳选择。
5ESRGAN 4x完全使用纯合成数据去尽量贴近真实数据,然后去对现实生活中数据进行超分的一个方法。
6R-ESRGAN 4x+基于Real ESRGAN的优化模型,针对照片效果不错。
7R-ESRGAN 4x+ Anime6B基于Real ESRGAN的优化模型,二次元最佳,如果你的模型是动漫类的,该选项是最佳选择。
8R-ESRGAN General 4xV3基于Real ESRGAN的优化模型,体积小,计算快,效果差。
9SwinIR_4x使用Swin Transformer思想,采用一个长距离连接,将低频信息直接传输给重建模块,可以帮助深度特征提取模块专注于高频信息,稳定训练。
10LDSRLatent Diffusion Super Resolution(潜在扩散超分辨率模型),质量好但速度非常慢,一般不推荐。

1、一般我们将生成好的图像发送到图生图,大模型、正/负向提示词、采样器这些内容都可以不改变,生成步数大于 20 步,尺寸与你上传的图像尺寸一致,重绘幅度设置在 0.15 - 0.35之间。(如果是从本地上传图像,大模型选择和图像风格一致的,负面提示词也填一些常用的,图像生成效果会更好)

7

2、将 WebUI 界面拉到最底层,从「脚本(Script)」列表中选择 Ultimate SD upscale 选项,在弹出的选项框内设置参数,最后可以点击「生成」按钮放大图像了。

8

  • Target size type:选择放大的方式。有三个选项,第一个是“From img2img settings”,即保持和img2img一样的配置,第二个选项“Custom size”,即自己设置大小,推荐选择第三项“Scale from image size”,直接设置当前图片的放大倍数。
  • 放大算法:具体的模型和算法参考上面介绍,推荐 ESRGAN_4x (逼真写实类)和 R-ESRGAN 4x+(其他风格),其余的大家可自行尝试。
  • 类型:推荐选择 Chess 模型,可以减少图像伪影。
  • 分块宽度/高度:图像分割成多大的图块,一般设置为 512 即可。
  • 蒙版边缘模糊:图块之间融合度,尺寸在512-768px 图块大小上将其设置为 12-16。直接使用默认值也可以。
  • Seams Fix:修复图块之间的接缝。如果生成的图块之间有明显的接缝,可以选择其中任意一个模型;如果图块之间没有接缝,不需要开启这个选项。

如下放大前图片:

9

放大后图片:

10

仓库地址:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111
配置详情说明:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111/wiki

sd-webui-lobe-theme

如果不喜欢默认的 Web UI 界面,可以用这个主题插件,看起来更现代简洁风。我们可以选择安装这款主题插件,可以自定义配置 Web UI 的界面样式。

11

仓库地址:https://github.com/lobehub/sd-webui-lobe-theme
配置详情说明:https://github.com/lobehub/sd-webui-lobe-theme/blob/main/README.zh-CN.md

stable-diffusion-webui-images-browser

该插件支持查看以前创建的图片,检查与图片生成相关的元数据,在 Web UI 中把这些数据直接运用到后续的图片生成,例如文生图或者图生图提示词。同时你也可以把喜欢的图片整理收藏,或删除不感兴趣的图片。

12

查看详情:

13

仓库地址:https://github.com/AlUlkesh/stable-diffusion-webui-images-browser

ADetailer

After Detailer 这是一款非常强大的、专门针对人脸进行修复的插件,可以解决生成全身图时人物面部扭曲/模糊的问题。
开启后,它能自动检测、遮罩和增强面部细节。根据你的图片输出,有时增强后的图像可能会过度拟合。可以尝试调整参数设置来获得更好的结果。

14

After Detailer 安装成功后,先勾选的「启用」选项,然后选择一个对应的模型,再正常进行生成操作即可。修复模型区别如下:

15

  • face_yolov8n.pt / face_yolov8s.pt:针对 2D/写实风的脸部
  • hand_yolov8n.pt :针对 2D/写实风的手部
  • person_yolov8n-seg.pt / person_yolov8s-seg.pt:针对 2D/写实风的人物
  • mediapipe_face_full / short / mesh:针对写实风的脸部
  • mediapipe_face_mesh_eyes_only:针对写实风的眼睛

仓库地址:https://github.com/Bing-su/adetailer

sd-dynamic-thresholding

Dynamic thresholding (CFG Scale Fix) 插件适用于多个 Stable Diffusion Web UI 界面,包括A1111和ComfyUI。安装这个插件之后,我们可以使用更高的 CFG 比例而不会出现颜色问题。这样,我们在使用 Stable Diffusion 生成图像时有更多灵活的选择,不必担心高 CFG 比例可能引起的失真。

16

仓库地址:https://github.com/mcmonkeyprojects/sd-dynamic-thresholding

stable-diffusion-webui-localization-zh_CN/stable-diffusion-webui-chinese

这两个都是 Web UI 的中文插件,对于国内中文使用用户界面做了翻译。安装后在 Web UI 的用户配置界面选择对应的语言配置即可,然后进行重启。
17

仓库地址:https://github.com/dtlnor/stable-diffusion-webui-localization-zh_CN
仓库地址:https://github.com/VinsonLaro/stable-diffusion-webui-chinese

sd-webui-aspect-ratio-helper

Aspect Ratio Helper 可以帮我们固定生成图像的宽高比,比如 2:3、16:9 等,点击后插件会自动将数值调整为对应的宽高比;锁定宽高比后,调整其中一项数值的时候,另一项也会跟随变化,非常方便。

18

在配置页面也可以对现有的数值进行修改,比如增加新的宽高比、限定最大尺寸等。

19

仓库地址:https://github.com/thomasasfk/sd-webui-aspect-ratio-helper

stable-diffusion-webui-wd14-tagger

Wd14 Tagger 插件可以反推提示词,反推AI生成的图,进行重现信息。安装完成后上传一张图像,然后选择一个反推模型(一般使用 WD14 ViT v2 ),点击 Interrogate Image 进行反推,就能得到关于图像的一组提示,并显示每个关键词的相关性权重。

当看到别人画的图,按照他提供的 prompt 以及模型根本无法复现。有时候甚至连 prompt 都没提供,凭自己的想象力很难用合适的提示词来描述这个画面,可以使用 tagger 反推提示词。

20

  • 阈值:设定权重值范围,超过此权重值的提示词才会显示出来;
  • 可以批量处理图片,并将提示词批量导出,训练 lora 模型时可以用来为图片批量打标签;
  • 使用结束后,记得点击下方的“卸载所有反推模型”,不然模型会占用很高的显存。

仓库地址:https://github.com/picobyte/stable-diffusion-webui-wd14-tagger

a1111-sd-webui-tagcomplete

这个插件能够自动提示prompt的拼写补全,非常方便。

  • 直接输入中文,调取对应的英文提示词;
  • 根据未写完的英文提示词提供补全选项,在键盘上按↓箭头选择,按 enter 键选中。

对于中文的输入,在安装后,在配置页面,调整配置文件为zh_cn.csv

21

现在我们输入中文就会提示对应的英文词汇。
22

仓库地址:https://github.com/DominikDoom/a1111-sd-webui-tagcomplete
配置详情说明:https://github.com/DominikDoom/a1111-sd-webui-tagcomplete/blob/main/README_ZH.md

以上就是本期的内容,喜欢本期内容的话记得点赞收藏支持一波,之后会继续为大家推荐更多实用的 AI 绘画干货。欢迎大家关注微信公众号"壁虎说技术",更多AI新技术,新点子在公众号第一时间更新。


壁虎说技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2141063.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MelosBoom:解锁数据价值的新纪元

在当今的数字时代,数据被誉为“新的石油”,但用户在传统的Web2环境中,往往无法真正享受到自己贡献数据的价值。大型互联网公司通过集中化的系统和算法,垄断了数据的使用权,并从中获取巨大的商业利益,而数据…

浏览器页面被禁用 F12(dev tools)

解决办法1: 使用浏览器设置栏, 打开开发者工具, 设置->更多工具->开发者工具 解决办法2: 命令行启动浏览器, 携带参数, 强制打开所有页面的 devtools chrome.exe –auto-open-devtools-for-tabs –user-data-dir./

时序必读论文10|ICLR23 Crossformer 跨维度依赖的多变量时序预测模型

论文标题:iCROSSFORMER : TRANSFORMER UTILIZING CROSS DIMENSION DEPENDENCY FOR MULTIVARIATE TIME SERIES FORECASTING 开源代码:https://github.com/Thinklab-SJTU/Crossformer 前言 Crossformer是一篇非常典型的在transformer基础上魔改注意力机…

k8s使用本地docker私服启动自制的flink集群

目标:使用本地flink环境自制flink镜像包上传到本地的私服,然后k8s使用本地的私服拉取镜像启动Flink集群 1、将本地的flink软件包打包成Docker镜像 从官网下载flink-1.13.6的安装包,修改其中的flink-conf.yaml,修改下面几项配置 …

鸿蒙开发之ArkTS 基础九 枚举类型

枚举把变量固定在特定的范围内 枚举的语法: enum 枚举名字 { 常量1 值1, 常量1 值1, 常量1 值1, ... } 定义具体如下: 使用具体如下:

【无人机设计与控制】四旋翼无人机俯仰姿态保持模糊PID控制(带说明报告)

摘要 为了克服常规PID控制方法在无人机俯仰姿态控制中的不足,本研究设计了一种基于模糊自适应PID控制的控制律。通过引入模糊控制器,实现了对输入输出论域的优化选择,同时解决了模糊规则数量与控制精度之间的矛盾。仿真结果表明,…

【探索数据结构与算法】希尔排序原理、实现与分析(图文详解)

目录 一、 引言 二、算法思想 三、算法步骤 四、代码实现 五、复杂度 💓 博客主页:C-SDN花园GGbond ⏩ 文章专栏:探索数据结构与算法 一、 引言 希尔排序(Shell Sort)是插入排序的一种更高效的改进版本&#x…

vulnhub靶机:Skytower

下载 下载地址:https://www.vulnhub.com/entry/skytower-1,96/ 导入靶机 解压发现是VirtualBox格式的,下载一个VirtualBox:Downloads – Oracle VirtualBox 选择解压后的vbox文件,然后点击左上角管理 点击导出虚拟电脑&#xff…

Datawhale------Tiny-universe学习笔记——Qwen

1. Qwen整体介绍 对于一个完全没接触过大模型的小白来说,猛一听这个名字首先会一懵:Qwen是啥。这里首先解答一下这个问题。下面是官网给出介绍:Qwen是阿里巴巴集团Qwen团队研发的大语言模型和大型多模态模型系列。其实随着大模型领域的发展&a…

卡尔曼滤波中Q和R与噪声的关系

卡尔曼滤波 一种用于估计系统状态的递归滤波器,通过融合传感器测量和系统模型,提供系统状态的最优估计。 Q和R是什么 在卡尔曼滤波中,Q和R分别表示过程噪声和测量噪声的协方差矩阵。 Q Q Q矩阵(过程噪声协方差矩阵)…

电子连接器温升仿真教程 一

电子连接器温升是指电子连接器的所有端子在施加额定电载荷的情况下,经过一段时间后,达成热平衡,连接器局部温度不再继续升高,此时规定测试点的温度与测试环境温度的差值。连接器的温升规格值因其应用环境不同,而不同。工业应用,且不与人体接触的电子连接器一般允许温升会…

日系编曲:电吉他音色制作 拾音器选择 电吉他音色制作逻辑 音箱分类 效果器单块分类

拾音器选择 拾音器:获取琴弦震动产生电信号经过线材传输到音箱(amp)使听众听到 一般的电吉他分为三块和两块拾音器,挡位分为三档或五档 Bridge(琴桥拾音器):声音更加清晰,音色更突…

[JAVA]介绍怎样在Java中通过字节字符流实现文件读取与写入

一,初识File类及其常用方法 File类是java.io包下代表与平台无关的文件和目录,程序中操作文件和目录,都可以通过File类来完成。 通过这个File对象,可以进行一系列与文件相关的操作,比如判断文件是否存在,获…

第3步VM的虚拟机无法用网络安装直接改用CDROM镜像包安装软件

精简版的CentOS只有ip add可用 ping命令可用其它软件版本太低都不能用,改用光盘镜像来安装软件。 步骤:1、修改Vm的设置,将光盘映像改为ISO文件。 步骤:2、在centos挂载cdrom 步骤:3、挂载成功后直接安装软件 发现软件…

认知杂谈68《燃爆!兄弟萌不可错过的人生开挂宝典》

内容摘要​: 生活如舞台,我们要做自己人生的导演兼主演。实现自我成长需打牢基础,如读《认知觉醒》等书并制定成长计划。 要向上生长,定短期和长期目标,学新技能、提升沟通能力,可借助在线平台和社群。用番…

面试经典150题——多数元素

目录 题目链接:169. 多数元素 - 力扣(LeetCode) 题目描述 示例 提示: 解法一:哈希表 Java写法: C写法: 解法二:它就在那里 Java写法: C写法: 解法…

求n至少为多大时,n个1组成的整数能被2013整除

题目&#xff1a;编写程序&#xff0c;求n至少为多大时&#xff0c;n个1组成的整数能被2013整除 #include<iostream> using namespace std; int main(){int n1;int m1;while(m%2013!0){m(m%2013)*101;n;}cout<<n<<endl;return 0; } 思路&#xff1a;直接用n…

2024年上海小学生古诗文大会倒计时一个月:做几道2024官方模拟题

2024年上海市小学生古诗文大会自由报名活动的初赛日期于10月19日开始&#xff0c;距离今天只有33天了。 那么如何准备2024年的小学生古诗文大会的自由报名初选呢&#xff1f;吃透&#xff08;记熟&#xff09;2024年小学生古诗文阅读专辑上的题目、知识点和往年真题及知识点。…

Linux memcg lru lock提升锁性能

内核关于per memcg lru lock的重要提交&#xff1a; f9b1038ebccad354256cf84749cbc321b5347497 6168d0da2b479ce25a4647de194045de1bdd1f1d 计算虚拟地址转换基本机制 为了处理多应用程序的地址冲突&#xff0c; linux 系统在应用中使用了虚拟地址&#xff0c;得益于硬件的…

【C++题目】1.日期差值

日期差值 题目&#xff1a; 链接&#x1f517;&#xff1a;日期差值 代码&#xff1a; #include <iostream> using namespace std; /* *思路&#xff1a; * 1. 分别求出每一个日期与0000年0月1日距离的天数 * 2. 两个距离天数相减即可得到两个日期相差的天数 *///平年…