stable diffusion webui 使用

news2024/11/15 21:33:34

参考各文章以及个人操作后的记录文章,也希望能帮助有需要的人~

首先进去大概是这样的,介绍下下图几个区域(主要是文生图)。
在这里插入图片描述

一、模型区域

Stable Diffusion checkpoint下拉选择框是用来切换ckpt模型,不清楚的可以看下这篇Stable Diffusion-webUI ckpt模型、lora模型的区别和使用
SD VAEvariable autoencoder的意思,在这里可以选择载入vae组分。使用vae组分可以让图片的色彩变得更好。

二、功能选项区域

简单介绍下各选项卡的功能

名称作用
txt2img 文生图用文字生成图片
img2img 图生图用图片生成图片
extras 附加用于优化图像,提高图片精度
PNG info 图片信息用于查看 SD所生成的 图片的图像信息(别人发了好看的图片,没有标签,拿过来可以显示)
Checkpoint Merger 模型合并合并不同的模型,生成新的模型
Train 训练训练模型
Settings 设置设置页面
Extensions 扩展扩展/插件管理

三、文生图标签区域

先分享大家一个好东西 :咒语生成器

提示词 Prompt(正向)

提示词 大佬的文章写的很清楚 : 秋风于渭水

支持的语言
支持的输入语言为英语,SD支持用自然语言描述,不过还是推荐使用用逗号分隔的一个个的关键词来写,当然表情符号,emoji,甚至一些日语都是可以用的。

tag语法

  1. 分隔:不同的关键词tag之间,需要使用英文逗号,分隔,逗号前后有空格或者换行是不碍事的
    ex:1girl,loli,long hair,low twintails(1个女孩,loli,长发,低双马尾)

  2. 混合:WebUi 使用 | 分隔多个关键词,实现混合多个要素,注意混合是同等比例混合,同时混。
    ex: 1girl,red|blue hair, long hair(1个女孩,红色与蓝色头发混合,长发)

  3. 增强/减弱:有两种写法

    • 第一种 (提示词:权重数值):数值从0.1~100,默认状态是1,低于1就是减弱,大于1就是加强
      ex: ,(loli:1.21),(one girl:1.21),(cat ears:1.1),(flower hairpin:0.9)

    • 第二种 (((提示词))),每套一层()括号增强1.1倍,每套一层[]减弱1.1倍。也就是套两层是1.1*1.1=1.21倍,套三层是1.331倍,套4层是1.4641倍。
      ex: ((loli)),((one girl)),(cat ears),[flower hairpin]和第一种写法等价

    • 所以还是建议使用第一种方式,因为清晰而准确

  4. 渐变:比较简单的理解时,先按某种关键词生成,然后再此基础上向某个方向变化。
    [关键词1:关键词2:数字],数字大于1理解为第X步前为关键词1,第X步后变成关键词2,数字小于1理解为总步数的百分之X前为关键词1,之后变成关键词2

    • ex:a girl with very long [white:yellow:16] hair 等价为
      开始 a girl with very long white hair 16步之后 a girl with very long yellow hair
    • ex:a girl with very long [white:yellow:0.5] hair 等价为
      开始 a girl with very long white hair 50%步之后 a girl with very long yellow hair
  5. 交替:轮流使用关键词
    ex:[cow|horse] in a field比如这就是个牛马的混合物,如果你写的更长比如[cow|horse|cat|dog] in a field就是先朝着像牛努力,再朝着像马努力,再向着猫努力,再向着狗努力,再向着马努力
    tag书写示例
    建议按类似这样的格式书写提示词

画质词>>
这个一般比较固定,无非是,杰作,最高画质,分辨率超级大之类的

风格词艺术风格词>>
比如是照片还是插画还是动画

图片的主题>>
比如这个画的主体是一个女孩,还是一只猫,是儿童还是萝莉还是少女,是猫娘还是犬娘还是福瑞,是白领还是学生

他们的外表>>
注意整体和细节都是从上到下描述,比如
发型(呆毛,耳后有头发,盖住眼睛的刘海,低双马尾,大波浪卷发),
发色(顶发金色,末端挑染彩色),
衣服(长裙,蕾丝边,低胸,半透明,内穿蓝色胸罩,蓝色内裤,半长袖,过膝袜,室内鞋),
头部(猫耳,红色眼睛),
颈部(项链),
手臂(露肩),
胸部(贫乳),
腹部(可看到肚脐),
屁股(骆驼耻),
腿部(长腿),
脚步(裸足)

他们的情绪>>
表述表情

他们的姿势>>
基础动作(站,坐,跑,走,蹲,趴,跪),
头动作(歪头,仰头,低头),
手动作(手在拢头发,放在胸前 ,举手),
腰动作(弯腰,跨坐,鸭子坐,鞠躬),
腿动作(交叉站,二郎腿,M形开腿,盘腿,跪坐),
复合动作(战斗姿态,JOJO立,背对背站,脱衣服)

图片的背景>>
室内,室外,树林,沙滩,星空下,太阳下,天气如何

杂项>>
比如NSFW,眼睛描绘详细


16 /9   =x / 512

将不同的分类的词,通过换行区分开,方便自己随时调整

(masterpiece:1.331), best quality,
illustration,
(1girl),
(deep pink hair:1.331), (wavy hair:1.21),(disheveled hair:1.331), messy hair, long bangs, hairs between eyes,(white hair:1.331), multicolored hair,(white bloomers:1.46),(open clothes),
beautiful detailed eyes,purple|red eyes),
expressionless,
sitting,
dark background, moonlight, ,flower_petals,city,full_moon, 

我跑的图是这样的

在这里插入图片描述
tag书写要点

  1. 虽然大家都管这个叫释放魔法,但真不是越长的魔咒(提示词)生成的图片越厉害,请尽量将关键词控制在75个(100个)以内。
  2. 越关键的词,越往前放。
  3. 相似的同类,放在一起。
  4. 只写必要的关键词。

反向提示词 Negative prompt

用文字描述你不想在图像中出现的东西
AI大致做法就是

  1. 对图片进行去噪处理,使其看起来更像你的提示词。
  2. 对图片进行去噪处理,使其看起来更像你的反向提示词(无条件条件)。
  3. 观察这两者之间的差异,并利用它来产生一组对噪声图片的改变
  4. 尝试将最终结果移向前者而远离后者
  5. 一个相对比较通用的负面提示词设置:
lowres,bad anatomy,bad hands,text,error,missing fingers,
extra digit,fewer digits,cropped,worst quality,
low quality,normal quality,jpeg artifacts,signature,
watermark,username,blurry,missing arms,long neck,
Humpbacked,missing limb,too many fingers,
mutated,poorly drawn,out of frame,bad hands,
unclear eyes,poorly drawn,cloned face,bad face

四、文生图操作区域

在这里插入图片描述

1. Generate按钮就是点击后根据你的tag生成图片
2.图标1:读取上一张图的参数信息,点击后会显示你上一张生成图的tag以及各种参数
3.图标2:清空描述语
4.图标3: 弹出选择模型

在这里插入图片描述
前两个选择模型(嵌入式、超网络)不常用到
后两个为常用的ckpt模型和lora模型
在这里插入图片描述

Stable Diffusion-webUI ckpt模型、lora模型的区别和使用
如何设置模型封面?
方法一:用当前模型跑一张图,然后点击替换预览图在这里插入图片描述
方法二:在模型文件夹放置一张和模型同名的png文件
在这里插入图片描述
视图预览有点大,怎么缩小?
打开设置,选择左侧附加网络,下拉框选择第二个,点击apply setings,重启webUI 刷新页面
在这里插入图片描述
ok,视图变小了
在这里插入图片描述

5.图标4、图标5 这两个图标都是用来设置‘‘预设/模板’’的
eg:先在左侧设置一些通用的标签,点击“图标5
在这里插入图片描述
完事后下面的下拉框会出现刚刚设置的模板
在这里插入图片描述
后面我们在写tag时生成图片后就会自动置入选择的模板
点击“图标4”将模板内容置入左侧描述框(就算没有点击图标4置入,只要在下拉框选择了相应模板,生成图片时候就会自动生效)
怎么管理模板?
在 sd 的根目录找到 styles.csv 用 记事本 打开 可以修改删除模板,不要用excel

五、文生图参数区域

在这里插入图片描述

1、采样方法 Sampling method

选择采样器方法,大佬做了很详细的描述,stable diffusion webui如何工作以及采样方法的对比
采样器方法太多了,如何隐藏?
找到设置,采样器参数,第一列勾选隐藏
在这里插入图片描述
常用的:

  • Euler a :富有创造力,不同步数可以生产出不同的图片。 超过30~40步基本就没什么增益了。
  • Euler:最最常见基础的算法,最简单的,也是最快的。
  • DDIM:收敛快,一般20步就差不多了。
  • LMS:eular的延伸算法,相对更稳定一点,30步就比较稳定了
  • PLMS:再改进一点LMS
  • DPM2:DDIM的一种改进版,它的速度大约是 DDIM 的两倍

2、采样步数 Sampling steps

一般默认20步就可以了
秋风于渭水 文章描述:
AI绘画的原理用人话说就是,先随机出一个噪声图片
然后一步步的调整图片,向你的 提示词 Prompt 靠拢
Sampling Steps就是告诉AI,这样的步骤应该进行多少次。
步骤越多,每一步移动也就越小越精确。同时也成比例增加生成图像所需要的时间。
大部分采样器超过50步后意义就不大了
下图是同一个图从1step到20step,不同step时图像的变化
在这里插入图片描述

3、Restore faces 面部修复

对生成图片任务面部进行修复, 对真人效果好,二次元作用不大,很占显存

4、Tiling 平铺/分块

生成可以往左右上下连续拼接的图像

5、Hires. fix 高清修复

在这里插入图片描述

将你的图片尺寸 ,按照你置顶的放大倍率,重新绘制图片内容
放大算法:不知道选什么就选“ESRGAN_4x ”
高清修复采样次数: 20 就行
重绘幅度:大后修改细节的程度,从0到1,数值越大,AI创意就越多,也就越偏离原图, 0.5~0.7就行
放大倍率:看你自己显卡能力了

6、宽&高

单位是像素,适当增加尺寸,AI会试图填充更多的细节进来。
非常小的尺寸(低于256X256),会让AI没地方发挥,会导致图像质量下降。
非常高的尺寸(大于1024X1024),会让AI乱发挥,会导致图像质量下降。
增加尺寸需要更大的显存。4GB显存最大应该是1280X1280(极限)

7、Batch count 生成批次

同样的配置,循环跑的次数

8、Batch size每批数量

每跑一次,生成几张图

9、 CFG Scale 提示词相关性

图像与提示词的匹配程度。一般在5~15之间为好,7,9,12是3个常见的设置值。

10、Seed 随机种子

图片的DNA,-1是随机
保持种子不变,相同的模型和参数大概率出现相同的图像
不同型号的显卡即使参数与模型完全一致,也可能会生成完全不同的图
在这里插入图片描述

  • 图标1(骰子):随机种子-1
  • 图标2(绿色箭头):自动填写最近生成的图片的种子值
  • EXtra(额外的)选择后会出现
    Variation seed(差异随机种子)
    可以是-1,也可以是一个固定的种子
    Variation strength(差异强度)
    越强越接近差异随机种子,越弱越偏向随机种子
    在这里插入图片描述

eg:我生成了一个贼好看的图片,我想生成和这张相似的其他图片
差异种子固定(你觉得好看的那张图的随机种子),差异随机种子-1,差异强度低一点,就能生成一系列相似图片
eg:我生成(同tag参数)了两张都很好看的图片,我想生成和这两张差不多的图片
差异种子固定(你觉得好看的那张图的随机种子),差异随机种子固定(你觉得另一张好看的那张图的随机种子),差异强度适中,就能生成一系列介于两张图片之间的图片

六、文生图出图区域

在这里插入图片描述
图片点击可以预览
1、打开图片存储的文件夹
2、点击后可以下载该图片
3、点击后下载打包的图片
4、5、6、将该图片移动到对应的操作区域

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/439736.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

快速入门 Python 内置模块 argparse

目录 一、argparse 简介二、The add_argument() method 一、argparse 简介 argparse 模块是 Python 内置的用于命令项选项与参数解析的模块,argparse 模块可以让人轻松编写用户友好的命令行接口,能够帮助程序员为模型定义参数。 使用 argparse 模块的四个…

C++string类详解

C语言中,字符串是以\0结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可…

【0基础学爬虫】爬虫基础之自动化工具 Selenium 的使用

大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学…

巨型AI模型时代已结束,我们没搞GPT-5,搞的是GPT-4.99999

文章目录 1、ChatGPT 研发热潮2、GPT5 被叫停“AI危险竞赛”3、 叫停是无法被阻止的4 、 不急于训练GPT-5 1、ChatGPT 研发热潮 自ChatGPT重新吹响人工智能革命的号角后,“百模大战”也已然在太平洋两岸同时拉开了帷幕。 近几个月来,OpenAI ChatGPT 的…

记frp内网穿透配置

这两天由于想给客户看一下我们的系统,于是想到用内网穿透,但是怎么办呢,没有用过呀,于是各处找资料,但是搞完以后已经不记得参考了那些文档了,对不起各位大神,就只能写出过程和要被自己蠢死的错…

一文了解,AI圈大火的虚拟数字人到底是什么?

近年来,人工智能技术的发展和应用已经成为科技领域的热门话题。AI不仅可以帮助人们解决各种问题,还可以提高生产效率、改善生活质量等方面做出贡献。而虚拟数字人作为AI技术的一种应用,也在不断地发展和应用,为人们带来更多的便利…

maven安装教程 linux

文章目录 1.maven下载1.1 移动压缩包位置1.2 解压1.3 改名 2. maven 配置修改2.1 创建仓库2.2 编辑settings.xml文件2.3 添加环境变量 1.maven下载 由于maven 暂不支持直接用yum安装遂采用此方法安装 点击链接下载apache-maven-3.6.3-bin.tar.gz wget https://archive.apach…

Javaee Spring的AOP简介

一.Spring的AOP简介 1.1 什么是AOP AOP 为 Aspect Oriented Programming 的缩写,意思为面向切面编程,是通过预编译方式和运行期动态代 理实现程序功能的统一维护的一种技术。AOP 是 OOP 的延续,是软件开发中的一个热点,也是…

人工智能论文的风格特点

搞清楚AI领域论文的风格特点是写出一篇高质量AI论文的前提,AI领域的论文有如下显著特点。 1. 论文的架构非常清晰且富有逻辑。一篇高质量的AI论文,读者通过大致扫一眼论文的各级标题就能够对论文的写作思路形成清晰的认识,明白论文各部分之间…

防火墙日志取证及分析

防火墙日志取证 网络安全解决方案的主要目的是保护网络免受攻击。它应监视安全事件并实时提醒,以帮助管理员尽快采取补救措施。此外,您需要深入的信息来分析任何漏洞的根本原因、攻击事件重建和用户活动;这就是取证日志分析的用武之地。 取证日志分析软…

广州蓝景分享—遇到网页慢,我们该怎么办?

前言 移动互联网时代,用户对于网页的打开速度要求越来越高。首屏作为直面用户的第一屏,其重要性不言而喻。优化用户体验更是我们前端开发非常需要 focus 的东西之一。 从用户的角度而言,当打开一个网页,往往关心的是从输入完网页…

计算机:理解操作系统:内存篇(中)

内存 1.堆和栈的本质是什么2. java、Python等内存模型3. java内存模型3.1 java中堆和栈是如何实现的 4. Python内存模型 什么是内存 C/C内存模型 堆区与栈区的本质 Java、Python等内存模型 Java内存模型 Jave中的堆区与栈区是如何实现的 Python内存模型 指针与引用 进程的内存…

企业网站架构部署与优化 LNMP

【安装 Nginx 服务】 systemctl stop firewalld systemctl disable firewalld setenforce 0 1、安装依赖包 yum -y install pcre-devel zlib-devel gcc gcc-c make 2、创建运行用户 useradd -M -s /sbin/nologin nginx 3、编译安装 cd /opt tar zxvf nginx-1.12.0.tar.gz -C …

Apifox软件的基础使用方式

Apifox软件的基础使用方式 简单方便的用途 该工具是接口在线调试工具,这里我给到连接供大家去官网下载,我个人觉得是比较于postman工具好用,提供的语言操作是中文版本的便于操作 下载和安装 https://apifox.com/?utm_sourcebaidu&ut…

【超详细】【YOLOV8使用说明】一套框架解决CV的5大任务:目标检测、分割、姿势估计、跟踪和分类任务【含源码】

目录 1.简介2.环境安装2.1安装torch相关库2.2 获取yolov8最新版本,并安装依赖 3. 如何使用模型用于各种CV任务3.1 目标检测任务实现检测图片代码检测视频代码 3.2 分割任务实现分割图片代码分割视频代码 3.3 追踪任务3.4 姿态检测任务姿态检测(图片&…

27.Linux网络编程 掌握三次握手建立连接过程掌握四次握手关闭连接的过程掌握滑动窗口的概念掌握错误处理函数封装实现多进程并发服务器实现多线程并发服务器

基本概念叫协议 什么叫协议? 协议是一个大家共同遵守的一个规则, 那么在这个网络通信当中,其实就是双方通信和解释数据的一个规则,这个概念 你也不用记,你只要心里明白就可以了, 分层模型, 物数网传会表应…

Tensorflow GPU 版本安装教程

非常详细的 Tensorflow GPU 版本安装教程 一、安装Anaconda二、TensorFlow GPU 一、安装Anaconda 这一步比较简单,也没有太多的需要注意的,去官网下载即可: 官网地址如下: https://www.anaconda.com/blog/individual-edition-2…

百家云在人工智能领域再有新动作,发布应用于多个行业的AIGC解决方案

4月17日消息,音视频SaaS上市公司百家云(股票代码:RTC)今日宣布,公司将正式推出应用于多个垂直行业及场景的人工智能生成内容及视频解决方案。 百家云总裁马义表示,此次发布的解决方案,将在极短…

谷歌SEO优化技巧方法

谷歌SEO排名对于许多公司和个人来说都非常重要。随着谷歌成为人们搜索信息的首选,拥有良好的谷歌排名可以帮助我们的网站在搜索引擎中展现出更高的可见度,吸引更多的访问量和潜在客户。优化谷歌SEO排名需要一定的时间和专业知识,无法一蹴而就…

Vulnhub项目:Lin.Security(Linux提权大合集)

靶机地址:linsecurity 靶机描述了用户名和密码 用户名:bob、密码:secret 登录后看到了IP地址,或者在kali上像之前那样进行ip收集,端口收集 开放的端口有很多,从22端口开始,知道用户名和密码&…