Stable Diffusion WebUI 生成参数:宽度/高度/生成批次/每批数量/提示词相关性/随机种子

news2024/9/23 2:24:29

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。

大家好,我是水滴~~

本文将继续了解 Stable Diffusion WebUI 的生成参数,主要内容有:宽度、高度、生成批次、每批数量、提示词相关性、随机种子。希望能对你有所帮助。

文章目录

  • 宽度(Width)和高度(Height)
  • 生成批次(Batch count)
  • 每批数量(Batch size)
  • 提示词相关性(CFG Scale)
  • 随机种子(Seed)


宽度(Width)和高度(Height)

在 Stable Diffusion WebUI 中,宽度和高度用于定义生成图片的大小,也就是分辨率,单位为像素,默认为:512×512。

在这里插入图片描述

对于 SD1.5,输出在 512×512 像素左右进行优化。常见纵横比的最佳分辨率通常是:

  • 1:1(方形):512×512、768×768
  • 3:2(横向):768×512
  • 2:3(纵向):512×768
  • 4:3(横向):768×576
  • 3:4(纵向):576×768
  • 16:9(宽屏):912×512
  • 9:16(高):512×912

对于 SDXL,输出在 1024x1024 像素左右进行优化。常见纵横比的最佳分辨率通常是:

  • 1:1(方形):1024×1024、768×768
  • 3:2(横向):1152×768
  • 2:3(纵向):768×1152
  • 4:3(横向):1152×864
  • 3:4(纵向):864×1152
  • 16:9(宽屏):1360×768
  • 9:16(高):768×1360

设置宽度和高度的要求是必须是 8 的倍数。如果想要生成更高像素的图片,建议不要直接调高分辨率,而是使用高分辨率修复,或者使用放大器。

生成批次(Batch count)

生成批次指的是每次运行 Stable Diffusion WebUI 生成图像的组数。通过调整生成批次,可以控制生成图片的数量。具体的生成图像数量 = 生成批次 × 每批数量

下图将【生成批次】设为 6,可以看出右侧输出了 6 张图片(第 1 张图片是它们的宫格图):

在这里插入图片描述

注意:这 6 张图不是同时生成的,而是生成完一个再生成下一个,不会增加显存负担。

每批数量(Batch size)

每批数量是指同时生成多少个图像。增加这个值可以提高算法的性能,但也需要更多的显存。

下图将【生成批次】还原为 1,【每批数量】设为 6,可以看出右侧也输出了 6 张图片:

在这里插入图片描述

需要注意的是,较大的每批数量会消耗更多的显存,因此在显存有限的情况下,建议将每批数量保持为较低的值,以避免显存不足的问题。

下图将【生成批次】和【每批数量】都设为 2,可以看出右侧输出了 4 张图片:

在这里插入图片描述

提示词相关性(CFG Scale)

在 Stable Diffusion 中,CFG(Classifier Free Guidance)表示为无分类器信息引导规模。CFG 是控制稳定扩散应遵循文本提示的紧密程度的设置,即提示词相关性。

在这里插入图片描述

理论上,CFG 值越高,它就越严格地遵循您的提示。默认值为 7,它在创作自由度和遵循您的方向之间提供了良好的平衡。值为 1 将使 Stable Diffusion 几乎完全自由,而高于 15 的值则相当受限制。

使用 CFG 来控制 Stable Diffusion 跟随文本提示的紧密程度听起来很简单,但遗憾的是 Stable Diffusion 并不是那么简单。不同的 CFG 值会带来一些权衡。为了演示它们,这里有一个使用 Euler A 采样器和 20 个采样步数的具体示例:

在这里插入图片描述

从这个例子中你可以注意到一些事情:

  • 色彩饱和度随着 CFG 的增加而增加
  • 对比度随着 CFG 的增加而增加
  • 高于某个 CFG 值时,输出图像会变得更加模糊,导致细节丢失

为了抵消较高 CFG 值时输出图像质量的下降,您通常可以执行以下两项操作:

  • 增加采样器步数:一般经验法则是,采样器步数越多,输出图像的细节就越多,尽管与 CFG 一样,该规则仅适用于特定阈值。请记住,更多的采样器步骤通常会导致更长的处理时间。
  • 更改采样器方法:一些采样器是专门为在较低或较高的 CFG 和采样步骤下最佳运行而开发的。例如,UniPC 可以在 CFG 低至 3 时返回良好的结果,但通常会在 CFG 为 10 左右时看到质量下降。另一方面,DPM++ SDE Karras 通常在 CFG 值大于 7 时产生大量图像细节。

为了获得最佳的输出图像,同时最大限度地减少内存和处理时间,用户需要在 CFG、采样器和采样步数之间找到平衡。

随机种子(Seed)

随机种子是用于初始化模型随机性的数字。通过设置种子,您每次都可以获得相同的输出。

在这里插入图片描述

如果您找到喜欢的图像但想要调整它或提高质量,您可以使用相同的种子,然后进行高分辨率修复。

在生成图后,可以点击“绿色循环箭头”图标来使用上次生成的图片的种子;如果想继续随机生成,可以点击“筛子”图标,或直接将随机种子设为 -1。

在这里插入图片描述

注意:如果您有固定的种子但更改图像的宽度、高度、提示词等信息,那么您将不会看到一致的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1527153.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

路由器级联

目录 一、实现功能二、实现步骤2.1 接线步骤 三、效果3.1 常规连接3.2 路由器级联 一、实现功能 主路由器:可有WiFi功能,LAN口下接各设备,并接一个辅路由器辅路由器:开启WiFi功能,有线或无线下接各设备功能&#xff1…

Docker部署TeamCity来完成内部CI、CD流程

使用TeamCity来完成内部CI、CD流程 本篇教程主要讲解基于容器服务搭建TeamCity服务,并且完成内部项目的CI流程配置。至于完整的DevOps,我们后续独立探讨。 一个简单的CI、CD流程 以下分享一个简单的CI、CD流程(仅供参考)&#…

量子计算的飞跃!澳研究团队发明新型光量子处理器

内容来源:量子前哨(ID:Qforepost) 编辑丨慕一 编译/排版丨沛贤 深度好文:1800字丨12分钟阅读 澳大利亚研究人员成功研制出全球首款可重新编程的基于光的量子处理器,这一创新成果通过最小化光损失&#xf…

Linux操作系统的安全相关介绍

Linux操作系统的安全模型、访问控制、安全策略和加密机制是确保系统安全的重要组成部分。下面将详细介绍这些方面。 安全模型 Linux操作系统的安全模型基于传统的Unix安全模型,主要包括以下核心概念: 1. **用户和组**:Linux系统中的每…

数据结构——lesson10排序之插入排序

💞💞 前言 hello hello~ ,这里是大耳朵土土垚~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 💥个人主页&#x…

项目中遇到的sql问题记录

有一张表,表结构及数据如下: INSERT INTO test.test_approve(approve_no, tra_date, tablename, part_dt) VALUES (approve001, 2021-02-18 00:00:00, tableA, 2024-03-18); INSERT INTO test.test_approve(approve_no, tra_date, tablename, part_dt) …

江科大STM32学习笔记(上)

STM32F103xx 前言外设篇GPIO输出GPIO位结构GPIO模式外设的GPIO配置查看实战1: 如何进行基本的GPIO输入输出 OLED显示屏及调试Keil的调试模式演示 EXTI外部中断NVIC基本结构EXTI结构代码实战2:如何使用中断和对射式红外传感器&旋转编码器 TIM&…

avue 框架(原生)点击的时候状态未过,一直处于加载状态如何解决

方法: //关闭avue自带弹框 this.$refs.crud.$refs.dialogForm.closeDialog();//取消加载状态 loading(false); // 设置loading状态为false,表示加载完成

huawei 华为交换机 配置手工模式链路聚合示例

组网需求 如 图 3-21 所示, SwitchA 和 SwitchB 通过以太链路分别都连接 VLAN10 和 VLAN20 的网络,SwitchA 和 SwitchB 之间有较大的数据流量。 用户希望SwitchA 和 SwitchB 之间能够提供较大的链路带宽来使相同 VLAN 间互相通信。 同时用户也希望能够提…

xAI 发布 Grok-1 — 最大的开源LLM

xAI 发布 Grok-1 — 最大的开源LLM 图片由 Jim Clyde Monge 提供 埃隆马斯克(Elon Musk)的人工智能公司xAI在Apache 2.0许可下发布了其3140亿参数的专家混合模型Grok-1的权重和架构。 在此之前,马斯克上周一承诺向公众免费提供格罗克。作为…

在基于全志V851se的TinyVision上手动构建 Linux 6.1 + Debian 12 镜像

构建 SyterKit 作为 Bootloader SyterKit 是一个纯裸机框架,用于 TinyVision 或者其他 v851se/v851s/v851s3/v853 等芯片的开发板,SyterKit 使用 CMake 作为构建系统构建,支持多种应用与多种外设驱动。同时 SyterKit 也具有启动引导的功能&a…

Coursera上Golang专项课程3:Concurrency in Go 学习笔记(完结)

Concurrency in Go 本文是 Concurrency in Go 这门课的学习笔记,如有侵权,请联系删除。 文章目录 Concurrency in GoMODULE 1: Why Use Concurrency?Learning Objectives M1.1.1 - Parallel ExecutionM1.1.2 - Von Neumann BottleneckM1.1.3 - Power W…

并发编程之共享带来的问题的详细解析

4.1共享带来的问题 Java代码示例 两个线程对初始值为 0 的静态变量一个做自增,一个做自减,各做 5000 次,结果是 0 吗? static int counter 0; public static void main(String[] args) throws InterruptedException {Thread t…

如何正确从github上下载数据集等内容

文章目录 一、现象:二、解决方案 一、现象: 数据集点击下载没有反应,那需要怎么下载数据集呢? 二、解决方案 输入以下命名行,亲测有效 git clone https://github.com/mymusise/ChatGLM-Tuning.git

CSS 让元素根据内容自适应宽度

一、需求 点击链接跳转,只点击标红区域才跳转,右侧空白区域不要跳转 二、实现 宽度太宽,导致右侧空白区域也加了跳转效果,修改为 将元素的最大宽度设置为其内容所需的宽度。 方法一:建议方式 使用 display: inline…

HTML5语义化元素

在HTML5之前,网站的分布层级有哪些呢? nav,header,main,footer 这样做有一个弊端 我们往往过多的使用div,通过ID或class来区分元素 对于浏览器来说这些元素不够语义化 对于我来说搜索引擎来说,不…

基础:TCP三次握手做了什么,为什么要握手?

1. TCP 三次握手在做些什么 1. 第一次握手 : 1)握手作用:客户端发出建立连接请求。 2)数据处理:客户端发送连接请求报文段,将SYN位置为1,Sequence Number为x;然后,客户端进入SYN_S…

Halcon 3D算子总结整理

halcon 3D包含以下几个模块: 3D Matching(3D匹配)3D Object Model(3D模型)3D Reconstruction(3D重构)3D Transformations(3D转换) 1. 3D Matching 1.1 3D Box3D盒查找器…

分布式搜索引擎elasticsearch专栏一

初识elasticsearch 1.1了解ES elasticsearch的作用 elasticsearch是一款非常强大的开源搜索引擎,具备非常多强大功能,可以帮助我们从海量数据中快速找到需要的内容 例如: 在码云搜索代码 在电商网站搜索商品 在百度搜索答案 1.1.2.ELK…

【Linux】日常使用命令(三)

文章目录 **cal 命令****date 命令****bc 命令****Linux下玩小游戏**: cal 命令 功能描述: cal 命令用于显示日历。 常用选项: -3:显示前一个月、当前月和下一个月的日历。-y:显示整年的日历。 常用示例: # 示例 1: 显示当前月的日历 cal# …