Stable Diffusion WebUI 生成参数:高清修复/高分辨率修复(Hires.fix)

news2025/1/20 18:37:27

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。

大家好,我是水滴~~

在本篇文章中,我们将深入探讨 Stable Diffusion WebUI 的一个引人注目的生成参数——高分辨率修复(Hires.fix)。我们将逐一解析这一功能的要点,包括推荐的绘图分辨率、高分辨率修复的参数设置,以及通过生动的案例演示来展现其实际效果。

希望能对你有所帮助!

文章目录

  • 推荐分辨率
    • SD1.5 模型
    • SDXL 模型
  • 高分辨率修复
    • 放大算法
    • 重设迭代步数
    • 重绘幅度
    • 放大倍率、将宽度调整到、将高度调整到
  • 案例演示
    • 生成参数
    • 生成原图(抽卡)
    • 高清修复(1K)
    • 高清修复(2K)


推荐分辨率

在 Stable Diffusion 的模型中,最常用的是 SD1.5 和 SDXL 两个版本。我们知道,SD1.5 模型是在 512px768px 下进行训练,而 SDXL 是在 1024px 下训练的。所以我们出图时的尺寸尽量不要超过这个分辨率,否则可能会让整体画面失去控制。

比如,下图出现了两个头:

在这里插入图片描述

下面是推荐的一些分辨率,可以根据你需要的宽高比例来选择:

SD1.5 模型

  • 1:1(方形):512×512、768×768
  • 3:2(横向):768×512
  • 2:3(纵向):512×768
  • 4:3(横向):768×576
  • 3:4(纵向):576×768
  • 16:9(宽屏):912×512
  • 9:16(高的):512×912
  • 9:20(高的):346×768

SDXL 模型

  • 1:1(方形):1024×1024、768×768
  • 3:2(横向):1152×768
  • 2:3(纵向):768×1152
  • 4:3(横向):1152×864
  • 3:4(纵向):864×1152
  • 16:9(宽屏):1360×768
  • 9:16(高的):768×1360
  • 9:20(高的):512×1138

高分辨率修复

那么我们如何生成更高尺寸的图片呢,这里我们使用的是“高分辨率修复(Hires.fix)”:

在这里插入图片描述

点击“三角号”可以展开面板:

在这里插入图片描述

放大算法

放大算法(Upscaler)是一种用于增强图像分辨率或尺寸的技术。在 Stable Diffusion 中,放大算法旨在将低分辨率的图像无损或尽可能少地损失细节地放大到更高的分辨率。这通常涉及到复杂的数学和机器学习技术,以确保放大后的图像在视觉效果上尽可能接近原始高清图像。

下面列出了18种放大算法:

Latent
Latent (antialiased)
Latent (bicubic)
Latent (bicubic antialiased)
Latent (nearest)
Latent (nearest-exact)
Lanczos
Nearest
DAT x2
DAT x3
DAT x4
ESRGAN_4x
LDSR
R-ESRGAN 4x+
R-ESRGAN 4x+ Anime6B
ScuNET GAN
ScuNET PSNR
SwinIR 4x

这些放大算法各有优缺点,我们不过多介绍,对于新手而言,这里只使用两个即可:

  • R-ESRGAN 4x+ Anime6B:绘制二次元漫画风格时使用。
  • R-ESRGAN 4x+:绘制其它风格时使用。

重设迭代步数

重设迭代步数(Hires steps)为我们进行高清修复时使用的迭代步数,设置为零时则使用默认步数。这个参数一般不需要调整,保持零即可。如果调整也需要配合重绘幅度进行.

重绘幅度

重绘幅度(Denoising strength)在 Stable Diffusion WebUI 中是一个 0~1 的值,值越高重绘幅度越大,也就是与原图的差距就越大。当设为0时,重绘后的图片没有任何变化;当设为1时,重绘后的图片几乎是另一张图。那么我们该如何选择呢?

我们在即保持原图不要有太大变化,又要增强图片的细节,通常这里选择 3~5 之间即可。

放大倍率、将宽度调整到、将高度调整到

放大倍率(Upscale by)指我们希望将原图的尺寸放大多少倍,默认为2。通常我们放大两倍即可,更高的倍数也更吃显存。

将宽度调整到(Resize width to)、将高度调整到(Resize height to)可以让我们自定义宽度和高度,它们不可以与放大倍率同时使用。

案例演示

下面将演示生成手机壁纸的过程:先使用低分辨率生成多张原图,然后选择满意的图片进行高清修复。

下面案例中,先生成了一张1K的图,然后生成了一张2K的图,可以对比看下效果。

生成参数

模型:DreamShaper(梦想塑造者)

分辨率:346×768

提示词:

masterpiece, best quality, 1girl, (colorful),(delicate eyes and face), volumatic light, ray tracing, bust shot ,extremely detailed CG unity 8k wallpaper,solo,smile,intricate skirt,((flying petal)),(Flowery meadow) sky, cloudy_sky, moonlight, moon, night, (dark theme:1.3), light, fantasy, windy, magic sparks, dark castle,white hair

负面提示词:

paintings, sketches, fingers, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), backlight,(ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (more than 2 nipples:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit, (futa:1.1),bad hands, missing fingers, bad-hands-5

生成批次:9

其它参数:默认

生成原图(抽卡)

先用低分辨率(346×768)生成 9 张图片,将这些图片做为原图。这个过程很多人叫做“抽卡”。

在这里插入图片描述

我们可以从这 9 张图片中选择一个满意的图片,然后进行高清修复。

高清修复(1K)

首先在图片预览区选中要高清修复的原图,点击“绿色循环”图标来获取随机种子,这时【随机种子】框中内容会变成该图的随机种子。

在这里插入图片描述

选中的原图:

在这里插入图片描述

然后选中【高分辨率修复】,放大算法选择【R-ESRGAN 4x+】,【重绘幅度】设为 0.4,【放大倍数】设为 2,表示放大两倍。(注意:生成批次别忘了改回 1)

设置好后点击【生成】按钮:

在这里插入图片描述

生成的图片像素为 692×1536,约为1K:

在这里插入图片描述

高清修复(2K)

效果还可以,我们再增加些尺寸,这次直接将宽度设为 1024,然后点击【生成】按钮:

在这里插入图片描述

生成的图片像素为 1024×2272,约为2K:

在这里插入图片描述

可以看出,生成的图片越来越清晰、细腻。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1529680.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

添加与搜索单词 - 数据结构设计

题目链接 添加与搜索单词 - 数据结构设计 题目描述 注意点 addWord 中的 word 由小写英文字母组成search 中的 word 由 ‘.’ 或小写英文字母组成1 < word.length < 25 解答思路 为了加快查询速度&#xff0c;可以使用字典树存储单词&#xff0c;基本结构是&#xf…

Linux: network: firewall: firewalld 导致icmp带admin prohibited

文章目录 简介查看相关的配置产生的rule不在rule里的被拒绝重新加载iptables服务进程简介 https://firewalld.org/documentation/man-pages/firewalld.zone.html 最近遇到一个主机主动回icmp,destination unreachable的错误包,而且里面的code是 administratively prohibited…

Flutter与Xamarin跨平台APP开发框架的区别

嘿&#xff0c;各位亲爱的朋友们&#xff01;大家好&#xff0c;我是咕噜铁蛋&#xff01;今天我们要探讨的话题是&#xff1a;Flutter与Xamarin这两款热门的跨平台APP开发框架。我深知选择合适的开发工具对于开发者来说有多么重要。那么&#xff0c;当我们需要开发跨平台应用时…

[Qt项目实战]Qt实现美松标签打印机标签二维码打印(QR混排模式+页打印模式)

1、硬件信息、环境参数及配套资料 1.1 打印机信息及开发环境 打印机 美松标签打印机串口/USB通讯Qt5.9 64位程序 1.2 打印机配套开发资料 打印机主要配套测试工具、开发SDK及驱动等&#xff0c;均由厂家提供。 开发Demo及动态库&#xff1a;MsPrintSDK-DLL-V2.2.2.5 链接&…

只需3步,使用Stable Diffusion无限生成AI数字人视频

基本方法 搞一张照片&#xff0c;搞一段语音&#xff0c;合成照片和语音&#xff0c;同时让照片中的人物动起来&#xff0c;特别是头、眼睛和嘴。 语音合成 语音合成的方法很多&#xff0c;也比较成熟了&#xff0c;大家可以选择自己方便的&#xff0c;直接录音也可以&#…

Linux TCP参数——tcp_allowed_congestion_control

tcp_allowed_congestion_control 设置允许普通进程使用的拥塞控制算法。这个参数的值阈是tcp_available_congestion_control参数的子集。默认值为"reno"加上tcp_congestion_control参数设置的算法。 reno 慢启动阶段&#xff1a;在开始的时候&#xff0c;cwnd按指数…

创建自己的“百度网盘”(部署owncloud)

[rootlocalhost html]# cd /root/[rootlocalhost ~]# wget https://download.com/server/stable/owncloud-10.12.0.zip --no-check-certificate #下载当前的owncloud代码包[rootlocalhost ~]# yum -y install unzip #安装解压工具[rootlocalhost ~]# unzip owncloud-10.12.0.zi…

BetterDisplay Pro for Mac(显示器校准软件) v2.0.11激活版

BetterDisplay Pro是一款由waydabber开发的Mac平台上的显示器校准软件&#xff0c;可以帮助用户调整显示器的颜色和亮度&#xff0c;以获得更加真实、清晰和舒适的视觉体验。 软件下载&#xff1a;BetterDisplay Pro for Mac v2.0.11激活版 以下是BetterDisplay Pro的主要特点&…

【数据分析可视化】动态生成柱状图

import pandas as pd import matplotlib.pyplot as plt import matplotlib.ticker as ticker from matplotlib.animation import FuncAnimation import matplotlib.patches as mpatches from matplotlib.animation import FFMpegWriter# 定义一个函数&#xff0c;用于生成…

开源模型应用落地-安全合规篇-模型输出合规性检测(三)

一、前言 为什么我们需要花大力气对用户输入的内容和模型生成的输出进行合规性检测,一方面是严格遵守各项法规要求,具体如下:互联网信息服务深度合成管理规定https://www.gov.cn/zhengce/zhengceku/2022-12/12/content_5731431.htm ​ 其次,受限于模型本身的一些缺陷,…

智能合约 之 ERC-20介绍

什么是ERC20 ERC20全称为Ethereum Request for Comment 20&#xff0c;是一种智能合约标准&#xff0c;用于以太坊网络上的代币发行 姊妹篇 - 如何部署ERC20 ERC20的应用场景 代币化资产&#xff0c;例如&#xff1a;USDT 是一种以美元为背书的ERC20代币&#xff0c;每个USDT代…

Unity 实现双屏或多屏内容展示

在某些应用场景&#xff0c;一个应用可能需要使用多个显示器显示。 Unity支持最多8个不同显示器同时显示应用程序中八个摄像头的视图&#xff0c;如下图&#xff1a; 具体实现如下&#xff1a; 1、在Hiearchy面板上点击鼠标右键->Camera,创建多一个Camera,如图&#xff1a…

Android Studio Gradle设置查看全部task

如果你在 Android Studio 的 Gradle 窗口中看不到所有的任务&#xff0c;你可以尝试以下步骤来解决这个问题 android studio 版本&#xff1a; Android Studio Iguana | 2023.2.1 Build #AI-232.10227.8.2321.11479570, built on February 22, 2024 打开 Android Studio 的设置…

深入探讨Python中的文件操作与文件IO操作【第141篇—Python实现】

&#x1f47d;发现宝藏 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。【点击进入巨牛的人工智能学习网站】。 深入探讨Python中的文件操作与文件IO操作 在Python编程中&#xff0c;文件操作和文件IO操作…

maven手动上传的第三方包 打包项目报错 Could not find xxx in central 解决办法

背景: 在Maven私服手动上传了第三方的jar包, 只有jar包, 没有pom文件, 项目在ide中可以正常编译启动,但打包报错无法找到jar包 解决办法: 上传jar包的时候, 点击生成pom. 则打包的时候不会报错

RHCE——三:Web服务器(内网穿透实验)

RHCE—第三天&#xff1a;Web服务器 一、WWW简介1、常见Web服务程序介绍&#xff1a;2、服务器主机3、主要数据4、浏览器5、网址及HTTP简介URL 二、部署Nginx1、常用命令systemctl系列nginx自带命令nginx配置文件 2、实验操作实验1&#xff08; 快速搭建网站&#xff09;实验2&…

OCP NVME SSD规范解读-13.Self-test自检要求

4.10节Device Self-test Requirements详细描述了数据中心NVMe SSD自检的要求&#xff0c;这一部分规范了设备自身进行各种健康检查和故障检测的过程。自检对于确保SSD的正常运行和提前预防潜在故障至关重要。 在进行设备自检时&#xff0c;设备应当确保不对用户数据造成破坏&am…

python字典:打印字典中的键、值、打印所有字典、python遍历字典

1.定义 字典以花括号&#xff08;{}&#xff09;括起来&#xff0c;里面的元素是成对出现的&#xff0c;不同对元素用逗号&#xff08;,&#xff09;分开&#xff1b;一对元素用 冒号&#xff08;&#xff1a;&#xff09;分割。 2.解读 字典里的每一对元素准确的来说是键值对&…

架起桥梁,畅享流通:如何使用私有Registry实现镜像跨源同步与管理

在Docker容器化世界中&#xff0c;镜像作为构建和运行应用的基础单元&#xff0c;其管理与分发对于企业级应用至关重要。私有Registry作为存储和管理Docker镜像的中心仓库&#xff0c;不仅可以保障企业数据的安全性&#xff0c;更能通过镜像同步功能实现跨源镜像的统一管理和高…

三维指静脉生物识别成像设备设计和多视图验证研究

文章目录 三维指静脉生物识别成像设备设计和多视图验证研究总结摘要介绍多视角指静脉识别模型结构内容特征编码Transformer(CFET)主导特征选择模块(DFSM) 实验和结果数据集实施细节视角研究池化层的作用消融实验和SOTA方法比较 论文: Study of 3D Finger Vein Biometrics on I…