Stable Diffusion教程:额外功能/后期处理/高清化

news2024/12/24 0:57:20

"额外功能"对应的英文单词是Extras,算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”,这都是意译,因为它的主要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力,都是额外扩展的。

下面正式开始介绍“额外功能”的相关能力。

图片放大

先看最基本的图片放大能力。对于分辨率比较小的图片,如果强制用较大的分辨率展示,会出现图片模糊的情况,这时候就可以使用SD WebUI的图片放大功能。所谓图片放大就是在保持图片清晰度的前提下增加图片的分辨率,它还有个专业点的名词:超分辨率技术,简称为“超分”。

具体操作方式请参考下图:

1、主菜单中点击进入“额外功能”。

2、点击“单张图像”,也就是一次只处理一张图片。后边的“批量处理”可以上传多张图片进行处理,“批量处理目录下图像”可以指定处理一个目录下的所有图片。

3、点击上传一张要处理的图片。

4、选择缩放比例。这里有两种方式:按照比例缩放和指定分辨率缩放,指定分辨率时可以设置是否自动裁剪,都很好理解,试试就明白了。

5、Upscaler1用来指定放大算法,常见的放大算法有下面几个:

  • 无/None:单纯的放大,不做任何优化处理。
  • Lanczos:使用加权平均插值方法,利用原始图像自身的像素信息,增加图像的细节,从而提高图像的分辨率。传统的纯数学算法,效果一般。
  • Nearest:使用简单的插值方法,基于最近邻像素的值进行插值,从而增加图像的细节和提高分辨率。传统的纯数学算法,效果一般,还不如 Lanczos 的效果好。
  • LDSR:基于深度学习,通过使用轻量级的网络结构和残差学习,实现较高的超分性能和计算效率。适用于各种需要快速且准确地提高图像分辨率的应用场景,如实时视频处理、移动设备图像处理等。
  • ESRGAN:全称Enhanced Super-Resolution Generative Adversarial Networks (增强超分生成对抗网络),基于深度学习的超分辨率算法。增加了很多看上去很真实的纹理,但是有时可能会过度拟合,出现不好的效果。
  • 4x-UltraSharp:基于ESRGAN做了优化,比较适合处理真人。
  • ESRGAN_4x:Real ESRGAN,完全使用纯合成数据来尽量贴近真实数据进行训练。腾讯贡献。
  • R-ESRGAN 4x+:基于Real ESRGAN的优化模型,适合放大真实风格的图片,常用。
  • R-ESRGAN 4x+ Anime6B:基于Real ESRGAN的优化模型,适合放大动漫风格的图片,常用。
  • ScuNET GAN:基于深度学习,使用生成对抗网络(GAN)进行训练。主要用在提高图像的视觉效果和感知质量,例如在图像增强、视频处理等。
  • ScuNET PSNR:基于深度学习,使用均方误差(PSNR)进行训练。主要用在提高图像的客观质量和准确性,例如在医学图像分析、监控视频处理等。
  • SwinIR_4x:使用Swin Transformer思想,基于自注意力机制的Transformer结构,适合各种图像的超分,比较通用。

这些算法会在首次使用它们时分别下载,你也可以提前下载它们,并放到指定的目录。我整理的SD绘画资源中已经收集了这些文件,下载方式请看本文最后的部分。

6、Upscaler2 用来避免 Upscaler1 过度处理的问题,比如磨皮太严重。可以使用一些普通方法算法,比如 Lanczos。Upscaler2 可见度是指图片放大时使用 Upscaler2 算法进行处理的比例,为0时完全不使用 Upscaler2,为1时只使用 Upscaler2。

7、点击“生成”。

8、放大后的图片在这里显示。

小结

这个图片放大功能主要是为了放大 Stable Diffusion 生成的低分辨率图片,因为图片分辨率越大对显存的要求也越大,所以对于显存较小的同学,可以先在文生图中生成一张低分辨率图片,然后再在这里放大。

对于修复模糊图片,这个图片放大功能其实能力有限,实际测试 WebUI 默认自带的放大算法也就是能去去噪点,消消锯齿,出图的效果并不是很好,特别是原本就很糊的图片。

不过可能存在其它的算法具备较好的模糊图片修复效果,大家可以找来试试。推荐一个放大模型的下载站点:openmodeldb.info/

修脸

虽然图片放大本身对修复模糊图片的效果有限,但是它附带了一个修脸的参数。如果文生图生成的人脸效果不好,比如磨皮太严重、人脸变形等,都可以在这里试试。对于模糊的人脸,也有比较好的修复效果。

修脸方法支持两个模型:GFPGAN 和 CodeFormer,操作方法参见下图:

1、GFPGAN:腾讯开源的一个修脸模型,修复的细节比较清晰,人物形象的还原度比较高,气质保持的好。

2、CodeFormer:另一个修脸模型,修图的细节也比较清晰,皮肤纹理更真实一些,不过这个模型对牙齿的处理效果不好。这个模型还有一个面部重建权重的参数,取值范围0-1,0的时候模型会补充很多细节,面部改变较大;1的时候面部基本没有改变,不会补充很多细节,但是也有修脸的效果。

这两个模型可以一起使用,我们可以通过 GFPGAN visibility 和 CodeFormer visibility 来设置它们的参与度。

下面是几组示例。

1、原图是 Stable Diffusion 生成的,我用图片管理工具缩小了分辨率。可以看到,相比仅放大,加上修脸之后,人物的面部有了明显的改善。

2、这是一张从网上收集的图片,原图就是比较模糊的老照片,分别单独使用GPFGAN和CodeFormer的效果。GFPGAN的人物气质拿捏的比较到位,CodeFormer面部纹理更真实一些,但是不宜将重建权重值设置的过小。

3、这也是从网上收集的图片,这张照片破损比较严重,使用的GFPGAN模型,能修复一些破损。

以上就是本文的主要内容了,如有问题,欢迎留言沟通交流。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1636679.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用docker创建rocketMQ主从结构,使用

1、 创建目录 mkdir -p /docker/rocketmq/logs/nameserver-a mkdir -p /docker/rocketmq/logs/nameserver-b mkdir -p /docker/rocketmq/logs/broker-a mkdir -p /docker/rocketmq/logs/broker-b mkdir -p /docker/rocketmq/store/broker-a mkdir -p /docker/rocketmq/store/b…

Python+PYGObject/PYGtk+CSS样式--2024python示例

隔久点不用老是会忘,留个笔记。。 PythonPYGObject/PYGtk,加载 CSS 样式的演示代码 demo 运行的效果截图: #!/usr/bin/env python3 import sys import gigi.require_version("Gtk", "3.0") from gi.repository import …

飞书API(6):使用 pandas 处理数据并写入 MySQL 数据库

一、引入 上一篇了解了飞书 28 种数据类型通过接口读取到的数据结构,本文开始探讨如何将这些数据写入 MySQL 数据库。这个工作流的起点是从 API 获取到的一个完整的数据,终点是写入 MySQL 数据表,表结构和维格表结构类似。在过程中可以有不同…

大型企业总分支多区域数据传输,效率为先还是安全为先?

大型企业为了业务拓展需要,会在全国乃至全球各地设立分公司和办事机构,以便更好地处理当地事务,并进行市场的开拓和客户维护,此时,企业内部就衍生出了新的业务需求,即多区域数据传输。 多区域很难准确定义&…

C++相关概念和易错语法(10)(定位new、模板)

1.定位new 我们使用类来实例化对象,开辟空间的时候会自动去调用它的构造函数。但在那篇博客我就特意强调过,使用a.A()的方式是错误的,A()根本不会被识别为一个构造函数,而会被识别为A类型。因此我们要注意最好在实例化对象&#…

test4282

欢迎关注博主 Mindtechnist 或加入【智能科技社区】一起学习和分享Linux、C、C、Python、Matlab,机器人运动控制、多机器人协作,智能优化算法,滤波估计、多传感器信息融合,机器学习,人工智能等相关领域的知识和技术。关…

ChatGPT 网络安全秘籍(一)

原文:zh.annas-archive.org/md5/6b2705e0d6d24d8c113752f67b42d7d8 译者:飞龙 协议:CC BY-NC-SA 4.0 前言 在不断发展的网络安全领域中,由 OpenAI 推出的 ChatGPT 所代表的生成式人工智能和大型语言模型(LLMs&#xf…

首页最新 多IP浏览器防关联:如何配置多个独立且稳定的IP地址?

在互联网时代,IP地址的重要性不言而喻。然而,IP关联问题却成为一项令人担忧的隐私和安全挑战。针对这个问题,多IP浏览器是一种解决方案,可以帮助用户单独配置多个独立且稳定的IP地址,有效地防止IP关联。 一、IP关联是…

【HarmonyOS4学习笔记】《HarmonyOS4+NEXT星河版入门到企业级实战教程》课程学习笔记(七)

课程地址: 黑马程序员HarmonyOS4NEXT星河版入门到企业级实战教程,一套精通鸿蒙应用开发 (本篇笔记对应课程第 14 节) P14《13.ArkUI组件-自定义组件》 将可变部分封装成组件的成员变量: 1、首先给标题添加两个图标&am…

百川crm系统 教育crm系统 一款高效的培训机构管理系统

在教育培训行业日益竞争激烈的今天,如何精准把握客户需求、提升服务质量、实现客户价值最大化,成为了每一家教育培训机构都必须面对的问题。为此,一款高效、智能的CRM客户管理系统成为了教育培训机构不可或缺的得力助手。本文将为您详细介绍这…

使用xshell工具连接ubuntu的root账户被拒绝的解决方法

问题描述: 我在使用xshell工具远程连接Ubuntu虚拟机的过程中,如果连接的是的普通用户则xshell工具可以正常连接,但是当我向连接ubuntu系统的root用户,即便是密码输入正确但还是不能连接成功。不能连接成功的截图如下: …

C#---使用Coravel实现定时任务

Coravel是一款框架轻,使用简单,支持秒级定时任务。 1.添加NuGet引用 2.定义自己的工作任务 using Coravel.Invocable; using Microsoft.Extensions.Logging; using System; using System.Collections.Generic; using System.Linq; using System.Thread…

【navicat】oracle library is not loaded 问题复现和解决方案

问题原因:客户端oci版本安装错误,navicat需要64位的oci,但是使用32位的oci。 解决方案:官网下载64位oci进行配置。本次演示的解决多了splplus,其实不必要安装也能运行。 首先判断是否数据库已经打开 尝试使用splplus连接数据库 1…

MYSQL自联结

文章目录 查找:生产ID为DTNTR物品的供应商,生产的其他物品。子查询自联结比较 查找:生产ID为DTNTR物品的供应商,生产的其他物品。 子查询 SELECTprod_id,prod_name FROMproducts WHEREvend_id ( SELECT vend_id FROM product…

静电纺聚丙烯腈(PAN)纳米纤维膜

静电纺聚丙烯腈(PAN)纳米纤维膜是通过静电纺丝技术制备的一种纳米级纤维膜材料。静电纺丝技术利用高压电场使带电的聚合物溶液或熔体在喷丝口形成细流,经过拉伸、固化后形成纳米纤维,最终收集形成纳米纤维膜。 PAN纳米纤维膜具有以…

Unity涂鸦纹理实现

文章目录 前言实现过程UV坐标和UI坐标对齐修改像素代码 前言 心血来潮实现下场景中提供一张纹理进行涂鸦的功能。 最终实现效果: 实现过程 UV坐标和UI坐标对齐 这里的纹理使用了UGUI的Canvas进行显示,所以这里使用一张RawImage。 因为Unity的视口坐标是以左下角…

微服务之SpringCloud AlibabaSeata处理分布式事务

一、概述 1.1背景 一次业务操作需要跨多个数据源或需要跨多个系统进行远程调用,就会产生分布式事务问题 but 关系型数据库提供的能力是基于单机事务的,一旦遇到分布式事务场景,就需要通过更多其他技术手段来解决问题。 全局事务:…

SOLIDWORKS2021:革新设计界的里程碑,引领您迈向数字化制造未来

在2021年,SOLIDWORKS 2021的发布犹如一股清新的创新之风,吹遍了整个设计与工程领域。作为业界领先的3D CAD解决方案,SOLIDWORKS 2021不仅巩固了其在设计软件领域的领导地位,更以前所未有的方式激发了设计者的创造力与生产力。亿达…

Flask教程3:jinja2模板引擎

文章目录 模板的导入与使用 模板的导入与使用 Flask通过render_template来实现模板的渲染,要使用这个方法,我们需要导入from flask import rander_template,模板中注释需放在{# #}中 模板的第一个参数为指定的模板文件名称,如自定…

有关CSS中排版常见问题(清除默认样式问题 + 元素居中问题 + 元素之间的空白问题 + 行内块的幽灵空白问题)

前言:在练习CSS排版的时候,我们经常会遇到一些排版上的问题,那么我们如何去解决这些问题呢?本篇文章给出了一些新手在练习排版时候可能会遇到的问题的解决方案。 ✨✨✨这里是秋刀鱼不做梦的BLOG ✨✨✨想要了解更多内容可以访问我…