探索【Stable-Diffusion WEBUI】的图片超分辨插件:StableSR

news2024/11/20 11:37:35

文章目录

  • (零)前言
  • (一)图片放大
  • (二)图片超分辨率放大脚本插件(StableSR)
    • (2.1)下载组件
    • (2.2)使用
    • (2.3)实例对比
  • (三)总结

(零)前言

本篇主要介绍WEBUI的插件:StableSR:图片超分辨放大的使用,以及和WEB UI附加功能图片放大功能的对比。
更多不断丰富的内容参考:🔗《继续Stable-Diffusion WEBUI方方面面研究(内容索引)》

(一)图片放大

之前通过《探索【Stable-Diffusion WEBUI】的附加功能:图片缩放&抠图》了解到,由于Stable-Diffusion并不适合生成很大的图片,所以我们可以先生成适合的正常尺寸图,再通过附加功能页的放大功能,放大图片。

同时介绍了好些缩放模型,其中有些效果挺好的。

特别是LDSR(潜在扩散超分辨率模型)照片表现非常好,不仅脑部的细节多,还加入了很多噪点显得真实。
但模型体积巨大+速度超级慢。放大一张512x512的图,几乎需要20分钟(其它放大算法都是20秒内……)。

所以,有没有其它放大选择呢?

(二)图片超分辨率放大脚本插件(StableSR)

参考:🔗插件StableSR
可以从WEB UI中直接安装,它是一个图生图的脚本。
安装后会在图生图最下面的脚本下拉框中出现StableSR。

由于官网有中文说明,不需要细讲了吧:)
简单列举下重点,细节请看官网(仓库)的中文说明。

对了:SR = Super-Resolution ,写出来以防忘记。。。

(2.1)下载组件

安装后需要下载模型才能使用(⚠️细节请看官网介绍):

  1. Stable Diffusion V2.1 512 EMA 模型(约 5.21GB)->放基础模型目录。
  2. 官方的 StableSR 模块 (约400MB)->放插件自己的模型目录。
  3. 可选使用官方提供的 VQGAN VAE(约750MB) ->放VAE模型目录。
  4. 可选配合 Tiled Diffusion & VAE 扩展,也就是分区扩散(Multi Diffusion)插件使用。
    说是可选,咱普通显存只能必选,否则稍大的图就显存不够了。

(2.2)使用

基本使用很简单,在图生图下面启用脚本就可以了。
主要步骤如下,官网还给出了具体参数配置的建议(⚠️细节请看官网介绍)。

  • 基础模型选择刚才下载的v2-1_512-ema-pruned模型。
  • 切换到 img2img 标签。在页面底部找到 “脚本” 下拉列表,选择StableSR脚本。
    点击刷新按钮,选刚才下载的 StableSR 模块。
  • 如果生成图像尺寸 > 512,推荐使用 Tiled Diffusion & VAE(也就是Multi Diffusion upscaler)。
  • 上传图像并开始生成。

我试了一下速度还不算太慢(比一般算法慢多了)。
一张512²的图大概5-6分钟吧(还是比LDSR快不少啊)。

💡 不过需要注意:

  • 中低显存下,不能打开Channels Last内存格式优化,否则报错。
  • 不要尝试放大特别小的图片(48x48一类?)😄 。
  • 纹理类可以脑部的细节很不错。但文字类需要“原样放大”的效果很差,看不出原文。
    这种情况请对比4x-UltraSharpR-ESRGAN 4x+等附加功能页图片放大的效果。
  • 使用SD2.1的基础模型时,嵌入式(embeddings)模型可能会暂时看不见,正常的,因为那些是给SD1.5用的。
  • 注意版权问题,目前由于版权协议,生成的图片不能商用。

(2.3)实例对比

下面这张图(请忽略AI生成导致不合理的部分),我们来把它放大4倍。
在这里插入图片描述

放大后实在是太大了,就给个局部裁剪吧。
局部:原图直接缩放(传统图像编辑软件,对比组)
请添加图片描述


局部:StableSR
请添加图片描述


局部:StableSR(纯噪声选项开)
纯噪声适合脑部肌肤纹理,植物人群,各种不太需要和原图一致的细节。细节多,显得更加清晰。
但是改变原图较多,不适合文字之类。有时也会生成莫名奇妙的东西。
请添加图片描述


局部:LDSR(最强对比组)
噪点多显得真实,但噪点真的太多了。而且没有色彩修复选项(关键是太慢,其它可以忍)。
请添加图片描述

(三)总结

插件非常适合可以脑补细节的图片放大,相对LDSR来说不算太慢。
但操作相对复杂,还需要配合分区扩散插件(不然就爆显存,参数设不对也爆显存)。

总之它给了我们一个新的选择,期待持续改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/562429.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

bat脚本语法与实战

一、什么是bat脚本 bat脚本就是将一系列DOS命令按照一定顺序排列而形成的集合,运行在windows命令行环境上。通过本文的学习,基本可以实现一些简单的脚本。 二、为什么学习bat脚本? 使用bat可以提高办公效率,可以直接使用Notepad编…

JavaEE(系列12) -- 常见锁策略

目录 1. 乐观锁和悲观锁 2. 轻量级锁与重量级锁 3. 自旋锁和挂起等待锁 4. 互斥锁和读写锁 5. 可重入锁与不可重入锁 6. 死锁 6.1 死锁的必要条件 6.2 如何避免死锁 7. 公平锁和非公平锁 8. Synchronized原理及加锁过程 8.1 Synchronized 小结 8.2 加锁工作过程 8.2.1 偏向锁…

MySQL保证主备一致,如何解决循环复制?

备库只读,是如何和主库同步数据的? 你可能会问,我把备库设置成只读了,还怎么跟主库保持同步更新呢? 这个问题,你不用担心。因为 readonly 设置对超级 (super) 权限用户是无效的,而用于同步更新…

用Typescript 的方式封装Vue3的表单绑定,支持防抖等功能。

Vue3 的父子组件传值、绑定表单数据、UI库的二次封装、防抖等,想来大家都很熟悉了,本篇介绍一种使用 Typescript 的方式进行统一的封装的方法。 基础使用方法 Vue3对于表单的绑定提供了一种简单的方式:v-model。对于使用者来说非常方便&…

【011】C++选择控制语句 if 和 switch 详解

C控制语句之if和switch语句 引言一、选择控制语句if1.1、if 语句的形式1.2、if...else...语句的形式1.3、if...else if... else...语句 二、选择控制语句switch2.1、switch语句形式 三、switch和if...else if...else...比较四、注意事项总结 引言 💡 作者简介&#…

企业工程行业管理系统源码-专业的工程管理软件-提供一站式服务

Java版工程项目管理系统 Spring CloudSpring BootMybatisVueElementUI前后端分离 功能清单如下: 首页 工作台:待办工作、消息通知、预警信息,点击可进入相应的列表 项目进度图表:选择(总体或单个)项目显示1…

Doo Prime 德璞资本:期货开户条件全解析!让你不再困惑!

期货市场是金融市场中一个非常重要的部分,对于许多投资者来说,期货市场是一个非常有吸引力的投资选择。然而,要进行期货交易,必须首先开设期货账户,这就需要满足一些期货开户条件,因此本文将介绍期货开户条…

认识SpringCloud(一) 注册中心Eureka

Spring Cloud 封装了 Netflix 公司开发的 Eureka 模块来实现服务治理。在传统的rpc远程调用框架中,管理每个服务与服务之间依赖关系比较复杂,管理比较复杂,所以需要使用服务治理,管理服务于服务之间依赖关系,可以实现服…

(原创)getX+Dio实现Flutter悬浮置顶的页面效果

前言 Flutter的开发相对已经比较成熟了,现在市面上不少商业应用也在使用这个技术 老实说,Flutter去实现一些基础的ui界面,效率还是很高的 当然前提是你对它要有一定的了解。 今天就演示一下,如何去实现一个基础悬浮置顶的页面效果…

OSTrack 中的边界框回归策略

目录 一、裁剪和标签的设置 二、模型的预测输出的边界框回归 一、裁剪和标签的设置 1、添加偏移量,得到偏移后的边界框 jittered_anno [self._get_jittered_box(a, s) for a in data[s _anno]] 2、以偏移后的边界框为中心,进行裁剪 首先以偏移边界…

Apache Pulsar入门指南

1.概述 Apache Pulsar 是灵活的发布-订阅消息系统(Flexible Pub/Sub messaging),采用计算与存储分离的架构。雅虎在 2013 年开始开发 Pulsar ,于 2016 年首次开源,目前是 Apache 软件基金会的顶级项目。Pulsar 具有支…

面试官:写一个单例模式

1. 什么是单例模式 了解单例模式之前,我们需要先了解什么是设计模式。 设计模式是一种抽象的编程思想,不局限于编程语言,简单来说,就是一些大佬程序猿针对一些典型的场景,给出一些典型的解决方案,只要按照这…

04-CSS3-渐变色、2D转换、3D转换

一、渐变色 CSS渐变色(Gradient)是指在元素背景中使用两种或多种不同的颜色进行过渡,超过两个颜色可以形成更为细腻的渐变效果。常见的CSS渐变色有线性渐变和径向渐变。 1. 线性渐变:Linear Gradients 向下/向上/向左/向右/对角…

SVN 修改URL路径-使用重新定位(relocate)命令和找不到问题解决

当svn服务器url发生变更,又不想在本地重新进行checkout操作,这时候可以使用svn relocate命令进行url的重新定位; 在windows下以TortoiseSVN为例,在仓库文件夹上右键,TortoiseSVN-(重新定位)relocate, 1、Windows TortoiseSVN客户端: 在工作复本的根目录上右键->TortoiseSV…

DOUBLETROUBLE: 1

文章目录 DOUBLETROUBLE: 1实战演练一、前期准备1、相关信息 二、信息收集1、nmap探测目标靶机端口2、扫描目标网址目录3、访问网站,发现secret下有个图片4、将图片下载5、查看图片所含内容6、破解密码并查看7、登陆邮箱8、创建反弹shell9、上传反弹shell10、监听11…

Jeecg-Boot 未授权SQL注入漏洞(CVE-2023-1454)

本文转载于:https://blog.csdn.net/qq_27536045/article/details/129944987 环境搭建 JDK: 1.8 (小于11) Maven: 3.5 MySql: 5.7 Redis: 3.2 Node Js: 10.0 Npm: 5.6.0 Yarn: 1.21.1 下载源码 后端源码 https://github.com/jeecgboot/jeecg-boot/tree/v…

MongoDB安装教程—Ubuntu

为啥用MongoDB,问就是客户要求。 为啥用Ubuntu,问就是客户只有Ubuntu的机器。 0. 环境 操作系统: Ubuntu 22.04.1 LTS (GNU/Linux 5.19.0-41-generic x86_64) 不同版本系统差异不同,其他版本系统未测试。 1. 安装 1.1 包管理公…

深入探索SDL游戏开发

前言 欢迎来到小K的SDL专栏第二小节,本节将为大家带来基本窗口构成、渲染器、基本图形绘制、贴图、事件处理等的详细讲解,看完后希望对你有收获 文章目录 前言一、简单窗口二、渲染器三、基本图形绘制1、点2、线3、矩形4、圆和椭圆 四、贴图五、事件处理…

XR交互技术趋势:6DoF追踪、手势识别、眼动跟踪……

XR交互技术提供了用户与虚拟环境进行交互的方式和手段,而实时云渲染则提供了真三维、可交互、高沉浸的图形渲染和计算能力。结合这两者,用户可以通过XR设备获得更真实、更沉浸的虚拟体验,同时享受到优质的图形效果和流畅的交互响应。本篇文章…

关于开发中对端口(port)的几点理解

一、服务端的端口是固定的,客户端的端口是随机的 客户端端口是随机的,比如访问百度,系统为浏览器分配了个端口1024。过一会重开电脑,访问了新浪,可能还是用1024端口,我不关浏览器,还要再开一个浏…