一步一步学习 Stable Diffusion

news2025/1/11 23:36:17

一步一步学习 Stable Diffusion

  • 0. 背景
  • 1. 安装
  • 2. 汉化
  • 3. 安装 sd-webui-controlnet 插件
  • 4. 安装 sd-webui-segment-anything 插件
  • 5. 安装 ultimate-upscale 插件
  • 6. 安装 SadTalker 插件
  • 7. 下载和配置 VAE 模型
  • 8. 使用 ChilloutMix 模型
  • 99. 未完待续

0. 背景

网上看了很多 Stable Diffusion 的视频,还有一些网站的资料之后,决定自己整理一份一步一步学习 Stable Diffusion 的学习资料。

1. 安装

请参照 Windows 11 本地部署 Stable Diffusion web UI 或者 Windows 11 上从零开始基于 wsl-ubuntu 搭建 AI 学习环境及部署多种私有 ChatGPT 进行部署。

2. 汉化

访问 Extensions => Available 标签,去掉 localization 勾选,然后单击 “Load from”,

在这里插入图片描述
在 Search 处输入 zh,然后单击 Install 安装 “zh_CN Localization localization”,

在这里插入图片描述
单击 Installed 标签,然后单击 “Apply and restart UI” 重新启动 UI。

在这里插入图片描述
单击 Settings => User interface,将 Localization 设置为 zh_CN,然后单击 “Apply settings”,在然后单击 “Reload UI”,

在这里插入图片描述
这样,Stable Diffusion 的环境就变成中文了。

在这里插入图片描述

3. 安装 sd-webui-controlnet 插件

单击扩展=>从网址安装,输入以下内容,然后单击安装,

  • 扩展的 git 仓库网址:https://github.com/Mikubill/sd-webui-controlnet

在这里插入图片描述
然后单击已安装,单击应用并重启用户界面,

在这里插入图片描述

访问 https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main 下载模型文件,只需要下载扩展名是 .pth 的文件,总共 14 个文件,大概 20GB。

在这里插入图片描述
在这里插入图片描述

然后将下载的文件保存到 stable-diffusion-webui\extensions\sd-webui-controlnet\models 目录下,

在这里插入图片描述
额外配置,

在这里插入图片描述

4. 安装 sd-webui-segment-anything 插件

单击扩展=>从网址安装,输入以下内容,然后单击安装,

  • 扩展的 git 仓库网址:https://github.com/continue-revolution/sd-webui-segment-anything

然后单击已安装,单击应用并重启用户界面,

在这里插入图片描述

下载模型文件 https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth,保存到 stable-diffusion-webui\extensions\sd-webui-segment-anything\models\sam 目录下,

在这里插入图片描述

5. 安装 ultimate-upscale 插件

单击扩展=>从网址安装,输入以下内容,然后单击安装,

  • 扩展的 git 仓库网址:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111

然后单击已安装,单击应用并重启用户界面,

在这里插入图片描述

下载模型文件 https://huggingface.co/lokCX/4x-Ultrasharp/resolve/main/4x-UltraSharp.pth,保存到 stable-diffusion-webui\models\ESRGAN 目录下,

在这里插入图片描述

6. 安装 SadTalker 插件

单击扩展=>从网址安装,输入以下内容,然后单击安装,

  • 扩展的 git 仓库网址:https://github.com/OpenTalker/SadTalker

然后单击已安装,单击应用并重启用户界面,

在这里插入图片描述

下载模型文件 https://github.com/OpenTalker/SadTalker/releases,保存到 stable-diffusion-webui\extensions/SadTalker/checkpoints 目录下,解压 BFM_Fitting.ziphub.zip 到当前文件夹,

在这里插入图片描述

7. 下载和配置 VAE 模型

下载下面几个 VAE 模型,

  • Anything-V3.0.vae.safetensors
  • vae-ft-ema-560000-ema-pruned.safetensors
  • vae-ft-mse-840000-ema-pruned.safetensors

保存到 stable-diffusion-webui\models\VAE 目录下,

在这里插入图片描述
访问设置=>“Stable Diffusion”,启用模型的 VAE。

在这里插入图片描述

8. 使用 ChilloutMix 模型

下载 (ChilloutMix](https://civitai.com/models/6424/chilloutmix) 模型,保存到 stable-diffusion-webui\models\Stable-diffusion 目录下。

下载 LoRA 微调模型,先下载这 2 个体验一下,保存到 stable-diffusion-webui\models\Lora 目录下。

在这里插入图片描述

99. 未完待续

未完待续!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/605124.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

priority_queue(优先级队列)

priority_queue 1. priority_queue的介绍及使用1.1 priority_queue的介绍1.2 priority_queue的使用1.2.1 constructor(构造)1.2.2 empty1.2.3 size1.2.4 top1.2.5 emplace1.2.6 push、pop、swap 1.3 数组中第K个大的元素 2.priority_queue的深度剖析及模拟实现 1. priority_que…

Makerbase SimpleFOC ESP32例程4 双电机闭环速度测试

Makerbase SimpleFOC ESP32例程4 双电机闭环速度测试 第一部分 硬件介绍 1.1 硬件清单 序号品名数量1ESP32 FOC V1.0 主板12YT2804电机2312V电源适配器14USB 线156pin杜邦线2 注意:YT2804是改装的云台无刷电机,带有AS5600编码器,可实现360连续运转。…

柔性作业车间调度

1柔性车间作业调度 个工件 要在 台机器 上加工。每个工件包含一道或多道工序,工序顺序是预先确定的,每道工序可以在多台不同加工机器上进行加工,工序的加工时间随加工机器的不同而不同。调度目标是为每道工序选择最合适的机器、确定每台机器…

【C语言】语言篇——数组和字符串

C站的小伙伴们,大家好呀😝😝!我最近在阅读学习刘汝佳老师的《算法竞赛入门经典》,今天将整理本书的第三章——数组和字符串的一些习题,本章习题较多,下选取部分习题进行练习总结,在这…

200道面试题(附答案)

最近有不少小伙伴跑来咨询: 想找网络安全工作,应该要怎么进行技术面试准备?工作不到 2 年,想跳槽看下机会,有没有相关的面试题呢? 为了更好地帮助大家高薪就业,今天就给大家分享两份网络安全工…

ubuntu20.04 ffmpeg mp4转AES加密的m3u8分片视频

样本视频(时长2分35秒): 大雄兔_百度百科 大雄兔_百度百科不知大家否看过世界上第一部开源电影:Elephants Dream(大象之梦)。这是一部由主要由开源软件Blender制作的电影短片,证明了用开源软件也能制作出效果媲美大公司的作品。…

1-9 随机算法【手写+Xmind笔记】

文章目录 1 Min-Cut【手写笔记】1.1 问题描述1.2 解决方案1.3 概率证明 2 赠券收集【手写笔记】3 快排期望【手写笔记】4 素数性质【手写笔记】4.1 基本性质4.2 解决方案4.3 群论4.4 费马小定理4.5 Miller Rabin素性测试 5-6 力矩与偏差【手写笔记】5.1 基础不等式5.2 矩生成函…

[图表]pyecharts模块-柱状图

[图表]pyecharts模块-柱状图 先来看代码: from pyecharts.charts import Bar from pyecharts.faker import Faker from pyecharts.globals import ThemeTypec (Bar({"theme": ThemeType.MACARONS}).add_xaxis(Faker.choose()).add_yaxis("商家A&q…

Spring 核心概念之一 IoC

前言 欢迎来到本篇文章!通过上一篇什么是 Spring?为什么学它?的学习,我们知道了 Spring 的基本概念,知道什么是 Spring,以及为什么学习 Spring。今天,这篇就来说说 Spring 中的核心概念之一 Io…

day2 -- 数据库的安全管理和维护

brief 访问控制的目的不仅仅是防止用户的恶意企图。数据梦魇更为常见的是无意识错误的结果,如错打MySQL语句,在不合适的数据库中操作或其他一些用户错误。通过保证用户不能执行他们不应该执行的语句,访问控制有助于避免这些情况的发生。管理…

Makerbase SimpleFOC ESP32 例程6 双电机闭环位置力矩互控

Makerbase SimpleFOC ESP32 例程6 双电机闭环位置力矩互控 第一部分 硬件介绍 1.1 硬件清单 序号品名数量1ESP32 FOC V1.0 主板12YT2804电机2312V电源适配器14USB 线156pin杜邦线2 注意:YT2804是改装的云台无刷电机,带有AS5600编码器,可实现360连续运…

Go 字节跳动—从需求到上线全流程

走进后端开发流程 整个课程会带大家先从理论出发,思考为什么有流程 大家以后工作的团队可能不一样,那么不同的团队也会有不同的流程,这背后的逻辑是什么 然后会带大家按照走一遍从需求到上线的全流程,告诉大家在流程的每个阶段&am…

angular环境安装 (含nodejs详细安装步骤)

在安装本次环境之前,需要先把本机上的nodejs环境卸载,环境变量手动删除!安装过程种环境才不会产生副作用!实际项目安装的一次记录,踩了太多坑,记录一下,旨在记录!项目需要两个不用版…

常用设计模式介绍~~~ Java实现 【概念+案例+代码】

前言 想要读懂源码、让自己的代码写的更加优雅,重构系统等。理解设计模式的思想,可以让我们事半功倍。以下稍微整理了常用的设计模式、每一种设计模式都有详细的概念介绍、案例说明、代码实例、运行截图等。这里给出目录导航。 目录 一、创建型模式 【一…

现在的面试把我卷崩溃了....

现在的面试也太卷了,前几天组了一个软件测试面试的群,没想到效果直接拉满,看来大家对面试这块的需求还是挺迫切的。昨天我就看到群友们发的一些面经,感觉非常有参考价值,于是我就问他还有没有。 结果他给我整理了一份…

Linux命令学习之cd

cd是进入某个目录的命令。man 1 cd看一下cd的使用说明。 发现cd是一个Shell内置命令。内置命令可以使用help 命令行来看一下帮助,比如help cd就可以看一下cd的帮助。 图中的[dir]就是参数,这个参数是目录名,比如可以使用cd /可以进入根目录…

外包派遣3年华为,合同结束转正,转正后工资12k-15k,13薪,包三餐,值得去吗?

“但凡有点机会,千万别去外包! ” 在程序员圈子里面,外包程序员似乎永远处于一个尴尬的角色,如果你说他们不是程序员吧,他们也是程序员。应该说是外包这个词比较尴尬吧。赶着和正式工一样的伙,待遇缺天差地别&#xf…

使用VS2019如何创建Win32的项目?

闲来无事,想学习一下Win32的开发,使用VS2019如何创建Win32的项目?费了老大的劲儿,终于捣鼓出来,现在记录一下。 1 创建新项目,在筛选栏选择C Windows 桌面,如下图,选择第一个“Windo…

由于找不到msvcr90.dll无法继续执行代码的5个修复方法

msvcr90.dll是Microsoft Visual C 2008 Redistributable软件包中的一个库文件,它是用于在Windows操作系统上运行C应用程序的重要文件之一。当我们电脑系统中的msvcr90.dll丢失或者损坏了,就会导致很多软件跟游戏无法打开运行,会提示“由于找不…

Linux文件权限及用户管理

文件权限 在Linux中,每个文件和目录都有一组权限,这些权限决定了哪些用户可以访问文件或目录,以及他们可以进行什么样的操作。权限分为三类: 所有者权限:这些权限适用于文件或目录的所有者。 组权限:这些…