本系列笔记主要参考B站nenly同学的视频教程,传送门:B站第一套系统的AI绘画课!零基础学会Stable Diffusion,这绝对是你看过的最容易上手的AI绘画教程 | SD WebUI 保姆级攻略_哔哩哔哩_bilibili
**Stable Diffusion(简称SD)**是2022年发布的一个深度学习文本到图像生成模型,由慕尼黑大学的CompVis研究团体首先提出,并与初创公司Stability AI、Runway合作开发,同时得到了EleutherAI和LAION的支持。
它可以实现的功能有很多,可以根据文本的描述生成指定内容的图片(图生图),也可以用于已有图片内容的转绘(图生图),还可以用作图像的局部重绘、外补扩充、高清修复,甚至是视频的“动画化”生成。 这些功能,我都会在后续进行介绍。
SD的源代码是开源发布在网上的,这意味着任何人都可以免费、不限量地使用它进行AI绘画生成操作。有开发者使用它的源代码制作了易于用户使用的图形化界面(GUI),于是便有了今天我们大多数人手里可以使用的Stable Diffusion WebUI(SD Web UI)。
此处我只介绍最简单的、对新手友好的Stable Diffusion的整合包的安装,如果你想要更深入研究Stable Diffusion,并且进行更高程度的定制化,可以在官网中查询更多细节:GRAVITI Diffus - Stable Diffusion WebUI
配置需求
目前,Stable Diffusion可以在一台搭载有民用级显卡的电脑上运行。它的配置要求不高但具有一定针对性,最主要的要求是显卡性能与显存大小。官方说明中的配置需求如下:
最低配置
操作系统 | 无硬性要求 |
---|---|
CPU | 无硬性要求 |
显卡 | RTX 2060 及同等性能显卡 |
显存 | 6GB |
内存 | 8GB |
硬盘空间 | 20GB的可用硬盘空间 |
在此配置条件下,约1-2分钟一张图,可绘制分辨率512*512像素。
推荐配置
操作系统 | Windows 10/11 64 位 |
---|---|
CPU | 支持 64 位的多核处理器 |
显卡 | RTX 3060Ti 及同等性能显卡 |
显存 | 8GB |
内存 | 16GB |
硬盘空间 | 100~150GB的可用硬盘空间 |
在此配置条件下,约10-30秒一张图,可绘制分辨率1024*1024像素。
下载并使用整合包
“整合包”一般指开发者对Automatic1111制作的Stable Diffusion WebUI进行打包并使其程序化的一种方式。使用整合包,一般可以省去一些自主配置环境依赖、下载必要模型的功夫。如果你打算使用整合包,我推荐使用秋葉整合包,秋葉整合包是公认最适合新手使用的整合包之一,支持一键启动,含可调节多种程序参数的启动器,方便更新管理;:【AI绘画·24年4月最新】Stable Diffusion整合包v4.8发布!解压即用 防爆显存 三分钟入门AI绘画 ☆更新 ☆训练 ☆汉化 秋叶整合包_哔哩哔哩_bilibili
上述整合包资源的下载方式:
点击视频链接,跳转B站视频,展开视频下方的“简介”,即可看到作者提供的下载链接与提取码。
整合包使用对新手十分友好,下载好解压之后,点击启动器即可一键启动,关于启动后的图形界面的介绍和基础功能的使用,我将在后续的章节中为你详细介绍。