stable diffusion webui 安装与入门
- 一、源码仓库
- 二、模型库地址
- 三、在 Windows 上自动安装步骤
- 安装Python
- 安装git
- 下载源代码
- 编辑 webui-user.bat
- 四、如何打开
- 五、依据文字生成图片
- 六、API在哪里?
- 七、用python调用API接口示例
- 八、如何制作生成精美的图片
- 1、下载模型
- 2、参考(抄袭)别人的提示词
- 九、如何使用模型
- 1. LoRA 是什么?
- 2. LoRA 目录
一、源码仓库
https://github.com/AUTOMATIC1111/stable-diffusion-webui
二、模型库地址
https://civitai.com/
三、在 Windows 上自动安装步骤
会linux基本上都懂得用github仓库,本指南主要面向小白,所以以windows为主。
安装Python
- 安装 Python 3.10.6 , 并检查 python 是否添加进全局变量.
安装git
安装 git.
下载源代码
运行 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.
编辑 webui-user.bat
下载完之后,进入stable-diffusion-webui目录
@echo off
set PYTHON= { 这里填上你的python的真实地址 }\python.exe
set http_proxy= {这里填上你的vpn的地址}
set https_proxy= {这里填上你的vpn的地址}
set GIT=
set VENV_DIR=
REM 如果没有显卡就加上 --no-half --skip-torch-cuda-test,如果要开通API功能就加上 --api
set COMMANDLINE_ARGS= --no-half --skip-torch-cuda-test --api
git pull
call webui.bat
四、如何打开
- 双击运行 webui-user.bat
- 启动后就会开始执行python的本地服务器,并监听7860 端口,所以浏览器打开:
http://127.0.0.1:7860
即可。
五、依据文字生成图片
六、API在哪里?
打开链接:http://127.0.0.1:7860/docs
这里面会有接口列表。
以 sdapi
开头的都是可使用的接口。
七、用python调用API接口示例
import requests
url = "http://127.0.0.1:7860"
payload = {
"prompt": "puppy dog",
"steps": 5
}
response = requests.post(url=f'{url}/sdapi/v1/txt2img', json=payload)
r = response.json()
print(r)
八、如何制作生成精美的图片
1、下载模型
因为模型是别人反复调试配备好的模板,生成的图片质量比较上乘
2、参考(抄袭)别人的提示词
除了模型,还要加上成熟的提示词,(要求英文的)这样才能进行精确的微调与操作
注意事项:生成的图片是比较随机的,所以可以一次性生成多张,方便挑选。
如果没有显卡的话,生成的速度会比较慢。建议加上显卡。
九、如何使用模型
为了让生成的图片更加好看,我们需要使用别人已经训练好的模型。
1. LoRA 是什么?
LoRA[^1],英文全称Low-Rank Adaptation of Large Language Models,直译为大语言模型的低阶适应,这是微软的研究人员为了解决大语言模型微调而开发的一项技术。
比如,GPT-3有1750亿参数,为了让它能干特定领域的活儿,需要做微调,但是如果直接对GPT-3做微调,成本太高太麻烦了。
LoRA的做法是,冻结预训练好的模型权重参数,然后在每个Transformer(Transforme就是GPT的那个T)块里注入可训练的层,由于不需要对模型的权重参数重新计算梯度,所以,大大减少了需要训练的计算量。
LoRA的微调质量与全模型微调相当。要做个比喻的话,就好比是大模型的一个小模型,或者说是一个插件。
2. LoRA 目录
路径:stable-diffusion-webui\models\Lora
下载完的 LoRA 文件,直接拷贝到这个目录即可。
先试着生成图片,后续再一步步生成精致的图片.
[^1] https://zhuanlan.zhihu.com/p/610031713