AI绘画Stable Diffusion安装、使用教程 整合包下载

news2025/1/13 15:52:32

安装Stable Diffusion webui

 效果图:

1.准备工作

在下载 AI 绘画工具前,电脑上需要提前下载一些运行的环境

1.下载python、git

首先本地机器最好是英伟达的 N 卡,并且至少需要 4GB 显存才能在本地运行,当然,A 卡也是可以玩起来的,因为绘画对显卡是有着很高的要求的。不然的话,即使安装成功,得到的图片结果可能也是全黑图或者是根本无法进行绘制

安装的时候,需要打开魔法上网,不然无法下载绘画所需要的一些依赖

另外本地需要有 python 环境,官方要求下载 Python 3.10.6 版本

其中 python 的下载地址:https://www.python.org/downloads/

另外还需要安装 Git,下载地址:https://git-scm.com/downloads/

python 安装完成后,我们运行以下命令,将 pip 升级到最新

python -m pip install --upgrade pip

2.下载Stable Diffusion webui

第一种使用 Git 命令:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

第二种直接下载压缩包文件,如下图所示:

3.运行启动

下载到本地后,如果你是 windows 系统,直接双击文件夹中的 webui-user.bat

如果你是 MACOS 或者 Linux 系统,请运行命令 ./webui.sh

第一次启动会下载各种依赖,时间比较久,而且最新版加入了一个近 4GB 的默认模型 v1-5-pruned-emaonly.safetensors 也是要下载的,所以耐心等就可以了。

如果想要加快下载速度的话,可以提前下载好这个模型,然后放到 models/Stable-diffusion 文件夹中即可,然后再启动 webui-user.bat,这样就不会再重新下载这个模型了

模型默认官方下载地址:https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main

如果觉得官方默认下载缓慢,评论区我也贴上了百度云默认模型的下载地址,请自行选择

如果安装过程顺利,直接在浏览器打开 http://127.0.0.1:7860

访问成功即是安装成功,打开的页面大概如下

 

2.下载插件,汉化

汉化安装

方式1:从可用安装

点击软件界面的 Extensions 按钮,再点击 Available 可用扩展按钮,最后点击 Load from 按钮,它就能从后面的索引链接中,检索出所有可用的扩展,供自己下载了

当扩展列表列表加载出来后,我们搜索 Bilingual Localization 语言本地化插件,点击后面的 install 下载即可

 方式2:从网站安装 

先点击 Extensions,然后点击下面的第三个按钮 Install from URL

需要自己手动填写汉化的链接地址进行安装,这里我们可以选择 github 的链接也可以去国内 gitee 上面的链接

汉化插件的开源仓库是 sd-webui-bilingual-localization 或者 stable-diffusion-webui-chinese,搜索一下,然后把链接贴进去,点击 Install 即可

https://github.com/VinsonLaro/stable-diffusion-webui-chinese.git

 方式3:从网站安装 

  • 我们直接找到 stable-diffusion-webui/extensions 扩展目录,然后打开命令行窗口在该目录下运行以下命令即可

git clone 仓库地址

启用汉化

方法一:点击 Setting 按钮,再点击左侧的 Bilingual Localization 栏,在 Localization file 下拉框中选择语言即可

方法二:点击 Setting 按钮,再点击左侧的 User interface 栏,拉到最下面就可以看到插件 Localizationg 的开启窗口了

在选择好后,我们需要点击 Apply setting 保存一下配置,再点击 Reload UI 重新加载界面即可愉快的玩耍了

双语汉化

  • 双语汉化仓库链接:https://github.com/journey-ad/sd-webui-bilingual-localization.git

  • 上面的简单汉化,只是界面全转成中文,如果你想既显示中文又显示英文的话,需要使用双语插件

  • 也是通过上面的三种方式任意一种下载好汉化插件后,需要启用它才可以看到效果

  • 此时我们需要将 Setting 中左侧的 User interface 栏下面的 Localizationg 的设置成 None,然后再在 Bilingual LocalizationLocalization file 下拉框中选择语言,重启 UI 即可

使用篇

效果图:

界面参数

在使用 Stable Diffusion 开源 AI 绘画之前,需要了解一下绘画的界面和一些参数的意义

目前 AI 绘画对中文提示词的效果不好,尽量使用英文提示词

最主要一些参数如下:

Prompt:正向提示词,也就是 tag,提示词越多,AI 绘图结果会更加精准

Negative prompt:反向提示词,也就是反向 tag

Width / Height:要生成的图片尺寸。尺寸越大,越耗性能,耗时越久。

CFG scale:AI 对描述参数 Prompt 的倾向程度。值越小生成的图片越偏离你的描述,但越符合逻辑;值越大则生成的图片越符合你的描述,但可能不符合逻辑。

Sampling method:采样方法。有很多种,但只是采样算法上有差别,没有好坏之分,选用适合的即可。

Sampling steps:采样步长。太小的话采样的随机性会很高,太大的话采样的效率会很低,拒绝概率高

Seed:随机数种子。生成每张图片时的随机种子,这个种子是用来作为确定扩散初始状态的基础。不懂的话,用随机的即可

Restore faces:面部修复,优化面部的,原理是调用一个神经网络模型对面部进行修复,影响面部。修复画面中人物的面部,但是非写实风格的人物开启面部修复可能导致面部崩坏

Tiling:无缝贴图,是一种老牌优化技术,即 CUDA 的矩阵乘法优化,影响出图速度和降低显存消耗,不过实际选上之后可能连正常的图都不出来了。打死不开

Highres.fix:高分辨率修复,默认情况下,文生图在高分辨率下会生成非常混沌的图像。如果使用高清修复,会型首先按照指定的尺寸生成一张图片,然后通过放大算法将图片分辨率扩大,以实现高清大图效果

采样器

Euler a:是个插画,tag 利用率仅次于 DPM2DPM2 a,环境光效菜,构图有时奇葩

Euler:柔和,也适合插画,环境细节与渲染好,背景模糊较深

Heun:单次出土平均质量比 EulerEuler a 高,但速度最慢,高 step 表现好

DDIM:适合宽画,速度偏低,高 step 表现较好,负面 tag 不够时发挥随意,环境光线与水汽效果好,写实不佳

DPM2:该采样方式对 tag 的利用率最高,几乎占用 80% 以上

DPM2 a:几乎与 DPM2 相同,只是在人物的时候可能有特写

PLMS:单次出图质量仅次于 Heun

LMS:质感 OA,饱和度与对比度偏低,更倾向于动画风格

LMS Karras:会大改成优化的风格,写实不佳

DPM fast:此为上界开发者所遗留的测试工具,不适合魔术师使用

文生图(txt2img)

文生图(text2img):根据提示词 Prompt 的描述生成相应的图片

选择 绘画模型(Stable Diffusion checkpoint)文生图(txt2img)填写正向提示词(Prompt)填写反向提示词(Negative prompt)选择采样器(一般选择DPM++ 2M Karras)设置采样步骤(一般设置30)设置长宽(Width / Height,推荐 1024 * 1536)点击生成(Generate)

根据上面的步骤,即可通过文字生成图片了,一般我们只要编写 Prompt 即可, Negative prompt 一般都是固定的,限制一下水印,低质量以及其他可能出现的逻辑错误即可

图生图(img2img)

图生图(img2img):将一张图片根据提示词 Prompt 描述的特点生成另一张新的图片

选择 绘画模型(Stable Diffusion checkpoint)图生图(img2img)填写正向提示词(Prompt)填写反向提示词(Negative prompt)选择采样器(一般选择DPM++ 2M Karras)设置采样步骤(一般设置30)设置长宽(Width / Height,推荐 1024 * 1536)点击生成(Generate)

将上传一张图片到图生图中,进行测试一下,这里使用的是刚刚文生图的照片,根据上面的步骤,点击生成,看看效果

可以看出:AI 图生图,其实就是根据你上传的图片和你的 Prompt 生成一张跟上传差不多的照片

标签权重

在输入 Prompt 标签的时候,有时候想到啥就会写啥,默认写在前面的权重会最高

stable Diffusion 中也可以通过特定符号提升关键词的权重

其中 () 是加强权重,[] 是降低权重,{}NAI() 的“实现”,<> 用于嵌入

例如:(eye) > [eye](eye:1.4)会比正常情况多增加约 40%(eye:0.6)会减少约40 %

模型下载

模型网站推荐:https://civitai.com/

左上角的下拉框可以用来选择模型,其中 v1-5-pruned-emaonly.safetensors 是默认模型

默认的模型画出来的图片比较丑,所以我们需要下载更好更适合的模型来绘画

每个模型侧重绘画的风格不一样,有些适合画人,有些适合画动漫,有些适合画风景,根据自己的需求选择适合自己的绘画风格模型进行下载

下载好模型,将模型文件放入到 models/Stable-diffusion 文件夹下,重载 UI,即可看到

模型的大致区别

名称需求效果备注
stable-diffusion (4GB emaonly模型)2GB 显存起步出图速度 10s,单次最大出 920×920适合出图用
stable-diffusion (7GB full ema模型)4GB 显存起步带最后一次训练的权重,所以费显存适合训练用
waifu (Float 16 EMA 模型)2GB显存起步与stable性能接近 ,显存占用略高适合出图用
waifu (Float 32 EMA 模型)2GB显存起步与stable性能接近,显存占用略高适合出图用,出图质量其实和16差别不大
waifu (Float 32 Full 模型)4GB显存起步与stable性能接近,显存占用略高适合出图或训练用
waifu (Float 32 Full + Optimizer 模型)8GB显存起步与stable性能接近,显存占用略高适合训练用
Naifu (4GB pruned 模型)最低8GB显存&8GB显存和官方比较接近适合出图用
Naifu (7GB latest模型)最低8GB显存(向上浮动10GB)和官方比较接近适合出图或训练用
  • 注意这里显存指的是512X512尺寸,默认配置下,出图时软件所需要占用的显存。2GB显存起步,意味浙你电脑显卡实际显存最少也要3GB(因为系统桌面,浏览器的显示也需要占用一部分显存)
  • 通过增加各种“优化”参数,可以通过性能的部分下降换取显存占用减少。
  • Nafu模型名称说明1:animefull-final-pruned = full-latest = NAI 全量模型(包含NSFW)
  • Nafu模型名称说明2:animesfw-latest = NAI 基线模型

参考资料:

Stable Diffusion 开源地址:GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

最新版本 Stable Diffusion 开源 AI 绘画工具之使用篇_人工智能_极客飞兔_InfoQ写作社区

AI 标签生成器 极客飞兔AI标签生成器

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/551502.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微服务开发系列——第一篇:项目搭建(保姆级教程)

总概 A、技术栈 开发语言&#xff1a;Java 1.8数据库&#xff1a;MySQL、Redis、MongoDB、Elasticsearch微服务框架&#xff1a;Spring Cloud Alibaba微服务网关&#xff1a;Spring Cloud Gateway服务注册和配置中心&#xff1a;Nacos分布式事务&#xff1a;Seata链路追踪框架…

【CH32】| 00——开发环境搭建 | 软件安装 | 资料及工具下载

系列文章目录 TODO 文章目录 1. 简介2. 下载软件3. 安装4. 资料及工具下载4.1 芯片数据手册/参考手册4.2 评估(开发)板原理图/demo4.3 烧录软件4.3.1 isp串口一键下载4.3.2 WCH-LINK Utility烧录 4.4 WCH LINK相关资料/驱动安装4.4.1 WCH LINK相关资料4.4.2 WCH LINK驱动安装 5…

摆摊卖网红气球怎么样?

本章主要介绍一下最近网红气球&#xff1a; 最近看到很多摆摊的抖音视频&#xff0c;都在说卖气球很好&#xff0c;成本低&#xff0c;收益高&#xff0c;所以调研了一下&#xff0c;网红气球分好几种&#xff1a; a,飘空气球&#xff1b; b.手持网红气球 c.青蛙 首先介绍飘空…

初始python

初始python 缘由 ​ 对于python&#xff0c;相比大家并不陌生&#xff0c;Python是一种高级的、解释性编程语言&#xff0c;它具有简洁的语法和强大的内置函数&#xff0c;适用于广泛的应用领域&#xff0c;例如运维,Web开发&#xff0c;数据科学&#xff0c;人工智能等。Pyt…

JVM基础学习---1、JVM总体机制、类加载机制

1、JVM总体机制 1.1 JVM概念 JVM&#xff1a;Java Virtual Machine&#xff0c;翻译过来是Java虚拟机。 JRE&#xff1a;Java Runtime Environment&#xff0c;翻译过来是Java运行时环境。 JDK&#xff1a;Java Development Ki JDK&#xff1a;Java Development Kits&#…

Mysql字符集

1、修改MySQL5.7字符集 我们在新建数据库时&#xff08;Navicat&#xff09;界面时会遇到这两个选项&#xff0c;字符集和排序规则 在MySQL 8.0版本之前&#xff0c;MySQL 5.7 默认的客户端和服务器都用了 latin1 &#xff0c;而latin1是不包含中文的&#xff0c;所以保存中文…

MetersPhere 试用

1. 功能测试 1.1 用例管理 脑图管理 样式&#xff1a; 脑图用例导入 1.2 用例评审 1.2.1 发起用例评审 1.2.2 关联用例&#xff1a; 1.2.3 用例评审 2. 接口测试 2.1 接口定义 类似postman、foxapi等主流接口管理页面 2.2 用例配置&#xff1a; 需要在meterphere安装节点…

路径规划算法:基于人工蜂群算法的路径规划算法- 附代码

路径规划算法&#xff1a;基于人工蜂群的路径规划算法- 附代码 文章目录 路径规划算法&#xff1a;基于人工蜂群的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要&#xff1a;本文主要介绍利用智能优化算法人工…

C++ [STL之vector的使用]

本文已收录至《C语言和高级数据结构》专栏&#xff01; 作者&#xff1a;ARMCSKGT STL之vector的使用 前言正文默认成员函数普通构造拷贝构造析构函数赋值重载 迭代器正向迭代器反向迭代器const迭代器 容量类空间容量查询空间容量操作扩容操作元素数量操作缩容操作 数据访问下标…

numpy log随机产生非常奇怪的数字(np.log的大坑)

背景 有一批信号数据要送到网络里训练&#xff0c;训练之前为了统一量纲&#xff0c;首先根据方差和均值做了一次标准化&#xff0c;然后求了一次能量&#xff08;20*log10(x)&#xff09;&#xff0c;也就是说送进网络里的其实是一个能量谱&#xff0c;但是训练过程中经常蹦出…

Python的用途与学习计划

python的用途&#xff1a; 1、web开发&#xff1b; 2、网络爬虫&#xff1b; 3、数据科学&#xff1b; 4、自动化运维&#xff1b; 5、数据库编程&#xff1b; 6、网络编程&#xff1b; 7、图形处理、数学处理、文本处理&#xff1b; 8、多媒体应用。 其中&#xff0c…

组合问题-回溯算法

1题目 给定两个整数 n 和 k&#xff0c;返回范围 [1, n] 中所有可能的 k 个数的组合。 你可以按 任何顺序 返回答案。 示例 1&#xff1a; 输入&#xff1a;n 4, k 2 输出&#xff1a; [[2,4],[3,4],[2,3],[1,2],[1,3],[1,4], ] 示例 2&#xff1a; 输入&#xff1a;n …

美国国际留学生超136万,本科、硕士和博士各占多少?

国际教育市场研究机构ICEF Monitor近日公布&#xff0c;2022年美国持有F-1和M-1有效学习签证的国际学生数量共计136.2万人&#xff0c;与2021年相比增长了10.1%。 其中&#xff0c;国际学生来美国读本科学士学位的占37%&#xff0c;读硕士学位的占41%&#xff0c;读博士学位的…

为什么WordPress这么难用?(以及如何让它变得简单点)

WordPress 是世界上最受欢迎的网站构建器&#xff0c;为互联网上超过 43% 的网站提供支持。然而&#xff0c;有些人抱怨说 WordPress 比 Squarespace 和 Wix 等解决方案更难使用。 在本文中&#xff0c;我们将解决为何WordPress这么难用的神话&#xff0c;并分享您可以用来毫无…

用于具有缺失模态的脑肿瘤分割的模态自适应特征交互

文章目录 Modality-Adaptive Feature Interaction for Brain Tumor Segmentation with Missing Modalities摘要本文方法Modality-Adaptive Feature InteractionGraph RepresentationGraph Edge ComputationModality Feature Updating 实验结果 Modality-Adaptive Feature Inter…

OpenCV入门-基于Python

图像入门 1. 创建窗口namedWindow()resizeWindow()destroyAllWindow() 2.显示图像imread()imshow()imwrite()waitKey()flip() 代码演示3.显示视频VideoCapure()对象cap.get()cap.isOpened()cap.read()cap.release() 部分功能代码演示VideoWriter()对象VideoWriter_fourcc()writ…

K8s之Pod生命周期、启动停止钩子

文章目录 一、Pod生命周期流程二、初始化容器-initContainers三、主容器操作-containers1、启动钩子-lifecycle.postStart2、停止钩子-lifecycle.preStop 一、Pod生命周期流程 Pod生命周期整个过程 如下图&#xff1a; 1、在启动任何容器之前&#xff0c;前创建 pause 容器&am…

u-boot移植:详细讲解移植u-boot.2022.10版本到imx6ull开发板

目录 一、u-boot编译环境准备 1.安装交叉编译工具链 2.u-boot源码包下载 3.编译 4.安装依赖库 二、U-Boot中添加自己的开发板 1、添加开发板默认配置文件 2、添加开发板对应的头文件 3、添加开发板对应的板级文件夹 4、修改 arch/arm/mach-imx/mx6/Kconfig 5、其他需…

5分钟使用UNI-APP框架创建你的第一个项目

UNI-APP学习系列 5分钟使用UNI-APP框架创建你的第一个项目 文章目录 UNI-APP学习系列前言uni-app框架创建项目一、HBuilderX可视化方式二、 vue-cli命令行方式 总结 前言 UNI-APP学习系列之5分钟创建自己的第一个uni-app项目。 uni-app框架创建项目 创建方式 一、HBuilderX可…

bash: /opt/ros/kinetic/setup.bash: 没有那个文件或目录

有时候打开终端的时候&#xff0c;会在第一行报错&#xff1a; bash: /opt/ros/kinetic/setup.bash: 没有那个文件或目录 bash: /opt/ros/melodic/setup.bash: 没有那个文件或目录 bash: /opt/ros/neodic/setup.bash: 没有那个文件或目录 凡是类似报错与bash有关的&#xf…