Stable Diffusion之novel Ai教程,小白必经之路

news2024/9/23 21:28:04

在这里插入图片描述

一、介绍是Stable Diffusion(简称SD)

1.SD是什么

Stable diffusion是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型。简单的来说SD是可以通过提示词生成图片的应用。目前已经发布了V4版本,可以更好的稳定扩散。 我们的目的就是能快速使用它,所以不去深究SD原理也是可以的。

2.SD能干什么

1)、刷视频可以刷到一些up、博主发的一些AI绘画的视频,就是基本的应用,通过大模型和描述词的结合生成漂亮的图片,不仅可以生成真实的图片还可以生成各种各样画风的人物和风景图。

在这里插入图片描述

2)、我们还可以用SD去训练制作一套属于我们自己的头像、壁纸,或者用SD去训练我们自己和家人的脸型,让图片上的我们身穿各种衣服处于各种场景。

3)、对于修复模糊照片和室内效果图等也有很大帮助

下面会具体说明。

二、本地部署SD

1.A卡和mac系统

A卡和mac系统目前来说还不能完全的匹配使用,需要自己不断测试,这个问题比较玄学,而且身边没有A卡和mac的计算机,所以我推荐两个大佬的解决办法。

针对mac系统:https://www.cnblogs.com/cheflone/p/17157938.html

针对AMD显卡:https://www.bilibili.com/video/BV1YV4y1o73q/?vd_source=80933838b024b85e550fb038b841810d

2.最低配置和推荐配置

最低配置要求

推荐配置

CPU: Intel Core i5以上

Intel Core i7以上

内存:8GB以上

内存:32GB或更高

显卡:显存至少6GB以上

显卡:显存12GB或更高

存储:至少50GB可用硬盘空间

存储:100G可用硬盘空间

操作系统:windows7以上

操作系统:windows10以上

以下是一些可用于优化stable diffusion性能的建议:

使用SSD存储:使用固态硬盘可以显著提高文件读取速度,从而加快stable diffusion的启动和加载时间。

关闭其他程序:确保在stable diffusion运行期间关闭其他运行的程序,从而释放系统资源并提高性能。

更新驱动程序:确保你的操作系统和显卡驱动程序是最新的,可以提供更好的性能和可靠性。

使用外部显卡:如果您的计算机配备了内置显卡,可以考虑添加外部显卡。外部显卡通常比内置显卡提供更好的性能。

结论:

要在stable diffusion上获得最佳性能,需要正确的硬件配置,可帮助用户提高性能和流畅度。

3.整合包一键部署,小白福音

本地部署不了,还要花费大量时间去测试,因为每个人的计算机环境不一样,同样的步我建议直接使用整合包,因为如果自己去部署的话百分十八十可能成功骤在别人电脑上就正常,自己电脑上就不正常了。整合包解决了这些问题,解压出来就可使用非常方便:

在这里推荐两个大佬的整合包:

秋叶整合包地址:https://pan.baidu.com/s/1_ibEk2OpKHxmEg4AnFOpSA 提取码:b145

星空整合包地址:

https://pan.baidu.com/s/1_FYbDpkX6Q6hDVHJpCMRxA?pwd=o852

这篇文章以秋叶的整合包为主:

下载秋叶整合包解压到存储空间大的盘符中

解压出来后先点击:启动器运行依赖。

在这里插入图片描述

点击安装
解压第二个sd-webui-aki-v4压缩包。打开文件,点击A启动器,等待安装完成进入界面。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

点击一键启动,在这个界面稍等一会。
在这里插入图片描述

如果出现报错可在启动器“疑难解答”中扫描并修复

下面这个就是SD页面。看着功能很多实际上基础使用中,有很多用不上。一张图介绍主界面。

在这里插入图片描述

三.WebUI界面介绍(基本常用)和使用方法

1.文生图

1.绘画关键词

生成一张图片最重要的就是tag(关键词),tag越准确图片越接近自己想要的。怎么写关键词呢?单词、词组、短句子都可以。在这里说一下画之前先确定想要的画风,然后选择合适的模型,在这里我们使用真实画风举例。选择dreamshaper_8.safetensors大模型。

怎么下载模型会在后面详细说明
在这里插入图片描述

选择完模型之后输入关键词:如果我们想要一个穿着T恤的女孩可以写1girl,wearing t-shirt,full body,注意每个词组之间用逗号隔开,点击生成,你的第一张图就出来了!
在这里插入图片描述

这里反向关键词是一个比较通用的提供给大家使用(asian, nude, smiling, tattoos, windows, 2girl, (text:1.3), (words:1.4), writing, deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck)

再演示一个例子,以这个例子详细说明tag。

我们再写tag之前可以先想一下照片质量的词,比如:高质量,8k画质,大师杰作什么的,这样出来的图片质量越好。 (8k, uhd, dslr, high quality, cinematic lighting, bokeh), (dramatic, award winning photography, incredible masterpiece:1.3) (strong depth of field),这些是质量词,然后想一下想要什么人想穿什么衣服:穿着修身T恤的,28岁左右,叫凯瑟琳的女孩。所以我们写:(editorial photograph of Catherine as a 28 y.o. female diplomat), (wearing a t-shirt, sophisticated top, intimate, detailed:1.3)然后想要人在什么背景中房间中?大街上?什么天气?比如在老旧的书房中就写,(background inside dark, moody, private study, old furniture:1.3)最后加一个镜头语言强景深(strong depth of field)这样我们就可以要我们想要的图了。除此之外,我们还可以加一些首饰tag、人物姿势tag、物品颜色tag。
在这里插入图片描述

大家可以看到例子里有好多括号,这里讲一下括号的作用:提示词加括号代表权重,一个括号代表重要性增加1.1倍,两个括号,如:((XXX))代表1.1*1.1倍,如果想要固定值就在括号里改数字,例如(XXX XXX 1:3)代表1.3倍权重。画面中权重越高的就会很显眼。这些需要根据实际情况不断调试。减权重也可以就是用[ ]这个括号括起来。
反向关键词:当我们生成照片次数多了之后,渐渐的发现偶尔生成出来的照片多了几个手指,甚至会多了一只手,那怎么才能避免这些情况呢?

反向tag就是告诉SD,我不要那样的照片!

不想出现的东西,比如:多余的手,两个头,扭曲的脸等,可以照抄上面的。

总结一下我们写关键词的公式:

画质+主体+主体细节+人物服装+其他(背景、天气、构图等)

2.VAE

VAE简单的说就是一层滤镜,可以看到不同的VAE出来的效果有些不一样。
在这里插入图片描述

3.Lora的使用

点击这个图标,就会出来Lora的选择选项。

在这里插入图片描述

直接点击Lora就可以调用Lora
在这里插入图片描述

不同Lora可以控制不同的画面,比如可以控制脸型、服装、配饰等可以一起使用。我们可以调整不同的Lora权重生成我们独一无二的图片。Lora的下载安装在后文会说到。(如果想的话可以训练我们自己或者偶像的Lora控制出图的脸型,这样可以让自己穿不同的衣服在不同的环境中。)注意如果用的是动画风格的Lora,那就要选择动画风格的大模型,真实的大模型会出来奇奇怪怪的东西。

4.迭代步数

迭代步数与图片质量有很大关系,但是不代表迭代步数越高越好。太高了会导致过度计算出来的图片不伦不类,太低计算不足也会这样。

迭代步数一般在20-50之间

5.采样方法

不同的采样方法会出来不同效果的图,我推荐这三种采样方法,实际操作应用多,当让有时间的话也可以尝试一下其他的采样方法。
在这里插入图片描述

6.随机数种子

为什么有时候我们跟别人用的大模型、关键词、Lora还有其他参数都一样可偏偏生成出来的图就是不一样?

那是因为随机数种子(seed)的因素。Seed控制着图片形状,它会决定我们照片的基础轮廓,相当于决定了我们照片人物的外形轮廓,包括姿势和站位等当随机数为-1的时候,SD就会随机给你的照片生成一个种子,这个种子就理解成不一样的线稿就可以 怎么看自己照片用的seed值(随机教种子)是什么呢?在我们点击生成的照片下面,有一大串英文,里面的seed值就是我们当前生成照片的seed值。

只有当我们所有参数,包括随机数种子跟别人的照片都一样时,我们才能生成跟别人差不多一样的照片。
在这里插入图片描述

2.图生图

1.图生图

图生图功能顾名思义就是以已有的一张图生成另外一张图。这个对于出一批构图、形象或者画风相近的图很有帮助。

假如我们想要一张自己形象的动画风格的图片,我们就可以上传一张自己的照片,选择动画风格的大模型,输入tag:1men,the best quality, ultra-high definition, masterpieces, extreme detail, 8k,

这样就可以得到自己的动画、二次元形象了,再也不用花钱找别人设计了。

底下的参数需要看一下生成图片的分辨率还有重绘幅度,重绘幅度越低,成图和原图约不一样,重绘幅度为1时,就会跟原图一模一样。

一般在0.6-0.85区间内,大家可以根据需求多试试。

在这里插入图片描述

2涂鸦和涂鸦重绘

你可以在涂鸦功能里粗略的画几笔,SD会根据你画的计算生成一副精湛的图片。上传一张白色的图片当作画纸,用画笔随便画画,输入tag,就可以得到一幅画了。涂鸦重绘在原图基础上涂鸦,操作一样。

3.局部重绘

如果想让模特不动换一件衣服,那么可以采用局部重绘功能,上传一张图片。将衣服涂黑。

在这里插入图片描述

在这里插入图片描述

调整参数,将衣服相关的提示词删掉或者修改,生成图片,就可以出现不同的衣服。
在这里插入图片描述

同理如果想换脸就把脸部涂黑,就可以换脸。

4.重绘蒙版

如果有一件漂亮的衣服想让人穿上它,可以使用重绘蒙版。结合controlnet插件(后续会具体讲解controlnet插件)使用。

首先找一张模特图片用PS将衣服分离出来,用亮色做背景作为一号图片。再做一个1号图蒙版。

推荐一个小网站,图片素材资源不错
https://huaban.com/pins/5764547782
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

之后来到sd中图生图——局部重绘(上传蒙版)将一号图和蒙版放上去,调整参数,
在这里插入图片描述
在这里插入图片描述

在ControlNet中一号图放0中,调整预处理器选择canny和模型选择canny(上面有链接,要提前下载安装好)。来到3D Openpose,调整角度、骨骼姿势,生成骨骼图片。

在这里插入图片描述

将骨骼图片放入Control Model-1中,预处理器无,模型选择openpose,引导时机0.7左右

输入需要的提示词点击生成,得到需要的图片,衣服相似度97%
在这里插入图片描述

3.后期处理

后期处理可以帮助我们处理模糊的图片。上传一张模糊的图片,调整Upscaler 1

修复二次元的照片选择”R-ESRGAN 4x+Anime68”

修复真人照片选择”R-ESRGAN 4x+”

其他的也可以尝试一下。

GFPGAN 强度调高点击生成就可以修复模糊照片啦。

4.图片反推(图片生成关键词)

1.PNG图片信息

上传一张图片,可以推理出这张图片的tag,将tag载入到文生图中可以得到与这张图片相似的图片。

2.标签器(Tagger)

标签器也可以反推tag,还可以给模型训练集批量打标。

Lora模型训练时可以用到这个功能。如图所示调整完参数之后点击反推提示词,就可以给训练集的图片打上标了。
在这里插入图片描述

5.Openpose

Openpose可以通过调整节点,控制人物形态动作
在这里插入图片描述

也可以上传图片读取里面人物的动作
在这里插入图片描述

这对于出图有很大的帮助。

6.大模型的获取途径和选择
在这里插入图片描述

大模型的我们可以通过C站(civitai)下载,里面有各种风格模型,包括大模型和lora模型。

不过需要科学上网。国内也有一些移植的模型下载网站,但是模型数量较少。还可以上淘宝去买模型,不过免费的东西还是不要花这个钱了。

civitai :https://civitai.com/

点击Download就可以下载了,在这里我们还可以获取一些大佬的提示词、采样方法、迭代步数等信息,点击图片,在右下角就可以看到。不过有些没有被分享出来。

在这里插入图片描述

下载出来的模型放在models文件夹里,在WebUI点击刷新就可以使用了。

在这里插入图片描述

在这里插入图片描述

注意下载的模型的画风,按照需要选择模型。

7.Lora模型的作用

Lora的作用就像上文提到的可以控制人物的脸型、服饰、背景等。可以多个lora模型搭配使用,通过调整每个lora的权重来调整画面中出现的lora质量。注意多个lora权重数相加等于1。

四.ControlNet插件安装使用方法

1.安装方法和下载模型

打开扩展——可下载——点击加载扩展列表找到图里所示就可以下载了。

也可以通过网址下载安装:https://gitcode.net/ranting8323/sd-webui-controlnet
在这里插入图片描述

模型下载地址:https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

看到这么多模型不用慌:常用的也就几个。
在这里插入图片描述

2.使用

插件模型安装好后就可以在主界面使用了。点击ControlNET就可以看到使用界面了。

比如我们有一张线稿图,就可以用这个插件上色。上传线稿图,点击启用,预处理器选择canny;模型选择canny调整参数。选择合适的模型,输入相对的tag,就可以生成图片了。

效果还不错哦。

前面我们提到的可以用openpose控制形态动作,但是没讲怎么用,这里就是使用方法了。

我们上传一张骨骼图,预处理器选择无,模型选择openpose,调整参数。这样就可以啦!

预处理器里面还有好多选项比如depth控制画面场景深度,openpose-hand可以控制手部动作等等。以后我会专门写一个controlNET插件相关的专栏来介绍这些。

五.结尾

本次stable diffusion基本使用方法就介绍到这里啦,略有不足的地方有很多,不过应该可以让大家轻松上手使用。以后我会写一些训练lora模型、controlnet插件等一些相关文章,包括有很多人想了解的如何利用lora模型做自己的产品效果图和如何变现的问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1110901.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode算法栈—验证图书取出顺序

验证图书取出顺序 目录 验证图书取出顺序 题解: 代码: 运行结果: 验证图书取出顺序 现在图书馆有一堆图书需要放入书架,并且图书馆的书架是一种特殊的数据结构,只能按照 一定 的顺序 放入 和 拿取 书籍。 给定一个…

MIKE水动力笔记17_MIKE文件转shp、统计每个单元格的面积

本文目录 前言Step 1 MIKE文件转shpStep 2 在ArcGIS中打开shp统计相应指标 前言 MIKE的工具箱中自带一个转shp的工具,然后可以拖进ArcGIS中很方便的统计每个单元格的面积和每个网格点的水深。 Step 1 MIKE文件转shp MIKE允许转shp的文件类型包括dfs2文件、dfsu文…

EDU实战-SQL注入漏洞

对于edu来说,是新人挖洞较好的平台,本次记录一次走运的捡漏0x01 前景 在进行fofa盲打站点的时候,来到了一个后台管理处看到集市二字,应该是edu站点 确认目标身份(使用的quake进行然后去ipc备案查询) 网…

Redis 之 SessionCallback RedisCallback 使用

📢📢📢📣📣📣 哈喽!大家好,我是「奇点」,江湖人称 singularity。刚工作几年,想和大家一同进步🤝🤝 一位上进心十足的【Java ToB端大厂…

前端 vue 实现区域地图-并在地图上标注柱状图

效果图 西藏的区域规划以及柱状图 一、下载区域地图的js文件 区域地图可以在中国的区域地图 这里下载 二、实现代码 一个普通的html可以参考 实现广东省的区域地图并标注柱状图 三、vue里具体实现代码 1.做一个有具体宽高的dom <template><div class"box&…

小程序之自定义组件 结合案例(会议OA的会议/投票管理及个人中心的搭建)详解 (4)

⭐⭐ 小程序专栏&#xff1a;小程序开发专栏 ⭐⭐ 个人主页&#xff1a;个人主页 目录 一.前言 二.小程序自定义组件及其使用 2.1 自定义组件的使用 三.使用自定义组件完成会议功能界面的实现 3.1 导航栏的实现 3.2 会议界面内容的实现 四.投票管理界面 五.个人中心 今天…

SystemVerilog Assertions应用指南 Chapter1.30 使用“ intersect”控制序列的长度

在123节讨论的“ intersec”运算符可以有效地控制序列的长度,尤其是在时序窗口未定义上界的情况。每当使用可能性( eventuality)运算符时,检验器成功所需的时钟周期数没有限制。运算符 intersect提供了一个定义可能性运算符可以使用的最小和最大时钟周期数的机制。 属性…

计算机丢失MSVCP140.dll的解决方法分享

MSVCP140.dll是一个动态链接库文件&#xff0c;它是Microsoft Visual C 2015 Redistributable的一部分。这个文件包含了许多用于运行C程序的函数和类库。当计算机丢失这个文件时&#xff0c;可能会导致某些软件或游戏无法正常运行。 那么&#xff0c;为什么计算机会丢失MSVCP14…

Flex and Bison 阅读与学习笔记

本文的内容来源于本人阅读 flex & bison的笔记和项目工程学习中遇到的问题。如果你能从中获得一丝丝帮助&#xff0c;本人将不胜荣幸。 文章目录 Ⅰ、目录与批注前四章 引言和使用介绍flex 规范参考bison 参考规范其余内容 Ⅱ、相关练习代码学习历程代码实例 参考文献 Ⅰ、…

【文章摘要-20231019】Any-to-Any Generation via Composable Diffusion

论文链接 代码链接 作者提出了一个可组合的扩散模型&#xff0c;该模型体现为能够处理任何输入模态的组合&#xff0c;进而输出任何模态组合的新型生成模型&#xff0c;如语言、图像、视频或音频。不同于已经存在的生成式人工智能系统&#xff0c;该算法能够并行生成多个模态并…

Java基础 :内部类、枚举、泛型

内部类 概念 是类中的五大成分之一&#xff08;成员变量、方法、构造器、内部类、代码块&#xff09;&#xff0c;如果一个类定义在另一个类的内部&#xff0c;这个类就是内部类。 场景 当一个类的内部&#xff0c;包含了一个完整的事物&#xff0c;且这个事物没有必要单独…

工作之余Happy一下(实现时钟特效)

样式 测试代码&#xff1a; <!DOCTYPE html> <html> <head lang"en"><meta charset"UTF-8"><title>时钟特效</title><style> body{background: #000;}.content{width: 400px;margin: auto;color: #fff;}#title…

openGauss学习笔记-104 openGauss 数据库管理-管理数据库安全-客户端接入之SSL证书管理-证书替换

文章目录 openGauss学习笔记-104 openGauss 数据库管理-管理数据库安全-客户端接入之SSL证书管理-证书替换104.1 操作场景104.2 前提条件104.3 注意事项104.4 操作步骤 openGauss学习笔记-104 openGauss 数据库管理-管理数据库安全-客户端接入之SSL证书管理-证书替换 openGaus…

工业企业网络推广解决方案 | 网络营销专家分享 | 上海添力

在国内&#xff0c;工业企业如果想在线上做推广&#xff0c;其主要途径就是做搜索引擎推广&#xff0c;在几个常用的搜索引擎&#xff08;百度、360、搜狗、必应&#xff09;中&#xff0c;一般都是从百度开始做起。但不少工厂做百度广告&#xff0c;钱花了不少&#xff0c;就是…

做PPT或制作表情包时,不会把视频转成gif动图?5分钟学会

一、背景 当我们在做PPT时&#xff0c;不可避免的需要放一些视频&#xff0c;但视频占用空间太大&#xff0c;而且比较烦的是需要点一下才能播放。因此需要将视频转成gif动态&#xff0c;以自动播放。 GIF的全称是Graphics Interchange Format&#xff0c;可译为图形交换格式…

SQL题目记录

1.商品推荐题目 1.思路&#xff1a; 通过取差集 得出要推荐的商品差集的选取&#xff1a;except直接取差集 或者a left join b on where b null 2.知识点 1.except selectfriendship_info.user1_id as user_id,sku_id fromfriendship_infojoin favor_info on friendship_in…

ATE测试工程师的前景待遇如何?薪资天花板有多高?

在芯片行业&#xff0c;ATE测试工程师扮演着至关重要的角色。 他们不仅需要理解电路和芯片内部的工作原理&#xff0c;还需要利用各种测试工具和方法对芯片进行精确的测试和分析。那么ATE测试工程师前景如何&#xff1f;需要具备哪些技能要求呢&#xff1f; 首先来了解什么是…

【数据库范式】实际案例分析

前言 在日常业务研发过程中&#xff0c;我们常常需要与数据库表打交道。设计范式是数据表设计的基本原则&#xff0c;对于数据表的设计范式&#xff0c;我们特别容易忽略它的存在。很多时候&#xff0c;当数据库运行了一段时间之后&#xff0c;我们才发现数据表设计上有问题。然…

2023年中国润滑油分散剂市场需求量及行业竞争现状分析[图]

润滑油分散剂是一种两亲性化学品&#xff0c;可以增加油性部分以及水性部分在同一体系中的相容性&#xff0c;能降低分散体系中固体或液体粒子聚集的物质。换油时&#xff0c;可将有害的悬浮物从油中清除。 国内从60年代末开始试制丁二酰亚胺型分散剂&#xff0c;并于80年代初在…

93. 递归实现组合型枚举

题目&#xff1a; 93. 递归实现组合型枚举 - AcWing题库 思路&#xff1a; 1.从n个数中选择m个数&#xff0c;问有多少种选法。---->抽象为有m个坑位&#xff08;设置kenway[N]表示&#xff09;&#xff0c;其中填入编号为1~n的萝卜&#xff0c;问有几种填法。这里我们可…