SD下载、安装、使用、卸载-Stable Diffusion整合包v4.10发布!

news2025/1/5 3:55:56

目录

    • 前言
      • 概述
    • SD安装
      • 1、安装软件
      • 2、启动
      • 3、配置
      • 4、运行
      • 5、测试
    • 导入SD模型【决定画风】
      • 常用模型
      • 下载安装模型
    • SD卸载
    • SD文生图
      • 提示词
      • 提示词使用技巧
      • 提示词的高级使用技巧
        • 强调关键词

前言

我向来不喜欢搞一些没有用的概念,所以直接整理可能用到的东西。

sd简单的说就是一个更据描述生成不同风格的图片的东西,与之对应的还有mj,但是我绝对不会使用他,为什么,因为收费,可以不赚钱,但是绝对不能往里搭,无非浪费一些时间而已

软件下载

  • 秋葉aaaki 唯一账号:https://space.bilibili.com/12566101

概述

Stable Diffusion模型并不是单一的文生图模型,而是多个模型组成的运作系统,其中的技术可以拆解为3个结构来看:

  • ClipText 文本编码器 :用于解析提示词的Clip模型
    • 编码器Clip ,它是由OpenAI公司开发的模型,包括文本编码和图像编码2个部分,分别用于提取文本和图像的特征,通过搜集大量网络上的图像和文字信息再对Clip模型进行训练,可以实现文本和图像的对应关系。
    • 在SD模型运作过程中,它可以提取提示词文本部分的特征传递给图像生成器,让模型理解我们输入的提示词内容,从而达到文本控制图像生成的目的。
  • Diffusion扩散模型 : 用于生成图像的U-Net 和Sche duler
    • 就是更据算法什么东西的生成图像
  • VAE模型 : 用于压缩和恢复的图像解码器
    • 相当于滤镜

SD安装

1、安装软件

在这里插入图片描述

2、启动

在这里插入图片描述

3、配置

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

4、运行

在这里插入图片描述

在这里插入图片描述

5、测试

要么直接弹窗,要么就复制控制台中的链接http://127.0.0.1:7860
打开页面后直接点击生成,看看有没有图片生成

在这里插入图片描述

导入SD模型【决定画风】

常用模型

  • Checkpoint(大模型)【常用】
    • 相当于风格滤镜,例如 油画,漫画,写实风等。
    • 需要注意的是,一些Checkpoint需要与特定的低码率编码器(Lora)配置使用,以获得更好的效果
  • VAE模型
    • 对模型的滤镜进行微调,不同的VAE右一些细节上的差异,但是不会影响输出的效果
    • 可以理解成对模型进行增强,有些模型文件已经有了VAE效果,所以不要盲目挂载,选择自动模式就行
  • embedding
    • 相当于组件。举个例子,如果我们想要生成一个开心的皮卡丘,通常需要输入很多描述词,如黄毛、老鼠、长耳朵、红等等。但是,如果引入皮卡丘的embedding,我们只需要输入两个词:皮卡丘和开心。皮卡丘的embedding打包了所有皮卡丘的特征描述,这样我们就不用每次输入很多单词来控制生成的画面了。
    • 在日常使用中,embedding技术通常用于控制人物的动作和特征,或者生成特定的画风。相比于其他模型(如LORA),embedding的大小只有几十KB,而不是几百兆或几GB,除了还原度对比lora差一些但在存储和使用上更加方便
  • LoRA模型【常用】
    • LORA与embedding在本质上类似,因为携带着大量的训练数据,所以LORA对人物和细节特征的复刻更加细腻。
    • 每个LORA模型对输出图像的权重设置是非常重要的。权重设置越大,对画面的影响因素就越浅。通常情况下,权重应该控制在0.7-1之间。如果权重过高,会大幅度影响出图的质量。
    • 为了获得最佳效果,我们可以根据不同的LORA模型选择适当的提示词和排除词,并在设置权重时进行调整。同时,我们还可以参考其他作者的经验和技巧,以便更好地利用LORA生成图像

下载安装模型

  • https://civitai.com/各类模型下载也俗称c站(不稳定,用魔法)
  • https://lexica.art/找一些风格提示词不错
  • https://www.liblib.art/

在这里插入图片描述

在这里插入图片描述

SD卸载

直接把整个文件夹删除,删除前记得把模型复制出来,以后还能用

SD文生图

Stable Diffusion基础的操作流程并不复杂

  1. 选择模型【决定画风】
  2. 选择功能(文生图)
  3. 填写提示词【主要决定画面内容】
  4. 设置参数 【设置图像的预设属性】
  5. 点击生成。
    通过操作流程就能看出,我们最终的出图效果是由 模型、提示词、参数设置 三者共同决定的,缺一不可。
    在这里插入图片描述

提示词

大家都知道,如今的AI工具大多是通过提示词来控制模型算法,那究竟什么是提示词?

对于人类而言,在经过多年的学习和使用后,我们只需简单的几句话便能轻松的沟通和交流。但如今的人工智能还是基于大模型的数据库进行学习,如果只是通过简单的自然语言描述,没有办法做到准确理解。为了更好的控制AI,人们逐渐摸索出通过反馈来约束模型的方法,原理就是当模型在执行任务的时候,人类提供正面或负面的反馈来指导模型的行为。而这种用于指导模型的信息,就被统称为 Prompt提示词。

Stable Diffusion的咒语上除了prompt(正向关键词)外,还有Negative prompt反向关键词。

  • 正向提示词用于描述想要生成的图像内容,
  • 反向关键词用于控制不想出现在图像中的内容

比如目前很多模型还无法理解的手部构造,为了避免出现变形,我们可以提前在反向关键词中输入手部相关的提示词,让绘图结果规避出现手的情况。

注意:不是zg人开发的,所以这里的提示词去翻译成英文,只需以词组形式分段输入即可,词组间使用英文逗号进行分隔。大部分情况下字母大小写和断行也不会影响画面内容,我们可以直接将不同部分的提示词进行断行,由此来提升咒语的可读性。

提示词使用技巧

当然如果每次都是想到什么输什么,画面中可能还是会缺失很多信息,这里给大家分享一下我自己平时使用的提示词公式,按顺序分别为: 主体内容、环境背景、构图镜头、图像设定、参考风格。 后续在编写咒语时可以按照一下类目对号入座,会更加规范和易读。
需要注意的是,公式只是参考,并非每次编写咒语我们都要包含所有内容,正常的流程应该是先填写主体内容看看出图效果,再根据自己的需求来做优化调整。
在这里插入图片描述

提示词的高级使用技巧

强调关键词

先来看看 强调关键词 ,这应该是使用最为频繁的语法了。强调关键词是依赖括号和数值来控制特定关键词的权重,当权重数值越高,说明模型对该关键词更加重视,在运行过程中模型就会着重绘制该部分的元素,在最终成像时图片中就会体现更多对应信息。反之数值越低,则最终图片中对应内容会展示的更少。

控制关键词的括号共有三种类型: 圆括号()、花括号{}和方括号[] ,分别表示将括号内关键词的权重调整到原有的1.1倍、1.05倍和0.9倍。其中花括号{}平时很少会使用, 一般都是用圆括号()和方括号[] 。

需要注意的是,这里括号是支持多层叠加的,每层括号都表示乘以固定倍数的权重

在这里插入图片描述
除了直接加括号外,还有一种更常用的控制权重方法,那就是直接填写数值。
在这里插入图片描述

虽然强调关键词语法支持的权重范围在0.1~100之间,但是过高和过低的权重都会影响出图效果,因此建议大家控制在 0.5~1.5 范围即可。

这里还有个快捷操作的小技巧,就是选中对应关键词后,按住 ctrl+⬆️ / ⬇️ ,可以快速增加和减少权重数值,默认每次修改0.1,可以在设置中修改默认数值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2270316.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【LeetCode】2506、统计相似字符串对的数目

【LeetCode】2506、统计相似字符串对的数目 文章目录 一、哈希表位运算1.1 哈希表位运算 二、多语言解法 一、哈希表位运算 1.1 哈希表位运算 每个字符串, 可用一个 int 表示. (每个字符 是 int 的一个位) 哈希表记录各 字符组合 出现的次数 步骤: 遇到一个字符串, 得到 ma…

【GO基础学习】gin的使用

文章目录 模版使用流程参数传递路由分组数据解析和绑定gin中间件 模版使用流程 package mainimport ("net/http""github.com/gin-gonic/gin" )func main() {// 1.创建路由r : gin.Default()// 2.绑定路由规则,执行的函数// gin.Context&#x…

溯源取证-手机取证-简单篇

好久没有写了,水一篇简单的 案例摘要: 我们目前正在调查一起谋杀案,目前已经获得了受害者的手机作为关键证据。在与证人和受害者核心圈子相关人员进行面谈后,您的目标是分析我们收集的信息,并努力追踪证据&#xff0…

【文献精读笔记】Explainability for Large Language Models: A Survey (大语言模型的可解释性综述)(四)

****非斜体正文为原文献内容(也包含笔者的补充),灰色块中是对文章细节的进一步详细解释! 四、提示范式(Explanation for Prompting Paradigm) 随着语言模型规模的扩大,基于提示(prom…

基于TCP的Qt网络通信

基于TCP的Qt网络通信 项目源码:https://github.com/say-Hai/TcpSocketLearn/tree/QTcpSocket 在标准C没有提供专门用于套接字通信的类,所以只能使用操作系统提供的基于C的API函数,但是Qt就不一样了,它是C的一个框架并且里边提供了…

java vscode springboot 问题汇总

问题1 VSCODE配置SpringBoot,创建新项目运行时报错程序包不存在 找不到符号解决方法 选择Run Java即可 , 不是Run Code DemoApplication.java:3: 错误: 程序包org.springframework.boot不存在 import org.springframework.boot.SpringApplication; …

BLIP论文笔记

论文地址 BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation 论文思想 其实Clip就相当于只用了ITC

linux上使用cmake编译的方法

一、hello 例程仅基于一个cpp文件 C文件或工程进行编译时可以使用g指令(需要对每一个程序和源文件分别使用g指令编译),当程序变大时,一个工程文件往往会包含很文件夹和源文件,这时我们需要的编译指令将越来越长&#…

Speech Recognition vs. Voice Recognition | 语音识别工作原理 | 模型训练 | 应用

注:Speech Recognition 与 Voice Recognition 机翻混淆,未校。 Speech Recognition vs. Voice Recognition: In Depth Comparison 语音识别与语音识别:深度比较 Calendar12 July 2023 Have you ever stopped to think about how your voice…

Tushare提示本接口即将停止更新,请尽快使用Pro版接口:https://tushare.pro/document/2

1、解决办法 tushare pro版本需要注册登录后获取tocken然后在代码中配置接口即可。 2、如何获取tushare? tushare是免费、开源的python财经数据接口,现在使用需要先注册tushare账号 1、跳转到tushare注册页面 Tusharez注册 Tushare数据 2、注册成功…

高频 SQL 50 题(基础版)_1068. 产品销售分析 I

销售表 Sales: (sale_id, year) 是销售表 Sales 的主键(具有唯一值的列的组合)。 product_id 是关联到产品表 Product 的外键(reference 列)。 该表的每一行显示 product_id 在某一年的销售情况。 注意: price 表示每…

【Ubuntu】Ubuntu server 18.04 搭建Slurm并行计算环境(包含NFS)

Ubuntu server 18.04 搭建Slurm并行计算环境(包含NFS) 一、Munge 认证模块 1.1、安装 munge 主节点和子节点都安装munge #安装 sudo apt update && sudo apt install munge libmunge-dev#设置开机启动 sudo systemctl enable munge sudo syste…

电脑主机后置音频插孔无声?还得Realtek高清晰音频管理器调教

0 缘起 一台联想电脑,使用Windows 10 专业版32位,电脑主机后置音频插孔一直没有声音,所以音箱是接在机箱前面版的前置音频插孔上的。 一天不小心捱到了音箱的音频线,音频线头断在音频插孔里面了,前置音频插孔因此用不…

Flink源码解析之:如何根据算法生成StreamGraph过程

Flink源码解析之:如何根据算法生成StreamGraph过程 在我们日常编写Flink应用的时候,会首先创建一个StreamExecutionEnvironment.getExecutionEnvironment()对象,在添加一些自定义处理算子后,会调用env.execute来执行定义好的Flin…

矩阵运算提速——玩转opencv::Mat

介绍:用Eigen或opencv::Mat进行矩阵的运算&#xff0c;比用cpp的vector或vector进行矩阵运算要快吗? 使用 Eigen 或 OpenCV 的 cv::Mat 进行矩阵运算通常比使用 std::vector<int> 或 std::vector<double> 更快。这主要有以下几个原因&#xff1a; 优化的底层实现…

Spire.PDF for .NET【页面设置】演示:向 PDF 添加平铺背景图像

平铺背景通常是指用一个或多个小图像重复填充的背景。在本文中&#xff0c;您将学习如何在 PDF 中平铺图像&#xff0c;并使用 C# 和 VB.NET 为您的 PDF 创建平铺背景。 Spire.PDF for .NET 是一款独立 PDF 控件&#xff0c;用于 .NET 程序中创建、编辑和操作 PDF 文档。使用 …

文件本地和OSS上传

这里写目录标题 前端传出文件后端本地存储阿里云OSS存储上传Demo实现上传ConfigurationProperties 前端传出文件 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>上传文件</title> </head&g…

SpringCloud源码分析-Gateway

Gateway核心原理&#xff0c;请求经过一系列的责任链最后到达服务端。

两个等号和三个等号(待查资料)

1太癫了&#xff0c;居然时要才行&#xff0c;都不行 2. 三等号的结果 .。。。。毁灭吧

什么是神经网络?神经网络的基本组成部分训练神经网络激活函数有哪些局限性和挑战

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c; 忍不住分享一下给大家。点击跳转到网站 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……&#xff09; 2、学会Oracle数据库入门到入土用法(创作中……&#xff09; 3、手把…