stable diffused快速入门

news2024/11/23 12:00:55

一、下载安装

1,网盘n519
在这里插入图片描述
2,环境依赖模型整合包必须下载,各种风格的模型可选
3,解压模型整合包
在这里插入图片描述
4,双击启动器运行依赖这个可执行文件,安装一些环境,直接下一步即可

二、启动

1,进入sd-webui-aki-v4.2文件夹下,找到A启动器入口,双击即可
在这里插入图片描述
2,一键启动
在这里插入图片描述
稍等片刻
在这里插入图片描述
运行效果如下:
在这里插入图片描述

三、小测试

1,以文生图为例,输入一段描述,模型会根据描述信息生成一张图片

一个漂亮的小女孩在沙滩上漫步,看向镜头,特写,上半身
一个充满肌肉的小狗:A beautiful little girl is strolling on the beach, looking towards the camera, close-up, upper body,
希望出现的往正向提示词里面丢,不希望出现的往反向提示词里面丢
正向提示词:

(masterpiece:1,2),best quality,masterpiece,highres,original,extremely detailed wallpaper,perfect lighting,(extremely detremely detailed CG:1.2),drawing,paintbrush,

反向提示词:

NSFW,(worst quality:2),(low quality:2),(normal quality:2),lowres,normal quality,((monochrome)),((grayscale)),skin spots,acnes,skin blemishes,age spot,(ugly:1.331),(duplicate:1.331),(morbid:1.21),(mutilated:1.21),(tranny:1.331),mutated hands,(poorly drawn hands:1.5),blurry,(bad anatomy:1.21),(bad proportions:1.331),extra limbs,(disfigured:1.331),(missing arms:1.331),(extra legs:1.331),(fused fingers:1.61051),(too many dingers:1.61051),(unclear eyes:1.331),lowers,bad hands,missing fingers,extra digit,bad hands,missing fingers,(((extra arms and legs))),

这里的正向和反向prompts才是最为关键的因素所在,后续会进行讲解
点击生成即可,像这样
在这里插入图片描述
这不,老婆不就有了?

2,保持图片

方法一:选中照片右击,复制照片或者另存为即可

方法二:找到相关路径

以我的为例,主要在outputs下面,因为是文生图,故保存在了txt2img-images这个文件夹下
E:\stable_diffusion_web_ui\sd-webui-aki-v4.2\outputs\txt2img-images
在这里插入图片描述

四、模型功能

1,文生图(text2img)相关提示词(Prompts)用法

Ⅰ,prompts大致分类(都是英语描述哈,用英文逗号隔开)

①内容提示词

人物及主体特征场景特征环境光照画幅视角
服饰穿搭:白色T恤室内或者室外:室内白天夜晚:夜晚距离
发型发色:白色的长头发大场景:海滩边特定时段:日落人物比例
五官特点:大大的眼睛小细节:金黄色的向日葵光环境:满天星辰观察角度
面部表情:面带微笑天空颜色:火烧云镜头类型:超广角
肢体动作:叉着腰

②画质、画风提示词

高画质、高分辨率画风
best quality, ultra-detailed, masterpiece,hires,8kk插画:illustration,painting,paintbrush
extremely detailed CG unity 8k wallpaper(超精细的8K Unity游戏CG)二次元:animecomic,game CG
unreal engine rendered (虚幻引擎渲染)写实系:photorealistic, realistic, photograph

Ⅱ,prompts权重分配

①括号加数字

提示词含义举例表达
( : )改变权重倍数(yelloe dog:1.5),黄色的小狗的权重变为原来的1.5倍,也就是出现的概率更多了

②套括号

提示词含义举例表达
小括号()每一层权重变为原来的1.1倍((((big dog)))),大狗的权重变为原来的1.1*1.1*1.1*1.1
中括号[]每一层权重变为原来的0.9倍[[big dog]],大狗的权重变为原来的0.9*0.9
大括号{}每一层权重变为原来的1.05倍{{{big dog}}},大狗的权重变为原来的1.05*1.05*1.05

③混合、迁移、迭代

提示词含义举例表达
混合|对同一对象进行不同描述white | yellow flower,生成白色和黄色的混合花
迁移[]连续生成具有不同描述的对象[red|blue|green] flower,先生成红色的花,再生成蓝色的花,最后生成绿色的花
迭代 ( : )一定阶段之后生成特定对象(red flower:bush:0.8)先生成红色的花,进程达到80%时,再生成灌木丛

2,图生图

图生图和文生图都类似,越往后学越简单。
主要就在于prompts提示词的书写,其他的都简单。

Ⅰ,上传图像

上传图片大小和参数的设置最好匹配,这里是800:800,一比一,也可以使用其他的比例,根据自己的电脑配置来
在这里插入图片描述
在这里插入图片描述

Ⅱ,书写prompts

书写prompts提示词,这里随便书写,正向、反向提示词使用文生图中的模板

Ⅲ,图像生成

例如我的,这里的随机种子就可以理解成模型随机的风格,如果你就喜欢这样的风格,每次绘画的时候就可以输入这个随机种子即可
在这里插入图片描述

五、模型切换

模型路径
以我的为例:E:\stable_diffusion_web_ui\sd-webui-aki-v4.2\models\Stable-diffusion
这里就是存放模型的位置,发现好玩的模型下载复制到这里即可,models\Stable-diffusion,这些模型被称为Checkpoint
通常大模型的后缀为.ckpt,小模型的后缀为.safetensors

一些较好的模型下载:0522
二次元的深渊橘AbyssOrange
我比较喜欢这个国风
在这里插入图片描述
像这样
在这里插入图片描述
左上角选择模型进行切换
在这里插入图片描述
调整VAE模型,可以理解成滤镜模型,后缀通常为.pt或者.safetensor,其文件夹存放路径为:E:\stable_diffusion_web_ui\sd-webui-aki-v4.2\models\VAE
在这里插入图片描述
在这里插入图片描述

六、模型下载渠道

1,Hugging face

官网链接
搜索:stable diffusion

在这里插入图片描述
就可以直接下载模型
在这里插入图片描述
当然,点击 Models,选择Multimodal,例如Text-to-Image,就可以选择下载文生图模型了

在这里插入图片描述
这里以DreamShaper为例,点进去
在这里插入图片描述
需要啥下载啥就行,下载好放到对应的文件夹下即可
在这里插入图片描述

2,Civitai

网站链接,咳咳这个需要科学上网,你懂得

七、模型风格

1,二次元模型

关键词:illustration,painting,sketch,drawing,comic,anime,cartoon
模型推荐:万象熔炉Anything V5、Counterfeit V2.5、Dreamlike Diffusion

2,真实系模型

关键词:photography,photo,realistic,photorealistic.RAW photo
模型推荐:Deliberate、Realistic Vision、L.O.F.I

3,2.5D模型

关键词:3D,render,chibi,digital art,concept,{realistic}
模型推荐:never ending dream(NED)、Protogen(Realistic)、国风3(GuoFeng3)

八、Hi-Res Fix图片高清修复

1,文生图高清修复

重绘幅度一般控制在0.5-0.7之间,其本质是将原始生成的低分辨率的图像重新进行绘制,变成高分辨率的图像
在这里插入图片描述
其中放大算法,无脑选择R-ESRGAN 4x+,若是二次元就选择R-ESRGAN 4x+ Anime6B,当然各种算法还是都有所差异的,需要尝试选择最符合自己喜欢的即可
在这里插入图片描述

最常用的操作:先通过文本描述prompts生成一张自己比较喜欢的图像,然后再勾选高清修复,采用相同的随机种子进行高分辨率重构即可

2,图生图放大

其本质就是裁剪多块,然后分别对这些小块进行放大,最后进行拼接即可实现放大
设置放大算法,记得点保存设置
在这里插入图片描述
脚本选择SD upscale,分块重叠像素宽度越大效果越好,当然需要在原始照片基础上进行加上该值
放大算法还是像上述一样无脑选择R-ESRGAN 4x+ 该算法最复杂,若是二次元就选择R-ESRGAN 4x+ Anime6B,当然各种算法还是都有所差异的,需要尝试选择最符合自己喜欢的即可
在这里插入图片描述

3,后期处理附加功能

速度快,但是效果相比于前两种方法而言比较差
这里可以选择两种不同的算法进行放大
在这里插入图片描述

九、经典模型介绍

1,Embeddings文本嵌入模型,又称Textual Inversion

Embeddings文件很小,一般几十KB大小
Checkpoint相当于大字典,Embeddings就相当于小书签
Embeddings不包含信息,只是一个标记而已,例如:绘制一个人鱼,人知道,鱼也知道,然后拼接人鱼就知道大概是啥了
Embeddings文件后缀一般为.pt

2,LoRa(Low-Rank Adaptation Models)低秩适应模型

3,Hypernetwork超网络模型

十、局部重绘

学习来源:
B站@秋葉aaaki@Nenly同学
本人只是在此基础上进行整合汇总而已

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1006101.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PMP与ACP的区别是什么?

首先,我们需要了解PMP和ACP的定义。如果你正在犹豫是否应该考取PMP或ACP证书,或者想知道这两种证书的区别和哪一个更有用,那么请继续阅读。 1. PMP是指项目管理专业人士认证,全称为Project Management Professional。在许多企业&a…

【算法与数据结构】701、LeetCode二叉搜索树中的插入操作

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:这道题关键在于分析插入值的位置,不论插入的值是什么(插入值和原有树中的键值都…

python实现数据的脱敏

背景 上一篇文章讲到了《一个注解,实现数据脱敏》,其实用起来还是相当的方便。那shigen是一个喜欢倒腾的人,对于python的接口,如何实现数据的脱敏呢?我找了很久的教程,发现关于这部分的资料并不多&#xf…

tomcat部署、tomcat虚拟主机及tomcat多实例、tomcaty优化

目录 一、Tomcat概述 tomcat是什么? 什么是 servlet? 什么是 JSP? Tomcat 功能组件结构 Container 结构分析 Tomcat 请求过程 二、Tomcat部署 1、关闭防火墙和selinux,并将Tomcat所需软件包传到/opt目录下 2、安装JDK 3、设置JDK…

LeetCode 2596. 检查骑士巡视方案【数组,模拟】1448

本文属于「征服LeetCode」系列文章之一,这一系列正式开始于2021/08/12。由于LeetCode上部分题目有锁,本系列将至少持续到刷完所有无锁题之日为止;由于LeetCode还在不断地创建新题,本系列的终止日期可能是永远。在这一系列刷题文章…

【markdown】How to use markdown

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

flink-1.14.4启动报错setPreferCheckpointForRecovery(Z)v

从flink1.12升级到flink1.14,修改了pom.xml的flink-version,打包的时候发现报错: // 当有较新的 Savepoint 时,作业也会从 Checkpoint 处恢复env.getCheckpointConfig().setPreferCheckpointForRecovery(true); 于是屏蔽了这段配置…

什么样的护眼灯好?盘点五款好用的护眼台灯

随着技术的发展,灯光早已成为每家每户都需要的东西。但是灯光不好可能会对眼睛造成伤害是很多人没有注意到的。现在随着护眼灯产品越来越多,市场上台灯的选择越来越多样化,如何选择一个对眼睛无伤害、无辐射的台灯成为许多家长首先要考虑的问…

21.(地图工具篇)geoserver发布wms服务文字被裁剪

1:问题描述 Partials:当标签在瓦片边缘显示不全时,是否绘制。 当设置partials时为true时(默认为false),出现以下问题(文字被裁剪): 2:解决方案 设置缓冲后&#xff…

如何利用Api接口获取手机当前的网络位置信息

在移动互联网时代,手机定位已经成为了一个日常化的需求,无论是导航、社交还是打车等服务都需要获取手机的位置信息。而获取手机位置信息最基础的一步就是获取手机当前的网络位置信息,本文将介绍如何利用API接口获取手机当前的网络位置信息。 …

《使用 Helm 管理 Kubernetes 应用程序的最佳实践》

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🐅🐾猫头虎建议程序员必备技术栈一览表📖: 🛠️ 全栈技术 Full Stack: &#x1f4da…

职业规划就问它!海量知识与智慧,AIGC助你冲破择业迷茫

数字化时代的兴起改变了我们的日常生活和职业工作方式。科技迅猛的发展,尤其是人工智能的崛起,将我们引入了一个崭新的智能化时代。在这个时代中,AI被认为是从"数字时代"向"数智时代"转变的关键元素,引领着这…

学校安全升级,门禁管理就选它了!

门禁监控系统是一项在当今教育界日益受到重视的技术应用,它不仅仅是一种安全措施,更是一种校园管理和学生安全保障的创新方法。 在这一背景下,门禁监控系统成为了一种重要的解决方案,能够确保学生和教职员工的安全,提高…

融云聊天室再放大招,服务更完整、集成更便捷

9 月 21 日,融云直播课 社交泛娱乐出海最短变现路径如何快速实现一款 1V1 视频应用? 欢迎点击上方小程序报名~ 聊天室是直播、语聊房等社交泛娱乐产品的必备组件,它以“公屏”形态面向用户。关注【融云全球互联网通信云】了解更多 作为一个…

C#+sqlserver网上作业批改与管理系统asp.net

功能需求 3.3.1 学生部分 1:查看发布作业:以列表的形式查看教师发布的作业。 2:上交作业:学生上交教师发布的作业。 需输入作业名称及添加WORD文档地址进行作业上传。 3:查看已上交作业:以列表的形式查看…

正中优配:股票重组前最明显的特征?

股票重组是指一家公司在经过一定的调整后,对其股票进行重新组合和发行的进程。股票重组是一种非常常见的商业行为,它能够协助公司提高效率、操控成本,提高股价等目的。在股票重组前,有许多显着的特征能够协助我们了解公司的情况以…

一款释放数据价值的项目,开源了!

在大数据和 AI 的时代背景下,数据已经成为了重要财富,大到政务数据、企业核心数据,小到个人信息、银行卡余额,这些数据无一例外都是“隐私数据”,如果在使用和流转时发生泄漏都会造成巨大的损失。 那有没有什么方法&a…

骨传导耳机对人体有危险吗?会损害听力吗?

如果在使用骨传导耳机的时候控制好时间和音量,是不会对人体带来危险和造成伤害的。 下面跟大家解释一下为什么骨传导耳机对人体没有危害,最大的原因就是骨传导耳机不需要空气传导,而是通过颅骨传到听觉中枢,传输过程中几乎没有噪…

U8G2 各显示屏初始化过程

主函数:u8g2lib.h --------各显示屏初始化函数 u8g2_d_setup.c-------- 主要函数 u8g2_SetupDisplay (u8g2, u8x8_d_ist3088_320x240, u8x8_cad_011, byte_cb, gpio_and_delay_cb); u8x8_d_ist3088_320x240, u8x8_cad_011 对应相应的初始化函数

Linux更新g++

不同版本的g会支持不同的c标准,若是g标准过低会导致一些c新的标准无法使用。 比如c11出的regex就需要g 4.9以上的标准才能使用。 一般更新g需要使用一些额外的软件源,便于我们更新g,这里采用Developer ToolSet来更新g。 更新步骤 首先使用ro…