最新版本 Stable Diffusion 开源 AI 绘画工具之微调模型篇

news2025/1/11 7:02:48

✨ 目录

    • 🎈 模型种类
    • 🎈 变分自动编码器 / VAE
    • 🎈 美学梯度 / Aesthetic Gradients
    • 🎈 大型语言模型的低阶自适应 / LoRA
    • 🎈 超网络模型 / Hypernetwork
    • 🎈 微调模型 / LyCORIS

🎈 模型种类

  • 当你打开模型网站C站后,你可以看到右上角筛选里面有很多不同种类的模型
  • 包括:CheckpointTextual InversionHypernetworkVAELoraLyCORISAesthetic Gradients等等
  • 其中 Checkpoint 是主模型,所以体积会很大,因为要基于大模型参数的训练,所以最开始诞生的就是主模型,你可以把它当作其他模型的主体
  • 因为体积太大,导致在处理各种细节的时候准确度其实是不够的,比如我要调图片的饱和度,给图片添加不同的滤镜,所以对于细节的处理,出现了各种衍生出来的小模型
  • 比如上一篇我们讲解的 Embedding 模型,它就是负责文本理解的模块,上手非常容易,但是效果却非常的不错,逐渐被用户接受,因此相继出现了其他的模型

模型种类

🎈 变分自动编码器 / VAE

  • 这个其实就是在主模型基础上做图片微调的,比如大家经常使用的滤镜,以及处理图片的饱和度
  • 所以这类模型比较少,主要是一些主流的修图软件已经可以实现这些功能,用起来门槛更低
  • 首先,默认操作界面上是没有 VAE 选项的,需要手动开启
  • 点击设置 Setting ► 点击用户界面 User Interface ► 找到快捷设置列表 Quicksettings list ► 输入框添加 ,sd_vae,CLIP_stop_at_last_layers ► 点击应用设置 Apply settings ► 点击重启UI界面 Reload UI,即可看到 VAE 选项卡

开启VAE选项卡
选项卡界面

  • 下载 vae 模型后,将其放置在 models/VAE 目录下,当然,你可以从C站上面下载,也可以从 huggingface 上面下载
  • 一些常见的 VAE 下载地址:
  • https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.ckpt
  • https://huggingface.co/AIARTCHAN/aichan_blend/resolve/main/vae/Anything-V3.0.vae.safetensors
  • https://huggingface.co/AIARTCHAN/aichan_blend/resolve/main/vae/Berry's%20Mix.vae.safetensors
  • 下载好,然后点击 VAE 设置项右边的刷新按钮就可以看到这些模型
    VAE模型
  • 可以使用 X/Y/Z plot 脚本对比一下加和不加 VAE 的一个对比情况

脚本设置
效果对比

🎈 美学梯度 / Aesthetic Gradients

  • 这个模型主要是通过一张或者几张参考图生成一个美学模型,最终对提示词进行调整和加权
  • 项目地址是:https://github.com/vicgalle/stable-diffusion-aesthetic-gradients,其中 aesthetic_embeddings 目录下有一些准备好的 Embedding
  • 如果你想使用它,需要安装扩展:https://github.com/AUTOMATIC1111/stable-diffusion-webui-aesthetic-gradients
  • 安装好这个扩展后,就可以在 Aesthetic imgs embedding 里面选择对应的 Embedding
  • 但是现在这个美学梯度已经属于落后的模型方式了,效果相对其他方案而言,已经没有了任何优势,现在算是大势已去

🎈 大型语言模型的低阶自适应 / LoRA

  • 这个模型主要是通过矩阵分解的方式,微调少量参数,并加总在整体参数上,所以它现在主要用来控制很多特定场景的内容生成
  • LoRA 模型下载后需要放置在 models\lora 目录下
  • 对比下不用 LoRA 和用 LoRA 的区别

是否添加lora区别

🎈 超网络模型 / Hypernetwork

  • 主要是让梯度作用于模型的扩散 Diffusion 过程。扩散过程中的每一步都通过一个额外的小网络来调整去噪过程的结果
  • 功能和embeddinglora类似,都是对生成的图片进行针对性地调整
  • hypernetwork 的应用领域较窄,主要是训练画风,训练难度很大
  • 未来很有可能被后出现的 lora 所替代,新手可以将 hypernetwork 理解为低配版的 lora
  • hypernetwork 最重要也是实现最好的功能是对画面风格的转换,也就是切换不同的画风
  • 模型下载后需要放在 models\hypernetworks 目录下,主要使用方式是在 prompt 中使用嵌入语法 <hypernet:felt:1>
  • 我这里使用的是毛毡风格画:https://civitai.com/models/68942/felt

毛毡艺术

🎈 微调模型 / LyCORIS

  • 这是最近开始流行的一种新的模型,如其名字是一种超越传统方法的 Lora,但是要比 LoRA 能够微调的层级多,它的前身是 LoCon (LoRA for convolution layer)
  • LyCORIS 模型可以放在 lora 的目录下,当做普通的 lora 使用,但无法使用丰富的细节参数
  • 如果需要使用更多的参数,需要安装扩展:https://github.com/KohakuBlueleaf/a1111-sd-webui-lycoris
  • 安装过 LyCORIS 插件后,将 LyCORIS 模型下载后,拷贝至 models\LyCORIS
  • 比如我们使用C站很火的胶片风模型:https://civitai.com/models/33208/filmgirl-film-grain-lora-and-loha
  • 使用语法:<lyco:LoRA名称:1:0.5:13>,可以通过 script 中的 prompt matrix 功能可以查看加和不加 lyco 的区别
# prompt 
young 1girl with braided hair and fluffy cat ears, dressed in Off-Shoulder Sundress, standing in a rustic farm setting. She has a soft, gentle smile, expressive eyes and sexy cleavage. The background features a charming barn, fields of golden wheat, and a clear blue sky. The composition should be bathed in the warm, golden hour light, with a gentle depth of field and soft bokeh to accentuate the pastoral serenity. Capture the image as if it were taken on an old-school 35mm film for added charm, looking at viewer, ||<lora:Velvia1:0.6>

# negative prompt
cartoon, anime, sketches,(worst quality, low quality), (deformed, distorted, disfigured), (bad eyes, wrong lips, weird mouth, bad teeth, mutated hands and fingers:1.2), bad anatomy, wrong anatomy, amputation, extra limb, missing limb, floating limbs, disconnected limbs, mutation, ugly, disgusting, (bad_pictures, negative_hand-neg:1.2)

效果对比

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/602332.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

jacoco检测功能或自动化测试覆盖率

参考文档&#xff1a;http://t.csdn.cn/QqCSh http://t.csdn.cn/HonVL 目录 下载jacoco 启动jacocoagent监控被测项目 执行手工测试 生成exec文件 生成report报告 jacoco代码覆盖率报告分析 下载jacoco http://t.csdn.cn/HonVL 我下载的最新的 jacoco-0.8.10.zip 下…

虚拟化技术 — Cgroups 与 Namespaces 支撑实现的操作系统虚拟化

目录 文章目录 目录操作系统虚拟化&#xff08;容器技术&#xff09;的发展历程ChrootCgroupsCgroup SubsystemsCgroup FilesystemCgroup HierarchyCgroups 的操作规则Cgroups 的代码实现 NamespacesUTS namespacePID namespaceIPC namespaceMount namespaceNetwork namespaceU…

mysql order by 索引问题综合分析

一&#xff0c;文章1 Mysql-索引失效 order by优化_orderby索引失效_zyk1.的博客-CSDN博客 总结&#xff1a; 0&#xff0c;索引 与 查询条件 与 排序字段关系&#xff0c;Using filesort出现场景 1.联合索引&#xff0c;最左匹配原则&#xff0c;不仅查询条件需要遵循&…

vivado FIFO的Standard 和 FWFT模式

vivado FIFO的Standard 和 FWFT模式 Standard 模式读操作 对于标准 FIFO 读取操作&#xff0c;在断言读有效后&#xff0c;如果 FIFO 非空&#xff0c;存储在FIFO中的下一个数据被驱动到输出总线&#xff08;dout&#xff09;上和VALID标志有效。 下图显示标准模式下的读数据…

ChatGPT介绍与使用场景

ChatGPT是OpenAI开发的一款基于GPT-3和GPT-4的人工智能聊天机器人。“GPT"代表的是"Generative Pre-trained Transformer”&#xff0c;这是一种深度学习技术&#xff0c;使用人工神经网络来生成类似人类的文本。 ChatGPT能够处理各种对话任务&#xff0c;包括回答问…

教您如何快速自助搭建一个元宇宙场景

【导语】 在数字化时代&#xff0c;营销方式正经历着巨大的变革。而在这场变革的浪潮中&#xff0c;元宇宙编辑器凭借其独特的元宇宙展厅解决方案&#xff0c;为企业和个人提供了快速、简便的自助搭建元宇宙场景的机会。 今天&#xff0c;让我们一起走进元宇宙编辑器的世界&…

如何将Windows 7系统镜像部署到不同的硬件计算机?

案例&#xff1a;将Windows 7系统镜像恢复到另一台电脑 “我有一台运行 Windows 7 的电脑&#xff0c;我已经创建了一个系统镜像并希望将其加载到另一台电脑上。但是&#xff0c;当我运行恢复控制台时&#xff0c;我不断收到错误消息。这让我想知道是否可以创建 Windows 7 系…

前端面试技巧?第一手面试真题!

面试有哪些套路和技巧&#xff1f; 第一次去面试&#xff0c;该注意什么&#xff1f; 怎么说话能打动面试官&#xff0c;成功入职&#xff1f; 当你褪去青涩&#xff0c;将头发梳成大人模样走向面试之路时&#xff0c;你们的搜索记录和行为早已暴露了自己内心状态&#xff1a…

数据结构和算法的基本概念

数据结构概念 1.数据&#xff1a;所有能输入计算机且能被计算机处理的符号总称 2.数据元素&#xff1a;是数据的基本单位&#xff0c;表示数据集合中的一个个体。 3 .数据项&#xff1a;数据元素中有独立含义的最小单位。 数据结构&#xff1a;相互之间存在一定关系的数据元素的…

Layui时间选择设置只能选择整点半点,并隐藏秒钟部分

文章目录 1.整点半点选择2.隐藏秒选择部分3.默认值处理3.1 操作done函数3.2 操作ready函数 1.整点半点选择 处理思路&#xff1a;通过循环将使用不到的时间点去除掉&#xff0c;关键代码位于ready函数 //选择起止时间 layui.laydate.render({elem: .laydate-times,type: &quo…

第五章 Electron|Node 使用cheerio 爬虫

一、cheerio是什么可以做什么 &#x1f447; &#x1f447; &#x1f447; Cheerio是一个快速、灵活且精益的jQuery核心实现&#xff0c;用于在Node.js环境中解析HTML文档。它可以帮助您在服务器端轻松地从HTML文档中提取数据&#xff0c;比如从网页中提取文章标题、内容、图片…

【JVM】.class文件如何在JVM中运行的?

一、先认识JVM的组成 java虚拟机整体包括&#xff1a;类加载系统、运行时数据区、执行引擎、垃圾回收器。 &#xff08;1&#xff09;方法区&#xff1a;线程共享&#xff0c;存储Class信息、常量、静态变量等等&#xff1b; jdk1.6~1.7时称为永久代&#xff0c;存储常量、Cla…

js常见面试题整理

1&#xff1a;JavaScript 有哪些数据类型 答&#xff1a; JavaScript 的数据类型分为原始类型和对象类型。 原始类型有 7 种&#xff0c;分别是&#xff1a; BooleanNumberBigIntStringNullUndefinedSymbol 对象类型&#xff08;也称引用类型&#xff09;是一个泛称&#x…

vue3 中使用indexDb

1.indexDb.js const indexDB window.indexedDB || window.webkitIndexedDB || window.mozIndexedDB; class IndexDBCache {// 构造函数constructor() {this._db null; //数据库this._transaction null; //事务this._request null;this._dbName "loginInfoDb"; …

API ‘variantOutput.getPackageLibrary()‘已过时的解决方法

一个发布到maven central的android库项目&#xff0c;为了方便管理&#xff0c;在build.gradle文件中加入了打包处理的一段脚本&#xff1a; //生成aarlibraryVariants.all { variant ->def name "library-${versionMajor}.${versionMinor}.${versionPatch}.aar"…

VUE 3.0 + NGINX + Hls.js + OBS -- 直播推拉流、流视频播放

&#x1f6f4;&#x1f6f4;前言&#xff1a; 该 Demo 基于 OBS推流 Nginx Vue 3.0 Nplayer.js hls.js &#xff0c;目的只是实现流媒体播放&#xff0c;以及简易推拉流直播。 文章目录 前端组件 NPlayer.js安装 nplayer.js 流视频播放页面元素初始化播放器清晰度控件样式…

D*算法详解 (D星算法 / Dynamic A*算法/ Dstar算法)(死循环解决)

所需先验知识&#xff08;没有也无大碍&#xff0c;只是了解的话会对D*的理解有帮助&#xff09;&#xff1a;A*算法/ Dijkstra算法 何为D*算法 Dijkstra算法是无启发的寻找图中两节点的最短连接路径的算法&#xff0c;A*算法则是在Dijkstra算法的基础上加入了启发函数h(x)&am…

js正则中的match()

在前端开发中&#xff0c;正则表达式是一大利器。所以我们这次就来讨论下match()方法。 match本身是JavaScript语言中字符串对象的一个方法&#xff0c;该方法的签名是 match([string] | [RegExp]) 它的参数既可以是一个字符串&#xff0c;也可以是一个正则表达式。该方法绝…

windows 达梦数据库服务连接时提示:登录服务器失败,错误号6001,错误消息:网络通信异常 之数据库服务不存在的处理方式

在windows客户端上连接部署在windows操作系统上的达梦数据库&#xff0c; 使用DM管理工具连接数据库 正确输入用户名与密码之后点击确定按钮之后出现&#xff1a; 登录服务器失败&#xff0c;错误号6001&#xff0c;错误消息&#xff1a;网络通信异常 现象 如下图所示&#…

银行从业资格证 个人理财 各种年金计算公式总结

变量说明&#xff1a; C C C &#xff1a;每期投入的现金流 r r r&#xff1a;利率&#xff08;收益率/贴现率&#xff09; n n n &#xff1a;计息期数&#xff1b; F V FV FV&#xff1a;终值 P V PV PV&#xff1a;现值 推导计算过程用到等比数列求和公式 S n a 1 ∗ 1 −…