AI绘画stable diffussion ：Lora大模型微调的利器

AI绘画stable diffussion ：Lora大模型微调的利器

news2026/2/14 20:55:41

前言

===

LoRA模型是小型的Stable Diffusion模型，它们对checkpoint模型进行微小的调整。它们的体积通常是检查点模型的10到100分之一。因为体积小，效果好，所以lora模型的使用程度比较高。

这是一篇面向从未使用过LoRA模型的初学者的教程。你将了解LoRA模型是什么，在哪里找到它们，以及如何在AUTOMATIC1111 GUI中使用它们。然后，你将在文章末尾找到一些LoRA模型的演示。

所有的AI设计工具，模型和插件，都已经整理好了，👇获取~

LoRA模型是什么？

LoRA（Low-Rank Adaptation）是一种微调Stable Diffusion模型的训练技术。

虽然我们已经有像Dreambooth和文本反转这样的训练技术。那么LoRA有什么用呢？

LoRA实际上可以看做是Dreambooth和文本反转embeddings的折中方案。Dreambooth功能虽然强大，但模型文件会比较大（2-7 GB）。文本反转非常小（约100 KB），但能做的事情比较少。

LoRA介于两者之间。它的文件大小更容易管理（2-200 MB），并且训练能力相当不错。

因为checkpoint比较大，所以硬盘空间存储会是一个问题。而LoRA是解决存储问题的优秀方案。

像文本反转一样，你不能单独使用LoRA模型。它必须与模型检查点文件一起使用。LoRA通过对配套的模型文件进行小的修改来改变风格。

LoRA是定制AI艺术模型的绝佳方式，而不会占用太多本地存储空间。

LoRA如何工作？

LoRA对Stable Diffusion模型中最关键的部分进行小的修改：交叉注意力层。研究人员发现，微调这部分模型就足以实现良好的训练。交叉注意力层是下面Stable Diffusion模型架构中的黄色部分。

交叉注意力层的权重以矩阵的形式排列。矩阵只是按列和行排列的一堆数字，就像Excel电子表格上一样。LoRA模型通过将自己的权重加到这些矩阵上来微调模型。

如果LoRA模型需要存储相同数量的权重，它们的文件怎么会更小呢？**LoRA的技巧是将矩阵分解成两个更小的（低秩）矩阵。**通过这样做，它可以存储更少的数字。让我们通过以下示例来说明。

假设模型有一个100行100列的矩阵。那是10000个数字（100x 100）需要存储在模型文件中。LoRA将矩阵分解成一个1000x2矩阵和一个2x100矩阵。那只有400个数字（100 x 2 + 2 x 100,如果矩阵够更大的话，LoRA模型会减少的更多。这就是为什么LoRA文件要小得多的原因。

在这个例子中，矩阵的秩是2。它比原始尺寸低得多，所以它们被称为低秩矩阵。秩可以低至1。

这种操作必定会带来数据上的缺失，但是在交叉注意力层来说，这些损失是无伤大雅的。所以Lora这种做法是可行的。

在哪里找到LoRA模型？

Civitai

寻找LoRA的首选地点是Civitai。该网站托管了大量LoRA模型的集合。应用LORA过滤器以仅查看LoRA模型。不过里面的大多数模型都是：女性肖像，动漫，现实主义插图风格等。

Hugging Face

Hugging Face是另一个LoRA库的好来源。你会发现更多种类的LoRA模型。但那里的LoRA模型可能没有C站多，并且也不太直观。因为没有图片预览。

如何使用LoRA？

这里，我将介绍如何在AUTOMATIC1111 Stable Diffusion GUI中使用LoRA模型。

AUTOMATIC1111原生支持LoRA。你不需要安装任何扩展。

第1步：安装LoRA模型

要在AUTOMATIC1111 webui中安装LoRA模型，请将模型文件放入以下文件夹。

stable-diffusion-webui/models/Lora

第2步：在提示中使用LoRA

要在AUTOMATIC1111 Stable Diffusion WebUI中添加带权重的LoRA，请在提示或否定提示中使用以下语法：

<lora: name: weight>

name是LoRA模型的名称。它可以与文件名不同。weight是应用于LoRA模型的权重。默认值为1。将其设置为0将禁用模型。

那么怎么知道lora的名字是什么呢？

其实我们并不需要手动输入lora的名字，我们只需要点击下面的lora标签：

你应该看到一个已安装的LoRA模型列表。单击你想要使用的模型。

LoRA短语将被插入到提示中。

就是这样！

使用LoRA的注意事项

你可以调整乘数以增强或调整效果。将乘数设置为0将禁用LoRA模型。你可以在0和1之间调整风格效果。

一些LoRA模型是使用Dreambooth训练的。你需要包括一个触发关键词才能使用LoRA模型。你可以在模型页面上找到触发关键词。

类似于嵌入，你可以同时使用多个LoRA模型。你也可以将它们与嵌入一起使用。

在AUTOMATIC1111中，LoRA短语不是提示的一部分。在应用LoRA模型后，它将被删除。这意味着你不能使用像[keyword1:keyword2: 0.8]这样的提示语法来使用他们。

实用的LoRA模型

这里介绍一些在实际应用中比较实用的Lora。

add_detail

谁不想要AI图像中更多的细节？细节调整器允许你增加或减少图像中的细节。现在，你可以调整你想要的细节量。

使用正LoRA权重来增加细节，使用负权重来减少细节。

add_saturation

这个lora可以给图片添加一些饱和度，效果如下：

add_brightness

这个lora可以用来控制图片的亮度：

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好，需要的点击下方插件，即可前往免费领取！

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2120997.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

使用tesseract.js插件实现前端js识别提取图片的文字

使用tesseract.js插件实现前端js识别提取图片的文字

<!DOCTYPE html> <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>图像OCR Tesseract.js 测试…

阅读更多...

给豆包MarsCode 编程插件点赞

给豆包MarsCode 编程插件点赞

本文正在参加豆包MarsCode测评官征文活动首先MarsCode 拉新福利还是蛮高的有E卡、周边T恤、肯德基代金券显卡等hahaha…… 略微炫耀一下100京东E卡，真香！ 活动入口：https://www.marscode.cn/events/s/ihx7hkNY/ 顺手帮忙助个力谢谢~ 2…

阅读更多...

人工智能 | 搭建企业内部的大语言模型系统

人工智能 | 搭建企业内部的大语言模型系统

大纲开源大语言模型大语言模型管理私有大语言模型服务部署方案开源大语言模型担心安全与隐私？可私有部署的开源大模型商业大模型，不支持私有部署 ChatGPTClaudeGoogle Gemini百度问心一言开源大模型，支持私有部署 MistralMeta Llama…

阅读更多...

ssl 协议工作过程

ssl 协议工作过程

ssl 协议工作过程 ChatGPT 说： ChatGPT SSL（Secure Sockets Layer）协议是用来确保网络通信安全的加密协议，已被TLS（Transport Layer Security）取代，但它的工作过程仍然是理解现代加密协议的重…

阅读更多...

【视频教程】GEE-PIE遥感大数据处理与典型案例实践

【视频教程】GEE-PIE遥感大数据处理与典型案例实践

随着航空、航天、近地空间等多个遥感平台的不断发展，近年来遥感技术突飞猛进。由此，遥感数据的空间、时间、光谱分辨率不断提高，数据量也大幅增长，使其越来越具有大数据特征。对于相关研究而言，遥感大数据的出现为其提…

阅读更多...

《开发环境使用HTTPS调试》

《开发环境使用HTTPS调试》

🤖 作者简介：水煮白菜王 ，一位资深前端劝退师 👻 👀 文章专栏： 前端专栏 ，记录一下平时在博客写作中，总结出的一些开发技巧✍。感谢支持💕💕💕 近…

阅读更多...

CoreDownload - WordPress文章下载增强插件v1.0.6

CoreDownload - WordPress文章下载增强插件v1.0.6

文章内下载效果后台编辑页面 CoreDownload 是一款高级WordPress 下载增强插件，支持几乎所有网盘，为WordPress增加任意下载功能安装插件后，在设置中全局开启。然后编辑文章，可以在下面找到CoreDownload下载增强功能。插件下载 …

阅读更多...

以太网和WIFI之间的网络切换脚本（Window环境）

以太网和WIFI之间的网络切换脚本（Window环境）

网络切换脚本在本地创建Window的批处理脚本【网络切换脚本.bat】，填入以下内容，然后以管理员身份运行，即可实现以太网和WIFI之间的切换。 echo off netsh interface show interface "WLAN" | find "管理状态: 已启用"…

阅读更多...

SLM21814系列SiLM21814CJ-AQ能提供独立的高边、低边输出驱动信号一款高压、高速的功率MOSFET和IGBT驱动器

SLM21814系列SiLM21814CJ-AQ能提供独立的高边、低边输出驱动信号一款高压、高速的功率MOSFET和IGBT驱动器

SLM21814系列SiLM21814CJ-AQ是一款高压、高速的功率MOSFET和IGBT驱动器，它提供独立的高边、低边输出驱动信号。采用专有的高压集成电路和锁存免疫CMOS技术，提供可靠的单芯片驱动方案。逻辑输入电平与标准CMOS或LSTTL输出兼容，最低支持3.3V逻辑…

阅读更多...

家常菜才最适合减肥！最新研究发现，减少外出就餐次数可减少儿童肥胖

家常菜才最适合减肥！最新研究发现，减少外出就餐次数可减少儿童肥胖

虽然老人们都喜欢孩子能“白白胖胖”，但随着生活水平的提高，儿童肥胖已成为一个不可忽视的健康问题。据报道，我国6-17岁儿童青少年超重率和肥胖率分别是11.1%和7.9%，也就是说，几乎每5个中小学生中就有一个小胖墩儿。有…

阅读更多...

如何在算家云搭建Open-Sora1.1（视频生成）

如何在算家云搭建Open-Sora1.1（视频生成）

一、Open-Sora1.1简介 Open-Sora 1.1 项目是 Colossal AI 团队开发的一个完全开源的视频生成项目，该项目致力于高效制作高质量视频，并通过开源原则实现先进视频生成技术的低成本普及。 1. 项目背景与目标 Open-Sora 项目旨在通过提供开源的模型、工具…

阅读更多...

【Python】数据可视化之核密度

【Python】数据可视化之核密度

KDEPlot（Kernel Density Estimate Plot，核密度估计图）是seaborn库中一个用于数据可视化的函数，它基于核密度估计（KDE）这一非参数统计方法来估计数据的概率密度函数。KDEPlot能够直观地展示数据的分布特征&a…

阅读更多...

定点荧光标记蛋白：轻松搞定CAR-T阳性率检测

定点荧光标记蛋白：轻松搞定CAR-T阳性率检测

CAR-T细胞疗法在8月份提前进入“丰收季”。8月27日NMPA官网公示，**国内第五款CAR-T细胞疗法——来自传奇生物的西达基奥仑赛注射液获批上市。**这款靶向BCMA的细胞疗法用于治疗复发或难治性多发性骨髓瘤（R/R MM）成人患者。同一天，…

阅读更多...

NDP协议是怎样帮助IPv6实现网络安全运行的？

NDP协议是怎样帮助IPv6实现网络安全运行的？

在复杂多变的网络环境中，确保各节点之间能够高效、准确地发现与通信，是构建稳定、可扩展网络架构的基石。那么IPv6是依靠什么实现网络安全运行的呢？今天我将就IPv6中的一个重要协议——NDP协议的基本概念及工作原理展开深入分析。 NDP协议的基…

阅读更多...

体育馆管理系统|基于SpingBoot+vue的体育馆管理系统(源码+数据库+文档)

体育馆管理系统|基于SpingBoot+vue的体育馆管理系统(源码+数据库+文档)

体育馆管理系统目录基于SpingBootvue的体育馆管理系统一、前言二、系统设计三、系统功能设计系统功能实现 1登录 2学生管理页面 3系统主界面模块的实现 4器材管理模块的实现四、数据库设计五、核心代码六、论文参考七、最新计算机毕设选题推荐八、源…

阅读更多...

ICM20948 DMP代码详解（11）

ICM20948 DMP代码详解（11）

接前一篇文章：ICM20948 DMP代码详解（10） 上一回讲解完了icm20948_sensor_setup函数的第1段代码，本回继续往下解析。为了便于理解和回顾，再次贴出icm20948_sensor_setup函数源码，在EMD-App\src\ICM20948\sen…

阅读更多...

一文讲清投影，定义投影，投影栅格……

一文讲清投影，定义投影，投影栅格……

正确的空间坐标系是进行地理分析和处理的基础，投影是其中十分重要的概念。在ArcGIS系列的软件中关于投影的工具有四个，分别是定义投影、投影、投影栅格、批量投影。你能分清他们吗？ 如果不能。别急，下面我来给你一一介绍。定…

阅读更多...

虚拟机卡死问题

虚拟机卡死问题

升级VMware至15.1.0版本解决Windows 10 1903下VMware Workstation 15 Pro虚拟机死机问题如题，在几乎全新的Windows 10 1903操作系统下，在VMware Workstation中安装虚拟机经常出现死机现象，主要表现在以下两个方面： 创建好虚拟机后…

阅读更多...

【Qt】按钮样式--按钮内部布局（调整按钮文本和图标放置在任意位置）

【Qt】按钮样式--按钮内部布局（调整按钮文本和图标放置在任意位置）

要求： 有一个按钮，要求按钮的右下角显示开关，点击切换开关状态 ps：注意，要求你添加完了之后，整个按钮的点击区域不变（就是说，点击右下角的文本，也可以触发按钮的点击事件…

阅读更多...

.net MAUI应用生命周期

.net MAUI应用生命周期

.NET Multi-platform App UI (.NET MAUI) 应用通常有四种执行状态：“未运行”、“运行中”、“已停用”和“已停止”。当应用从未运行状态转换为运行状态、从运行状态转换为已停用状态、从已停用状态转换为已停止状态、从已停止状态转换为运行状态，以及…

阅读更多...

推荐文章

最新文章