SD微调 dreambooth Lora controlNet 持续更新中

SD微调 dreambooth Lora controlNet 持续更新中

news2025/4/12 12:09:35

微调：步骤

1 选择预训练模型如ResNet VGG

2 准备新的数据集

3 构建模型

4 冻结部分模型

5 定义损失函数和优化器

6 微调模型

7 评估模型

8 微调的策略

https://www.zhangzhenhu.com/aigc/dreamBooth.html

dreambooth

(fix the object, then generate the same object in different scene)

DreamBooth 并不是一个独立的图像生成模型，它是一种微调技术，通过对现有的预训练好的图像生成模型进行微调，进而实现能通过文本 Prompt 控制生成同一个主体的不同场景的图像。

DreamBooth 仅仅是在文本 Prompt 动了手脚，不需要对扩算模型做任何改动

最大的特点是Subject-Driven，针对某一个特定的主体，生成这个主体可以是一个动物或者某个物体，包括人都是可以的

todo: 实际训练一把人像或者狗

LORA

https://juejin.cn/post/7229787490257190973

代码链接

Low-Rank Adaptation of Large Language Models（Lora）是一种为了解决大语言模型微调而开发的技术。它将预训练模型权重冻结，并将可训练的秩分解矩阵注入到Transformer架构的每一层，大大减少了下游任务的可训练参数数量。具体来说，它将原始矩阵分解为两个矩阵的乘积，其中一个矩阵的秩比另一个矩阵的秩低。这时只需要运用低秩矩阵来进行运算，这样，可以减少模型参数数量，提高训练吞吐量，并且在模型质量上表现出色，且不会增加推理延迟。

代码改动: 就把unet attention里面的dense层换成了dense_lora

LoRA的做法是将一个权重矩阵分解为两个矩阵存储，能起到的作用可以用下图表示，参数量由(1000* 2000)减少到(1000* 2+2000*2), 大概300多倍！

controlNet

fixed your position,then generate a lot of same position but not different style pics

它是在预训练的 Stable Diffusion 模型基础上，为其增加了一个额外的输入，这个输入是另外一张图像，比如姿态图、线稿、草图等等，这个额外的输入作为 Stable Diffusion 的一个控制条件（condition），它可以控制 Stable Diffusion 生成的图像结果，使其符合我们输入的条件图像特征。

ControlNet 在训练时，原始 Stable Diffusion 的 Unet 部分是冻住的，参数不更新，仅仅 ControlNet 部分的参数进行更新

textual inversion

目标：与DreamBooth一样，都是想要微调模型生成特定目标或风格的图像
方法：通过在vocabulary中添加一个额外的embedding来学习输入的新特征。预训练模型的所有参数都锁住，只有新的embedding被训练

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1996121.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Android Media Framework（十五）ACodec - Ⅲ

Android Media Framework（十五）ACodec - Ⅲ

这一篇我们一起来了解ACodec的Buffer分配流程。 1、initiateStart 首先对上一篇内容做一点补充，configureCodec执行完成后组件的状态没有变化，仍处在OMX_StateLoaded。因此，当我们调用initiateStart时，发出的消息将由ACodec::Loa…

阅读更多...

SVN使用教程 - 快速上手

SVN使用教程 - 快速上手

参考视频： SVN使用教程 - 快速上手一、SVN简介 1、SVN的功能 （1）SVN是一种代码版本管理工具，它能记住程序员每次修改的内容，可以查看所有的历史修改记录，可以将代码恢复到任何历史版本，可以恢…

阅读更多...

【Mysql】第十一章事务-重点（原子性+持久性+隔离性+一致性）

【Mysql】第十一章事务-重点（原子性+持久性+隔离性+一致性）

文章目录一、概念1.查看事务支持版本-show engines2.事务提交方式-show variables like autocommit3.事务常见操作方式1.将mysql的默认隔离级别设置成读未提交，方便看到实验现象2.需要重启终端，进行查看隔离级别3.创建一个银行用户表4.演示 - 证明事务的…

阅读更多...

【Transformer】关于RNN以及transformer的相关介绍

【Transformer】关于RNN以及transformer的相关介绍

文章目录 RNNTransformer是干什么的？什么是 Word Embedding ？什么是 Word2vec ？CBOW(Continuous Bag-of-Words Model)Skip-gram(Continuous Skip-gram Model)Word2vec 的优缺点 Transformer整体架构注意力机制self-attention（自注…

阅读更多...

生成式人工智能助力6G核心技术

生成式人工智能助力6G核心技术

崔曙光加拿大皇家科学院加拿大工程院双院院士主要工作：适配改造人工智能算法，来满足通信网络性能从基础LLM到专用LLM：四个必须面对的问题如何选择合适的基础LLM规模如何让基础LLM读懂专用领域信息如何避免基础LLM的幻觉现象&#xf…

阅读更多...

第9天 xxl-job

第9天 xxl-job

使用xxl-job需要建表引入依赖添加配置 Bean public XxlJobSpringExecutor xxlJobExecutor() {logger.info(">>>>>>>>>>> xxl-job config init.");XxlJobSpringExecutor xxlJobSpringExecutor new XxlJobSpringExecutor();xxlJo…

阅读更多...

sql注入——sqlilabs16-26

sql注入——sqlilabs16-26

文章目录 less-163.注入 less-172.数据库名2.1 floor报错注入数据库名 3.查到数据表3.1floor 报错注入数据表 4.查取列名4.1 floor报错注入列名 5.查取内容 less-181.添加X-Forwarded-For测试2修改User-Agent测试3.查数据表名4.查数据列5.查取数据 less-192.查数据库3.查数据表…

阅读更多...

医疗大健康解决方案HIS方案

医疗大健康解决方案HIS方案

本篇接上篇文章医疗大健康解决方案HIS方案-CSDN博客，介绍第二部分区域医疗解决方案。依托腾讯云优势，联合合作伙伴，连接政府、医疗服务机构、医药研发与流通、康养等，构建医疗大健康产业云生态，助力数字化升级。方…

阅读更多...

小怡分享之数据结构基础知识准备

小怡分享之数据结构基础知识准备

前言： 🌈✨之前小怡给大家分享了JavaSE的知识，今天小怡要给大家分享一下数据结构基础知识。一、初识集合框架 1.什么是集合框架 Java集合框架Java Collection Framework， 又称为容器container，是定义在Java.util 包…

阅读更多...

Linux服务器基于NFS实现共享目录

Linux服务器基于NFS实现共享目录

NFS简介：NFS（Network File System）是一种分布式文件系统协议，允许用户通过网络访问远程计算机上的文件和目录，就像访问本地文件一样。NFS 最初由 Sun Microsystems 在 1984 年开发，现在已经成为类 Unix 系统…

阅读更多...

SpringBoot企业人事管理系统-附源码与配套论文

SpringBoot企业人事管理系统-附源码与配套论文

1.1引言随着计算机技术的飞速发展，计算机在各种单位机构管理中应用的普及﹐管理信息系统的开发在强调管理、强调信息的现代社会中也显得越来越重要。因此,利用计算机高效率地完成人事管理的日常事务，是适应现代各种单位机构制度要求、推动各种单位机构…

阅读更多...

【项目】火灾烟雾检测管理系统。PyQT5+QT Designe+YOLOv8_ssod半监督算法+OpenCV

【项目】火灾烟雾检测管理系统。PyQT5+QT Designe+YOLOv8_ssod半监督算法+OpenCV

【项目】火灾烟雾检测管理系统。PyQT5QT DesigneYOLOv8_ssod半监督算法OpenCV 0.摘要1.引言2.烟雾检测算法2.0图像标注2.1 YOLOv8全监督算法结构2.2 Efficient-Teacher半监督算法结构 3.性能对比图4.源码、论文获取 0.摘要火灾是常见而危险的自然灾害，不仅对人类生…

阅读更多...

数值分析【3】

数值分析【3】

目录第四章插值边角料： 分段二次插值——三个一插编辑三次样条插值小结：等距看差分编辑第五章最小二乘第六章数值积分代数精度编辑第四章插值边角料： 分段二次插值——三个一插三次样条插值三次阳台函数是光滑…

阅读更多...

Oracle一对多(一主多备)的DG环境如何进行switchover切换？

Oracle一对多(一主多备)的DG环境如何进行switchover切换？

本文主要分享Oracle一对多(一主多备)的DG环境的switchover切换，如何进行主从切换，切换后怎么恢复正常同步？ 1、环境说明本文的环境为一主两备，数据库版本为11.2.0.4，主要信息如下： 数据库IPdb_unique_n…

阅读更多...

落子“用户Happy”，vivo的“做活”与“长气”之道

落子“用户Happy”，vivo的“做活”与“长气”之道

有人说，中国手机行业，是名副其实的“Hard”模式。竞争焦灼，内卷不止。然而，这种主观的判断，也许从侧面反映出另一个客观事实：中国手机市场，凭借巨大的用户规模、多元化的消费倾向、自由展开的科…

阅读更多...

从微软蓝屏事件聊到数据库系统中的纸牌屋

从微软蓝屏事件聊到数据库系统中的纸牌屋

2024 年 7 月 19 日，全球约有 850 万台 Windows 电脑崩溃，无法重启，陷入蓝屏死机状态。这次故障影响了全球各地的企业和政府，波及运输、金融服务、医疗保健等绝大多数行业。故障发生几小时后，蓝屏原因找到&#xff0…

阅读更多...

Python 数组计算逻辑

Python 数组计算逻辑

a{1,2,3} b{2,3,4} 与 & 交集(取中) a&b{2, 3} 或 | 并集 (左中右) a&b{1,2,3,4} 差集 ^ 取左右 a^b {1,4} 减 - 取左 a - b {1} a-b {1}

阅读更多...

同态加密和SEAL库的介绍（二）BFV 基础方案实现

同态加密和SEAL库的介绍（二）BFV 基础方案实现

写在前面： 本篇具体讲解如何使用 BFV 加密方案对加密的整数进行简单的计算（一个多项式评估），来源是官方提供的示例。BFV 是比较常见的方案，在很多大模型推理的时候，都是将浮点数的权重和输入变换成…

阅读更多...

新品周销量20W+，月GMV1300W+，黑马品牌如何实现快速突围？

新品周销量20W+，月GMV1300W+，黑马品牌如何实现快速突围？

随着视频号用户的不断增加，直播带货生态的不断发展，越来越多的品牌也开始入局视频号。近期友望数据发现，不少新品牌在视频号上脱颖而出。比如服饰内衣行业品牌「瑰菲女神」，专注女性内衣裤行业，周销量近20W件&#xf…

阅读更多...

Java 并发（二）—— AQS原理

Java 并发（二）—— AQS原理

AQS，全名AbstractQueuedSynchronizer。抽象队列同步器定义多线程访问共享资源的同步模板，解决了实现自定义同步器时涉及的大量细节问题，简化开发两种同步状态：独占、共享核心组件：State变量、CLH变体队列、获取 / 释…

阅读更多...

推荐文章

最新文章