MMagic调试(训练)dreambooth

news2024/11/24 6:17:47

时间:2024.1.23

1.dreambooth配置文件

dreambooth在mmagic中的路径:

configs/dreambooth

本文以dreambooth.py 为例

configs/dreambooth/dreambooth.py

2.下载数据集

下载数据集并保存至data/dreambooth/,数据集:

https://drive.google.com/drive/folders/1BO_dyz-p65qhBRRMRA4TbZ8qW4rB99JZ

文件夹的数据结构如下:

data
└── dreambooth
    └──imgs
       ├── alvan-nee-Id1DBHv4fbg-unsplash.jpeg
       ├── alvan-nee-bQaAJCbNq3g-unsplash.jpeg
       ├── alvan-nee-brFsZ7qszSY-unsplash.jpeg
       └── alvan-nee-eoqnr8ikwFE-unsplash.jpeg

3.修改配置文件中数据集路径

修改配置文件中的数据集路径,就是上一步骤中图片的路径。

data_root='你的数据集路径'

4.从hugging face 下载与训练权重

hugging face 中stable diffusiond的网址如下:

https://huggingface.co/runwayml/stable-diffusion-v1-5

点击Files and versions就能下载相关文件了:
在这里插入图片描述

要下载的权重和配置文件入下:

runwayml
└── stable-diffusion-v1-5
    └── scheduler
       └── scheduler_config.json
    └── text_encoder
		├── config.json
		└── pytorch_model.bin
	└── tokenizer
		├── merges.txt
        ├── special_tokens_map.json
        ├── tokenizer_config.json
        └── vocab.json
	└── unet
		├── config.json
		└── diffusion_pytorch_model.bin
	└── vae
		├── config.json
		└── diffusion_pytorch_model.bin

根据上述说明,从hugging face下载。注意文件夹的数据结构。注意文件的名称不能随意改。注意其他文件不需要,就没不要下载了。
将这些文件放在你喜欢的路径下,记住这个路径,在下一步中要用,用来替换配置文件中的stable_diffusion_v15_url路径。

5.修改stable_diffusion_v15_url路径

在配置文件中configs/dreambooth/dreambooth.py修改stable_diffusion_v15_url路径,默认是:

stable_diffusion_v15_url = 'runwayml/stable-diffusion-v1-5'

这个stable_diffusion_v15_url的作用是读入vae、unet、clip、scheduler的权重和配置文件。但是如果路径不是这个就要改成自己的路径。你自己的路径在步骤3中已经准备好了。

stable_diffusion_v15_url = '你自己的路径'

6.评价

(1)Hugging face喜欢整洋活,把代码集成好放pip中,通过pip安装直接调用。但这有个问题,需要下载权重的时候,自动联网下,但如果连不上网就没有办法下了啊!readme也不说明下哪些权重。
(2)MMagic太依赖hugging face 的diffuser了,干脆直接用diffuser就完了呗,还用mmagic干什么呢?学学隔壁的mmdetection等,要想做一个库,就不要那么依赖diffuser。建议把diffuser的代码该重构重构,权重该转到自家代码库就转。
(3)MMagic中默认提供的能训练的模型太少了,大部分只给了推理代码,没有给训练代码。真离谱!作为openmmlab旗下的扩散模型继承代码库,mmagic中大部分模型竟然不能训练!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1406376.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[BUUCTF]-PWN:babyfengshui_33c3_2016解析

又是一道堆题,先看保护 关键信息是32位,没开pie 直接看ida 大致是alloc创建堆块,free释放堆块,show查看堆块内容,fill填充堆块内容 其他的都没啥关键的要讲,但alloc那里非常需要解析一下 解释如上图 再具…

npm install运行报错npm ERR! gyp ERR! not ok问题解决

执行npm install的时候报错: npm ERR! path D:..\node_modules\\**node-sass** npm ERR! command failed ...npm ERR! gyp ERR! node -v v20.11.0 npm ERR! gyp ERR! node-gyp -v v3.8.0 npm ERR! gyp ERR! not ok根据报错信息,看出时node-sass运行出现…

基于taro搭建小程序多项目框架

前言 为什么需要这样一个框架,以及这个框架带来的好处是什么? 从字面意思上理解:该框架可以用来同时管理多个小程序,并且可以抽离公用组件或业务逻辑供各个小程序使用。当你工作中面临这种同时维护多个小程序的业务场景时&#xf…

前端面试题-(浏览器内核,CSS选择器优先级,盒子模型,CSS硬件加速,CSS扩展)

前端面试题-(浏览器内核,CSS选择器优先级,盒子模型,CSS硬件加速,CSS扩展) 常见的浏览器内核CSS选择器优先级盒子模型CSS硬件加速CSS扩展 常见的浏览器内核 内核描述Trident(IE内核)主要用在window系统中的IE浏览器中&…

【论文阅读|2024 WACV 多目标跟踪Deep-EloU】

论文阅读|2024 WACV 多目标跟踪Deep-EloU 摘要1 引言(Introduction)2 相关工作(Related Work)2.1 基于卡尔曼滤波器的多目标跟踪算法(Multi-Object Tracking using Kalman Filter)2.2 基于定位的多目标跟踪…

Elasticsearch:Simulate ingest API

Ingest pipeline 为我们摄入数据提供了极大的方便。在我之前的文章中,有非常多的有关 ingest pipeline 的文章。请详细阅读文章 “Elastic:开发者上手指南”。针对一组提供的文档执行摄取管道,可以选择使用替代管道定义。 Simulate ingest AP…

如何查找SpringBoot应用中的请求路径(不使用idea)

背景 昨天有个同事向我咨询某个接口的物理表是哪个,由于公司业务较多、这块业务的确不是我负责的,也没有使用idea不能全局搜索(eclipse搜不到jar内的字符串),也就回复了不清楚。 除了自己写代码输出servlet的路径和类外,发现了一…

【C++】list容器功能模拟实现

介绍 上一次介绍了list队容器的迭代器模拟,这次模拟实现list的简单功能,尤其要注意构造函数、析构函数、以及赋值运算符重载的实现。 list容器需要接纳所有类型的数据,因此,结构设置与迭代器设置同理,需要引入结点&…

邮件服务支持Exchange协议,资产历史账号支持设置保留数量,JumpServer堡垒机v3.10.2 LTS版本发布

2024年1月22日,JumpServer开源堡垒机正式发布v3.10.2 LTS版本。JumpServer开源项目组将对v3.10 LTS版本提供长期的支持和维护,并定期迭代发布小版本。欢迎广大社区用户升级至v3.10 LTS版本,以获得更佳的使用体验。 在v3.10.2 LTS版本中&…

LeetCode203 移除链表元素

203. 移除链表元素 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示例 1: 输入:head [1,2,6,3,4,5,6], val 6 输出:[1,2,3,4,5] 示例 2&#…

简单高效 Learn LaTeX 008 - LaTex Font Color 字体与颜色 (32 mins)

在LaTeX中进行字体和颜色的设置: https://www.ixigua.com/7298100920137548288?id7304094068840071730&logTag3418d8469157c468c60b

开始学习vue2(Vue方法)

一、过滤器 过滤器(Filters)是 vue 为开发者提供的功能,常用于文本的格式 化。过滤器可以用在两个地方:插值表达式 和 v-bind 属性绑定。 过滤器应该被添加在 JavaScript 表达式的尾部,由“管道符 ”进行 调用&#…

春招冲刺第二天——SQL学习

春招冲刺第二天 前言 MySQL学习:哔哩哔哩参考视频: 【中字】SQL进阶教程 | 史上最易懂SQL教程!10小时零基础成长SQL大师 第一章 Mysql安装 视频前三节有教程,或自行查阅,不做赘述 课程资料和数据库数据的网盘&…

苹果眼镜(Vision Pro)的开发者指南(6)-实战应用场景开发 - 游戏、协作、空间音频、WebXR

第一部分:【构建游戏和媒体体验】 了解如何使用visionOS在游戏和媒体体验中创建真正身临其境的时刻。游戏和媒体可以利用全方位的沉浸感来讲述令人难以置信的故事,并以一种新的方式与人们联系。将向你展示可供你入门的visionOS游戏和叙事开发途径。了解如何使用RealityKit有…

windows .vscode的json文件配置 CMake 构建项目 调试窗口中文设置等

一、CMake 和 mingw64的安装和环境配置 二、tasks.json和launch.json文件配置 tasks.json {"version": "2.0.0","options": {"cwd": "${workspaceFolder}/build"},"tasks": [{"type": "shell&q…

V∗: Guided Visual Search as a Core Mechanism in Multimodal LLMs

摘要 当我们环顾四周并执行复杂任务时,我们如何看待和选择性地处理我们所看到的是至关重要的。然而,这种视觉搜索机制的缺乏,在目前的多模态LLM(MLLM)阻碍了他们的能力,专注于重要的视觉细节,特…

顶顶通呼叫中心中间件利用自动外呼进入机器人的压力测试配置流程

文章目录 前言呼入进入机器人配置流程创建线路创建线路组呼入配置创建自动外呼任务1. 实现“一端放音,另一端进入机器人”操作创建拨号方案—“模拟放音”呼叫路由—“internal”启用拨号方案—“模拟放音”队列外呼配置 2. 实现“两端都进入机器人”操作队列外呼配…

网络安全--防御保护02

第二天重要的一个点是区域这个概念 防火墙的主要职责在于控制和防护---安全策略---防火墙可以根据安全策略来抓取流量之后做出对应的动作 防火墙的分类: 单一主机防火墙:专门有设备作为防火墙 路由集成:核心设备,可流量转发 分…

云原生离线工作流编排利器 -- 分布式工作流 Argo 集群

作者:庄宇 在现代的软件开发和数据处理领域,批处理作业(Batch)扮演着重要的角色。它们通常用于数据处理,仿真计算,科学计算等领域,往往需要大规模的计算资源。随着云计算的兴起,阿里…

【趣味CSS3.0】粘性定位属性Position:sticky是不是真的没用了?

🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享博主 🐋 希望大家多多支持一下, 我们一起学习和进步!😄 🏅 如果文章对你有帮助的话,欢迎评论 💬点赞&a…