【深度学习】【Lora训练0】StabelDiffusion,Lora训练,kohya_ss训练

news2024/11/28 12:32:21

文章目录

  • 环境
  • 数据
  • 自动标注
    • kohya_ss BLIP2
    • kohya_ss WD14
  • 后续

资源:

(1)训练ui kohya_ss:
https://github.com/bmaltais/kohya_ss

(2)kohya_ss 的docker+ 其他docker

https://github.com/ashleykleynhans/stable-diffusion-docker

环境

需要等待环境构建,有点慢,启动起来后,访问 http://home.elvisiky.com:7861/。

docker run -d \
  --gpus all \
  -v /workspace \
  -p 7860:3001 \
  -p 7861:3011 \
  -p 7862:3021 \
  -p 7863:6066 \
  -p 7864:8000 \
  -p 7866:8888 \
  -p 7867:2999 \
  -e JUPYTER_PASSWORD=Jup1t3R! \
  -e ENABLE_TENSORBOARD=1 \
  ashleykza/stable-diffusion-webui:latest
  

Application Log file

Stable Diffusion Web UI /workspace/logs/webui.log

Kohya SS /workspace/logs/kohya_ss.log

ComfyUI /workspace/logs/comfyui.log

在这里插入图片描述

数据

数量几十张即可

分辨率适中,勿收集极小图像

数据集需要统一的主题和风格的内容,图片不宜有复杂背景以及其他无关人物

图像人物尽量多角度,多表情,多姿势

凸显面部的图像数量比例稍微大点,全身照的图片数量比例稍微小点

堆糖:https://www.duitang.com
花瓣:https://huaban.com
pinterest:https://www.pinterest.com

通常,准备数百张图像是理想的(图像数量太少会导致类别图像无法被归纳,特征也不会被学习)。

如果要使用生成的图像,生成图像的大小通常应与训练分辨率(更准确地说,是bucket的分辨率,见下文)相匹配。

自动标注

kohya_ss BLIP2

“/workspace/kohya_ss/venv/bin/python”
“/workspace/kohya_ss/sd-scripts/finetune/make_captions.
py” --batch_size 1 --num_beams 1 --top_p 0.9
–max_length 75 --min_length 5 --beam_search
–caption_extension .txt “/workspace/maonv”
–caption_weights

在这里插入图片描述

在这里插入图片描述

kohya_ss WD14

在这里插入图片描述

"/workspace/kohya_ss/venv/bin/python"
                         "/workspace/kohya_ss/sd-scripts/finetune/make_captions_
                         by_git.py" --batch_size 1 --max_data_loader_n_workers 2
                         --max_length 75 --caption_extension .txt
                         "/workspace/yifei" with shell=True

后续

遇到了一个文件夹命名的问题,后续直接用秋叶包,不再用kohya_ss。

https://github.com/kohya-ss/sd-scripts/issues/1294

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1659229.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

书生第三课作业

视频:https://www.bilibili.com/video/BV1QA4m1F7t4/ 教程:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/readme.md 作业:https://github.com/InternLM/Tutorial/blob/camp2/huixiangdou/homework.md 项目地址:h…

基于Opencv的车牌识别系统(毕业设计可用)

系统架构 图像采集:首先,通过摄像头等设备捕捉车辆图像。图像质量直接影响后续处理的准确性,因此高质量的图像采集是基础。 预处理:对获取的原始图像进行预处理,包括灰度化、降噪、对比度增强和边缘检测等。这些操作旨…

什么是内存泄漏?什么是内存溢出?

我们讲内存溢出时,首先看一下上面这张图,比如说你要往一个500ml的杯子里倒800ml的水,这样肯定是装不下的,水会溢出来,在我们电脑内存中也是一样的,你这个内存中就只有5M的内存空间,可是你要将8M…

如何编辑百度百科并提供参考资料

大家都知道参考资料是创建百度百科中最重要的一步,百度百科只收录可以找到资料来源的事实,参考资料的意义在于,指出该部分内容的来源/出处,从而保障这段内容是客观真实的。 注册和登录百度账号 首先,你需要在百度百科…

腿式移动机器人

腿式运动以一系列机器人和地面之间的点接触为特征。其主要优点包括在粗糙地形上的自适应性和机动性。 因为只需要一组点接触,所以只要机器人能够保持适当的地面步距,这些点之间的地面质量是无关紧要的。另外,只要行走机器人的步距大于洞穴的宽度,它就能跨越洞穴或者…

软件工程复习之软件定义时期

1.什么是软件? 答:软件是程序,数据和文档的集合。 程序是完成指定功能的计算机可执行的指令序列。 数据是程序进行信息处理的数据结构。 文档是开发,使用,维护的图文资料。 2.软件有何特点? 答&#…

Python远程连接Linux执行操作

一、任务要求 要使用Python编写代码来远程给Linux主机上传一个文件,可以使用paramiko库,这是一个实现了SSHv2协议的Python库,它支持SSH连接(包括客户端和服务端),并且提供SFTP(SSH File Transf…

无线充电宝哪个比较好?哪些充电宝牌子比较值得入手?充电宝排名

在智能科技飞速发展的当下,智能手机已成为我们生活中不可或缺的一部分。然而,手机电量的限制却时常让我们陷入窘境,担心错过重要信息或无法完成关键操作。为了应对这一挑战,充电宝应运而生,成为了我们出行的得力助手。…

PSoc™62开发板之IoT应用

实验目的 使用PSoc62™开发板驱动OLED模块,实时监控室内的光照强度、温度信息 实验准备 PSoc62™开发板SSD1309 OLED模块DS18B20温度传感器BH1750光照传感器 模块电路 SSD1309 OLED模块的电路连接和模块配置教程请参考之前的文章,这里不详细展开描…

通配符证书是什么意思?使用起来有什么优势?

通配符证书就像是一个万能钥匙,但它专门用于网站的安全。当你运营一个网站时,特别是有很多子网站,每个都需要安全连接(比如开头是https的网址),通常你需要为每个子网站买一个证书来保证访问者的安全。但是&…

ICLR 2024 杰出论文出炉:“大模型”成最大赢家

源自:北京科技大学机械工程学院 作者:陈哲涵 黎学臻 ““人工智能技术与咨询” 发布 国际表征学习大会(International Conference on Learning Representations,ICLR)公布了 ICLR 2024 杰出论文。 声明:公众号转载的…

5月游戏市场迎来新的体验,网易两款游戏重磅出炉

易采游戏网5月9日消息,随着科技的飞速发展,手机游戏已经成为人们休闲娱乐的重要方式。在这个领域,网易作为国内领先的游戏开发商,一直致力于为玩家带来高品质的游戏体验。近日,网易携手国际大厂Square Enix&#xff0c…

Azure Windows2012升级2016

Azure Windows2012升级2016 在自己电脑配置Azure PowerShell前置条件PowerShell 登录到 Azure Azure 中运行 Windows Server 的 VM 的就地升级前置条件,生成一块OS磁盘将生成的OS磁盘附件到需升级的服务器执行就地升级到 Windows Server 2016 升级后配置故障恢复 在…

Allegro PCB designer放置振列过空,Via Array,

首先 Place >>Via Array, 然后配置options 选项卡。 最后鼠标左击一下,拉个区域框,再点击一下。如下图 尤其注意鼠标左击一下再左击一下。

可持续未来:含镍废水处理工艺的革新探索

在向可持续能源转型的全球大潮中,高性能动力电池的生产扮演着举足轻重的角色。这些电池核心材料包含镍、钴、锰和铝等贵重元素,极大地提升了电池的能效,但同时也带来了含镍废水处理的严峻挑战。本文旨在深入探讨当前处理含镍废水的四大主流技…

HTML4(三):表单

文章目录 表单1. 基本结构2. 常用表单控件2.1 文本输入框2.2 密码输入框2.3 单选框2.4 复选框2.5 隐藏域2.6 提交按钮2.7 重置按钮2.8 普通按钮2.9 文本域2.10 下拉框2.11 示例 3. 禁用表单控件4. lable标签5. fieldset与legend标签6. 总结 表单 概念:一种包含交互…

链表第5/9题--两两交换链表中的节点--递归法

LeetCode24: 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题(即,只能进行节点交换)。 示例 1: 输入:head [1,2,3,4…

【PX4-AutoPilot教程-TIPS】Matlab使用ROS Toolbox编译MAVROS2消息报错缺少geographic_msgs消息

Matlab使用ROS Toolbox编译MAVROS2消息报错缺少geographic_msgs消息的解决方法 问题描述解决方法 环境: MATLAB : R2022b ROS Toolbox : 1.6 Windows :Windows 10 22H2 ROS :ROS2 Foxy 问题描述 在使用Matlab的ROS Toolbox工具箱编译与…

蓝桥杯EDA客观题

目录 前言 一、PCB类知识点和题目分析 1.电阻 2.电容 3.封装类 4.单位转换类 5.电路板结构类 6.PCB绘制规则 7.立创软件 8.PCB硬件 线性电源和开关电源 二、数电知识点和题目分析 1.门电路 2.逻辑代数 3.组合逻辑电路 4.触发器 5.时序逻辑电路 6.其他 三、模…

怎么编辑百度百科

百度百科是一个开放、免费的在线百科平台,由百度公司推出,旨在创造一个涵盖各领域知识的中文信息收集平台。任何人都可以通过注册百度账号并登录后,对符合条件的词条进行编辑和修改。以下是编辑百度百科的步骤和注意事项: 注册和登…