【stable diffusion】图片批量自动打标签、标签批量修改（BLIP、wd14）用于训练SD或者LORA模型

news2025/2/22 1:30:55

参考：

B站教学视频【：AI绘画】新手向！Lora训练！训练集准备、tag心得、批量编辑、正则化准备】
官方教程：https://github.com/darkstorm2150/sd-scripts/blob/main/docs/train_README-en.md#automatic-captioning

一、sd-webui通用的打标界面

1.1 打标界面
根据需求，选择通用打标模型（BLIP）还是动漫打标模型（deepbooru）
设置好后，选择预处理，会开始下载模型，可开代理加速
在这里插入图片描述
1.2 BLIP打标结果

1.3 Deepbooru标注结果（标签效果比下一段介绍的wd-14差一些）
在这里插入图片描述

二、sd-webui插件下wd14自动对动漫打标

插件名称： stable-diffusion-webui-wd14-tagger

安装与下载方式

可参考

stable-diffusion-webui 扩展模块安装

在 extensions/文件夹下拉取源码

git clone https://github.com/toriato/stable-diffusion-webui-wd14-tagger.git extensions/tagger

2.1 选择Tagger下的Batch from directory

在这里插入图片描述

2.2 输入图片的路径

图片与服务器应在同一台电脑

批量达标

在这里插入图片描述

单张图片看效果

可以了解到一些打标签原理，他是一个多类分类器，输出得每个词都是有概率的，一般输出置信度40%以上的词。
在这里插入图片描述

2.3 等待模型自动下载（可能卡住）

在这里插入图片描述

2.4 打标结果

在这里插入图片描述

图片与对应tag结果1
在这里插入图片描述

图片与对应tag结果2

在这里插入图片描述

三、sd-webui`编辑标签`

3.1 导入自动打标后的图片

在这里插入图片描述

3.2 批量修改添加

首先在所有tag前面加一个风格tag: cike567
在这里插入图片描述

打开txt查看

在这里插入图片描述

3.3 批量删除

在这里插入图片描述

四、lora训练集成开发工具自动打标

dreambooth、lora、sd模型微调的GUI环境安装（cuda驱动、pytorch、xformer）

（下载模型时间长，过程是类似的，本文暂不介绍了）
在这里插入图片描述

4.1 BLIP打标

首先会下载模型，下载非常慢
在这里插入图片描述

附录

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/638861.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Springboot全文链路id,并ELK搭建部署整合全文链路id

Springboot全文链路id,并ELK搭建部署整合全文链路id

Springboot全文链路id,并ELK搭建部署整合全文链路id 1.docker-compose.yaml部署 version: 3 services:elasticsearch:image: elasticsearch:7.13.2container_name: elasticsearchenvironment:- "cluster.nameelasticsearch" #设置集群名称为elasticsearch- "d…

阅读更多...

[笔记]C++并发编程实战《五》C++内存模型和原子类型操作

[笔记]C++并发编程实战《五》C++内存模型和原子类型操作

文章目录前言第5章 C内存模型和原子类型操作5.1 内存模型基础5.1.1 对象和内存位置5.1.2 对象、内存位置和并发5.1.3 修改顺序 5.2 C中的原子操作和原子类型5.2.1 标准原子类型总结前言第5章 C内存模型和原子类型操作本章主要内容： C11内存模型详解标准库提…

阅读更多...

【Docker】子系统与其相关名词的界定、Control Groups等详细讲解

【Docker】子系统与其相关名词的界定、Control Groups等详细讲解

前言 Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux或Windows操作系统的机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。 📕作者简介：热…

阅读更多...

回收旧物系统平台开发的功能

回收旧物系统平台开发的功能

1、定位服务为了方便用户寻找最近的废品回收点，小程序应该提供位置服务和导航功能。 2、垃圾分类知识普及用户可以查看所有垃圾分类知识，每种物品属于哪一个类型的垃圾分类。一目了然。相当于一本活字典，用户可以随时翻看查阅垃圾分类的…

阅读更多...

人工智能(pytorch)搭建模型11-pytorch搭建DCGAN模型，一种生成对抗网络GAN的变体实际应用

人工智能(pytorch)搭建模型11-pytorch搭建DCGAN模型，一种生成对抗网络GAN的变体实际应用

大家好，我是微学AI，今天给大家介绍一下人工智能(pytorch)搭建模型11-pytorch搭建DCGAN模型，一种生成对抗网络GAN的变体实际应用，本文将具体介绍DCGAN模型的原理，并使用PyTorch搭建一个简单的DCGAN模型。我们将提供模型…

阅读更多...

java+openlayer实现大气污染扩散模拟反演

java+openlayer实现大气污染扩散模拟反演

一、模拟参数及效果二、应用背景大气污染是当今社会面临的一个重要问题。随着工业化和城市化的进程，大气污染问题变得越来越严重。为了更好地应对这个问题，许多科学家和研究人员开始探索大气污染扩散反演技术。大气污染扩散反演技术是一种通过数学模…

阅读更多...

给软件测试人的一封信，全网最佳“指路明灯“

给软件测试人的一封信，全网最佳“指路明灯“

一、一招鲜吃遍天下你需要有一个核心技能。这个技能至少达到远超你的同事（包括开发岗位的同事的）平均水平。最好达到业界领先水平，且这个核心技能需要不断打磨提高。比如，我选择的核心技能是使用Python写代码。这个核心技能可以…

阅读更多...

3.2 基于Java配置类整合SSM框架实现用户登录

3.2 基于Java配置类整合SSM框架实现用户登录

一、基于Java配置类整合SSM框架实现用户登录 1、创建Maven项目 Maven项目 - SSMLoginNew 单击【Finish】按钮 2、添加相关依赖在pom.xml文件里添加相关依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache…

阅读更多...

Kubernetes 1.27 加快 Pod 启动速度

Kubernetes 1.27 加快 Pod 启动速度

如何在大型集群中加快节点上的 Pod 启动？这是企业集群管理员常常会面临的问题。这篇博文重点介绍了从 kubelet 一侧加快 Pod 启动的方法。此方法不涉及通过 kube-apiserver 由 controller-manager 创建 Pod 所用的时间段，也不包含 Pod 的调度时间或在其…

阅读更多...

电脑最牛逼的截图方式

电脑最牛逼的截图方式

1.电脑桌面上空白的地方新建一个文本文档，将后缀名修改为bat，截图如下： 2.右键点击该文档编辑，在编辑界面输入start snippingtool，点击保存之后关闭该文档。 3.双击该文档，在模式里面选择响应的截图方式即可…

阅读更多...

MySQL IDE与pymysql模块

MySQL IDE与pymysql模块

一、IDE工具介绍生产环境还是推荐使用mysql命令行，但为了方便我们测试，可以使用IDE工具在此我们推荐使用Navicat软件或pycharm来连接数据库,这样就能更详细直观地查询数据掌握： #1. 测试链接数据库 #2. 新建库 #3. 新建表，新增…

阅读更多...

2023 年程序员高考试卷！你能答对几个？

2023 年程序员高考试卷！你能答对几个？

又是一年高考季，一起来做做“程序员们的高考试卷”，压压惊吧~ 2023年普通高等学校招生全国统一考试程序员的高考试卷（A卷） 考生类别：码农 1、程序员A：借我1000元吧。程序员B：给你凑个整数…

阅读更多...

Linux基础知识点2

Linux基础知识点2

Linux基础知识适合有Linux基础的人群进行复习。禁止转载！ 文件管理与常用命令 Linux的文件的组成部分： 文件名、inode(i节点)和block(真正存数据的区域)。查看某个文件的属性： ls -lh #可看到有类似”-rw-r--r--”的属性符号 …

阅读更多...

轻松来自实力，亚马逊云科技助力边界智能应对业务高峰值数据考验

轻松来自实力，亚马逊云科技助力边界智能应对业务高峰值数据考验

边界智能（Bianjie.AI）是2016年创立于上海的国家高新技术企业和专精特新企业，同时也是以香港为全球总部、服务全球的区块链技术创新团队。公司专注于区块链技术支持的下一代互联网应用服务，自主研发了跨多条联盟链的分布式应用服务…

阅读更多...

STL入门 + 刷题（下）

STL入门 + 刷题（下）

👂 Raindrops (Intl. Version) - Katja Krasavice/Leony - 单曲 - 网易云音乐 👂 Rush E (Playable Version) - Sheet Music Boss - 单曲 - 网易云音乐 👂 最美的瞬间 - 真瑞 - 单曲 - 网易云音乐 👂 你可别卷了 - SipSu小口酥…

阅读更多...

CTF Crypto --- orz!

CTF Crypto --- orz!

文章目录题目解题过程题目 from Crypto.Util.number import * from gmpy2 import *flag bxxx t len(flag)//3 part1 bytes_to_long(flag[:t]) part2 bytes_to_long(flag[t:2*t]) part3 bytes_to_long(flag[2*t:]) q getPrime(1024) p next_prime(q) n p * qo getPr…

阅读更多...

面试必备，29个Java面试必考点、1000多道Java面试题

面试必备，29个Java面试必考点、1000多道Java面试题

马上金九银十招聘旺季就到了，不知道大家是否准备好了，面对金九银十的招聘旺季，如果没有精心准备那笔者认为那是对自己不负责任；就我们Java程序员来说，多数的公司总体上面试都是以自我介绍项目介绍项目细节/难点提问基础…

阅读更多...

文献下载神器：文献党下载器使用方法

文献下载神器：文献党下载器使用方法

文献党下载器是一款文献资源整合平台，把知网、万方、维普、超星/读秀、Web of Science、Elsevier（ScienceDirect）、Wiley 、SpringerLink、EI（工程索引）、IEEE（电气电子工程师学会）、Taylor &am…

阅读更多...

ESP32-C3系列模组简介

ESP32-C3系列模组简介

ESP32-C3是一款安全稳定、低功耗、低成本的物联网芯片，搭载RISC-V 32位单核处理器，为物联网产品提供行业领先的射频性能、完善的安全机制和丰富的内存资源。嵌入式智能终端、无线WIFI技术以及Internet的广泛应用必将使家居控制变得更加自动化、智能化和…

阅读更多...

基础软件加速自主创新，openGauss成就业务“新箭头”

基础软件加速自主创新，openGauss成就业务“新箭头”

不久前，想必业界都注意到了MetaERP横空出世的消息。作为企业经营的核心系统，MetaERP突破外部封锁，实现完全自研替代，是华为有史以来牵涉面较广、复杂性较高的项目。这其实是国产基础软件迅速崛起的一个缩影。基础软件产业是关系…

阅读更多...

推荐文章

最新文章