AI绘画SD必学技能—从零开始训练你的专属Lora 模型!StableDiffusion模型训练保姆级教程建议收藏!

news2024/11/17 9:28:19

大家好,我是画画的小强

接触AI绘画的小伙伴,一定听过Lora。

Lora模型全称是:Low-Rank Adaptation of Large Language Models,可以理解为Stable-Diffusion中的一个插件,在生成图片时,Lora模型会与大模型结合使用,从而实现对输出图片结果的调整。

我们举个更容易懂的例子:大模型就像素颜的人,Lora模型就如同进行了化妆、整容或cosplay,但内在还在大模型的底子。当然Lora模型不仅仅限制于人物,场景、动漫、风格都有相对应的Lora。

在这里插入图片描述

作为公认最具性价比的模型训练手段,只需要不到20张图片和10分钟的训练,就可以将一个人物、物品甚至是风格融入到AI绘画中,所以说训练Lora是每一个AI绘画学者必备的技能!今天就跟着晓晓来进入学习吧~


一、配置要求和训练环境

1、电脑配置: N卡 gpu 6G以上;

2、训练环境: 除了直接用训练脚本直接进行操作外,可以使用不同的训练图形化操作界面方便操作。可以用秋叶Lora模型训练器、朱尼酱的赛博丹炉等等选一个即可

3、模型训练器下载:秋叶大佬的Lora模型训练器我已经准备好了,需要的小伙伴可以看文末扫描免费获取哦

二、训练数据集准备

1、训练素材处理:

首先确定你的训练主题,比如某个人物、某种物品、某种画风等,确定好后准备用于训练的素材图片,素材图的质量直接决定了模型的质量,好的训练集有以下要求:

  • 不少于 15 张的高质量图片,一般可以准备 20-50 张图;

  • 图片主体内容清晰可辨、特征明显,图片构图简单,避免其它杂乱元素;

  • 如果是人物照,尽可能以脸部特写为主(多角度、多表情),再放几张全身像(不同姿势、不同服装);

  • 减少重复或相似度高的图片。

素材图准备完毕后,需要对图片做进一步处理:

  • 对于低像素的素材图,可以用 Stable Diffusion 的 Extra 功能进行高清处理;

  • 统一素材图分辨率,注意分辨率为 64 的倍数, 显存低的可裁切为 512x512,显存高的可裁切为 768x768,可以通过美图秀秀等工具进行批量裁切,尺寸越大训练模型越吃显存,可能会出现报错学习卡死等问题。

2. 图像预处理

这一步的关键是对训练素材进行打标签,从而辅助 AI 学习。这里介绍两种打标签的方法:

方法一:把训练素材文件夹路径填写到 Stable Diffusion 训练模块中的图像预处理功能,勾选生成 DeepBooru,进行 tags 打标签。

在这里插入图片描述

方法二:安装 tagger 标签器插件,进行 tags 打标签。项目地址:https://github.com/toriato/stable-diffusion-webui-wd14-tagger
(该网站需科学上网,需要tagger 标签器插件的小伙伴可以看上方或文末扫描免费获取哦)

选择批量处理, 输入目录填写处理好的图片目录,设置标签文件输出目录,阈值设置为 0.3(生成尽可能多的标签来描述图片内容),开始打标签。

在这里插入图片描述

3. 打标优化

预处理生成 tags 打标文件后,就需要对文件中的标签再进行优化,一般有两种优化方法:

保留全部标签:

优势: 效率快省时省力的训练出模型,拟合度提高,且过拟合出现的情况是最低的。

缺陷: 风格会变化过大,tag调用比较困难,训练时需要把epoch提高时间成本会被拉长。

剔除部分特征标签

优势: 整合成少量的触发词tag后,调用方便,更精准还原角色特征。

缺陷: 容易导致过拟合,泛化性也会降低,如果标签删太多会导致生成的画面非常固化。

三、训练参数调节

至此,准备工作就完成了,可以开始准备正式训练LoRA了,这边使用秋叶大佬的Lora训练器SD-Trainer,选择新手训练模式。

在这里插入图片描述

进入新手模式后,需要选择训练LoRA使用的大模型:

底模文件路径,选择你要训练Lora使用的大模型,直接点击右侧的小文件夹选择即可。

在这里插入图片描述

训练数据集路径:在选择这一步之前,需要现在sd/lora-scripts-v1.7.3/train这个文件夹下建一个文件夹,在文件夹在里面建一个“数字_英文名”的文件夹,将之前打标好的图和标签一起复制到“数字_英文名”的文件中。

修改分辨率(之前数据集的尺寸是多少,这里就用多少)保存设置:保存模型的名称修改成你想要的名称,点击开始训练,就可以在终端看到它正在疯狂训练中…这个时间会比较久,慢慢等待就好。
在这里插入图片描述

这个过程会比较久,等待训练成功后会提示你训练成功。至此整个Lora的训练就完成了,你可以拿你训练好的Lora在WebUI上使用了。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2066539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

要做实施先做人

文/杨长春 作者简介:某IT公司项目总监,资深IT博主,专注于IT项目知识分享,著有《实战需求分析》、《软件需求分析实战》、《数字化管理软件实施》。 圣人曰,要做实施先做人。 作为一个软件项目的实施者,项目…

如何探索Sui DeFi生态

无论你是想进行tokens兑换、探索NFT世界,还是只是想借出资产以赚取奖励,Sui的DeFi生态都有适合你的内容。由于Sui原生的特性,这些apps能够应对DeFi中的常见挑战,例如通过DeepBook解决流动性问题。 一个健康的DeFi生态由几个关键应…

RFID光触发标签的特性、应用与传统RFID标签的差别

在当今数字化、智能化的时代浪潮中,RFID技术作为一种非接触式自动识别技术,已经在众多领域得到了广泛应用。而RFID光触发标签作为这一技术的创新发展,正以其独特的优势引领着行业的变革。 一、RFID光触发标签的特性 (一&#xf…

GitHub配置SSH:一步步教你如何轻松连接远程仓库

GitHub配置SSH:一步步教你如何轻松连接远程仓库 优点:具体步骤1.检查本地SSH密钥2. 生成 ssh key3. 获取并保存公钥内容4.添加公钥到GitHub账户5.验证SSH设置是否成功 SSH工作原理 主页传送门:📀 传送 优点: 提高安全…

Android13禁用Settings里面的Force Stop 強制停止按钮

总纲 android13 rom 开发总纲说明 目录 1.前言 2.问题分析 3.代码修改 4.编译 5.彩蛋 1.前言 禁用Settings里面的 強制停止按钮,禁用下面这个按钮 2.问题分析 根据文本找到对应的位置 搜索 Force stop 或者 強制停止,结果 ./packages/apps/Settings/res/values/s…

领夹麦克风哪个品牌好?揭秘选购无线麦克风时的五大隐藏风险

随着短视频行业的兴起,几乎人人都会拍些视频分享日常,更有一些人成为了专职的短视频内容的创作者。其实无论是专业的或是非专业的,我们在拍摄过程中,都会使用到一些辅助工具,比如摄影支架、补光灯、麦克风等&#xff0…

三种方法加密图纸!2024如何对CAD图纸进行加密?分享给你

“机事不密则害成,是以君子慎密而不出也。” 此言道出了保密的重要性,尤其是在今日数字化时代,图纸作为设计领域的核心资料,其安全性更是至关重要。 CAD图纸作为设计行业的基石,不仅承载着设计师的心血与智慧&#x…

超详细前端AI蔬菜水果生鲜识别应用优化之路

目录 背景原理技术选型技术栈 构造封装优化模型选择让模型加载更快张量释放 让indexddb更快将图片拆出单独建表特征向量降维 后续规划模型的下发更新模型的增强学习识别数据的上传和下发 背景 先定性,带AI识别的生鲜收银机早就上市了,目前学习的只能说是…

第48课 Scratch入门篇:仙女棒

仙女棒 故事背景: 夜空中,仙女棒划破天空,划过一条一条美丽的光线!! 程序原理: 自己动手设计一个动态变化的角色,实现美丽的仙女棒;仙女棒移动的轨迹,是通过背景的重叠而产生的,这里就是我们今天要学习的一个新知识:“图章”,图章跟我们平时盖章类似,就是复制一个…

C++概观:并发及实用工具(A Tour of C++: Concurrency and Utilities)

(说明:本章内容讲的主要是 c11 标准相对于之前的标准新增加的内容。本书作者是 c 之父 Bjarne Stroustrup,这位作者的行文风格就是站在c的设计者角度进行讲解,内容极其丰富,但并没有像传统编程书籍那样事无具细地罗列知…

无人机之云台的重要性

无人机云台在无人机技术中占据着举足轻重的地位,其重要性体现在多个方面: 首先,无人机云台是确保拍摄稳定性的关键组件。无人机在飞行过程中,尤其是遇到风力干扰或进行复杂飞行动作时,机身容易产生震动和晃动。而云台的…

Nginx简介和安装

一、 Nginx 简介 1、Nginx概述 Nginx (“engine x”) 是一个高性能的 HTTP 和反向代理服务器,特点是占有内存少,并发能 力强,事实上nginx的并发能力确实在同类型的网页服务器中表现较好,中国大陆使用nginx 网站用户有:百度、京东…

【Oracle点滴积累】解决ORA-29913和KUP-04095: preprocessor command的方法

广告位招租! 知识无价,人有情,无偿分享知识,希望本条信息对你有用! 今天和大家分享ORA-29913: error in executing ODCIEXTTABLEFETCH callout和KUP-04095: preprocessor command错误的解决方法,本文仅供参…

基于FastCAE平台开发的多物理场仿真软件开发分享

开发目的 基于FastCAE平台开发的多物理场仿真软件,是为了更有效地控制多物理场耦合问题中的重要特征参数,如流体与固体的相互作用力和温度分布,进行了耦合分析。通过该耦合分析,能够深入研究多物理场相互作用的特性,并…

车载T-Box通信稳定性弱网测试方案

作者介绍 T-Box(Telematics Box,车载终端)是一种安装在汽车上的控制器,用于实现车辆的远程监控、数据采集、通信和控制等功能。T-Box是连接汽车与外部世界的关键节点之一,在汽车网联中扮演着重要的角色。通过T-Box&…

css 将背景图片居中显示,并且显示全,不拉伸的效果实现,图片设置宽度,高度自适应,并且显示全。

1、背景自适应的css: .bg-tns {background-image: url(img/xxx.jpg);background-size: cover;background-position: center; /* 将图片居中显示 */min-height: calc(100vh-100px); /* 确保至少为视口高度 */} 这个布局是这样的: 这里的背景图的高度&am…

如何加密车载U盘?车载U盘加密软件推荐

在数字化浪潮中,U盘凭借其卓越的便携性,已然成为我们日常存储与传输数据的不可或缺之利器。然而,这一便利性的背后,数据安全问题也日益严峻,尤其是在需要将U盘连接至多样设备如车载音响、家庭影院系统及电视等场景下。…

毛利率承压连亏三年后一季度业绩暴增,百利天恒谋求A+H双上市

《港湾商业观察》施子夫 7月10日,四川百利天恒药业股份有限公司(以下简称,百利天恒)递表港交所主板,联席保荐机构高盛、摩根大通和中信证券。 此次递表港交所系百利天恒第二次谋求上市,若上市成功&#x…

高质量的课堂,就是让学生“玩起来”

声明:此篇为 ai123.cn 原创文章,转载请标明出处链接:https://ai123.cn/2202.html Hey体育老师们,🏀🏸️你们有没有发现现在的学生好像对体育课的热情不如以前了?是不是因为咱们的体育设施不够&a…

【算法】时间复杂度(快速排序,归并排序,堆排序)

1 归并排序先分解再合并 2 归并排序演示 3 时间复杂度(快速排序,归并排序,堆排序) 1 归并排序先分解再合并 2 归并排序演示 """ 归并排序(Merge Sort)是一种基于分治思想的排序算法。 它将一个大的问题递归地分解…