终于不用为GPU算力发愁了,FLUX LoRA训练一键启动!(附模型)

news2024/9/29 19:23:10

FLUX 是一个开源的全新的图像生成器,可以生成逼真的超现实图像,人们称它为 Midjourney 的终结者,下一代 Stable Diffusion 的替代品。

FLUX究竟强大到什么程度?外网到现在为止,都还有抵制它的声音。

Google DeepMind 团队甚至在本月还发布了一篇研究人们如何滥用生成式 AI 的论文。令人震惊的是,所谓极具亲密性的图像、小黄片,这都不是首要的问题,真正危险的地方在于假冒他人身份。

而这,正是 FLUX 非常擅长的地方。

那么这篇文章将会带你手把手从零开始运行这个“危险”的 AI 工具,如何用自定义的数据集微调模型,训练想要的 Lora,并将结果转换成视频,生成你想要的内容。

需要体验的小伙伴直接扫码可以获取

打开这里的 API 地址,就能看到 FLUX 的服务了。打开 API,我们可以选择加载哪个工作流,如果想跑黑神话悟空的,那就选择 Wukong,然后点击添加提示词队列就能运行了。

绿的框框代表运行到的位置,第一次运行会慢一些,因为需要加载模型,直到运行到最后一个节点,就能看到预览图像了。第二次运行会快很多,因为涉及到的模型已经加载到了显存中。

在这里插入图片描述

TED 真人演讲工作流运行方法也一样。另外如果想要在图片中生成文本内容,可以参考 3mm4w 这个工作流。

想要训练 Lora,在项目页面打开工作空间。

在工作目录里找到train.sh这个文件。

开启命令行窗口,使用sh train.sh运行文件。

稍等片刻后,可以看到加载出的public URL,进入即可看到 FLUX Lora 的 WebUI 页面。

我们还是以川普为例,先输入名字:

上传十张他的图片,耐心等待一会。这里的图片尽量是人物的正脸照片,人脸比例最好大些,且分辨率要尽可能的高。等到页面变成这样,说明上传成功了。

这里我们需要写每个图片对应的文本表述,比如穿着西装系着蓝色领带的帅气大男孩。注意,得用英文。如果嫌麻烦,这里也有 AI 能够一键生成描述。只需要点击一下,稍等片刻,每张图片对应的文本描述就做好了。

对于 AI 描述不准确的地方,可以手动修改。

在这里插入图片描述

最后,点击开始训练的按钮。再等待几分钟,就能看到这个训练的进度条,一共训练 1000 轮次,可以通过进度条查看现在训练到了第几轮。如果你使用的是 RTX4090,大概 40 分钟能够训练完一个 Lora 模型。

当出现如图的字样时,说明训练完成了。

此时在 ai-toolkit 目录下的 output 文件夹里能看到训练好的模型,在 samples 里还有生成的图片,这个效果不错的话,就表明模型训练完成了。

训练好模型之后,我们关掉这个训练服务,释放 GPU 资源,要不然会一直占用显存,然后重启 ComfyUI,具体步骤:

1、运行「Ctrl+C」停掉训练服务

2、运行「sh copy.sh」命令

3、运行「sh dependencies.sh」命令

4、等待 1 分钟之后,重新打开 API 地址即可

最后,在 LoRA 加载器里选择新训练好的模型,即可使用了:

本文对应的视频教学:

https://www.bilibili.com/video/BV1xSpKeVEeM

FLUX LoRA 训练工具:

https://github.com/ostris/ai-toolkit

OpenBayes 平台专属注册链接:

https://openbayes.com/console/signup?r=JackCuiAI_R3mZ

本地搭建流程

最后,讲解下本地搭建流程:

环境要求:

  • Python,版本大于3.10

  • Nvidia GPU,显存大于 12GB

  • Python 虚拟环境(venv)

  • Git

安装步骤

如果你是Windows系统,可以参考以下流程:

git clone https://github.com/ostris/ai-toolkit.git #克隆项目仓库   cd ai-toolkit #进入项目目录   git submodule update --init --recursive #更新并初始化子模块   python -m venv venv #创建 Python 虚拟环境   .\venv\Scripts\activate #激活虚拟环境   pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121 #安装 PyTorch(根据CUDA版本选择)   pip install -r requirements.txt #安装其他依赖   

如果你是Linux系统,可以参考以下流程:

git clone https://github.com/ostris/ai-toolkit.git #克隆项目仓库   cd ai-toolkit #进入项目目录   git submodule update --init --recursive #更新并初始化子模块   python3 -m venv venv #创建 Python 虚拟环境   source venv/bin/activate #激活虚拟环境   pip3 install torch #安装 PyTorch   pip3 install -r requirements.txt #安装其他依赖   

根据以上步骤,你已经可以在本地搭建好一个运行 FLUX 的环境了!当然,想要使用的话,在安装完 ai-toolkit 后,你还需要一些操作,以下是本地通过 Gradio UI 进行训练的步骤:

  • 进入项目目录 cd ai-toolkit

  • 登录 Hugging Face,使用 write 权限的 Token huggingface-cli login

  • 启动自定义 UI 进行训练 python flux_train_ui.py

该 UI 会让你上传图片,给图片添加标题,并训练和发布你的 LoRA 图像模型。

更多的本机配置方法及细节,可以参考官方 Github 的文档。

https://github.com/ostris/ai-toolkit

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2167058.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

excel快速入门(二)

Excel的概念说明 文章目录 Excel的概念说明常见术语说明单元格/单元格区域活动单元格/单元格区域行或列单元格引用相对引用绝对引用混合引用 Excel的常见格式说明单元格格式数字格式 Excel 工作表编辑鼠标指针介绍1.白色十字状2.单向黑色箭头状3.双向单竖线箭头状4.双向双竖线箭…

Dubbo框架面试题

1.什么是Dubbo? Dubbo是基于Java的高性能轻量级的RPC分布式服务框架,现已成为 Apache 基金会孵化项目。 2.为什么要使用Dubbo? 随着互联网的快速发展,Web应用程序的规模不断扩大,分布式服务体系结构和流计算体系结构势在必行。 dubbo的…

对博客系统进行自动化测试

博客系统代码:spring-blog taotao/Studying JavaEE Advanced - 码云 - 开源中国 (gitee.com) 自动化脚本代码:BlogAutoTest taotao/Studying JavaEE Advanced - 码云 - 开源中国 (gitee.com) 上线项目地址:博客登陆页 目录 一、博客系统项…

【Spring】lombok、dbUtil插件应用

一、lombok插件 1. 功能:对实体类自动,动态生成get、set方法,无参、有参构造..... 2. 步骤: (1)idea安装插件(只做一次) (2)添加坐标 (3)编写注解 NoArgsCo…

Python面向对象编程:类和对象①

文章目录 一、什么是面向对象编程1.1 面向对象编程的基本概念1.2 Python中的类和对象 二、定义类和创建对象2.1 定义类2.2 创建对象2.3 __init__方法2.4 self参数 三、类的属性和方法3.1 类的属性3.1.1 实例属性3.1.2 类属性 3.2 类的方法3.2.1 实例方法3.2.2 类方法3.2.3 静态…

Redis缓存技术 基础第二篇(Redis的Java客户端)

文章目录 一、Redis的Java客户端二、Jedis快速入门三、Jedis连接池四、SpringDataRedis快速入门五、SpringDataRedis优化 一、Redis的Java客户端 在Redis官网中提供了各种语言的客户端,地址:https://redis.io/clients 而关于java的功能模块分为以下几种…

数据的表示和存储 第4讲 C语言中的浮点数的编码表示

作者简介:互联网行业 算法研发工程师 本文适合阅读者:对C语言浮点数有一些疑惑的同学~ C语言的基本数据类型中,除了整数之外,还包含浮点数。 浮点数在机器中是如何表示的呢? 科学计数法,我们比较熟悉,任何十进制的数,都可以表示为:一个小数✖10的多少次方。 尾数的…

FIOT/浙江信达可恩消防股份有限公司25周年庆典隆重召开

一年一度,有着智慧消防物联网发展“行业风向标”的FIOT2024中国消防物联网大会,9月10日在杭州拉开帷幕!大会以丰富的流程设置,全新的会议视角为您呈现一场新思想、有干货、有价值的行业盛会。 9月10号下午,浙江信达可…

Spring MVC中实现一个文件上传和下载功能

说到文件上传和下载,相信每个开发者都有或多或少的接触过文件上传的功能吧,文件上传和下载是我们在学习计算机网络应用常见的一个功能,主要涉及到用户和服务器之间的数据传输。 我们来对文件上传和下载功能的进行相关概述吧! 文…

MySQL事务、索引、数据恢复和备份

MySQL事务、索引、数据恢复和备份 1.MySQL的事务处理 事务就是将一组SQL语句放在同一批次内去执行 如果一个SQL语句出错,则该批次内的所有SQL都将被取消执行 MySQL的事务实现方法 : SET AUTOCOMMIT 使用SET语句来改变自动提交模式 SET AUTOCOMMIT 0; # 关…

测试干货 | 一文读懂工业CT检测技术—无损检测手段

撰文排版:刘佳 审核指导:肖俊灵 “研路漫漫,伴你同行” 本文较长,建议先收藏后随时查看!以后我们将更新更多此类硬核科普,欢迎关注! 工业CT,即工业计算机断层成像技术,作…

舞台灯细绿激光模组安装方式

在追求视觉盛宴的现代舞台艺术中,细绿激光模组以其独特的色彩、高亮度和精准性,成为了不可或缺的创意元素。舞台灯细绿激光模组不仅能营造出梦幻般的氛围,还能通过精准的光束定位,引领观众视线,增强表演的层次感和沉浸…

大浪淘沙下的金融智变:AGI入场,巨头们已经吃到了第一波红利

长久以来,金融行业始终是全球 AI 技术投入的最大领域,其中银行这一细分市场的 AI 投资金额就占据了全球 AI 市场的超过 10%,无疑成为了 AI 实践的先锋。在国内市场,这一趋势同样显著且强劲。2024 年上半年的大模型招标统计数据显示…

《论软件架构建模技术与应用》写作框架,软考高级系统架构设计师

论文真题 软件架构风格是描述一类特定应用领域中系统组织方式的惯用模式,反映了领域中诸多系统所共有的结构特征和语义特征,并指导如何将各个模块和子系统有效组织成一个完整的系统。分层架构是一种常见的软件架构风格,能够有效简化设计&…

世优科技“1+2+N”,助力湖南旅发大会“火出圈”

刚刚,第三届湖南旅游发展大会在衡阳盛大启幕,现场,世优科技团队通过“12N”模式(即:1个IP复活,2项技术突破,N个场景应用),助力衡阳市IP“火出圈”3D形象惊艳亮相&#xf…

支付宝开放平台-开发者社区——AI 日报「9 月 26 日」

1 突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿 新智元|阅读原文 就在刚刚,创业成功的27岁亿万富翁Alexandr Wang宣布——Scale AI的年化收入,几乎达到了10亿美元!Scale AI主攻的就是如今AI模型…

BACnet协议-(基于ISO 8802-3 UDP)(2)

1、模拟设备的工具界面如下: 2、使用yet another bacnet explorer 用作服务,用于发现设备,界面如下: 3、通过wireshark 抓包如下: (1)、整体包如下: (2)、m…

AI制作30秒疗愈视频,单月变现9万+,这才是顶流赛道!

用AI做短视频,赚流量分成,一个月竟然能月赚9万元,毫不夸张的说已经能够媲美二线城市普通上班族全年收入! 在国外社交平台YouTube油管上的账号,仅仅只用一段30秒的风景空镜头,配上一段纯文字的情感鸡汤&…

【GUI设计】基于图像分割和边缘算法的GUI系统(7),matlab实现

博主简介: 如需获取设计的完整源代码或者有matlab图像代码项目需求/合作,可联系主页个人简介提供的联系方式或者文末的二维码。 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 本次案例是基于图像分割和边缘算法的GUI系统…

[Redis][Zset]详细讲解

目录 0.前言1.常见命令1.ZADD2.ZCARD3.ZCOUNT4.ZRANGE5.ZREVRANGE6.ZRANGEBYSCORE7.ZPOPMAX8.BZPOPMAX9.ZPOPMIN10.BZPOPMIN11.ZRANK12.ZREVRANK13.ZSCORE14.ZREM15.ZREMRANGEBYRANK16.ZREMRANGEBYSCORE17.ZINCRBY 2.集合间操作1.有序集合的交集操作2.ZINTERSTORE3.有序集合的并…