FLUX.1模型是什么?
FLUX模型是一个开源的AI图像生成模型,由黑森林工作室研发。
堪比sd3以及Midjourney-v6
背景/backdrop
黑森林工作室(Black Forest Labs)由前Stability AI核心成员团队成立,专注于开发高级生成式AI模型。以下是该工作室的一些背景信息:
创始团队:
• 艾里克·斯通(Eric Stone):在深度学习和模型压缩方面具有丰富经验,致力于提升模型的计算效率和生成质量 。
• 卡拉·李(Cara Lee):负责模型的工程实现和优化,确保模型在不同硬件平台上的高效运行 。
• 雷恩·托马斯(Ryan Thomas):专注于大规模数据处理和模型训练管道的开发,提升了模型的训练速度和稳定性 。
技术贡献:
• 团队成员曾参与开发过多个知名的AI项目,包括VQGAN、Latent Diffusion和Stable Diffusion等 。这些项目在生成式AI领域具有重要影响力,为FLUX模型的开发奠定了坚实的基础。
融资与支持:
• 黑森林工作室获得了由安德森·霍洛维茨(Andreessen Horowitz)领投的3100万美元融资,其他投资者包括布伦丹·伊里比(Brendan Iribe)、迈克尔·奥维茨(Michael Ovitz)、加里·谭(Garry Tan)、提莫·艾拉(Timo Aila)和弗拉德伦·科尔顿(Vladlen Koltun)等知名专家 。
模型发布:
• FLUX模型是他们最新的开源图像生成模型,拥有120亿参数,能够处理复杂的图像生成任务,同时保持较高的效率 。FLUX模型的权重和推理代码已在HuggingFace和GitHub上公开,方便开发者使用和二次开发 。
FLUX.1功能特点
强大的文本理解和生成能力:FLUX模型能够精确地理解和执行用户的文本提示,生成图像时的提示跟随能力较强。这意味着用户可以更准确地通过文字描述生成所需的图像 。
高质量图像输出:该模型生成的图像细节丰富,色彩鲜明,整体质量较高。尤其是在生成手指和手部细节方面,FLUX.1取得了显著的进步,解决了许多AI模型在这方面常见的错误 。
多样化的图像风格和输出:FLUX模型可以生成多种风格的图像,从写实风格到超现实主义,再到简约卡通风格,满足用户的各种创意需求 。
开源和社区支持:FLUX模型的权重和推理代码在HuggingFace和GitHub上公开,便于开发者使用和二次开发。此外,用户还可以通过Replicate和fal.ai等平台在线体验FLUX模型的功能
FLUX.1模型的3个版本
pro专业版
性能最佳,但只能通过API调用
dev开发版
由pro版提炼而来,生成质量相似,略差一点
schnell快速版
比dev更差,但速度更快
FLUX.1本地部署条件
最新版comfyUI
电脑配置(16g显存以上+32g内存以上)
FLUX.1模型文件下载
hugginface
dev版:https://huggingface.co/black-forest-labs/FLUX.1-dev/tree/main
schnell版:https://huggingface.co/black-forest-labs/FLUX.1-schnell
github
https://github.com/black-forest-labs/flux
打包好的文件
链接: https://pan.baidu.com/s/1BSpw63l4_y9YtlKXXK1JJw?pwd=fhsb 提取码: fhsb
FLUX.1模型本地部署
将下载好的文件放入对应的根目录
模型本体文件(flux1-dev.sft)➡️ models的unet文件夹
vae文件(flux-ae.sft)➡️ vae文件夹
clip文件(带clip的与带t5xxl的文件)➡️ clip文件夹
运行FLUX.1模型
打开comfyUI加载对应的工作流(FLUX.json)
unet、clip、vae都选择flux对应的,
如果我们用的是完整版的dev模型,这个权重模型就用默认的,
clip那些用哪个其实也相差无几。
参数方面先用默认就好,然后我们是不需要写负面提示词设置cfg的
跑图评测
整个跑图的时长还是很长的,一张图片3分多钟,我现在这个配置是32g内存+16g显存,跑图过程内存是直接拉满的100%,生成的效果我觉得还是很棒的,真比sd3medium强,但细节还是稍差Midjourney一点,仅此而已,配置如果足够好的话用来替代mj倒也行,特别是后面开始适配controlnet跟IPadapter,但我估计4090ti都不太够