哦吼,新模型?文生图领域的新模型FLUX.1(附模型下载网盘地址和详细使用方法)

news2024/11/15 11:07:09

🎡背景

Black Forest Labs 是由 Stable Diffusion 原班人马成立的公司,致力于研发优质的多模态模型并开源。该公司由多位前 Stability AI 研究员组成,包括 Robin Rombach 在内的团队成员,他们在图像和视频生成领域有着杰出的贡献,包括 VQGAN、Latent Diffusion 以及 Stable Diffusion 模型等 。

2024年8月1号,也就是前天,Black Forest Labs 推出了名为 FLUX.1 的开源 AI 图像生成模型系列,包含三个变体:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。这些模型在视觉质量、提示词遵循能力、尺寸/宽高比可变性、排版和输出多样性等方面,都超越了当前市场上的多个流行模型,如 Midjourney v6.0、DALL·E 3 (HD) 和 Stable Diffusion 3-Ultra 3。

(当然,号称超越Midjourney各个版本的模型有很多,实际效果大家懂的都懂,这次实际效果会如何呢?待会儿我们测试看看)

FLUX.1 模型采用了多模态架构和并行扩散 Transformer 结构,通过流匹配方法改进了传统的扩散模型,引入了旋转位置嵌入技术和并行注意力层,以增强模型对图像中不同位置特征的识别能力和捕捉长距离依赖关系的能力 。

此外,Black Forest Labs 已经完成了 3100 万美元(约合人民币 2.25 亿元)的种子轮融资,并预告将发布 SOTA 视频模型,该公司在视频生成领域的潜力巨大,可能会成为该领域的一匹黑马。

如果FLUX.1质量的确不错的话,那么SOTA视频模型也就非常值得期待了。

🎠看跑分

大模型大家都喜欢跑个分,我们简单看下官方给出的跑分和效果图:

从跑分上乍一看,FLUX.1比前一段时间Stability发布的SD3-Midium强了小一半的样子,实际上仔细一看,这个跑分左侧的值是从900开始到1060,所以如果sd3-midium是990分的话,Flux.1的三个版本大概是1020~1055左右,所以强了30分~65分,貌似...还好。

不得不说,这些评测机构是懂心理暗示的。

让我想起来SD3发布的时候发布的那个奇葩的评测角度:

那么,啥是ELO Score呢?稍微查了下资料:

ELO评分系统是由物理学家阿帕德·埃洛(Arpad Elo)创建的,最初用于评估国际象棋选手的相对实力。ELO系统基于数学模型,通过选手之间的比赛结果来调整各自的评分,从而反映出他们的实力水平。ELO评分系统后来也被广泛应用于其他各种竞技领域,如围棋、足球、电子竞技、大模型评估等。

计算 Elo Score 的过程涉及到每个对局的结果和参与对局的模型的当前评分。胜利会导致评分提高,失败则会导致评分下降。评分的变化量取决于对手的相对水平,即对手评分越高,胜利带来的评分增加越多,反之亦然。这种评估方法不仅考虑到了任务的结果,还考虑到了对手的实力,使得模型之间的相对性能更具可解释性和比较性。

简单理解的话:这是个相对评分,所以简单看看就好

看下官方的样图:

 一黑板的文字这张图是有点厉害了,别的模型还没见过...不过待会儿我们测试看看。

🥽模型下载与使用方法

首先是网盘下载地址:点击下载

打开你会看到这么几个文件:

下载到本地后,模型放置位置如下:

1、将t5xxl_fp8_e4m3fn.safetensors、t5xxl_fp16.safetensors和clip_l.safetensors放在models\clip文件夹下:

2、将flux1-dev.sft和flux1-schnell.sft两个FLUX1模型本体放在models\unet文件夹下,可以新建二级目录,我这里放在了unet下FLUX1目录下,这样unet目录下模型多了比较好区分, (直接放在unet文件夹下也可以);

3、将ae.sft放在models/vae目录下;

完成配置之后,下载文件中的这两个图片是两个工作流,分别用于测试flux.dev和flux.schnell的,原图拖拽到comfyui中即可查看,大家自行测试就好。

注:

1、在使用的过程中,如果你的内存(注意是内存,不是显存)不到32G的话,t5xxl模型可以使用t5xxl_fp8_e4m3fn.safetensors,但是如果你的内存超过32G,那么建议使用t5xxl_fp16.safetensors,效果会更好;

2、如果提示内存不足,可以在“Load Diffusion Model”中的weight_dtype中选择fp8,可以减少一半内存使用量,但是相应的,生成质量会下降一丢丢;

对应的comfyui作者原文:

If you don’t have t5xxl_fp16.safetensors or clip_l.safetensors already in your ComfyUI/models/clip/ directory you can find them on: this link. You can use t5xxl_fp8_e4m3fn.safetensors instead for lower memory usage but the fp16 one is recommended if you have more than 32GB ram.

The VAE can be found here and should go in your ComfyUI/models/vae/ folder.

Tips if you are running out of memory:

You can set the weight_dtype in the “Load Diffusion Model” node to fp8 which will lower the memory usage by half but might reduce quality a tiny bit.

🧸生成速度参考

首先是生成速度方面,flux_dev模型,默认的20步参数生成,在4090显卡,64G内存的机器上,大概需要30~40秒生成一张1024x1024的图像;

而蒸馏模型flux_schnell模型,默认只需要4步,大概需要15秒生成一张1024x1024的图像;

🍩生成质量参考

下一篇,我们对比下开源版本中效果最好的一个搭配:flux1_dev模型+t5xxl_fp16+clip_l+20步,对比midjourney V6,选几个典型场景,看下生成效果到底如何;

记得关注我哦,暂定明天更新~

✨写在最后

如果对comfyui还不熟悉的话,最近面向ComfyUI的新手,开了一门图文课程,现在已经更新完成了,如果大家在学习过程中遇到什么问题,也可以直接文章下留言,会持续更新相关答疑内容哈。欢迎订阅哦~

https://blog.csdn.net/jumengxiaoketang/category_12683612.html

​​

感谢大家的支持~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1975901.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

取消订单业务

文章目录 概要整体架构流程技术细节小结 概要 取消订单是电子商务、外卖平台、在线零售等多个行业中常见的业务需求之一。这项功能允许消费者或商家取消已下的订单,通常是因为各种原因(如商品缺货、配送问题、支付问题等)。 需求分析以及接…

【课程总结】day19(中):Transformer架构及注意力机制了解

前言 本章内容,我们将从注意力的基础概念入手,结合Transformer架构,由宏观理解其运行流程,然后逐步深入了解多头注意力、多头掩码注意力、融合注意力等概念及作用。 注意力机制(Attension) 背景 深度学…

如何在立创EDA的PCB电路板导入logo图案

1、首先制作好logo图案,一般为公司logo图标,如下图 2、打开立创EDA的PCB文件,如下图 3、将PCB的图层切换到丝印层: 4、然后选择EDA菜单栏的放置---图片: 5、进入后点击选择图片,将logo图片导入,…

人生低谷来撸C#--022 winfrom 和WPF

1、简单介绍 标题其实是写错了,是winform,不是winfrom,如果再准确点,应该是 WinForms(复数形式),它代表的是 Windows Forms 技术,用于在 .NET Framework 中创建桌面应用程序的用户界面。在 Vis…

数据结构——八大排序

一.排序的概念和其应用 1.1排序的概念 排序:排列或排序是将一组数据按照一定的规则或顺序重新组织的过程,数据既可以被组织成递增顺序(升序),或者递减顺序(降序)。稳定性:假定在待…

Prometheus监控的搭建(ansible安装——超详细)

目录 1.各组件功能介绍 2.安装批量部署工具ansbile 3.执行服务器 4.各服务器间做免密 5.下载安装包 5.1Prometheus的下载的下载地址 5.2exporter的下载地址 5.3grafana的下载地址 6.编辑ansible需要的配置文件 7.编写ansible文件 8.验证执行结果 今天和大家分享一下…

网站在线查询工具箱源码分享

终极网络工具系统”(SAAS),是一款功能强大的PHP脚本在线查询工具。本版集合了超过470种快速且易用的Web工具,为日常任务处理和开发人员提供了极大的便利。作为一款综合性的网络工具系统,66toolkit不仅满足了用户的基本网络需求,更…

Java面试题 -- 为什么重写equals就一定要重写hashcode方法

在回答这个问题之前我们先要了解equals与hascode方法的本质是做什么的 1. equals方法 public boolean equals(Object obj) {return (this obj);}我们可以看到equals在不重写的情况下是使用判断地址值是否相同 所以默认的 equals 的逻辑就是判断的双方是否引用了一个对象&am…

【EI会议征稿】第四届高性能计算与通信工程国际学术会议(HPCCE 2024)

出版出版 【SPIE出版 | 往届会后3个月内完成EI检索】 第四届高性能计算与通信工程国际学术会议(HPCCE 2024) 2024 4th International Conference on High Performance Computing and Communication 第四届高性能计算与通信工程国际学术会议(HPCCE 2024&#xf…

使用Chainlit接入通义千问快速实现一个自然语言转sql语言的智能体

文本到 SQL 让我们构建一个简单的应用程序,帮助用户使用自然语言创建 SQL 查询。 最终结果预览 ​ 先决条件 此示例有额外的依赖项。你可以使用以下命令安装它们: pip install chainlit openai​ 导入 应用程序 from openai import AsyncOpenAI…

扩展------零拷贝技术(Mmap,SendFile)

什么是零拷贝 零拷贝(Zero-Copy)是一种计算机操作技术,旨在减少数据在内存之间的拷贝次数,以提高数据传输的效率和性能。 传统的IO模式: 模拟网络传输数据运行过程: 用户态read()发起系统调用&#xff0c…

Flink中上游DataStream到下游DataStream的内置分区策略及自定义分区策略

目录 全局分区器GlobalPartitioner 广播分区器BroadcastPartitioner 哈希分区器BinaryHashPartitioner 轮询分区器RebalancePartitioner 重缩放分区器RescalePartitioner 随机分区器ShufflePartitioner 转发分区器ForwardPartitioner 键组分区器KeyGroupStreamPartitio…

力扣SQL50 第二高的薪水 ifnull() 分页

Problem: 176. 第二高的薪水 👨‍🏫 参考题解 Code select ifNull((select distinct salaryfrom employeeorder by salary desclimit 1,1),null) as SecondHighestSalary

【Python数据结构与算法】分治----汉诺塔问题

题目:汉诺塔问题 描述 古代有一个梵塔,塔内有三个座A、B、C,A座上有n个盘子,盘子大小不等,大的在下,小的在上。三个座都可以用来放盘子。有一个和尚想把这n个盘子从A座移到C座,但每次只能允许移…

AWS SES 认证策略设置全攻略:轻松掌握简单步骤!

最近,我有机会设置 Amazon Simple Email Service(以下简称:SES)的认证策略,所以这次写下来作为备忘。 前言 Amazon Simple Email Service(SES)是一项通过 API 端点或 SMTP 接口进行邮件发送的服…

MySQL:VIEW视图

概述 MySQL 视图(View)是一种虚拟存在的表,同真实表一样,视图也由列和行构成,但视图并不实际存在于数据库中。行和列的数据来自于定义视图的查询中所使用的表,并且是在使用视图时动态生成的。 数据库中只…

从Notion Sites的推出,分析SaaS服务发展浪潮

引言 前段时间,Notion发布了新功能“Notion Sites”,允许用户直接在Notion中编辑页面并将其作为网站发布。其实在此之前,一些SaaS(软件即服务)软件也具有该功能,比如HelpLook AI知识库、Squarespace、Wix等…

buu做题(13)

[BSidesCF 2019]Kookie 给了一个账户: cookie / monster 根据提示, 我们需要以 admin 的身份登录 抓个包 , 可以发现一个奇怪的地方, Set-Cookie: usernamecookie; 以这样的方式确定登录的用户, 尝试伪造一下 直接 加上一个请求头: Cookie:usernameadmin 就可以得到flag 也…

卡码网--数组篇(二分法)

系列文章目录 文章目录 系列文章目录前言数组二分查找 前言 详情看:https://programmercarl.com/ 总结知识点用于复习 数组 概念: 数组是存放在连续内存空间上的相同类型数据的集合。 数组可以方便的通过下标索引的方式获取到下标对应的数据。 特点:…

图欧资源站与AI站23年5月~24年5月一年更新日志大汇总!

Hello,大家好,我是图欧君,很久没上CSDN啦,来跟大家一口气盘点一下我和我们团队从2023年5月到2024年5月以来都干了些什么大事吧~本文超长!流量预警!建议在WIFI环境下观看! 别眨眼,三&…