[ComfyUI]Flux:写真新篇章!字节PuLID率先开启一致性风格迁移,无损画手和优质画面保持

news2024/9/21 22:56:56

前言

Flux:PuLID率先开启F1写真新篇章

所有的AI设计工具,模型和插件,都已经整理好了,👇获取~在这里插入图片描述

Flux PuLID简介

在Flux出来后短时间内,社区生态反响和发展足够的迅猛快速。至今为止,社区LORA模型的涌现,Flux底膜数据集缺少问题(特别中文元素)逐步解决。ControlNet可控性方面已有Xlabs和InstantX的几款ControlNet(目前已可用,但画质还有待进一步提升)也在加速训练和完善中。近日字节Pulid团队,在之前SDXL的Pulid版本沉淀基础上,再次出手推出了:PuLID-FLUX-v0.9.0模型发布,为FLUX.1-dev提供了一个无需调整的身份ID一致性和定制化解决方案,风格一致性保持一直是在人物写真、连续多图漫画展示和视频等领域作为核心问题之一。

更多关于PuLID简介文件可以参见之前文章:[SD必备知识系列三:PuLID面部特征一致性风格保持与迁移,轻松搞定私人写真摄影,风格迁移模型评比] 。更多风格一致性系列文章:

  • • [SD必备知识系列四:面部特征保持哪家强?人物一致性定量评估]

  • [•] [SD必备知识系列二:InstantID面部特征一致性风格保持与迁移,轻松搞定私人写真摄影,SDWebUI使用指南]

  • [] [SD必备知识系列一:IPAdapterFaceID面部特征一致性保持与迁移,轻松搞定私人写真摄影,SDWebUI使用指南]

  • 在线体验地址:https://huggingface.co/spaces/yanze/PuLID-FLUX

  • github地址:https://github.com/ToTheBeginning/PuLID

PuLID-FLUX推理

PuLID-FLUX刚出来,当前还未完成ComfyUI插件的支持,目前可以统一本地WebUI方式或在线体验。在线体验地址:https://huggingface.co/spaces/yanze/PuLID-FLUX。

WebUI部署

使用如下命令可实现本地部署体验:

# 环境设置  
# clone PuLID repo  
git clone https://github.com/ToTheBeginning/PuLID.git  
cd PuLID  
# create conda env  
conda create --name pulid python=3.10  
# activate env  
conda activate pulid  
# Install dependent packages  
pip install -r requirements.txt  
  
# 授权模型下载  
!pip install -U huggingface_hub  
!huggingface-cli login  
  
# 服务启动  
# start service  
python app_flux.py

视觉结果展示

实用技巧

有两个关键参数需要仔细设置:

    1. 开始插入ID的时间步:此参数控制ID插入的时机。如果设置为0,则ID从第一个时间步开始被插入到DIT中。越早插入,ID的保真度越高,但可编辑性可能会降低。越晚插入,对ID的忠实度越低,但可编辑性会增加,对原始模型行为的干扰也会更小。对于生成逼真图像,建议将其设置为4。如果发现ID的相似性不够高,可以尝试相应降低此参数。对于生成风格化图像,建议将其设置为0-1。

    1. 真正的CFG比例:FLUX.1-dev是一个指导蒸馏模型。原来的CFG过程,需要双倍的推理步骤,被蒸馏成一个指导比例,从而通过指导比例调制DIT,用一半的推理步骤模拟真正的CFG过程。在文档中将这被称为假CFG。PuLID-FLUX模型可以在假CFG设置下进行测试,指导比例可以设置为常用的值,比如4。然而,该模型也支持使用真正的CFG进行推理。研发团队在下面的逼真场景中比较了使用真正CFG和假CFG的结果。

如上图所示,在ID保真度方面,使用假CFG在大多数情况下与真正的CFG相似,除了在少数情况下,真正的CFG实现了更高的ID相似性。在图像审美和面部自然性方面,假CFG表现更好。然而,通过仔细调整超参数,真正的CFG的性能可能进一步提高。研发团队建议对逼真场景使用假CFG。如果对ID的忠实度不满意,可以尝试切换到真正的CFG。此外,如下图所示,发团队还发现在风格化场景中使用假CFG有时会导致ID相似性降低和风格响应变差,所以如果在风格化场景中遇到这两个问题,请考虑切换到真正的CFG。

3. 研发团队还提到:从MLP结构转向了Transformer结构作为ID编码器。受到Flamingo的启发,每隔几个DIT块插入额外的交叉注意力模块,以使ID特征与DIT图像特征相互作用。在Pulid中使用的加速方法(如SDXL-Lightning)是一种可选的加速技巧,但不是训练PuLID不可或缺的。

Flux PuLID一致性风格体验

在本文中将使用笔者LIBLIB分享的基础Flux文生图出图Pulid WebUI一致性组件出图实现风格保持一致性对比。另外,在体验过程中发觉Pulid实现比同类其他ControlNet模型更加优秀,不会对画面产生影响,保持优质画面同时能够保持Flux优秀画手能力。在下面的演示示例中,Flux直出图将启用不同的LORA测试,但Pulid暂未集成到ComfyUI,因此笔者使用中并未启用LORA效果。

Flux 文生图工作流

关于Flux模型本地ComfyUI工作流体验参见之前文章:[FLUX[续篇]:12B参数23G最大开源文生图模型,Dev版直出惊艳美图欣赏].本文涉及ComfyUI工作流和模型均可在LIBLIBAI上下载或在线运行体验:

  • • FLUX.1哩布在线可运行-黑暗森林工作室:https://www.liblib.art/modelinfo/488cd9d58cd4421b9e8000373d7da123

  • • 工作流-Flux文|图生图+LORA+CN+提示反推一键切换工作流:https://www.liblib.art/modelinfo/782aacd70f604da39e83368c696a02a8

  • Flux Pulid在线体验:https://huggingface.co/spaces/yanze/PuLID-FLUX

输入风格图

(网图侵删)

01. AGI Flux

Flux版本使用了墨幽自拍模型,详情参见:[[ComfyUI]Flux:超赞网图风格,高p高糊的反向真实质感]

a chinese woman holding sign with glowing green text "AGI Flux", Bright sunshine
Flux

Flux Pulid

02. 豪车

Flux版本使用了FLUX–细节质感提升–FLUX DETAILER模型,详情参见:[[ComfyUI]Flux:太赞了!细节质感增强,人物降油光写实,富有电影光线,丰富画面元素]

This is a high-resolution portrait of a modern style, featuring a young woman., In this dynamic display scene, a model stands in front of a beautifully designed high-end sports car with a posture that is both elegant and powerful, perfectly complementing the vehicle she is showcasing. The sports car catches everyone's eye with its streamlined design and dazzling body colors, while the model adds life to the moment with her charm and confidence. The car model wears a simple and fashionable dress that shows her professional image without losing her feminine beauty. Her clothing echoes the colors and designs of the sports car, creating a harmonious yet engaging visual effect. Her hair, gently combed and falling over her shoulders, set off against her delicate makeup, showing her elegance and sophistication. Her eyes are firm and confident, as if telling the story behind the sports car and the speed and passion it represents. She leaned gently in front of the car, one hand touching the front, the other hand drooping. This pose not only shows her familiarity and closeness to the car, but also her professionalism and pursuit of perfect presentation.
Flux

Flux Pulid

03. 厨房

Flux版本使用了墨幽自拍模型和Missa_F.1_花境模型,详情参见:[[ComfyUI]Flux:超赞网图风格,高p高糊的反向真实质感]、[Flux:手机摄影般超真实,真假难辨!Missa花境超逼真写实的庭院艺术,身临其境视觉体验]

d577,hj, Kitchen, beautiful Chinese girl, virtuous, beautiful and generous, The video shows a woman cooking in the kitchen. She is wearing a white shirt and beige apron, and is concentrating on placing food on a wooden cutting board. Her hair is black and falls on her shoulders. A modern kitchen with stainless steel appliances and wooden cabinets can be seen in the background. Various ingredients and kitchenware are placed on the countertop, including green vegetables, sliced meat, and other condiments. The lighting is warm and soft, creating a comfortable atmosphere. The style of the entire video is simple and natural, focusing on the cooking process and the details of preparing food.
Flux

Flux Pulid

04. 阿凡达

Flux版本使用功了AWP-FLLORA模型,详情参见:[[ComfyUI]Flux:超逼真质感!AWPFL极致构图和细节,精致逼真的皮肤和质感,报脸全球TOP榜]

Photography, photo, realistic,Chinese girl,20-old-years, Craft an image inspired by the characters from the movie 'Avatar,' featuring a subject with the distinct blue complexion of the Na'vi. Their skin is detailed with intricate, bioluminescent patterns that glow against the dark backdrop, mirroring the mystical flora of Pandora. The character's pointed ears, a hallmark of the Na'vi, protrude elegantly, and they wear a necklace with beads that seem to absorb the surrounding light. The makeup is designed to resemble the iridescent qualities of the Na'vi, with blue glitter and sparkles enhancing the facial features. The background remains intentionally out of focus, drawing all attention to the subject's vibrant and fantasy-inspired appearance, as if they are a real inhabitant of the alien world depicted in the film.
Flux

Flux Pulid

这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,相信大家会对AIGC有着更深入、更系统的理解。

有需要的朋友,可以点击下方免费领取!

在这里插入图片描述

AIGC所有方向的学习路线思维导图

这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:
在这里插入图片描述

AIGC工具库

AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC
在这里插入图片描述

有需要的朋友,可以点击下方卡片免费领取!

在这里插入图片描述

精品AIGC学习书籍手册

书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。

在这里插入图片描述

AI绘画视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2134283.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣每日一题:236.二叉树的最近公共祖先

题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个节点 p、q,最近公共祖先表示为一个节点 x,满足 x 是 p、q 的祖先且 x 的深度尽可能大(一个节点也可以是它…

<<编码>> 第 11 章 逻辑门电路(Gates)--猫咪选择电路 示例电路

使用门电路的猫咪选择电路 info::操作说明 鼠标单击开关切换开合状态 primary::在线交互操作链接 https://cc.xiaogd.net/?startCircuitLinkhttps://book.xiaogd.net/code-hlchs-examples/assets/circuit/code-hlchs-ch11-16-cat-circuit-with-gate.txt 集成的猫咪选择电路 in…

html+css+js网页设计 旅游 厦门旅游网11个页面

htmlcssjs网页设计 旅游 厦门旅游网11个页面 网页作品代码简单,可使用任意HTML辑软件(如:Dreamweaver、HBuilder、Vscode 、Sublime 、Webstorm、Text 、Notepad 等任意html编辑软件进行运行及修改编辑等操作)。 获取源码 1&am…

WPF 手撸插件 八 依赖注入

本文内容大量参考了:https://www.cnblogs.com/Chary/p/11351457.html 而且这篇文章总结的非常好。 1、注意想使用Autofac,Autofac是一个轻量级、‌高性能的依赖注入(‌DI)‌框架,‌主要用于.NET应用程序的组件解耦和…

Halcon 深度学习 分类预处理

文章目录 read_dl_dataset_classification 产生一个深度学习数据集算子split_dl_dataset 将样本分为训练、验证和测试子集create_dl_preprocess_param 使用预处理参数创建字典preprocess_dl_dataset 预处理DLDataset中声明的整个数据集write_dict 写入字典文件find_dl_samples …

[网络]TCP/IP五层协议之应用层,传输层(1)

文章目录 一. 应用层二. 传输层端口号传输层的协议UDPTCPTCP报头TCP协议的核心机制 一. 应用层 应用层是和应用程序直接相关, 和程序猿打交道最多的一层 应用层协议, 里面描述的内容, 就是你写的程序, 通过网络具体按照啥样的形式来传输数据 不同的应用程序, 就可以用不同的应…

PHP 使用Spreadsheet写excel缓存导致内存不断增加

这里写自定义目录标题 问题描述问题解决 问题描述 新增了 Spreadsheet 用于写 excle 文件。 从网上查找一些实例后,封装成 createExcelFormData 函数如下: /*** brief 按照指定的键,将 array2(关联数组) 合并到 array1(关…

【C#】VS插件

翻译 目前推荐较多的 可以单词发言,目前还在开发阶段 TranslateIntoChinese - Visual Studio Marketplace 下载量最高的(推荐) Visual-Studio-Translator - Visual Studio Marketplace 支持翻译的版本较多,在 Visual Studio 代码编辑器中通过 Googl…

YOLOV8实现小目标检测

YOLOV8小目标检测 前言:: yolo版出现很多,基本大同小异 但是这些差异让我们考虑在实验中使用哪个版本会比较好! 在对小目标检测的过程中,yolov7相比yolov8性能更加好。 如果我们还是想使用yolov8,也是可以实…

大模型获利「攻略」浮出水面!ToC 蓬勃发展,ToB 蕴含奥秘

前言 自去年引发“百模大战”,到近日开启“行业价格战”,中国大模型行业迈入了新的发展阶段。在近期的智源大会上,众多专家分享了对大模型发展现状的见解。结合 IDC 近期发布的大模型实测报告以及 Scale AI 的“AI 就绪报告”,大…

热榜:24年秋招没有金九银十?地信应届生想就业,如何入场?

秋招的“金九银十”即将结束,你的秋招到哪一步了? 是早已收获满满offer,还是仍然在海投面试中,亦或者根本没开始呢? 2024年的就业环境到底如何?上周,“2024年的就业环境到底如何?”…

LeetCode(04) 最接近的三数之和 【双指针】

题目描述 给你一个长度为 n 的整数数组 nums 和 一个目标值 target。请你从 nums 中选出三个整数,使它们的和与 target 最接近。 返回这三个数的和。 假定每组输入只存在恰好一个解。 解题思路 首先进行数组排序,时间复杂度 O(nlogn);在…

花3000元自学AI大模型后,她薪水涨了20%

“我看到了一个充满无限可能的新世界”,在面试完AI产品经理这一岗位后,陈漫在社交平台上如此描述自己的感受。 AGI大模型浪潮席卷全球,技术革新越是凶猛,人们的失业焦虑便越加强烈。为了应对AI带来的冲击,有些人决定“…

c++—多态【万字文章】

目录 C—多态1.多态的概念2.多态的定义及实现2.1多态的构成条件2.2虚函数的重写2.2.1虚函数重写的两个例外:2.2.1.1协变2.2.1.2析构函数的重写 2.3 c11的override和final2.3.1final2.3.2override 2.4 重载、重写、重定义的对比 3.抽象类3.1抽象类的概念3.2接口继承和…

组件上的v-model(数据传递),props验证,自定义事件,计算属性

一.props验证 在封装组件时对外界传递过来的props数据进行合法性校验&#xff0c;从而防止数据不合法问题。 1.基础类型检查 String,Number,Boolean,Array,Object,Date,Function,Symbol 2.多个可能的类型 3.必须项校验 4.属性默认值 5.自定义验证函数 <template>&…

CAD2020安装方法

文章目录 下载安装包打开压缩包打开文件夹打开CAD2020文件夹双击运行Setup.exe点击安装选择我接受 点击下一步路径默认点击安装等待加载完成安装完成点击立即启动点击OK点击输入序列号点击我同意点击激活输入序列号和 产品钥密点击下一步选择我具有 Autodesk 提供的激活码以管理…

【北京迅为】《STM32MP157开发板使用手册》- 第二十八章Cortex-M4外部中断实验

iTOP-STM32MP157开发板采用ST推出的双核cortex-A7单核cortex-M4异构处理器&#xff0c;既可用Linux、又可以用于STM32单片机开发。开发板采用核心板底板结构&#xff0c;主频650M、1G内存、8G存储&#xff0c;核心板采用工业级板对板连接器&#xff0c;高可靠&#xff0c;牢固耐…

SRT3D: A Sparse Region-Based 3D Object Tracking Approach for the Real World

基于区域的方法在基于模型的单目3D跟踪无纹理物体的复杂场景中变得越来越流行。然而&#xff0c;尽管它们能够实现最先进的结果&#xff0c;大多数方法的计算开销很大&#xff0c;需要大量资源来实时运行。在下文中&#xff0c;我们基于之前的工作&#xff0c;开发了SRT3D&…

一、轻松部署的大模型开发平台dify.ai

一、轻松部署的大模型开发平台dify.ai 今天学习了大模型&#xff0c;顺便介绍的是一个名为dify.ai的神奇平台&#xff0c;它能让你轻松部署和使用大模型&#xff0c;即使你是编程小白也不用担心。 官网&#xff1a;https://dify.ai/zh 什么是大模型&#xff1f; 首先&#…

C++ nullptr 和NULL的区别

个人主页&#xff1a;Jason_from_China-CSDN博客 所属栏目&#xff1a;C系统性学习_Jason_from_China的博客-CSDN博客 概念概述&#xff1a; 在C中&#xff0c;nullptr 和 NULL 都是用来表示空指针&#xff0c;但它们之间有一些重要的区别&#xff1a; nullptr和NULL之间的区分…