精准控图工具 Concept Sliders:超好用的 控制 Lora 适配器

news2024/11/13 6:31:44

screenshot-20240911-140517.png

Concept Sliders

你有没有遇到这样的情况?你花费大量时间制作提示和寻找种子,以使用文本到图像模型生成所需的图像。但是,你还需要对生成图像中的属性强度(如眼睛大小或照明)进行更细致、更精细的控制。修改提示会破坏整体结构。艺术家需要保持连贯性的表达控制。你该怎么办呢?

如果你也有这样的困扰,不妨来试试 Concept Sliders。它是应用于预训练模型之上的即插即用低秩适配器。通过使用简单的文本描述或一小组配对图像,然后训练概念滑块来表示所需属性的方向。在生成时,这些滑块可用于控制图像中概念的强度,从而实现细微的调整。

Concept Sliders

main.png

Concept Sliders 实用效果

Concept Sliders 的概念滑块可以在文本提示、图像对或 StyleGAN 样式空间神经元上进行训练,以识别扩散模型中的目标概念方向,以实现精确的属性控制。

创作团队提出了两种类型的训练:单独使用文本提示和使用图像训练。对于难以用文本描述的概念或模型无法理解的概念,他们更建议使用图像对训练。这里我们讨论一下文本概念滑块的训练。

文本训练原理

image.png

文本训练原理

这个想法很简单但很强大:预训练模型 Pθ*(x) 有一些预先存在的概率分布来生成概念 t,因此我们的目标是通过形成一个新的模型 Pθ(x) 来学习模型层的一些低秩更新,该模型通过降低属性 c- 的概率来重塑其分布并根据原始预训练模型,当以 T 为条件时,提高图像中属性 c+ 的概率。

image.png

文本训练原理

这与基于组合能量的模型背后的动机相似。在扩散中,它导致了一个简单的微调方案,该方案通过减去一个组件并添加一个以目标概念为条件的组件来修改噪声预测模型。

该团队查询冻结的预训练模型以预测给定目标提示的噪声,并控制属性提示,然后在训练时使用无分类器指导而不是推理的思想来训练编辑后的模型,将其引导到相反的方向。他们发现,使用此目标微调滑块权重非常有效,可以生成一个即插即用的适配器,直接控制目标概念的属性。

image.png

文本训练原理

在实践中,他们还注意到这些概念彼此纠缠在一起。例如,当他们尝试控制一个人的 age 属性时,这个种族在推理过程中会发生变化。为了避免这种不必要的干扰,建议使用一小组保留提示来找到方向。这不是单独使用一对单词来定义属性,而是通过使用多个文本组合来定义它,找到一个改变目标属性的方向,同时保持其他 attribute-to-preserve 不变。

实际应用效果

screenshot-20240911-140002.png

使用测试效果展示

Concept Sliders 的操作其实也十分简单,只需要输入提示词然后选择自己需要调整的风格,例如我这里选择的就是手部修复,点击生成之后就可以看见用原模型与使用了Concept Sliders 的效果对比了。可以看到手部的修复系统还是十分好用的,起到了很不错的效果。

repair_all.png

官方效果图例展示

Concept Sliders 的功能还有很多,例如细节优化、粘土风格、年龄调整、肌肉调整、身材调整等十余个风格或者部位的调整。以这个修复细节的滑块展示为例,修复滑块使模型能够生成更逼真且不失真的图像。此滑块控制下的参数可帮助模型纠正其生成输出中的一些缺陷,例如 (a, b) 中扭曲的人类和宠物、(b, c, d) 中的非自然对象以及 (b,c) 中模糊的自然图像。

 有关厚德云

厚德云致力于为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2125346.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

141. 环形链表、142. 环形链表 II

题目 思路 链表无环情况:有空结点 链表有环:有些结点会重复 所以 用集合(哈希表)来记录遍历的结点 结点不存在,则将结点加到集合中,当遍历到的结点存在集合中,即为链表环开始的结点&#xff0c…

遥控器握杆的几种常见方式!!!

1. 双手持握法 站姿操作:站立时,两脚分开,比肩略宽,以保持身体稳定。双手持握遥控器的两侧,保持放松状态。 细节技巧: 轻轻地用无名指和小指托起遥控器,掌心和遥控器之间留有一定的空隙。 遥…

华为网络多生成树协议

多生成树协议 一个或多个vlan可以映射到同一个生成树中; MSTP将一个网络划分为多个域,每个域有多个生成树,域间利用CIST 公共与内部生成树commonand internal spanning tree 保证拓扑结构无环路; 实例即多个vlan的集合&#xf…

facebook投放版位选择技巧

卖家若想通过Facebook广告推广业务,首先需要了解Facebook广告的版位和展示位置。 Facebook广告版位包括动态消息、桌面右边栏、移动应用受众网络、Instagram版位和视频插播广告。动态消息版位分为桌面版和移动版,支持多种广告目标,如主页赞、…

算法-简化路径(71栈)

这道题,首先开头肯定是“/"而且不同级目录之间都是用"/"分割 所以我们首先将路径按”/“分割并把分割后的字符放到一个新的字符数组里面 然后开始遍历,如果为空或者.则忽略 如果为..则为返回上一级目录,栈顶弹出一个元素 否…

Spring MVC 处理请求

Servlet初始化 DispatcherServlet( 前端控制器 )是 Spring MVC中最核心的一个类, 它负责请求的行为流转, 接收请求、响应结果, 相当于转发器 。 那么在Servlet的初始化阶段,会调用 init() 方法进行各个组件的初始化操作,该方法 由其父类Http…

2024年9月15日(星期天)骑行古莲村

2024年9月15日 (星期天)骑行古莲村,早8:30到9:00,大观公园门口集合,9:00准时出发【因迟到者,骑行速度快者,可自行追赶偶遇。】 偶遇地点:大观公园门口集合 ,家住东,西,…

IGNAV_NHC分析

extern int nhc(insstate_t *ins,const insopt_t *opt,const imud_t *imu)函数名 insstate_t* ins IO ins state insopt_t* opt I ins options imud_t* imu I imu measurement data return : 1 (ok) or 0 (fail) 用NHC进行约束,其实用NHC做量测去…

Amazon EC2:灵活、可扩展的云计算解决方案

在当今数字化快速发展的时代,企业面临着不断变化的市场需求和技术挑战。为了保持竞争力,许多公司正在转向云计算,以提高业务的灵活性和可扩展性。而在众多云服务提供商中,Amazon Elastic Compute Cloud(EC2&#xff09…

Initializing libiomp5md.dll, but found libiomp5md.dll already initialized

情况一:之前没有任何下载安装等其他异常操作,则直接使用的时候报错了。 可以检查一下自己anaconda的安装路径中是否存在两个该dll文件。比如我在pycharm中使用的是虚拟环境pytoch1.7,在pycharm的右小角可以看到自己当前使用的环境。 找到该环…

发展绿色新质生产力,创维汽车亮相2024国际数字能源展

2024年9月8日,2024国际数字能源展在深圳会展中心(福田)拉开帷幕,展会以“数能先锋 智创未来”为主题,设立7大展区,助力国内外供采链条对接交流。创维光伏储能以及搭载闪放闪充技术的创维汽车亮相此次会展。…

泽众ALM全新升级:多维度优化软件研发管理

泽众ALM(覆盖全生命周期的研发过程管理平台),迎来了新一轮的更新。本次更新涵盖了需求管理、评审中心、环境管理、代码库管理、报工管理等多个模块,进一步提升了软件研发团队的协作效率与项目管理水平。 泽众ALM平台 一、需求管理更加灵活多样 本次更新…

Open-Vocabulary SAM: 分割并交互式识别两万类别。

摘要 CLIP和Segment Anything Model(SAM)是杰出的视觉基础模型(VFMs)。SAM在多个领域的分割任务中表现出色,而CLIP以其零样本识别能力而闻名。本文深入探索了将这两种模型整合到一个统一框架中。具体来说,…

【Linux】Ubuntu 22.04 shell实现MySQL5.7 tar 一键安装

参考 https://blog.csdn.net/qq_35995514/article/details/134350572?spm1001.2014.3001.5501 在原作者基础上做了修改,加了一个删除原有mysql 的脚本 文章目录 一、安装下载**my.cnf 配置文件** 二、执行安装**install_mysql.sh 安装脚本**本机免密脚本 ssh_keyge…

上汽大众:存储成本节约85%,查询性能提升5倍|OceanBase案例

近日,上汽大众汽车有限公司(简称“上汽大众”)的积分卡券等关键业务系统,已成功升级至 OB Cloud 云数据库。借助 OceanBase 原生分布式数据库的卓越性能与先进技术,实现了存储成本的大幅降低,高达85%&#…

解锁多语言洞察力:使用 Python、LangChain 和 Vector Database 翻译数据集

作者:来自 Elastic Jessica Garson 将数据集从一种语言翻译成另一种语言可能是一种强大的工具。你可以深入了解以前可能无法获得的数据集,例如检测新的模式或趋势。使用 LangChain,你可以获取数据集并将其翻译成你选择的语言。翻译数据集后&a…

游戏出海迎新变局——海外游戏市场有哪些新趋势和新机遇?

游戏出海的热度越来越高,也面临着竞争加剧、门槛提升、成本增加的现实环境,游戏出海有哪些新变化和新趋势? 移动游戏出海的主要海外市场 在海外市场分布方面,美日韩仍然是我国移动游戏重要的海外市场,占据了中国出海…

mfc140u.dll丢失有啥方法能够进行修复?分享几种mfc140u.dll丢失的解决办法

你是否曾遇到过这样的情况:当你满怀期待地打开一个应用程序时,却被一个错误提示拦住了去路,提示信息中指出 mfc140u.dll 文件丢失。这个问题可能会让你感到困惑和无助,但是不要担心,本文将为你详细解读 mfc140u.dll 丢…

给孩子选台灯什么品牌好?看儿童护眼灯推荐测评挑选护眼台灯!

儿童的视力健康是每个家庭都非常关注的问题。当前,近视问题在全球范围内日益严重,尤其是在中国,近视率高企不下,并且呈现出年轻化、低龄化的趋势。随着课业负担的增加和电子产品的普及,儿童近视的问题变得更加突出。我…

超490万预订,华为三折叠屏手机凭什么卖爆?

“3nm制程芯片不是消费者买手机的核心理由?” 作者 | 魏 强 编辑 | 卢旭成 9月10日,华为手机在苹果秋季发布会(北京时间9月10日凌晨)之后紧跟着发布华为Mate XT非凡大师(以下简称非凡大师XT)三折叠屏手机,售价从19…