设计师AI神器!AnyDesign,一张照片加简单描述就可以编辑时尚图像!

news2024/9/19 9:46:56

在AI时代很多行业都被颠覆了,建议大家在业余时间也尽量多学习一些AI工具的使用,提高效率的同时也去探索更多好玩的应用。

今天给大家介绍一个非常好用的图像编辑方法-AnyDesign,适合时尚设计师以及普通用户使用的,可以让你能够更简单、方便地编辑时尚图像。

AnyDesign构建了一个智能的模型,可以直接在你提供的人物图像上进行编辑,而无需额外的掩膜或复杂的步骤。它引入了一种叫做Fashion-Guidance Attention的技术,使得模型能够更好地理解服装的类型和样式,从而做出更自然的修改。这意味着你可以只用一张照片和简单的描述,就可以让你的衣服的样式或颜色发生改变。

下图为AnyDesign进行时尚编辑的效果

AnyDesign可以适应各种设置,并使用灵活的提示编辑各种服装类别。

相关链接

论文地址:http://arxiv.org/abs/2408.11553v1

代码地址:https://github.com/nyf8/AnyDesign

论文阅读

AnyDesign:通过无遮罩扩散的多功能区域时尚编辑

摘要

时尚图像编辑旨在根据给定的指令修改人物的外观。现有的方法需要辅助工具,如分割器和关键点提取器,缺乏灵活统一的框架。此外,这些方法处理的服装类型有限,因为大多数数据集都集中在干净背景中的人,只包括上衣、裤子和连衣裙等普通服装。这些限制限制了它们在现实场景中的适用性。

在本文中,我们首先扩展了现有的人类生成数据集,以包括更广泛的服装和更复杂的背景。这个扩展的数据集包含穿着各种物品的人,如上衣、裤子、连衣裙、裙子、头饰、围巾、鞋子、袜子和包包。此外,我们提出了一种基于扩散的方法 AnyDesign,可在多种区域进行无遮罩编辑。用户只需输入人体图像以及相应的提示(文本或图像格式)。

我们的方法结合了时尚 DiT,配备了时尚指导注意 (FGA) 模块,旨在融合明确的服装类型和 CLIP 编码的服装特征。定性和定量实验都表明,我们的方法可以提供高质量的时尚编辑,并且优于当代文本引导的时尚编辑方法

方法

(a)数据集扩展方法。我们使用现有方法提取关键点和密集信息。然后,设计特定于服装的提取器来创建不可知论图像和引导提示。(b)不同的特征去除策略。

时尚编辑框架的整体架构。(a)两阶段图像训练框架。在第一阶段,我们训练了一个基于掩码的模型,使用未配对的文本提示或图像提示来生成伪样本。在第二阶段,我们使用配对提示和服装类型作为输入,利用生成的伪样本训练最终的无口罩。这个阶段的训练目标是生成逼真的图像。(b)时尚资讯科技的架构。

时尚引导注意(FGA)模块。

本研究的核心在于一种创新的无掩膜扩散框架,分为两个阶段。第一阶段使用掩膜基础的扩散模型生成伪样本,利用未配对的文本或图像提示。此后,在第二阶段,构建最终的无掩膜模型,利用从第一阶段生成的伪样本进行训练。这个方法能够依据给定的服装类型和叶状文本或图像提示,自动识别目标区域并完成合成。使用OpenFashion CLIP模型提取的跨模态特征,使得文本和图像的语义信息能够有效融合,从而实现精确的区域编辑。特别是在推理阶段,只需要输入图像和提示,而无需任何额外的人工标定或者掩膜,从而简化了使用过程,提高了效率。

效果

VITON-HD和Dresscode图像的视觉比较。从左到右:给定的人,文本驱动的编辑结果通过一系列的方法。

SHHQe的可视化结果。在文本驱动的编辑中,指示颜色的单词以红色突出显示,而指示样式的单词以绿色突出显示。在图像驱动的编辑中,样式可以转移。

人的评价结果主要体现在意象平等和语义一致性方面。

更多结果

结论

本文引入了一种数据扩展方法并提出了AnyDesign,一个基于扩散的人类时尚编辑的无面具框架。该模型可以在文本或样式图像的指导下编辑野外人类图像。在这个框架中,进一步引入了一个具有时尚指导注意力模块的创新时尚DiT,以增强编辑多类型服装的灵活性。实验表明,我们的方法在流行的数据集上表现出色,实现了最先进的时尚编辑性能。我们相信,我们的工作将推动时尚编辑技术在现实世界中的应用。

​感谢你看到这里,也欢迎点击关注下方公众号并添加公众号小助手加入官方读者交流群,一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion、Sora等相关技术,欢迎一起交流学习💗~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2064382.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python编程:从入门到实践书籍介绍

对于Python入门的书籍推荐,以下是五本详细讲解的书籍,它们各自具有不同的特点和适用对象: 1. 《Python编程:从入门到实践》 作者:埃里克马瑟斯(Eric Matthes)《Python编程:从入门到实践》是一本经典的Pyth…

C#实现数据采集系统-数据反写(1)MQTT订阅接收消息

C#实现数据采集系统-数据反写 实现步骤 MQTT订阅,接收消息反写内容写入通信类,添加到写入队列中 链接-消息内容处理和写入通信类队列实现Modbustcp通信写入 具体实现 1.MQTT订阅,接收消息 Mqtt实现采集数据转发 Mqtt控制类增加订阅方法…

【微信小程序】使用 npm 包 - Vant Weapp --定制主题

小程序对 npm 的支持与限制 1. 什么是 Vant Weapp 官方文档地址 :https://youzan.github.io/vant-weapp 2. 安装 Vant 组件库 详细的操作步骤,大家可以参考 Vant 官方提供的快速上手教程: https://youzan.github.io/vant-weapp/#/quickst…

Texio电源维修德士直流电源维修PSW-1080M160

Texio德士电源维修类型有:指针式小型直流电源、数字显示直流电源、多路输出直流电源、直流电源、相控电源、低噪声开关电源、宽幅电源、高电压宽幅电源、开关电源、超薄直流电源、4象限双电源、高电压直流电源 Texio电源维修常见系列如下 PSW-系列是一款单路输出、…

框架——Mybatis(!!!MyBatis 环境搭建步骤)

目录 一、Mybatis 概述 1.背景 2.简介 3.Mybatis 中文官网 二、MyBatis 环境搭建(超全!!!) 1.创建一张表和表对应的实体类 2.导入 MyBatis jar包,mysql数据库驱动包 3.创建 MyBatis全局配置文件 4. 在接口中…

2024年4款高质量的英语翻译工具推荐!

英语作为一门应用非常广泛的语言,其影响力还是非常深远的。虽然现在学英语的人很多,但对于非英语母语的人来说,英语多多少少会是一个壁垒,所以翻译工具也变得重要了起来。这次,我便要跟大家分享几个很专业的英语翻译工…

连锁门店收银系统源码+电子发票

传统纸质开票模式,流程复杂、时间长,为解决商户开票难的问题,千呼新零售2.0上线了电子发票功能,开通方便,使用简便!商户只需要简单配置,就可以实现门店实现开票自由! 一、线下订单开…

黑马程序员|8天Python第13章面向对象

一 初识对象 1.生活中数据的组织 2.程序中数据的组织 3.使用对象组织数据 类的属性: 二 成员方法 1.类的定义和使用 2.成员变量和成员方法 类外面是函数,类里面是方法。 3.成员方法的定义语法 self 只是写在这里,传参的时候可以当作不存在。…

QTCreator学习

1.新建程序 2. 设置项目名称 3. Build System选择qmake,若选择cmake则只会产生CmakeLists文件,不会产生pro文件。 4.Base class选择QDialog,表示该类继承于QDialog类 5.套件选择MinGW 32bit,取消掉其他的。 6. 双击ui文件,拖动可添加工具。 7.点击左…

深信服技术服务工程师面试全过程分享

吉祥知识星球http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247485367&idx1&sn837891059c360ad60db7e9ac980a3321&chksmc0e47eebf793f7fdb8fcd7eed8ce29160cf79ba303b59858ba3a6660c6dac536774afb2a6330#rd 《网安面试指南》http://mp.weixin.qq.com/s?…

这对二婚夫妻结婚半年,一起生活才一个月,就走到了婚姻尽头!

这对二婚夫妻结婚半年,一起生活才一个月,就走到了婚姻尽头! 这是一篇涉离婚纠纷的民事起诉状 (范文点评) 离 婚 起 诉 状 原告:韩某斌,男,现年37岁,汉族,打…

Spring Cloud Consul面试题

​ ​ 您好,我是程序员小羊! 前言 Spring Cloud Consul 是微服务架构中的一个重要组件,用于服务发现、配置管理以及健康检查。了解 Spring Cloud Consul 的工作原理和应用场景,对于微服务开发者和架构师来说至关重要。以下是一些常…

线程优先级调度

Windows优先级调度算法 系统维护了一个全局的处理器数组KiProcessorBlock,其中每个元素对应于一个处理器的KPRCB对象。其次,另有一个全局变量KiIdleSummary记录了哪些处理器当前是空闲的。所谓一个处理器是空闲的,是指该处理器正在执行空闲循…

《Techporters架构搭建》-Day08 Spring Boot日志实现

集成日志功能 日志介绍日志相关概念选择Logback还是Log4j2?LogBack相关知识LogbackLogback的基本概念Logback的日志级别Logback的配置文件Logback日志文件解析logback-spring.xml的配置项标签说明完整的logback-spring.xml配置示例知识点补充 整合Spring Boot和Logb…

【Lecture1】清华大学大模型公开课——大模型绪论

#清华大模型公开课第二季 #OpenBMB 目录 1. The Evolution of Artificial Intelligence --History 人工智能的演变--历史 1.1 Definition of AI --定义 1.2 Conceptualization of AI -- 概念 1.3 Birth of AI as a Discipline 1.4 Development of AI 1.4.1 Symbolic Int…

Oracle问题笔记

ORA-28040 没有匹配的验证协议 问题出现场景oracle数据库为12c,应用使用的jdbc或客户端工具是11g版本一下,连接12c数据库时会报ora-28040错误。解决办法在Oracle服务端的$ORACLE_HOME/network/admin/sqlnet.ora文件中添加: SQLNET.ALLOWED_LOGON_VERSI…

消息队列篇

1、队列简介 概念: 队列是任务到任务、任务到中断、中断到任务数据交流的一种机制,说白了,队列就是用来传递消息的。 ----------------------------------------------------------------------------------------------------------------…

【Python机器学习】NLP概述——深度处理

自然语言处理流水线的各个阶段可以看作是层,就像是前馈神经网络中的层一样。深度学习就是通过在传统的两层机器学习模型架构(特征提取建模)中添加额外的处理层来创建更复杂的模型和行为。 上图中,前四层对应于聊天机器人流水线中的…

MCtalk·CEO对话×每刻科技:经济挑战期,企业如何将“好钢”用在“刀刃”上?

2015 年 10 月,网易数智发布第一款产品,正式踏上了 ToB 商业化之路。从那以后,我们每年举办不同主题的科技峰会,分享最新的行业体感和洞察;访谈各界企业领导者,记录他们的创新与创业经历;走过大…

dubbo:dubbo+zookeeper整合nginx实现网关(四)

文章目录 0. 引言1. nginx简介2. 集成nginx2.1 负载均衡实现 3. 源码4. 总结 0. 引言 我们之前讲解过dubbozookeeper实现服务调用和注册中心,但是还缺乏一个统一的入口,即网关服务。dubbozookeeper的模式更加适合的网关组件为nginx,所以今天…