[ECCV2022]Language-Driven Artistic Style Transfer

news2025/1/16 16:00:30

标题:Language-Driven Artistic Style Transfer

链接:https://sites.cs.ucsb.edu/~william/papers/LDAST.pdf

如标题所示,本文做的是基于文本引导的风格迁移。整体的思路还是用的AST(arbitrary style transfer)那一套自编码器结构。AST的思路就是通过将原图和目标图都经过一个encoder,得到原图的风格和语义特征以及目标图的风格和语义特征而这篇文章唯一的不同就是目标图自带一套文本描述,因此可以抽取文本的特征,然后将之视作风格特征与原图语义融合,最后通过解码器生成符合文本语义的结果即可。而这里的目标图像则是用作了监督信号。

模型结构

模型结构图画的比较复杂,但其实几乎全是同一组encoder和decoder在起作用,所以本质上很简单。唯一要注意的是输入的部分,比如左边的LVA模块,输入的是两张图和一段文字,这段文字是用来描述最底下图像的,也就是配套的一组数据。而右边的CR模块有四张图(c1,c2,s1,s2)和两段文字(x1,x2),s1和x1是配套的,s2和x2是配套的。理解了这里就很简单了。

语言视觉艺术家(LVA)

这个模块位于结构图的左上角,也是最终做测试时候使用的模块。包含了一个文本编码器,一个图像编码器和一个图像解码器。文本编码器就是输入文本输出一个文本特征。图像编码器就是输入图像,输出一个风格特征和一个语义特征。将图像输出的风格特征和语义特征输入解码器就获得了图像的重建结果。而将图像的语义特征和文本特征输入解码器就获得了符合目标文本的风格迁移结果。而为了让解码器能达到这样的效果,自然要设计一系列的训练方案,也就是接下来要说的其他部分。

结构重建

就是把图像编码器和图像解码器当做一组自编码器来训练,做重建损失。

分块风格判别器

这里用了GAN中的判别器来为风格做监督训练。作者将目标图像做随机划分,然后输入判别器作为正样本,将经过LVA输出的风格迁移的结果的随机划分块作为负样本,以此来训练判别器。这样目的自然就是让LVA输出的风格迁移结果贴近目标图像的风格。训练方式和GAN一样。

对比推理

这里虽然有对比两个字,但是并不是对比学习。作者这里的期望就是在相同的图像上加不同的风格时,出来的结果应当有相同的语义特征(Lc-c)。

而当在不同的图像上加相同的风格时,出来的结果应当有相同的风格特征(Lc-s)。

除此以外,作者还希望在将同一张图迁移成不同风格时,相似的风格迁移成相似的结果。比如风格1中有"明亮高耸的山"的描述,而风格2中有“山矗立在湖边”,那这两个风格就是相似的,那他们的结果就需要是比较类似的。因此作者对风格图计算了相似度,并加权在对比loss上(Lr-s)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/48498.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

期中考试【Verilog】

期中考试【Verilog】前言推荐期中考试一. 单选题(共10题)二. 填空题(共5题)三. 简答题(共3题)四. 其它(共4题)最后前言 编写于2022/11/30 13:30 以下内容源自Verilog期中试题 仅供…

Windows访问centOS的Tomcat

首先,先准备好jdk1.8和Tomcat的文件 点击此处获取jdk1.8和Tomcat的文件(提取码:xxrc) 配置IP地址 打开终端输入ifconfig,检查centOS的ip地址 根据要求,是要把ip地址最后一位改为自己的学号(前…

手把手教你做智能合约开源|多文件合约开源|引用文件开源

本文手把手教你使用 区块链浏览器 验证智能合约的三种方式。 验证单一 Solidity 文件 在开始验证之前,我们需要首先部署智能合约。进入 Remix IDE,创建一个合约新文件。复制粘贴下面的代码: // SPDX-License-Identifier: MITpragma solidit…

夜曲编程Python体验课

目录 day1 编程中的“文本” 代码规范 打印数字 打印字符串 注释 总结思维导图 day2 变量与赋值 变量 常量 赋值 格式化输出 转义字符: 总结思维导图 day3 编程中的“数字” 整形 浮点型 运算符 四种常见的四则运算符( - * / &…

【软件测试】测试人的我们,咋做一个如鱼得水的测试员?

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 一千个人&#xff0…

短视频创作,主动变现和被动变现方式详解,建议收藏反复阅读-下

同样先说纲要,有兴趣可以继续看下去,上一篇讨论了抖音变现的有三个建议,①变现标准低、②变现天花板高、③可主动变现。 这一篇的内容只要是抖音上被动和主动两类变现方式,涉及了直播打赏,广告接单,视频带货…

小啊呜产品读书笔记001:《邱岳的产品手记-15》第28讲 产品分析的套路(上):谁是利益相关者? 29讲产品分析的套路(中):解决什么问题?

小啊呜产品读书笔记001:《邱岳的产品手记-15》第28讲 产品分析的套路(上):谁是利益相关者?& 29讲产品分析的套路(中):解决什么问题? 一、今日阅读计划二、泛读&知…

【Big Data】Hadoop--MapReduce经典题型实战(单词统计+成绩排序+文档倒插序列+每月Top3温度)

🍊本文使用了4个经典案例进行MapReduce实战 🍊参考官方源码,代码风格较为优雅 🍊解析详细 一、Introduction MapReduce是一个分布式运算程序的编程框架,核心功能是将用户写的业务逻辑代码和自身默认代码整合成一个完整…

vue+videojs视频播放、视频切换、视频断点分段上传

“本次需求是做一个视频列表,点击视频列表播放对应视频;同时要求实现断点分段上传大文件(视频)的功能 。 videojs文档:Getting Started with Video.js - Video.js: The Player Framework | Video.js 断点续传组件地址…

WebRTC学习笔记六 兼容性 adapter.js

一、adapter.js发展背景 adapter.js自2012年底或者2013年初WebRTC早期的时候就已经出现了。它最初是Google的apprtc demo的一部分。原始版本仍可在Chrome tree中找到。它是一个非常小的项目,还没有150行。主要功能是隐藏像webkitRTCPeerConnection和mozRTCPeerConne…

Spring Boot+Mybatis:实现数据库登录注册与两种properties配置参数读取

〇、参考资料 1、hutool介绍 https://blog.csdn.net/abst122/article/details/124091375 2、Spring BootMybatis实现登录注册 https://www.cnblogs.com/wiki918/p/16221758.html 3、Spring Boot读取自定义配置文件 https://www.yisu.com/zixun/366877.html 4、Spring Boot读取p…

医院用故障电弧探测器AAFD 安科瑞 时丽花

摘 要: 医院运行中对于用电方面的要求越来越高,为了更好地体现用电价值,首先应该确保用电的安全性,尤其是对 于越来越繁杂的医院用电系统。基于此,在未来医院用电过程中应该加大关注力度,切实做好相关管理工…

Compose学习-> Text()

设置文本:text xxx 直接设置 Text(text "我是一个Text")引用资源文件:stringResource Text(text stringResource(id R.string.string_text))设置字体颜色:color xxx 引用系统自带的颜色 Text(text "我是一个Text"…

【技术分享】NB860+Lierda云平台=上电即上云——云管端协作让万物互联更简单(二)

随着物联网行业的快速发展,越来越多的物联网云服务平台涌现。如何快速实现应用开发,如何管理,如何让设备快速上云,成为关注的焦点。 第一期中我们介绍了基于MQTT协议快速接入利尔达物联网全连接云平台,本期我们将介绍如…

ManageEngine 第六次入选 Gartner® 安全信息和事件管理魔力象限™!

今天,我们很高兴地宣布,ManageEngine 已在2022年 Gartner 安全信息和事件管理 (SIEM) 魔力象限中获得认可,今年已经是其连续第六次出现在Gartner中。ManageEngine非常高兴再次获得这一认可。 在过去两年中,互联网向云计算的转变不…

svn的常规使用

svn的常规使用svn的常规使用1 客户端2 svn server3 qt使用svn4 svn项目迁移svn的常规使用 1 客户端 下载地址:官网,中文简体语言包在其下方 分别安装客户端可语言包,在安装语言包的时候勾选应用,svn便可变成中文了,或…

改革后IB数学该如何选?

IB数学,作为一个IB课程里必选科目,让无数IB学霸为之自豪,他们能解出外教都不会做的题。另一方面,也让很多同学(自称“学渣”)避之不及。 从2019年起,IB数学教学大纲发生重大改革。▲图源&#x…

Android -- 每日一问:如何理解 Android 中的 Context,它有什么用?

经典回答 官方文档对于 Context 的解释: Interface to global information about an application environment. This is an abstract class whose implementation is provided by the Android system. It allows access to application-specific resources and cla…

[附源码]SSM计算机毕业设计学生宿舍设备报修JAVA

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

光格科技将于12月6日上会:拟募资6亿元,姜明武为实控人

近日,苏州光格科技股份有限公司(下称“光格科技”)在上海证券交易所科创板递交招股书(上会稿)。据贝多财经了解,光格科技将于2022年12月6日接受科创板上市委的现场审议。 公开信息显示,光格科技…