【论文阅读】(VAE-GAN)Autoencoding beyond pixels using a learned similarity metric

news2024/12/29 10:08:56

 论文地址;[1512.09300] Autoencoding beyond pixels using a learned similarity metric (arxiv.org) /

一、Introduction

主要讲了深度学习中生成模型存在的问题,即常用的相似度度量方式(使用元素误差度量)对于学习良好的生成模型存在一定的障碍,并提出了一种新的方法——使用学习到的相似度度量方式来改善生成模型的性能。同时,该部分还介绍了如何学习这种相似度度量方式,即通过联合训练变分自编码器(VAE)和生成对抗网络(GAN)来使用GAN鉴别器来度量样本之间的相似度。

注意:

使用学习相似性度量训练的生成模型与使用元素误差度量训练的模型的区别在于相似性度量的方式不同。使用元素误差度量训练的模型是默认的选择,它使用像平方误差这样的逐元素度量来衡量重建质量。而使用学习相似性度量训练的生成模型则可以使用更高级的、基于特征的度量来衡量重建质量,并且可以在学习中提供更好的数据分布建模。这种方法可以更好地捕捉图像数据的特性,例如对平移等变性的不变性,从而提高生成模型的性能。

二、Autoencoding with learned similarity

本章节主要介绍了如何使用学习到的相似度度量来改进生成模型,特别是在学习像变分自编码器(VAE)这样的模型时,元素级别的相似度度量会成为训练信号的主要组成部分。文章提出了一种基于联合训练VAE和生成对抗网络(GAN)的方法,将GAN鉴别器中学习到的特征表示作为VAE重构目标的基础,从而用特征级别的相似度度量替换元素级别的误差,更好地捕捉数据分布。文章还介绍了如何在人脸图像上应用该方法,并展示了该方法比使用元素级别相似度度量的VAE在视觉保真度方面表现更好的结果。此外,文章还展示了该方法学习到的嵌入空间具有高级别的抽象视觉特征,可以通过简单的算术操作进行修改。

三、Related Work

讨论了之前的相关研究,特别关于使用自编码器进行特征学习和图像重建的研究它提到了一些使用变分自编码器和生成对抗网络方法来提高自编码器重建质量和学习更好的征表示的研究。此外,该部分还介绍了一些特征匹配和相似度度量的方法来比较图像相性的研究。

总结:

本文介绍了一种基于学习相似度度量的自编码器,该自编码器结合了变分自编码器和生成对抗网络的优点,使用GAN鉴别器中学习到的特征表示作为VAE重构目标的基础,从而用特征级别的误差代替元素级别的误差更好地捕捉数据分布。作者在人脸图像数据集上的实验结果表明,与使用元素级别相似度度量的VAE相比,该方法在视觉保真度方面表现更好,同时也展示了该方法学习到了一个内在空间,其中高级别的抽象视觉特征(如戴眼镜)可以通过简单的算术运算进行修改。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1208813.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++】类与对象 I

类与对象 I : 前言:(C)面向过程 和(C)面向对象 初步认识前言:类的引入一、类的介绍二、类的定义(一)class 语法(二)类的两种定义方式:…

Linux多线程服务端编程:使用muduo C++网络库 学习笔记 第七章 muduo编程示例(下)

7.5 一种自动反射消息类型的Protobuf网络传输方案 本节假定读者了解Google Protocol Buffers是什么,这不是一篇Protobuf入门教程。本节的示例代码位于examples/protobuf/codec。 本节要解决的问题是:通信双方在编译时就共享proto文件(用于定…

解密N数之和问题的秘密

目录 两数之和三数之和 两数之和 我们来看力扣第一题 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一…

jetson配置笔记

typora-root-url: /home/msj/ubuntu笔记本台式机环境配置说明/images Ubuntu18.04 配置 说明:我们所有文档配置都是按照ubuntu18.04,保证x86架构(笔记本台式机)和 ARM架构(jetson Nano只能安装18.04)的一致性 1. 更换各类源 我们所有源都更换清华源&a…

一文说清楚Openai的这波更新内容,大地震 一大波套壳公司倒闭

前几天Openai召开了首届的开发者大会,45分钟的会议,让千万用户感到兴奋,但是让万千的套壳的创业公司,却感觉如坐针毡。这次发布会发布了哪些功能?为什么会导致这种情况的发生?让我们接着往下讲 API升级且降…

振南技术干货集:深入浅出的Bootloader(5)

注解目录 1、烧录方式的更新迭代 1.1 古老的烧录方式 (怀旧一下,单片机高压烧录器。) 1.2 ISP 与ICP 烧录方式 (还记得当年我们玩过的 AT89S51?) 1.3 更方便的 ISP 烧录方式 1.3.1串口 ISP (是 STC 单片机成就了我们,还是我们成就了…

以阿里云全球故障为例,聊聊如何保障 Auth 服务的 SLA

在刚刚过去的“双十一”购物狂欢季,阿里云经历了一次大规模故障,导致阿里系产品集体中断服务。据报道,11 月 12 日,淘宝、钉钉、闲鱼、阿里云盘等阿里系产品出现无法使用的问题, “阿里全系产品崩了” 的话题迅速引发众…

龙迅LT9211D MIPI(DSI/CSI)转LVDS和集创北方ICN6202 MIPIDSI转LVDS比对

龙迅LT9211D描述: Lontium LT9211D是一款高性能的MIPI DSI/CSI- 2到双端口LVDS转换器。LT9211D反序列化输入的MIPI视频数据,解码数据包,并将格式化的视频数据流转换为AP和移动显示面板或摄像机之间的LVDS发射机输出。LT9211D支持最大14 dB输…

【luckfox】0、开发环境搭建

前言 本章简单介绍如何搭建luckfox的开发环境。 一、抓取luckfox源码 需要提前准备好ubuntu环境。 git clone https://github.com/LuckfoxTECH/luckfox-pico.git二、编译 youkaiubuntu:/home/luckfox/luckfox-pico$ ./build.sh lunchyoukaiubuntu:/home/luckfox/luckfox-p…

二十、泛型(7)

本章概要 动态类型安全泛型异常混型 C 中的混型与接口混合使用装饰器模式与动态代理混合 动态类型安全 因为可以向 Java 5 之前的代码传递泛型集合,所以旧式代码仍旧有可能会破坏你的集合。Java 5 的 java.util.Collections 中有一组便利工具,可以解…

ubuntu中使用 vscode 连接docker开发环境

文章目录 ubuntu中使用 vscode 连接docker开发环境步骤一:安装 Remote Development 插件步骤二:连接远程环境步骤三:开发 问题解决参考连接 ubuntu中使用 vscode 连接docker开发环境 Remote Development 是一个 Visual Studio Code 插件&…

【python 生成器 面试必备】yield关键字,协程必知必会系列文章--自己控制程序调度,体验做上帝的感觉 1

python生成器系列文章目录 第一章 yield — Python (Part I) 文章目录 python生成器系列文章目录前言1. Generator Function 生成器函数2.并发和并行,抢占式和协作式2.Let’s implement Producer/Consumer pattern using subroutine: 生成器的状态 generator’s st…

【EI会议征稿】第四届环境资源与能源工程国际学术会议(ICEREE 2024)

第四届环境资源与能源工程国际学术会议(ICEREE 2024) 2024 4th International Conference on Environment Resources and Energy Engineering ICEREE(2020-2023)大会先后在珠海,昆明,长沙成功召开。会议主…

自定义Matplotlib中的颜色映射(cmap)

要自定义Matplotlib中的颜色映射(cmap),您可以按照以下步骤进行操作: 导入所需的库: import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import LinearSegmentedColormap创建自定义颜色映…

ViewPager2和TabLayout协同使用,实现多Fragment页面切换类似于QQ音乐,bilibili效果

一、ViewPager2的基本用法 使用前先添加依赖: implementation androidx.appcompat:appcompat:1.4.0 // AndroidX AppCompatimplementation com.google.android.material:material:1.4.0 // Material Design Components1、制作Fragment 首先制作一个Fragment的xml布…

欧拉回路和欧拉路径

目录 欧拉回路基础 欧拉回路的定义 欧拉回路的性质 判断图中是否存在欧拉回路的java代码实现 寻找欧拉回路的三个算法 Hierholzer算法 详细思路 代码实现 欧拉路径 欧拉路径的定义 欧拉路径的性质 欧拉回路基础 欧拉回路的定义 欧拉回路遍历了所有的边,…

spring cloud 简介

springcloud 定义 1.定义:springcloud为开发人员提供了在分布式系统中快速构建一些通用模式的工具(例如配置管理、服务发现、断路器、路由、控制总线等)2.微服务:基于单体应用,基于业务进行拆分,每个服务都是独立应用…

栈的实现---超详细

栈的实现 文章目录 栈的实现一、栈的模型二、栈的代码实现以及测试用例①栈的初始化②入栈③出栈④弹出栈顶⑤判断栈空间是否为空⑥计算栈空间长度⑦销毁栈⑧测试用例 一、栈的模型 首先栈有两个概念 1.数据结构里的栈。2.语言/操作系统中的栈(内存空间),可能会在递…

xshell连接云服务器(保姆级教程)

文章目录 1. 前言2. 查看云服务器的信息3. xshell7连接云服务器 1. 前言 云服务器,也被称为Elastic Compute Service (ECS),是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。它源于物理服务器集群资源池,可以像从大海中取水一样&am…

从流程优化到经营提效,法大大电子签全面助力智慧零售升级

在新零售模式下,“商业综合体、百货商场、连锁商超、连锁便利店、线上电商平台”等各类商业零售企业借助数字化的手段来改造和重塑传统零售流程和逻辑,实现全面数字化转型,包括线上线下一体化、全场景覆盖、全链条联通、全渠道经营、客户服务…