深度卷积对抗神经网络 基础 第四部分 可控制的GANs(Controllable GANs)

news2025/1/11 13:01:57

不同的生成模型定义

深度卷积对抗神经网络包含两种不同的生成模型, 条件生成模型非条件生成模型。非条件生成模型就像是一个彩票机或者赌博机,你输入一个任意数字的硬币数量,而输出则是随机的彩球。这样的系统,我们不能控制输出的结果的具体类别。而条件生成模型便可以类比为一个自动售卖机,你投入任意数字的硬币,那么就会有对应价格的商品被生成出来。

非条件的生成模型

非条件生成模型 (Unconditional generation) 通过任意输入噪声,能够生成随机的假图形。

可控制的生成模型

目的: 可以通过某种方式Control GANs in some ways to manipulate the feature output instead of input classes

Controllable generation 可控制的生成器Conditional generation 条件的生成器
output with features that you want 输出的图片的特性可以自己决定output form the classes you want 输出的图片只能决定类别
training dataset doesn't need to be labeled 输出的训练集需要被标记training dataset needs to be labeled 输出的训练集需要被标记
manipulate the z vector input 通过操作z空间的向量空间来控制append a class vector to the input 将一个类别向量加到噪音向量中

条件的生成模型

条件生成模型 (Conditional generation) 通过特殊定义的输入噪声,能够得到对应的输出类的随机假图形。

  • 其需要标记的数据集来作为训练数据。 requires labeled datasets for training

  • 而带来的好处就是其能生成对应类别的图片。can produce example for the selected class

使用方式

  • 通过使用单热点向量来指定生成的图片类图片。Generator: Use one hot vector

  • 而在判别器中使用单热点通道判别器。 Discriminator :Use one hot channel layer matrices

模型架构

所遇到的挑战 Challenges

  • 图像的特性包含着非常多的相似性。 Features correlation: correlated feature are commons

  • Z空间是纠缠着的,并不会对应每一个特性都有相应的空间维度。Z-Space Entanglement(纠缠的): Doesn't have enough dimension to control all output features

Z向量空间的代数操作 Vector algebra in the Z-Space

在Z空间上进行寻找,直到找到对应的feature在噪声空间上的对应方向和位置。

在noise space上找方向,direction。通过在z-space上移动来生成拥有对应的feature的output。

分类器梯度 Classifier gradient

这种类型的模型需要一个预先训练好的特性分类器来给生成器做参考。Need a pre-trained classifier to classify the features and give these feedback to the generator.

解决纠缠问题 Disentanglement

通过将z 空间向量映射到潜在空间的方式去解决纠缠问题。 如果一个随机生成的噪声向量各个空间之间是纠缠的话,那么就通过搭建多层的神经网络,将向量映射到潜在的空间去解耦,这样我们就得到了解纠缠后的Z空间。Latent factors of variation : z -space factor to control the features

通过 supervised way 和unsupervised way去解决特征空间的纠缠问题

L_{new} = L_{original} +reg_{d}

reg_d可以通过classifier gradient 或者其他更先进的算法去解决这些问题,这就是经典的分类器所给出的特性的反馈

  • 解纠缠的Z空间可以让你控制单一的特性而不仅仅是图片的类别。 Disentangled Z-spaces let you control individual features by corresponding z values directly to them

  • 存在很多的监督或者非监督的学习方式可以解决纠缠问题。There are supervised and unsupervised methods to achieve disentanglement

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/179469.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第九层(3):STL之vector类

文章目录前情回顾vrctor类vrctor类的功能vector与普通数组的区别vector的迭代器vector类内的构造函数vector类内的赋值操作vector类内对容器和大小操作vector类内的插入操作vector类内的删除操作vector类内的单个访问vector类内的交换函数vector类内的预留空间下一座石碑&#…

goto语句——“C”

各位CSDN的uu你们好啊,好久不见,甚是想念。今天小雅兰要带大家学习的内容是一个小知识点——goto语句,好啦,就让我们进入goto语句的世界吧 C语言中提供了可以随意滥用的goto语句和标记跳转的标号。 从理论上 goto语句是没有必要…

Python爬虫教你爬取视频内容

前面介绍了基本的数据爬取,图片爬取的相关案例前面文章也有涉及,关于有些案例网站不能登录的问题,可以再找些别的网站,因为道理既然明白了,其实什么网站都一样,它有反爬机制,自然有应对它的办法…

安装mysql 5.7.24

官网 https://downloads.mysql.com/archives/community/ 安装 安装好后解压有如下内容 配置电脑环境变量 MYSQL_HOME mysql安装目录 PATH %MYSQL_HOME%\bin 配置mysql相关信息 (1)新建配置文件my.ini 配置的是字符集类信息与存储引擎相关信息 &…

(Java高级教程)第四章必备前端基础知识-第二节2:CSS属性

文章目录一:CSS属性一览表二:常用属性详解(1)字体属性(2)文本属性(3)背景属性一:CSS属性一览表 W3C:元素属性 A: align-content规定弹性容器内…

[Android开发练习1] 绘制国旗

前言 本题主要在于熟练使用线性布局,了解其布局特点学会横向与纵向排列控件,以及认识TextView控件,同时学会使用对控件赋予不同的权重值来布局,在布局中使用了权重的控件的宽度就要设置成0dp。另外,了解到如何应对xml代…

Linux常见命令 25 - RPM包安装、升级、卸载、查询、校验、提取

目录 1. 包名与包全名 2. RPM安装 3. RPM包升级 4. RPM包卸载 5. 查询是否安装RPM包 6. RPM包校验 7. RPM包中文件提取 1. 包名与包全名 包全名:操作的包是没有安装的软件包时,使用包全名,而且要注意路径包名:操作已经安…

【进击的算法】基础算法——怎么优雅地控制边界范围

学习范围 : ✔️数组 ✔️边界控制本文作者 : 蓝色学者i 边界控制的艺术前言一、为什么需要控制边界?二、怎么优雅地控制边界?三、令人抓狂的二分查找3.1 题目概述3.2解题思路3.3 解决方案方案一:边界都有效方案二&…

Python3 循环语句

本章节将为大家介绍 Python 循环语句的使用。 Python 中的循环语句有 for 和 while。 Python 循环语句的控制结构图如下所示: while 循环 Python 中 while 语句的一般形式: while 判断条件(condition):执行语句(statements)…… 执行流程…

【数据结构之二叉树系列】万字深剖普通二叉树的遍历+分治算法思想

目录前言一、背景知识二、前序遍历三、中序遍历四、后序遍历五、求二叉树中结点的个数1. 遍历计数(1)前序遍历计数(2)中序遍历计数(3)后序遍历计数2.分治算法思想(推荐)敬请期待前言…

Java基础 IO

IO流 IO流 什么是IO流? 存储和读取数据的解决方案 I:input O:output 流:像水流一样传输数据 IO流的作用? 用于读写数据(本地文件,网络) IO流按照流向可以分类哪两种流&#xff1f…

数据库02_函数依赖,数据库范式,SQL语句关键字,数据库新技术---软考高级系统架构师009

1.首先我们来看这个,给定一个X,能确定一个Y那么就说,X确定Y,或者Y依赖x,那么 比如y = x * x 就是x确定y,或者y依赖于x 2.然后再来看图,那么左边的部分函数依赖,就是,通过A和B能决定C,那么如果A只用给就能决定C,那么就是部分函数依赖. 3.然后再来看,可以看到,A可以决定B,那么…

servlet过滤器Filter简要回顾-过滤请求字符编码,/和/*和/**的区别

servlet过滤器Filter简要回顾-过滤请求字符编码,/和/*和/**的区别servlet过滤器1.filter过滤器的含义2.filter过滤器的使用3.测试-过滤字符编码正确响应中文编码3.1 创建servlet用于显示中文字符3.2 自定义过滤器3.3 配置web.xml中的servlet映射以及过滤器请求拦截3.4 运行输出…

【编程入门】开源记事本(安卓版)

背景 前面已输出多个系列: 《十余种编程语言做个计算器》 《十余种编程语言写2048小游戏》 《17种编程语言10种排序算法》 《十余种编程语言写博客系统》 《十余种编程语言写云笔记》 本系列对比云笔记,将更为简化,去掉了网络调用&#xff0…

第二章 物理层

第二章 物理层 2.1 物理层的基本概念 物理层考虑的是怎样才能在连接各种就算机的传输媒体上传输数据比特流,而不是指具体的传输媒体 物理层的主要任务描述为确定与传输媒体的接口有关的一些特性 机械特性 指明接口所用接线器的形状和尺寸,引脚数目和排…

辗转相除以及辗转相减法

文章目录前言辗转相除法(又名欧几里算法)辗转相减法(又名更相减损法)原始辗转相减法改版辗转相减法(减的是指数)参考文章前言 在学习Acwing c蓝桥杯辅导课第八讲数论-AcWing 1223. 最大比例时有使用到求指…

使用CNN进行2D路径规划

卷积神经网络(CNN)是解决图像分类、分割、目标检测等任务的流行模型。本文将CNN应用于解决简单的二维路径规划问题。主要使用Python, PyTorch, NumPy和OpenCV。 任务 简单地说,给定一个网格图,二维路径规划就是寻找从给定起点到所需目标位置&#xff0…

如何取消PDF文件的保护设置?

PDF文件可以设置两种保护模式,一种是打开文件保护,也就是设置打开密码,只有输入密码才能打开文件;另一种是限制保护,即限制密码,可以根据需要设置PDF文件是否可以进行编辑、复制、打印等操作。 如果不需要…

第二篇:Haploview做单倍型教程2--分析教程

大家好,我是邓飞,这里介绍一下如何使用Haploview进行单倍型的分析。 计划分为三篇文章: 第一篇:Haploview做单倍型教程1–软件安装第二篇:Haploview做单倍型教程2–分析教程第三篇:Haploview做单倍型教程…

kaggle竞赛 | 计算机视觉 | Doodle Recognition Challenge

目录赛题链接赛题背景数据集探索合并多个类别CSV数据集数据建模 (pytorch)赛题链接 https://www.kaggle.com/competitions/quickdraw-doodle-recognition/overview/evaluation 数据集从上述链接中找 赛题背景 Quick,Draw!作为实验性游戏发布&#xff…