【吴恩达GANs】【C1W4】Conditional Controllabel Generation

news2024/11/15 9:35:20

视频链接:吴恩达DeepLearning.ai之生成对抗网络(GANS)专业化〔Andrew Ng〕

4-2 Conditional generation intuition

  1. Unconditional Generation:从随机类中得到输出,每次输出的类也都是随机的,无法得到指定输出类。
  2. Conditional Generation:允许生成指定的类。如下图,就像自动售货机
    在这里插入图片描述

总结:

Conditional Generation需要标注的数据集,可以从选择的类中生成实例
在这里插入图片描述

4-3 conditional generation inputs

  1. Generator Input:Noise vector(指定类中的随机实例)+one-hot vector(指定类,也叫class vector)
    在这里插入图片描述
  2. Discriminator Input: feature(图片等) + label(描述该feature的标注信息)
    • 若feature和label可以对应,则Discriminator输出的打分高
      在这里插入图片描述

    • 若feature和label不对应,则Discriminator输出的打分低
      在这里插入图片描述
      以上图为例,其中Discriminator的输入实际为image+one-hot matrix(注意这里为了和image channel对应,是matrix而不是vector),而该种image又有3通道,即Discriminator的输入如下图所示:
      在这里插入图片描述

总结:

  1. 类信息以one-hot vector形式传给generator,以one-hot matrix形式传给discriminator
  2. vector长度 = matrix个数 = 类数量

4-4 Controllable generation

  1. 调整输入Generator的noise可以得到特征不同的输出
    在这里插入图片描述
    在这里插入图片描述
  2. Controllable Generation和Conditional Generation的对比:
    在这里插入图片描述

4-5 Vector algebra in the z-space

z1和z2是z-space中的两个维度,v1=[5,10],v2=[4,2] 是z-space中的两个向量,g(v1)和g(v2)生成的两张图像如下。如果想得到这两张图像的中间值(通过这些中间值可以看到这两张图像相互转换的中间过程),可以在z1和z2维度中对v1和v2进行中间插值
在这里插入图片描述
那么一旦我们找到了从一个特征到另一个特征的矢量d,就可以从一张图像g(v1)生成另一张g(v1+d)
在这里插入图片描述

4-6 Challenges with controllable generator

  1. Feature correlation:有的特征和其他特征是有相关关系的,比如给不能给女生加上胡子,而是需要将其性别调整为男性之后再添加胡子
    在这里插入图片描述
  2. Z-space Entanglement
    由Feature correlation导致的Z-space中的特征纠缠问题,即若想改变输出的某一特征,不能只改变noise vector中的一项,即需要改变noise vector中的多项,而这又会导致输出的其他特征发生改变。特别是当噪声 z 维度不够时,就更容易发生z-space entanglement。
    在这里插入图片描述

总结:

当我们试图去改变一个特征,其他关联特征也会被改变。当z维度不够时会发生Z-space entanglement问题,使得特征控制问题变得困难。

4-7 Classifier gradients

如下图所示,g(noise)生成一个图像后,用pre-trained classifier来识别该图像内容的特征(在这里是图像中的人是否佩戴了太阳镜),classifier返回的识别结果再用来修改noise vector z的值,而不用修改Generator的权重值。其中每一张被归类为“没有佩戴太阳镜”的图像都会受到梯度惩罚,重复以上过程直至Generator生成的图像中的人都是佩戴了太阳镜
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

总结:

classifier可以找到改变某一特征的方向,即4-8中从v1到v2的方向矢量d。这一过程中只更新noise vector的值。

4-8 Disentanglement

解决Z-space Entanglement需要改变一个向量的同时不改变其他向量。

解决方法一:将类信息嵌入到噪声向量中。但是这种方法会对连续类生成有问题
在这里插入图片描述
解决方法二:不给任何实例加标注,而是在损失函数是中加入一个正则化项,来鼓励模型将 噪声向量中的每个索引 与 输出中的不同特征 相关联。而这一正则化项可以来自classifier gradients或者其他无监督方法等。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/605751.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redis和Mysql数据同步方案---延迟双删

一般场景下数据库和redis的同步机制: 针对有请求来读取数据库的场景: 但是如果有想要修改数据库内容的场景该怎么保持同步呢? 在我们访问redis时,redis中的数据可能不是热点数据,即此时数据库的更新操作已经完成&…

chatgpt赋能python:Python几行代码:打造高效SEO工具

Python几行代码:打造高效SEO工具 Python作为一种易用、可靠的编程语言,在数据处理、网页爬取等方面都有广泛应用。而对于SEO工作者来说,利用Python写几行简单的代码,可以帮助我们更高效地分析网站数据、监控关键词排名、抓取竞争…

测试工程师:“ 这锅我不背 ” ,如何回怼开发....?

前言 在一个周末的早餐我被同事小周叫出去跑步,本想睡个懒觉,但是看他情绪不太稳定的样子,无奈艰难爬起陪他去跑步。 只见她气冲冲的对着河边大喊:真是冤枉啊!!! 原来是在工作中被莫名其妙背锅&#xff0…

计算机存储体系

目录 一、基本概念 二、主存储器的基本组成 三、SRAM和DRAM 四、只读存储器ROM 五、主存储器与CPU的连接 六、双端口RAM和多模块存储器 七、磁盘存储器 八、固态硬盘SSD 九、Cache高速缓冲存储器 十、虚拟存储系统 一、基本概念 存储器的层次结构 主存——辅存&…

1_5 光流法计算VO(optical_flow)

采用特征点法做VO存在耗时较大的问题,一般耗时情况:如下 (1) 在图像中提取特征点并计算特征描述, 非常耗时 ~10ms ORB,shift耗时更多; (2) 在不同图像中寻找特征匹配, 非常耗时 …

centos上搭建以太坊私有链

第一步 安装go语言环境 root用户下新建一个soft目录(相关目录可以随意) 去golang官网找到链接,在soft目录下下载golang压缩包 wget --no-check-certificate https://go.dev/dl/go1.20.4.linux-amd64.tar.gz其中如果出现Unable to establish SSL connection.&am…

Redis持久化、主从与哨兵架构-02

RDB快照(snapshot) 在默认情况下, Redis 将内存数据库快照保存在名字为 dump.rdb 的二进制文件中。 你可以对 Redis 进行设置, 让它在“ N 秒内数据集至少有 M 个改动”这一条件被满足时, 自动保存一次 数据集…

QLoRA | 48G内存训练24小时,改进版4-bit量化技术微调650亿参数的模型达到chatgpt99.3%的效果

一、概述 title:QLORA: Efficient Finetuning of Quantized LLMs 论文地址:https://arxiv.org/pdf/2305.14314.pdf 代码:GitHub - artidoro/qlora: QLoRA: Efficient Finetuning of Quantized LLMs and https://github.com/TimDettmers/bi…

【搭建服务器】Python一行命令搭建HTTP服务器并外网访问

文章目录 1.前言2.本地http服务器搭建2.1.Python的安装和设置2.2.Python服务器设置和测试 3.cpolar的安装和注册3.1 Cpolar云端设置3.2 Cpolar本地设置 4.公网访问测试5.结语 1.前言 Python作为热度比较高的编程语言,其语法简单且语句清晰,而且python有…

Jetson AGX 安装 VScode 教程,适用于所有系统安装旧版本 VScode

最近使用Jetson AGX做项目,系统为Jetpack4.6,Ubuntu18.04版本,想装个VScode编辑代码,但是设备的内核是ARM 64架构,搜出来的是arrch64 直接在VScode官网上下载的arm版本deb安装包,无法安装,经过…

论文学习笔记:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

论文阅读:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 今天学习的论文是 ICCV 2021 的 best paper,Swin Transformer,可以说是 transformer 在 CV 领域的一篇里程碑式的工作。文章的标题是一种基于移动窗口的…

【LeetCode】14,最长公共前缀。 难度等级:简单。知识点:字符串的大小比较(比较 ascii码的大小)

文章目录 一、题目二、我的解法:双指针逐个字符比较三、巧妙解法:字符串的字典序比较四、知识点:字符串的字典序比较 一、题目 二、我的解法:双指针逐个字符比较 双指针逐个字符比较是最容易想到的方法,但由于测试用例…

torch_scatter.scatter()的使用方法

学习目标: 在学习PyG时,遇到了 scatter 这个函数,经过学习加上自身的理解,记录如下以备复习 学习内容: src:表示输入的tensor,接下来被处理;index:表示tensor对应的索引…

【C++】C++11

文章目录 1、C11的简介2、 统一的列表初始化2-1、{}初始化2-2、std::initializer_list 3、声明3-1、auto3-2、decltype3-3、nullptr 4、范围for循环5、智能指针6、STL中一些变化6-1、STL新容器和容器新方法6-2、final和override 7、右值引用和移动语义7-…

【网络协议详解】——OSPF协议(学习笔记)

目录 🕒 1. 概述🕒 2. 相关概念🕘 2.1 基本思想🕘 2.2 区域及路由🕘 2.3 链路状态数据库🕤 2.3.1 点到点网络🕤 2.3.2 点到多点网络🕤 2.3.3 广播网络与非广播多址接入网络&#x1f…

嵌入式开发常用的几招调试方法

嵌入式系统调试时相对比较麻烦一些,特别是在定位一些疑难问题时,调试手段就显得非常重要。废话不多说,直接上方法。 方法一:利用特殊文件名字的文件存在与否来触发调试代码是否运行。比如有些特殊状况下,我们需要保存一…

文心一言 VS 讯飞星火 VS chatgpt (30)-- 算法导论5.2 2题

二、在 HIRE-ASSISTANT 中,假设应聘者以随机顺序出现,你正好雇用两次的概率是多少? 文心一言: 我们可以先计算出在HIRE-ASSISTANT中,雇佣一个应聘者的概率为3/4,然后计算出雇佣两次应聘者的概率为3/4 * 3…

教你用Appium搭建Android自动化测试框架(详细教程)

如题,本文附有仓库地址以及代码,目录如下: 1.下载安装appium 2.配置并使用appium 3.配置工程 一、下载安装appium 下载appium-desktop的mac版本,我选择用1.17.1版本,最新的版本1.22.0,拆分一个桌面应用…

k-means算法超级详解-转载

这是搬运的 一、 实验准备 1.1 实验概述 所谓聚类算法是指将一堆没有标签的数据自动划分成几类的方法,属于无监督学习方法,这个方法要保证同一类的数据有相似的特征。根据样本之间的距离或者说是相似性(亲疏性),把越…

牛郎织女的幸福生活(活锁)

从前,有一对夫妻,男的叫牛郎,女的叫织女,他们很好地传承了中华民族的谦让美德,每次吃饭时都会优先考虑对方,如果对方饿的话,就让给对方吃,等对方吃饱了自己才吃,这种美德…