训练 GAN 之技巧

news2024/11/14 15:02:05

        GAN 是以很难训练而闻名的,我们接下来介绍一些其中的原因和训练GAN的小技巧。 首先,我们回顾一下判别器和生成器都在做些什么。判别器的目标是要分辨真的图片与产生 出来的假图片间的差异,而生成器在做的事情是要去产生假的图片,骗过判别器。而事实上 这两个网络,生成器和判别器它们是互相砥砺才能互相成长的,如图1所示。因为如果判 别器太强了,那么生成器就会很难骗过它,生成器就会很难产生出真的图片。但是如果生成 器太强了,那么判别器就会很难分辨真图片和假图片。只要其中一者发生什么问题停止训练, 另外一个就会跟着停下训练就会跟着变差。假设在训练判别器的时候一下子没有训练好,那 么判别器没有办法分辨真的跟产生出来的图片的差异,同时生成器就失去了可以进步的目标, 生成器就没有办法再进步了。那么判别器也会跟着停下来,所以这两个网络是互相砥砺才能互相成长的。所以这也是为什么GAN很难训练的原因,因为这两个网络必须要同时训练,而 且必须要同时训练到一个比较好的状态。

图1 GAN 训练的难点

        所以GAN 本质上它的训练仍然不是一件容易的事情,当然它是一个非常重要的前瞻技 术。有一些训练GAN的小技巧,例如Soumith、DCGAN、BigGAN等等。大家可以自己看 看相关文献进行尝试。

        训练GAN 最难的一个领域其实是要拿GAN来生成文字。如果要生成一段文字那需要 一个序列到序列的模型,其中的一个解码器会产生一段文字,如图2所示。这个序列到序 列的模型就是我们的生成器。著名的Transformer就是一个解码器,它现在在GAN里面,就 扮演了生成器的角色,负责产生我们要它产生的东西,比如说一段文字。那这个序列到序列的 GAN 和原来的用于图像中的GAN有什么不同呢?就最高层次来看,就算法来讲它们没有太 大的不同。因为本质上就是训练一个判别器,判别器把这段文字读进去,去判断说这段文字是 真正的文字还是机器产生出来的文字。而解码器就是想办法去骗过判别器,生成器就是想办 法去骗过判别器,我们来调整生成器的参数,想办法让判别器觉得生成器产生出来的东西是 真正的文字。所以从算法的角度来讲,它们没有太大的不同。对于序列到序列的模型其真正 的难点在于,如果要用梯度下降去训练解码器,去让判别器输出得分越大越好,你会发现很 难做到。我们来思考下,假设我们改变了解码器的参数,这个生成器,也就是解码器的参数, 有一点小小的变化的时候,到底对判别器的输出有什么样的影响。如果解码器的参数有一点 小小的变化,那它现在输出的分布也会有小小的变化,那因为这个变化很小,所以它对于输出 的词元不会有很大的影响。

图 2  序列生成的GAN

        其中词元就是现在在处理产生这个序列的单位。假设我们今天,在产生一个中文的句子 的时候,我们是每次产生一个汉字,那这每一个汉字就是我们的词元。在处理英文的时候,每 次产生一个英文的字母,那字母就是你的词元。所以词元就是你产生一个序列的单位,那这个 单位是你自己定义的。假设你一次是产生一个英文的词,英文的词和词之间是以空白分开的, 那就是词就是你的词元。

        我们回到刚才的讨论,假设输出的分布只有小小的变化,并且在取最大值的时候,或者 说在找分数最大那个词元的时候,你会发现分数最大的那个词元是没有改变的。输出的分布 只有小小的变化,所以分数最大的那个词元是同一个。那对于判别器来说,它输出的分数是没有改变的。判别器输出也不会改变,所以你根本就没有办法算微分,也根本就没有办法做 梯度下降。当然就算是不能做梯度下降,我们还是可以用强化学习的方法来训练生成器。但 是强化学习本身是以难训练而闻名,GAN也是以难训练而闻名,这样的东西加在一起,就会 非常非常地难训练。所以要用GAN产生一段文字,在过去一直被认为是一个非常大的难题。 所以有很长一段时间,没有人可以成功地把生成器训练起来产生文字。 

        直到有一篇文章叫做ScratchGAN,不需要预训练(pre-training),可以直接从随机的 初始化参数开始,训练生成器,然后让生成器可以产生文字。它的方法是调节超参数,并且 加上一些训练技巧,就可以从零开始训练生成器。里面的技巧比如说要用SeqGAN-Step的技 术,并且将训练批大小设置的很大,要上千,然后要用强化学习的方法,要改一下强化学习的 参数,同时加一些正则化等等技巧,就可以从真的把GAN训练起来,然后让它来产生序列。

        此外,其实有关生成式的模型不是只有GAN而已,还有其他的比如VAE,比如流模型 等等,这些模型都有各自的优缺点。当然,就假设目前想要训练一个生成器,想让机器可以生 成一些东西还是那有很多方法,可以用GAN,可以VAE,也可以用流模型。但是如果我们想 要产生一些图片,那就最好用GAN,因为GAN是目前为止比较好的生成式的模型,它可以 产生最好的图片。但是如果想要产生一些文字,那就只有用VAE或者流模型,因为GAN在 产生文字的时候,还是有一些问题。从训练角度,你可能会觉得GAN从式子上看起来有一个 判别器和生成器,它们要互动。然后像流模型和VAE它们都比较像是直接训练一个一般的模 型,有一个很明确的目标,不过实际上训练时它们也没有那么容易成功地被训练起来。因为它 们的分类里面有很多项,它们的损失函数里面有很多项,然后把每一项都平衡才能够有好的 结果,但要达成平衡也非常地困难。

        那为什么我们需要用生成式来做输出新图片的事情呢?如果我们今天的目标就是,输入 一个高斯分布的变量,然后使用采样出来的向量,直接输出一张照片,能不能直接用监督学习 的方式来实现呢?具体做法比如我有一堆图片,每一个图片都去配一个向量,这个向量来源于 从高斯分布中采样得到的向量,然后我就可以用监督学习的方式来训练一个网络,这个网络 的输入是这个向量,输出是这个图片。确实能这么做,也真的有这样的生成式模型。但是难点 在于,如果纯粹放随机的向量,那训练起来结果会很差。所以需要有一些特殊的方法例如生成 式潜在优化等方法,供大家参考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2106304.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RK3588平台开发系列讲解(显示篇)图像的宽高和跨距

文章目录 一、图像宽、高二、图像跨距沉淀、分享、成长,让自己和他人都能有所收获!😄 “图像的基本组成单元为像素,对视频图像的存储,实际上是对像素的存储”。基于图像位深,我们可以确定存储一个像素所需的字节数,下面,可以开始“指导”计算机如何定量读取图像数据了…

图文解析保姆级教程:Postman专业接口测试工具的安装和基本使用

文章目录 1. 引入2. 介绍3. 安装4. 使用 此教程摘选自我的笔记:黑马JavaWeb开发笔记16——请求(postman、简单参数、实体参数、数组集合参数、日期参数、Json参数、路径参数)想要详细了解更多有关请求各种参数介绍的知识可以移步此篇笔记。 1…

存储卡恢复:如何从存储卡恢复已删除的照片/视频?

如何使用免费软件从存储卡恢复已删除的照片/视频? 在我们的指南中,从 Android 手机的微型 SD 卡恢复已删除的文件是免费的。以下是恢复所需的信息。 一台装有 Windows 操作系统的计算机;一个存储卡适配器(必需,因为如…

配置IPv6 over IPv4的手动隧道和自动隧道

正文共:888 字 9 图,预估阅读时间:1 分钟 随着IPv6的不断普及,现在家庭宽带基本上都能获取到IPv6地址了,介于此种场景,我们介绍了比较常见的GRE over IPv6的业务配置(配置GRE over IPv6隧道&…

基于SSM+MySQL的民宿推荐系统

系统背景 随着经济发展,各类电子产品普及千家万户。网民数量不断增加,网络显然已经成为了人际交流的重要形式。回顾近一个世纪的科技发展史,各类新的信息发布手段均随着时代洪流更新。旧时代是广播,报纸,电视&#xff…

读软件设计的要素01概念

1. 概念 1.1. 一个软件,从运行于手机上的最小程序到大型的企业系统,都是由概念组成的,每个概念都是独立的功能单元 1.2. 软件中的可用性问题,经常可以追溯到其底层概念 1.2.1. 概念帮助识别软件的不可用性 1.3. 概念都是以同样…

后端发送数据成功,前端也接收成功,但是显示不出来

提示&#xff1a; shouye.vue:128 [Vue warn]: Property "LiuyanData" was accessed during render but is not defined on instance. at <PopularPets onVnodeUnmountedfn<onVnodeUnmounted> refRef< Proxy(Object) {getdata: ƒ, getLiuyan: ƒ, …} …

武汉凯迪正大—氧化锌避雷器带电测试仪 氧化锌避雷器阻性电流测试仪

产品概述 武汉凯迪正大KDYZ-201氧化锌避雷器测试仪是用于检测氧化锌避雷器电气性能的专用仪器&#xff0c;该仪器适用于各种电压等级的氧化锌避雷器的带电或停电检测&#xff0c;从而及时发现设备内部绝缘受潮及阀片老化等危险缺陷。 仪器操作简单、使用方便&#xff0c;测量…

经济下行,这4家AGV巨头却逆势扩产

导语 大家好&#xff0c;我是社长&#xff0c;老K。专注分享智能制造和智能仓储物流等内容。 在全球经济普遍面临下行压力的微妙时刻&#xff0c;当众多企业纷纷收缩战线、谨慎前行时&#xff0c;自动引导车&#xff08;AGV&#xff09;行业却悄然掀起了一股扩产浪潮。 四家行业…

2024国赛数学建模备战-数学建模思想方法大全及方法适用范围

第一篇&#xff1a;方法适用范围 一、统计学方法 1.1 多元回归 1、方法概述&#xff1a; 在研究变量之间的相互影响关系模型时候&#xff0c;用到这类方法&#xff0c;具体地说&#xff1a;其可以定量地描述某一现象和某些因素之间的函数关系&#xff0c;将各变量的已知值带…

C3与C2f模块介绍与代码

C3与C2f模块介绍与代码 微信公众号&#xff1a;幼儿园的学霸 目录 文章目录 C3与C2f模块介绍与代码目录简介CSP/C3模块概述C2f模块概述C3与C2f结构对比参考资料 简介 顺序:CSPNet->C3->C2f C2 module refers to the CSP (Cross Stage Partial) Bottleneck with 2 convol…

【LabVIEW学习篇 - 18】:人机界面交互设计02

文章目录 错误处理函数简单错误处理器通用错误处理器清楚错误合并错误错误代码至错误簇转换查找第一个错误 鼠标指针 错误处理函数 在LabVIEW中&#xff0c;是通过错误输入簇和错误输出簇来传递错误信息&#xff0c;可以将底层错误信息传递到上层VI。设计人员需要对不同程度的…

Air780E低功耗4G模组硬件设计手册01

本文主要介绍了Air780E的硬件设计中的的应用接口部分。 一、主要性能 Air780E模块功能框图&#xff1a; 模块型号列表&#xff1a; 模块主要性能&#xff1a; *注: 模组工作在-40C&#xff5e;-35C或75C&#xff5e;85C温度范围时&#xff0c;模组可以正常工作&#xff0c;但…

基于51单片机的车距离警示灯proteus仿真

地址&#xff1a; https://pan.baidu.com/s/1tBIqTY4cCK38Z_xRKrq83g 提取码&#xff1a;1234 仿真图&#xff1a; 芯片/模块的特点&#xff1a; AT89C52/AT89C51简介&#xff1a; AT89C52/AT89C51是一款经典的8位单片机&#xff0c;是意法半导体&#xff08;STMicroelectro…

pyqt fromlayout 布局中间空隙问

问题&#xff1a;当采用 form layout 布局时候&#xff0c;在qt designer 设计界面&#xff0c;如果把中间移除会在布局中间占用位置&#xff08;图1、图2&#xff09;&#xff0c;需要把后续空间向前移动后保存&#xff08;图3&#xff09;&#xff0c;在将界面文件打开即显示…

基于STM32景区环境监测系统的设计与实现(论文+源码)

1系统方案设计 根据系统功能的设计要求&#xff0c;展开基于STM32景区环境监测系统设计。如图2.1所示为系统总体设计框图。系统以STM32单片机作为系统主控模块&#xff0c;通过DHT11传感器、MQ传感器、声音传感器实时监测景区环境中的温湿度、空气质量以及噪音数据。系统监测环…

中国各省会、地级市到杭州球面距离的数据

环境规制是一系列政策措施&#xff0c;旨在解决环境问题、保护生态环境&#xff0c;并推动低碳可持续发展。这些措施包括法律法规、行政命令和经济激励等&#xff0c;目的是减少企业和个人对环境的负面影响。环境规制强度是衡量这些政策措施严格程度的指标&#xff0c;通常通过…

GIS十大经典问题之9.地形分析问题

本系列《GIS十大经典问题》包括&#xff1a; 缓冲区分析问题叠加分析问题最短路径分析问题空间插值问题泰森多边形&#xff08;Voronoi 图&#xff09;生成问题空间聚类问题空间数据压缩问题空间查询问题地形分析问题网络分析中的连通性问题 一、地形分析介绍 地形分析在地理…

HTTP 二、进阶

四、安全 1、TLS是什么 &#xff08;1&#xff09;为什么要有HTTPS ​ 简单的回答是“因为 HTTP 不安全”。由于 HTTP 天生“明文”的特点&#xff0c;整个传输过程完全透明&#xff0c;任何人都能够在链路中截获、修改或者伪造请求 / 响应报文&#xff0c;数据不具有可…

数字化营销:品牌知名度提升的新利器

​嘿&#xff0c;朋友们&#xff01;在如今这个数字化高速发展的时代&#xff0c;企业的营销格局发生了翻天覆地的变化。使用蚓链数字化营销系统&#xff0c;数字化营销正成为提升品牌知名度的关键力量。 先来了解一下蚓链数字化营销的内涵与特点。它是利用数字技术和互联网平台…