GAN：DCGAN-深度卷积生成对抗网络

GAN：DCGAN-深度卷积生成对抗网络

news2026/4/8 18:33:52

论文：https://arxiv.org/pdf/1511.06434.pdf

发表：ICLR 2016

一、架构创新

1：全卷积网络：用逐步卷积代替确定性的空间池化函数（如maxpooling），使网络学习自己的空间下采样。使用这种方法，允许它学习他自己的空间上采样和鉴别器。

2：取消卷积特征之上的全连接层：gap平均池化层提升了模型的稳定性，但降低了收敛速度。

3：批量标准化：BN有助于处理由于初始化较差而出现的训练问题，并帮助深层模型中的梯度流。这证明深层生成器开始学习非常重要。直接将批处理应用于所有层面，会导致样品振荡和模型不稳定。通过不将批处理应用于生成器输出层和鉴别器输入层来避免。

生成器中除了output层使用Tanh 激活，其他层使用ReLU激活。判别器中使用leaky ReLU激活。

二、训练干货

1：除了缩放至tanh激活函数[-1，1]的范围之外，没有对训练图像进行应用预处理。

2：使用小批量随机梯度下降法（SGD）进行训练，batch size为128。

3：权重初始化都是以零为中心的正态分布初始化的，标准偏差为0.02。

4：在LeakyReLU中，斜率设置为0.2。

5：使用Adam优化器。我们发现建议的学习率为0.001太高，用0.0002来代替。此外，我们发现将动量项留在0.9的建议值导致了训练振荡和不稳定性，同时将其降低到0.5，这有助于稳定训练。

三、操纵生成表示

去除图像中某些物体，论文中实现的方法如下：
- 选择152张生成的图片，对其中52张有窗户的图像，标记窗户的location。
- 在倒数第二层卷积features上，使用逻辑回归找出窗户的位置。来自窗户的位置区域的是positives，图上的其他区域是negatives。
- 将窗户区域中weights大于0的特征进行丢弃（手动设置为0）。
- 使用相同的输入特征，重新生成图片。
- 论文配图如下：
  - 第一行为原始图片（有窗户）。
  - 第二行为将窗户相关特征添加到dropout后的结果（没有窗户）。
  - 总体结果：图像变模糊，但窗户在一定程度上也少了。

四、人脸上的尝试

经典示例：king国王特征 - man男性特征 + women女性特征 = queen女王特征

对单个样本进行实验，结果是不稳定的，但是对三个样本的Z向量进行平均，显示了在语义上服从算术是一致的和稳定的。此外，我们还证明了人脸姿态也是在Z空间中线性建模的。 （暗指人脸编辑是可行的，当然这个是16年，很早的文章了，很有启发性。后续已经有更好的方案了）

3个女性（微笑表情）的平均 - 3个女性（正常表情）的平均 + 3个男性（正常表情）的平均

= 可以生成微笑表情的男性

左边3列：

对于每一列，将样本的Z向量进行算术运算，得到新的向量Y。中心

右边3列：

中间样本是通过将 Y 作为输入提供给生成器而生成的。

其他两列是通过使用比例为 +-0.25 的均匀噪声采样对Y进行操作，产生得到。

五、代码尝试

1：阅读pytorch官方指南：https://pytorch.org/tutorials/beginner/dcgan_faces_tutorial.html

2：使用pytorch官方代码：https://github.com/pytorch/tutorials/blob/main/beginner_source/dcgan_faces_tutorial.py

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1261999.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

京东大数据（京东运营数据采集）：2023年10月京东牛奶乳品行业品牌销售排行榜

京东大数据（京东运营数据采集）：2023年10月京东牛奶乳品行业品牌销售排行榜

鲸参谋监测的京东平台10月份牛奶乳品市场销售数据已出炉！ 10月份，牛奶乳品整体销售上涨。鲸参谋数据显示，今年10月，京东平台上牛奶乳品的销量将近1700万，同比增长1%；销售额将近17亿，同比增长约5…

阅读更多...

双通道 12V 直流电机驱动芯片GC8548，可替代LV8548/LV8549/ONSEMI，内置 LDO，不需要逻辑电源，输入兼容 3.3V 与 5V

双通道 12V 直流电机驱动芯片GC8548，可替代LV8548/LV8549/ONSEMI，内置 LDO，不需要逻辑电源，输入兼容 3.3V 与 5V

GC8548 是一款双通道 12V 直流电机驱动芯片，为摄像机、消费类产品、玩具和其他低压或者电池供电的运动控制类应用提供了集成的电机驱动解决方案。芯片一般用来驱动两个直流电机或者驱动一个步进电机。它可以工作在 3.8~12V 的电源电压上， 每通道能提…

阅读更多...

如何通过内网穿透实现公网远程ssh连接kali系统

如何通过内网穿透实现公网远程ssh连接kali系统

文章目录 1. 启动kali ssh 服务2. kali 安装cpolar 内网穿透3. 配置kali ssh公网地址4. 远程连接5. 固定连接SSH公网地址6. SSH固定地址连接测试简单几步通过[cpolar 内网穿透](cpolar官网-安全的内网穿透工具 | 无需公网ip | 远程访问 | 搭建网站)软件实现ssh远程连接kali 1…

阅读更多...

中小型公司如何搭建运维平台，rancher、kubersphere、rainbond

中小型公司如何搭建运维平台，rancher、kubersphere、rainbond

很多开发人员应该是了解过运维发布相关的平台或实际操作过应用发布，但又通常不是十分熟悉。在一个初创公司，或者没有成熟的运维发布平台的公司，如果让你来搭建一套发布平台，你应该如何去抉择呢？ 这里我简单介绍几种。…

阅读更多...

“大型”基础模型中幻觉的调查

“大型”基础模型中幻觉的调查

Abstract 基础模型 (FM) 中的幻觉是指生成偏离事实或包含捏造信息的内容。这篇调查论文广泛概述了近期旨在识别、阐明和解决幻觉问题的努力，特别关注“大型”基础模型（LFM）。该论文对LFM特有的各种类型的幻觉现象进行了分类，并建…

阅读更多...

Mybatis 源码搭建

Mybatis 源码搭建

文章目录源码下载测试模块搭建学习博客源码下载首先下载mybatis-parent的源码：gitee地址 > https://gitee.com/callback_lab/mybatis-parent.git 然后下载mybatis的源码：gitee地址 > https://gitee.com/callback_lab/mybatis-src.git 带中文…

阅读更多...

pandas(八)--实战一下

pandas(八)--实战一下

背景收到一批数据，数据形式。采集数据的间隔时间是10分钟，全天采集数据，每天的数据量是144条处理后的数据形式分析去除表格中的q的异常值，置为0去除重复行将原始表格中的date分裂成日期和时间缺失的时间点数据补0&#x…

阅读更多...

最新的外贸自建站教程？做外贸如何建网站？

最新的外贸自建站教程？做外贸如何建网站？

外贸自建站教程步骤有哪些？海洋建站如何做网站搭建？ 想要了解关于外贸自建站的最新教程吗？外贸自建站不再是高不可攀的难题，相反，它为企业提供了更多的机会和自主掌握业务的空间。海洋建站将为您提供一份全面的指南&a…

阅读更多...

山寨Stream API设计分析

山寨Stream API设计分析

作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO 联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬私以为，Jav…

阅读更多...

多类场景、遍布各地，融云 IM 支撑多款应用全球增长

多类场景、遍布各地，融云 IM 支撑多款应用全球增长

（全网都在找的《社交泛娱乐出海作战地图》，点击获取👆） 无论是面向企业场景的工作流协同还是消费场景的网络效应形成，商务社交还是陌生人社交，IM 都是必备组件。IM 遍布互联网各角落，出现在所有…

阅读更多...

超声波雪深监测站冬季雪景的智能守护者

超声波雪深监测站冬季雪景的智能守护者

随着冬季的到来，白雪皑皑的景象让人感到无比美丽。然而，雪景的美丽却给人们的生活和出行带来了一定的困扰。雪的深度和分布是影响道路交通、公共安全和旅游体验的关键因素。为了解决这一问题，WX-XS1 超声波雪深监测站在冬季应运而生&#xff…

阅读更多...

Nvidia VPI 双目相机生成深度图

Nvidia VPI 双目相机生成深度图

nVidia VPI（Vision Programming Interface）提供了多种后端，用于执行图像处理和计算机视觉操作。不同的后端针对不同的硬件和用例进行了优化。这些后端包括： 1. CPU: 这是最通用的后端，它运行在标准的中央处理器&#…

阅读更多...

【2023CANN训练营第二季】——Ascend C自定义算子工程介绍及实验

【2023CANN训练营第二季】——Ascend C自定义算子工程介绍及实验

一、自定义算子工程介绍与创建自定义算子工程是一个包含用户编写的host侧和kerne|侧算子实现文件的，用于编译和安装自定义算子run包的工程框架。 CANN软件包中提供了工程创建工具msopgen，开发者可以输入算子原型定义文件生成Ascend C算子开发工程。需…

阅读更多...

AMP State Evolution的计算：以伯努利先验为例

AMP State Evolution的计算：以伯努利先验为例

AMP State Evolution (SE)的计算 t 1 t1 t1时， E ( t ) E [ X 2 ] \mathcal E^{(t)} \mathbb E [X^2] E(t)E[X2]，SE的迭代式为 τ r ( t ) σ 2 1 δ E ( t ) E ( t 1 ) E ∣ η ( t ) ( X Z ) − X ∣ 2 , Z ∼ N ( 0 , τ r ( t ) ) \begin{a…

阅读更多...

盘点72个Android系统源码安卓爱好者不容错过

盘点72个Android系统源码安卓爱好者不容错过

盘点72个Android系统源码安卓爱好者不容错过学习知识费力气，收集整理更不易。知识付费甚欢喜，为咱码农谋福利。链接：https://pan.baidu.com/s/1qiWeLjF2i4dlgmTYgPPSvw?pwd8888 提取码：8888 项目名称 A keyboardlisten…

阅读更多...

AIGC系列之：升级版的Stable Diffusion之SDXL介绍

AIGC系列之：升级版的Stable Diffusion之SDXL介绍

目录 AIGC工具对比 DALL-E MidJourney Stable Diffusion 相关资料 SDXL介绍 SDXL生图效果 SDXL训练LoRA流程 AIGC工具对比在目前的三大新兴文本转图像模型中，Stable Diffusion诞生得最晚，但由于拥有发展良好的开源社区，它的用户关注…

阅读更多...

Linux系统安装Docker-根据官方教程教程（以Ubuntu为例）

Linux系统安装Docker-根据官方教程教程（以Ubuntu为例）

Linux系统安装Docker-根据官方教程教程（以Ubuntu为例） 1. 背景介绍2. 环境配置2.1 软件环境要求2.2 软件下载2.3 文档地址2.3 必备命令工具下载 3. 安装Docker3.1 使用root用户操作后续命令3.2 卸载可能存在的旧版本 4. 安装Docker4.1 更新依赖包4.4 配置…

阅读更多...

530. 二叉搜索树的最小绝对差在java中，一个类里面的属性，直接定义在类下面和定义在该类的方法里，有什么区别

530. 二叉搜索树的最小绝对差在java中，一个类里面的属性，直接定义在类下面和定义在该类的方法里，有什么区别

530. 二叉搜索树的最小绝对差原题链接：完成情况：解题思路：参考代码：错误经验吸取在java中，一个类里面的属性，直接定义在类下面和定义在该类的方法里，有什么区别？？&…

阅读更多...

webshell之反射免杀

webshell之反射免杀

主要讲解反射在webshell中的利用，以及反射绕过杀软的利用与原理原始反射马免杀效果: 特征太明显里面还有java.lang.Runtime，getRuntime，exec这些敏感内容，由于与反射相关的参数都是字符串，由此我们能操作的空间就很…

阅读更多...

接口01-Java

接口01-Java

接口-Java 一、引入(快速入门案例)二、接口介绍1、概念2、语法三、应用场景四、接口使用注意事项五、练习题1 一、引入(快速入门案例) usb插槽就是现实中的接口。你可以把手机、相机、u盘都插在usb插槽上，而不用担心那个插槽是专门插哪个的，原因是做u…

阅读更多...

推荐文章

最新文章