深度卷积对抗神经网络 基础 第二部分 DC-GANs

news2024/10/6 6:47:24

深度卷积对抗神经网络 基础 第二部分 DC-GANs

DC-GANs (DC-GANs Deep convolutional GAN)是基于GANs的一种专门对图片生成的一种模型,其通过卷积操作来进行图片的一些基本操作来实现模型的功能。

激活函数 Activations

激活函数是任何输入的输出是一个区间内的函数。其必须是可导,并且是非线性的。

一些通用的激活函数包括:(Common activation functions)

  • 线性整流函数 (ReLU): 负无穷的时候其值都为0 Rectified Linear Unit dying problem wiht 0 derivative

  • Leaky ReLU: 负无穷的时候,其值不断减小而不是0,其解决了训练饱和问题 X<0 a slope saturation problems

  • Sigmoid: $ \frac{1}{1+e^{-z}} $ 在classification中用于最后的计算概率,但是在hidden layer中不能使用他,是因为函数在正无穷或者负无穷会产生导数为零的点,这样也就造成了学习停止的问题。 Vanishing gradient and saturation problems

    Screenshot 2023-01-12 112332

  • Tanh: 双曲正弦 hyperbolic tangent or tanh for short t a n h ( z ) tanh(z) tanh(z)

    • 优点是保持了输出的正负号,其有时很重要。Keep the sign of input which is important in some application
    • 会出现之前的梯度崩溃以及饱和的问题Same issues as sigmoid vanishing gradient and saturation problems

    Screenshot 2023-01-12 112723

批标准化 Batch normalization - Using batch statistics

定义

批标准化(Batch Normalization )简称BN算法,是为了克服神经网络层数加深导致难以训练而诞生的一个算法。根据ICS理论,当训练集的样本数据和目标样本集分布不一致的时候,训练得到的模型无法很好的泛化。

而在神经网络中,每一层的输入在经过层内操作之后必然会导致与原来对应的输入信号分布不同,并且前层神经网络的增加会被后面的神经网络不断的累积放大。这个问题的一个解决思路就是根据训练样本与目标样本的比例对训练样本进行一个矫正,而BN算法(批标准化)则可以用来规范化某些层或者所有层的输入,从而固定每层输入信号的均值与方差 。

当出现数据集的不同特征分布不同的情况时,那么cost function的最优解以及分布也会相应地移动,正如下图所示。这样会影响训练的整体有效性以及降低训练速度,因此通过batch normalization来解决这个问题。

优点

其优点包含如下:

  1. 稳定化模型并减少内部自己的本征移动,导致学习不准确。Stablize the model and reduce the internal covariate shift
  2. 可以平滑损失函数。 Smooths the cost function
  3. 加速学习速度。 Speed up learning
  4. 减少了参数的人为选择,可以取消dropout和L2正则项参数,或者采取更小的L2正则项约束参数。
  5. 减少了对学习率的要求。
  6. 可以不再使用局部响应归一化了,BN本身就是归一化网络。
  7. 更破坏原来的数据分布,一定程度上缓解过拟合(over-fitting)。

Screenshot 2023-01-12 114330

使用方法

使用方法便是一般用在非线性映射(激活函数)之前,对y= Wx + b进行规范化,是结果(输出信号的各个维度)的均值都为0,方差为1,让每一层的输入有一个稳定的分布会有利于网络的训练。 在神经网络收敛过慢或者梯度爆炸时的那个无法训练的情况下都可以尝试。

批标准化在训练好测试中的区别 (How they differ during training versus testing)

  • 在这个训练过程中,每次的测试数据都会求 z ^ \hat{z} z^, 然后通过调整 γ \gamma γ β \beta β来调整实际分布。(mean and standard deviation of every batch)

Screenshot 2023-01-12 120146

  • 而在测试的过程中,我们的均值和方差是确定的,我们取测试集整体的值。(running mean and standard deviation over the entire training)

Screenshot 2023-01-12 121955

个人的理解在于,由于每一个batch,也就是训练集所分出的每一个包,无论是如何分出的这个包(随机地或者是顺序的),那么每个包都会存在一个本征的分布,其并不是所研究对象的真实分布。比如说实际情况下,实际的美国人口分布中,白:黑:黄的比例是7:2:1,但是我们取出一个某个州的人口样本,他们的比例是白:黑:黄为 3:3:4,那么显然当神经网络模型想要才出实际的美国人口分布便会比较困难,也就是你的先验概率教不准确。这样,当将数据正交化后,其比例没有变化,我们还会有3:3:4的样本数据,但是当经过一层神经网络的计算之后,提取出部分有效信息,将其正交化为分布为N(0,1)的正态分布,使得每一层的输入都会有一个稳定的分布,这样会更有利于训练。

卷积计算的应用 Convolution

一些参数定义 Parameters

卷积通过一些卷积矩阵的运算来实现图像的各种处理。

  • Stride: 扫描步长
  • Padding: 填充边缘长度 , 保证每个数据可以等次地扫描到
  • pooling: 池化,模糊化, 没有任何需要学习的参数
    • max pooling: 最大化
    • average pooling
    • min pooling
  • up-sampling; 超采样
    • Nearest neighbor up-sampling
    • linear and bi-linera interpolation

(反卷积,去卷积) Transposed convolutions or deconvolution

通过可学习的filter对输入图像进行操作来得到想要的更大的图片的过程叫做去卷积

Screenshot 2023-01-12 124851

这会导致chekerboard问题,但是其filter是可以学习的。

pytroch 问题记录

当BatchNorm2d 加入affine==false之后,那么会出现 torch.nn.init 之后并没有实例化的情况,在此记录,之后会再次研究这个函数的作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/173445.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录--哈希表章节总结

代码随想录–哈希表章节总结 1. LeetCode242 有效的字母异位词 给定两个字符串 s 和 t &#xff0c;编写一个函数来判断 t 是否是 s 的字母异位词。 注意&#xff1a;若 s 和 t 中每个字符出现的次数都相同&#xff0c;则称 s 和 t 互为字母异位词。 示例 1: 输入: s &quo…

高德地图红绿灯读秒是怎么实现的?(二)

通过上一篇高德官方回复&#xff0c;以及一些科技大佬们的脑回路&#xff0c;做了一些简单的回复&#xff1b; 这次好好的从个人研究观点来阐述一下这个论题 目前有两种说法&#xff0c;一种说是靠大数据分析&#xff0c;一种说是靠交管部门数据。 从个人的研究来看&#xff0…

socket 2---TCP编程

目录 一、TCP编程流程 二、函数接口 2.1、监听接口 2.2、发起连接 connect 2.3、接收新连接 accept 2.4、收发接口 三、代码实现 问题&#xff1a; 要是创建多个客户端的话会怎么样呢&#xff1f; 那么怎么去真正解决这个问题呢&#xff1f; 一、TCP编程流程 这里…

数据结构与算法基础(王卓)(9):线性表的应用(有序表合并)(有序,可重复)

PPT&#xff1a;第二章P176&#xff1b; 合并为一个新的整体&#xff1a;有序表的合并&#xff08;有序&#xff0c;可重复&#xff09; 线性表&#xff1a; 对于该操作的具体实现的流程设计&#xff1a;&#xff08;各模块&#xff09; 创建一个空表C 依次从A或B(中&#…

移动云国产商用密码规模化应用

前言 为深入贯彻落实《密码法》&#xff0c;推动商用密码技术在工业和信息化行业领域的融合应用&#xff0c;工业和信息化部密码应用研究中心组织开展了“首届全国商用密码应用优秀案例征集”工作&#xff0c;并评审选出15项优秀案例。 同时&#xff0c;为持久发挥本次活动的…

CSAPP笔记

目录 第一章 一个典型的硬件组成 从键盘上读取hello指令​编辑 存储器结构示例 相对性能公式 计算机系统抽象 第二章--信息的表示和处理 按位 & | ^ ~ 与逻辑运算 && || 逻辑右移和算术右移 左移 定义计算机如何编码和操作整数的数学定义 补码编码的定义 补码…

【JavaWeb】前端开发三剑客之CSS(上)

✨哈喽&#xff0c;进来的小伙伴们&#xff0c;你们好耶&#xff01;✨ &#x1f6f0;️&#x1f6f0;️系列专栏:【JavaWeb】 ✈️✈️本篇内容:CSS从零开始学习&#xff01; &#x1f680;&#x1f680;代码托管平台github&#xff1a;JavaWeb代码存放仓库&#xff01; ⛵⛵作…

擎创动态 | 官宣!与深智城集团正式签约

近日&#xff0c;上海擎创信息技术有限公司与深圳市智慧城市科技发展集团有限公司&#xff08;以下简称“深智城集团”&#xff09;就“一体化协同办公平台项目”达成战略合作&#xff0c;签约仪式已圆满完成。 ​深智城集团副总经理罗介平、智城软件公司常务副总经理韩小宇、智…

android 读取assets配置文件

方法1-getAssets().open(“re.properties”) try {Properties props new Properties();props.load(getAssets().open("re.properties"));Log.e(TAG, "className:" props.getProperty("className"));} catch (IOException e) {e.printStackTrace…

支持加密的日记应用程序DailyTxT

本文完成于 12 月下旬&#xff0c;对应的版本为 1.0.10(2022_11_02)&#xff1b; 什么是 DailyTxT &#xff1f; DailyTxT 是一个加密的 Web 日记应用程序&#xff0c;用于写下您当天的故事并轻松地再次找到它们。它是用 Python Flask&#xff08;后端&#xff09;和 Vue.JS&am…

23种设计模式(十二)——外观模式【接口隔离】

外观模式 文章目录 外观模式意图什么时候使用外观真实世界类比外观模式的实现外观模式的优缺点亦称:Facade 意图 外部与一个子系统的通信必须通过一个统一的外观对象进行,为子系统中的一组接口提供一个一致的界面,外观模式定义了一个高层接口,这个接口使得这一子系统更加容…

一直以来,人们都在探索互联网赋能实体的正确的途径和逻辑

一直以来&#xff0c;人们都在寻找互联网回归实体的正确的方式和方法&#xff1b;一直以来&#xff0c;人们都在探索互联网赋能实体的正确的途径和逻辑。然而&#xff0c;互联网似乎始终都游离于产业之外&#xff0c;似乎始终都超脱于产业之上。尽管经历了PC时代和移动互联网时…

分支预测详解

分支预测用于在微处理器中以流水线效率为目标来预测程序流。有许多方法来实现分支预测&#xff0c;通常在更好的预测结果和增加硬件做预测之间需要进行权衡。 目录 分支预测简介 静态分支预测 动态分支预测 启动分支预测 分支预测简介 要了解分支预测器&#xff0c;就不得…

QT当类有多个不同类型的同名信号时如何处理QOverload?

我们在设计类的信号时也许也会像设计类方法一样&#xff0c;给予多种不同参数类型的重载版本&#xff0c;这样一来我们就可以应对不同类型的参数输入或者输出。 但我们在使用有重载的信号版本时就不那么方便了&#xff0c;QT系统没有那么智能&#xff0c;不会自动匹配&#xff…

【实操案例三】进制转换、异常捕获、输出颜色设置、格式化字符串的设置等实例代码及运行效果图!

任务一&#xff1a;将指定的十进制数转换成二进制、八进制、十六进制 # 任务一&#xff1a;将指定的十进制数转换成二进制、八进制、十六进制 def fun():numint(input(请输入一个十进制整数&#xff1a;))print(num,的二进制数为&#xff1a;,bin(num)) # 第一种写法&#xff…

网线交叉、直连区别

欢迎来到东用知识小课堂&#xff01;一.网线常识网线常用的有&#xff1a;双绞线、同轴电缆、光纤等。双绞线可按其是否外加金属网丝套的屏蔽层而区分为屏蔽双绞线&#xff08;STP&#xff09;和非屏蔽双绞线&#xff08;UTP&#xff09;。从性价比和可维护性出发&#xff0c;大…

golang语言websocket百万长链接

是简单demo测试 前端 <html> <head><title>Simple client</title><script type"text/javascript">var ws;function init() {// Connect to Web Socketws new WebSocket("ws://localhost:8866/ws");// Set event handlers…

联合证券|再创纪录,外资狂买超1000亿!券商、期货板块持续活跃

A股今天全线上扬&#xff0c;沪指小幅走高&#xff0c;创业板、科创50指数体现强势&#xff1b;港股走势疲弱&#xff0c;恒生科技指数一度跌超2%。 详细来看&#xff0c;两市股指盘中震动上扬&#xff0c;午后全线走高&#xff0c;创业板指、科创50指数涨超1%&#xff1b;到收…

PCB板缺陷检测识别系统 YOLOv7

PCB板缺陷检测识别系统通过YOLOv7网络深度学习技术&#xff0c;对现场PCB是否存在缺陷部分进行实时分析检测&#xff0c;当检测到PCB本身存在缺陷的时候&#xff0c;立即抓拍存档告警方便后期针对性的进行调整改。YOLO系列算法是一类典型的one-stage目标检测算法&#xff0c;其…

CSS+JS 折叠

文章目录CSSJS 折叠效果CSSjQuery 鼠标经过显示详细信息CSSJS 折叠效果 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>折叠效果</title><style type"text/css">.collapse-box {width: 500px;borde…