pytorch中BatchNorm2d的实验验证

news2024/11/19 2:32:00

BatchNorm2d

对二维矩阵进行批量归一化,mean为当前batch的均值,std为当前batch的标准差,使用批量归一化能够将取值范围不同的数据映射到标准正态分布的区间中,减少数据之间的差距,方便模型快速收敛。批量归一化本质上减少了样本之间的绝对误差,但不改变相对误差,比如对[1,2,3,4]做归一化,虽然数字大小变了,但数字之间的大小关系不会变。一般建议在卷积核后面接一个批量归一化

公式

  • 归一化公式
    在这里插入图片描述

  • 全局均值估计:running_mean全局方差估计:running_var
    x n e w = ( 1 − m o m e n t u m ) × x o l d + m o m e n t u m × x t x_{new}=(1-momentum) \times x_{old}+momentum \times x_{t} xnew=(1momentum)×xold+momentum×xt
    x n e w x_{new} xnew为更新后的running_mean/running_var x o l d x_{old} xold为更新前的running_mean/running_var x t x_{t} xt为当前batch的mean和varmomentum为权重因子,一般取0.1

  • pytorch中使用BatchNorm2d
    batchnorm=torch.nn.BatchNorm2d(num_features=通道的数量)
    不建议更改其他参数

关于BatchNorm2d的实验验证

  • 归一化公式的验证
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as opti
from torchvision.transforms import RandomRotation
import torchsummary
import time
import datetime
import numpy as np
import copy
import torch.nn as nn
data=torch.tensor(
   [[[[1,2],
    [3,4]]]],dtype=torch.float32
)
batchnorm=nn.BatchNorm2d(num_features=1,momentum=0.1)
print('------------1--------------')
print("初始状态下的running_mean,running_var")
print(batchnorm.running_mean)
print(batchnorm.running_var)
print('------------2--------------')
print("输入data后状态下的running_mean,running_var")
test=batchnorm(data)
print(batchnorm.running_mean)
print(batchnorm.running_var)
print('训练状态下对data进行batchNorm')
print(test)
print('手动计算的batchNorm')
mean=torch.mean(data)
std=torch.var(data,False)
print((data[0][0]-mean)/torch.sqrt(std+1e-5))

结论,归一化的mean和std都是当前batch的mean和std

  • running_meanrunning_var的公式验证
print('------------3--------------')
print("人工计算的running_mean,running_var")
running_mean=torch.tensor(0)
running_var=torch.tensor(1)
running_mean=0.9*running_mean+0.1*mean
running_var=0.9*running_var+0.1*std
print(running_mean)
print(running_var)

print('测试状态下对data进行batchNorm')
batchnorm.training=False
test=batchnorm(data)
print(test)
#得出如下结论:
#running_mean=(1-momentum)*running_mean+momentum*batch_mean
#running_var=(1-momentum)*running_var+momentum*batch_var

running_mean和running_var只对测试有影响,对训练没有任何影响,测试数据使用running_meanrunning_var进行归一化

  • 当track_running_stats=False时的影响
print('------------4--------------')
print('track_running_stats设置为False时,输入data前得running_mean,running_var')
batchnorm=nn.BatchNorm2d(num_features=1,momentum=0.1,track_running_stats=False)
print(batchnorm.running_mean)
print(batchnorm.running_var)
print('------------5--------------')
print('track_running_stats设置为False时,输入data后得running_mean,running_var')
test=batchnorm(data)
print(batchnorm.running_mean)
print(batchnorm.running_var)
print('------------6--------------')
print('track_running_stats设置为False时,训练状态下对data进行batchnorm')
print(test)
print('------------7--------------')
print('track_running_stats设置为False时,测试状态下对data进行batchnorm')
batchnorm.training=False
test=batchnorm(data)
print(test)
#得出如下结论
#running_mean和running_var是用于对测试集进行归一化,如果track_running_stats设置为False,则测试集进行归一化时不会使用running_mean和running_var
#而是直接用自身得mean和std

不要将track_running_stats设置为False

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/451362.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vivado增量编译:加速FPGA设计实现的利器

随着FPGA设计的复杂度不断提高,设计人员需要选择更为高效的设计流程来保证开发效率和减少开发成本。其中,Vivado增量编译是一种非常重要的设计流程。本文将介绍Vivado增量编译的基本概念、优点、使用方法以及注意事项。 通过阅读本文可以了解&#xff1…

大多数开发人员都不知道的JSON.stringify 秘密

作为前端开发工程师,你一定用过JSON.stringify,但你知道它的全部秘密吗? 基本上,JSON.stringify 将对象转换为 JSON 字符串。同时,JSON.stringify 有如下规则: JSON.stringify({name: Tom, age: 18}) {&q…

银行数字化转型导师坚鹏:数字人民币创新及金融场景应用

数字人民币创新及金融场景应用 课程背景: 很多银行存在以下问题: 不清楚数字人民币的发展历程? 不清楚数字人民币对我们有什么影响? 不知道数字人民币具体应用场景? 课程特色: 前沿性&#xff1a…

【c语言】带你快速理解函数的传值和传址

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 给大家跳段街舞感谢支持&#xff01;ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…

大数据 | 实验一:大数据系统基本实验 | 熟悉常用的HBase操作

文章目录 &#x1f4da;HBase安装&#x1f407;安装HBase&#x1f407;伪分布式模式配置&#x1f407;测试运行HBase&#x1f407;HBase java API编程环境配置 &#x1f4da;实验目的&#x1f4da;实验平台&#x1f4da;实验内容&#x1f407;HBase Shell 编程命令实现以下指定…

【天梯赛补题】

175对我这种蒟蒻好难&#xff0c;&#xff0c;&#xff0c; L1-6剪切粘贴 题目详情 - L1-094 剪切粘贴 (pintia.cn) 天梯赛&#xff1a;L1-094 剪切粘贴_scarecrow133的博客-CSDN博客 本蒟蒻看到字符串就害怕&#xff0c;一看就没思路&#xff0c;果断跳过了…… 等佬佬讲…

表的查询内容

表的查询 这里是关键的select的使用对表不同的条件进行筛选&#xff0c;实现对于内容的书写 全列查询 使用*进行查询&#xff0c;表现的是整个表的内容。 指定列查询 name的id列信息查询 查询字段为表达式 这里的id加上10&#xff0c;形成了新的列表 这里的id1 id的结果聚合在…

echarts 象形柱图

Echarts 常用各类图表模板配置 注意&#xff1a; 这里主要就是基于各类图表&#xff0c;更多的使用 Echarts 的各类配置项&#xff1b; 以下代码都可以复制到 Echarts 官网&#xff0c;直接预览&#xff1b; 图标模板目录 Echarts 常用各类图表模板配置一、象形柱图二、环形图…

苹果笔到底有没有必要买?苹果平板电容笔排行榜

事实上&#xff0c;Apple Pencil与市场上普遍存在的电容笔最大的区别&#xff0c;就是两者的重量以及所具有的压感都互不相同。但是&#xff0c;苹果原有的电容笔因其昂贵的价格而逐步被平替电容笔所替代&#xff0c;而平替电容笔所具备的各种性能也在逐步提高。接下来&#xf…

【c语言】函数的数据传递原理 | 数组传入函数方法

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 给大家跳段街舞感谢支持&#xff01;ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ ኈ ቼ ዽ ጿ…

什么是摄像头组播技术?有哪些应用场景?

摄像头组播技术是一种广泛应用于视频会议、网络监控等领域的网络传输技术&#xff0c;它将摄像头采集到的视频信号通过网络进行传输&#xff0c;实现多用户同时观看。本文将介绍摄像头组播的基本原理、应用场景以及存在的问题与解决方案。 一、摄像头组播的基本原理 摄像头组播…

法规标准-EU 2021-646标准解读

EU 2021-646是做什么的&#xff1f; EU 2021-646全称为关于机动车紧急车道保持系统&#xff08;ELKS&#xff09;型式认证统一程序和技术规范&#xff0c;其中主要描述了对认证ELKS系统所需的功能要求及性能要求 基本要求 1.应急车道保持系统&#xff08;ELKS&#xff09;应…

obsidian体验组件世界

title: 组件世界-初体验 date: 2023-04-23 13:23 tags: &#x1f308;Description&#xff1a; ​ 逛网站的时候看到的组件库&#xff0c;感觉很漂亮&#xff0c;记录并实验看下效果。 我用的是 obsidian&#xff0c;所以本文是基于 obsidian 来实验组件世界的效果。 组件世界-…

iMazing2023最新免费版iOS设备管理软件

iMazing是一款功能强大的iOS设备管理软件&#xff0c;它可以帮助用户备份和管理他们的iPhone、iPad或iPod Touch上的数据。除此之外&#xff0c;它还可以将备份数据转移到新的设备中、管理应用程序、导入和导出媒体文件等。本文将详细介绍iMazing的功能和安全性&#xff0c;并教…

设计模式 --- 行为型模式

一、概述 行为型模式用于描述程序在运行时复杂的流程控制&#xff0c;即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务&#xff0c;它涉及算法与对象间职责的分配。 行为型模式分为类行为模式和对象行为模式&#xff0c;前者采用继承机制来在类间分…

《安富莱嵌入式周报》第310期:集成大语言模型的开源调试器ChatDBG, 多功能开源计算器,M7内核航空航天芯片评估板, Zigbee PRO规范

周报汇总地址&#xff1a;嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 视频版&#xff1a; https://www.bilibili.com/video/BV1GM41157tV/ 《安富莱嵌入式周报》第310期&#xff1a;集成大语…

Spring Gateway + Oauth2 + Jwt网关统一鉴权

之前文章里说过&#xff0c;分布式系统的鉴权有两种方式&#xff0c;一是在网关进行统一的鉴权操作&#xff0c;二是在各个微服务里单独鉴权。 第二种方式比较常见&#xff0c;代码网上也是很多。今天主要是说第一种方式。 1.网关鉴权的流程 重要前提&#xff1a;需要收集各个…

循环代码模型构建方法

循环结构是源代码程序的重要结构&#xff0c;然而即使是简单的循环程序&#xff0c;也很容易出错&#xff0c;循环中的很多错误往往需要执行多次或者在某些特定的情况下才能被发现&#xff0c;检测这些错误的代价很高&#xff0c;所以需要重点开展对软件循环代码的安全性分析研…

简单聊下HBase

大家好&#xff0c;我是易安&#xff01; Google发表了三篇论文&#xff0c;即GFS、MapReduce和BigTable&#xff0c;被誉为“三驾马车”&#xff0c;开启了大数据时代。今天我们来聊一下BigTable对应的NoSQL系统HBase&#xff0c;看看它是如何处理海量数据的。 在计算机数据存…

Mybatis 全局配置文件 mybatis-config.xml

1、全局配置文件的用处 mybatis通过配置文件可以配置数据源、事务管理器、运行时行为、处理别名、类型处理、插件等信息。在mybatis应用初始化时&#xff0c;程序会解析全局配置文件&#xff0c;使用配置的信息实例化Configuration组件&#xff0c;完成基本配置的初始化。在my…