BN、LN、IN、GN的自我理解

news2025/1/11 2:41:17

目录

一、Batch Normal

二、Layer Normal

三、Instance Normal

四、Group Normal

五、参考


参考了这两三篇博客,终于理解了这几个概念。

一、Batch Normal

Batch Normal,举例来说:输入一个batch size,这个batch size中有2个元素(feature size),每个元素的channel为3,每个channel的宽高为2*2,那么Batch Normal是怎么计算的呢?

网上说:“batch方向做归一化,算NHW的均值,对小batchsize效果不好;BN主要缺点是对batchsize的大小比较敏感,由于每次计算均值和方差是在一个batch上,所以如果batchsize太小,则计算的均值、方差不足以代表整个数据分布” 刚开始不理解什么在batch方向做,原来是一次计算是batch个大小,其实也很好理解,因为是相同channel进行计算,那一个batch有两个特征,那相同特征计算就会有两个channel进行计算,所以这就是batch方向。

二、Layer Normal

layer normal是每个特征自己进行normal,比如有十句话,每句话长短不一,那这里batch是10,每句话是一个特征,一句话的长度是dimension,那进行layer normal是分别对每句话进行的,即一个特征对自己所有维度进行normal,与别的特征没有任何关系,如下:

 图片来源:【深度学习】batch normalization和layer normalization区别_layer normalization和batch normalization_山顶夕景的博客-CSDN博客

三、Instance Normal

这个从batch normal的角度来理解,batch normal是每个特征相同的channel进行一起进行计算均值,方差。但是Instance Normal是每个特征的每个channel进行独自计算,即:比如有一个bacth,里面2个特征,每个特征有3个dimension,那Instance normal是特征一的channel1进行计算自己的均值和方差,channel2进行计算自己的均值方差,channel3进行计算自己的channel。特征2也是这样。

四、Group Normal

主要是针对Batch Normalization对小batchsize效果差,GN将channel方向分group,然后每个group内做归一化,算(C//G)*H*W的均值,这样与batchsize无关,不受其约束。

这个从Instance Normal的角度来理解,比如一个batch,里面有2个特征,每个特征有6个channel,那我把这6个特征分为三组,(channel1、channel2)为组一,(channel3、channel4)为组二,、(channel5、channel6)为组三。即特征1有三组,特征2也有三组,那计算均值方差,是特征1和特征2的组一一起进行计算,特征1和特征2的组二一起计算,特征1和特征2的组三一起计算,那最终得到均值和方差也都是向量,均值向量里面有三个值,分别是组一、组二、组三的均值,方差向量里面也是三个值,也分别是组一、组二、组三的方差。

 

 

五、参考

1.Batch Normalization详解以及pytorch实验_太阳花的小绿豆的博客-CSDN博客 

2.Layer Normalization解析_runtimeerror: given normalized_shape=[256], expect_太阳花的小绿豆的博客-CSDN博客

3.【深度学习】batch normalization和layer normalization区别_layer normalization和batch normalization_山顶夕景的博客-CSDN博客

4.PyTorch学习之归一化层(BatchNorm、LayerNorm、InstanceNorm、GroupNorm)_mingo_敏的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/707154.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2. Linux组件之数据库连接池

目录 一、数据库连接池1.1 池化技术1.2 数据库连接池及其作用1.3 不使用数据库连接池1.4 使用数据库连接池1.5 长连接和连接池1.6 数据库连接池运行机制1.7 连接池和线程池的关系 二、数据库连接池的设计2.1 mysql 连接池1. 构造函数2. 初始化3. 请求获取连接4. 归还连接5. 析构…

Linux训练营(文件和目录操作)

文章目录 前言一、ls命令二、cd命令三、mkdir命令四、cp命令五、rm命令总结 前言 本篇文章我们来讲解Linux中的文件和目录操作,在这里我们主要使用的是Linux中的命令来操作这些文件和目录,命令是Linux中最基础的部分。 一、ls命令 ls是一个常用的命令…

5-NumPy如何创建N维数组?【视频版】

目录 问题视频解答 问题 视频解答 点击观看: 5-如何创建等N维数组?

C++ 命名空间

假设这样一种情况,当一个班上有两个名叫 Zara 的学生时,为了明确区分它们,我们在使用名字之外,不得不使用一些额外的信息,比如他们的家庭住址,或者他们父母的名字等等。 同样的情况也出现在 C 应用程序中。…

DMAR IOMMU页表错误

DMAR: [DMA Write] Request device ......, 设备在进行 DMA 操作的时候,检查页表失败,在 IOMMU 的错误处理函数中会打印详细信息。 如下,出现 DMAR 错误,iova 0x9e4ef2373000 的 PTE 页表没有设置, 而实际…

③mybatis的动态sql

很多时候需要实现多条件查询&#xff0c;手动判断拼接sql有些麻烦 mybatis提供了一个动态sql实现多条件查询的方法 1.if标签 使用if元素可以根据条件来包含或排除某个SQL片段 <select id"search" resultType"Household">select id,idcard,name,cell…

蓝鲸社区:解决小伙伴们插眼关注的一个需求

背景 在蓝鲸社区“社区问答”帖子中发现这么一个需求&#xff1a; 究其原因&#xff0c;我在《不是CMDB筑高墙&#xff0c;运维需要一定的开发能力&#xff01;》一文中已经介绍&#xff0c;在此我再简单重复下&#xff1a; 蓝鲸5.1 自带“事件推送”功能&#xff0c;当配置…

pdf文档多页内插入统一图片

常用来添加公司logo、签名、印章等等 概括来说就是插入同一个图片&#xff0c;然后复制在每一页&#xff08;自动&#xff09; 用的是福昕pdf阅读器 首先打开pdf&#xff1a; 点击图像标注功能&#xff1a; 在弹出窗口中选择浏览&#xff0c;点击需要插入的图片&#xff08…

1.1.1 Qt信号槽之connect与disconnect介绍

关于Qt信号槽中connect与disconnect介绍 首先我们要知道&#xff0c;如果想要使用Qt中的信号槽机制&#xff0c; 那么必须继承QObject类&#xff0c;因为QObject类中包含了信号槽的一系列操作&#xff0c;今天我们来讲解的是信号与槽怎么建立连接以及断开连接。 一、connect …

用于语义图像分割的弱监督和半监督学习:弱监督期望最大化方法

这时一篇2015年的论文&#xff0c;但是他却是最早提出在语义分割中使用弱监督和半监督的方法&#xff0c;SAM的火爆证明了弱监督和半监督的学习方法也可以用在分割上。 这篇论文只有图像级标签或边界框标签作为弱/半监督学习的输入。使用期望最大化(EM)方法&#xff0c;用于弱…

rain-nowcasting-using-deep-learning github:使用深度学习进行临近降水预报

来源 github地址 是什么 本资料库旨在阐述 "在应用于降雨预报的深度学习模型中合并雷达雨量图像和风速预测 "&#xff08; “Merging radar rain images and wind predictions in a deep learning model applied to rain nowcasting”&#xff09;一文中提出的深度…

下拉表格多选sql批量插入以身份证号自动加载年龄性别生日

目录 一、layui下拉表格多选1、引入js2、html3、js代码①非动态数据②动态数据 4、运行效果 二、sql server批量插入三、根据身份证号动态填写出生日期年龄性别 一、layui下拉表格多选 1、引入js 2、html <div class"layui-input-inline"><input type&quo…

安装 Grafana 及 windows_exporter 配置 dubbo 配置 及报告示例

目录 安装部署 官网下载 配置中文 启动 访问 账户密码 界面效果 图表操作 新建添加仪表 添加 Prometheus 数据源 导入已有报告示例 下载 windows_exporter Grafana 的图表模板 node_exporter 中文版&#xff1a;windows_exporter for Prometheus Dashboard CN v2…

element框架select值更新页面不回显的问题,动态表单props绑定问题

1、页面中使用form表单&#xff0c;引入select组件 当data中默认没有定义form.region的值时&#xff0c;会出现选择select后input没有回显选择数据值&#xff1b;所以使用select时&#xff0c;必须定义默认值 <el-form ref"form" :model"form" label-…

常见面试题之线程中并发锁(二)

1. 什么是AQS&#xff1f; 1.1. 概述 全称是AbstractQueuedSynchronizer&#xff0c;是阻塞式锁和相关的同步器工具的框架&#xff0c;它是构建锁或者其他同步组件的基础框架 AQS与Synchronized的区别 synchronizedAQS关键字&#xff0c;c语言实现java语言实现悲观锁&#…

CISSP证书考试难度大吗?本文教你如何轻松拿下CISSP

主题&#xff1a;CISSP含金量、CISSP考试经验、CISSP备考、CISSP考试大纲 CISSP含金量高 CISSP注册信息系统安全师认证是信息安全领域被全球广泛认可的IT安全认证&#xff0c;一直以来被誉为业界的“金牌标准”。CISSP认证不仅是对个人信息安全专业知识的客观评估&#xff0c…

给若依添加单元测试(一)

给若依添加单元测试 方案二&#xff08;异常困难但企业开发一般用这个&#xff09; 方案一&#xff08;简单&#xff09; 在 admin 模块中添加单元测试 S1.在 src 目录下创建 test.java.MapperTests 文件 S2.将以下内容复制进去 import com.ruoyi.RuoYiApplication; imp…

初学mybatis(六)动态sql

学习回顾&#xff1a;初学mybatis&#xff08;五&#xff09; 一、动态SQL 介绍 什么是动态SQL&#xff1a;动态SQL指的是根据不同的查询条件 , 生成不同的Sql语句. 官网描述&#xff1a; MyBatis 的强大特性之一便是它的动态 SQL。如果你有使用 JDBC 或其它类似框架的经验&…

小研究 - Java 指针分析综述(三)

近年来静态程序分析已成为保障软件可靠性、安全性和高效性的关键技术之一. 指针分析作为基 础程序分析技术为静态程序分析提供关于程序的一系列基础信息&#xff0c;例如程序任意变量的指向关系、变量 间的别名关系、程序调用图、堆对象的可达性等. 介绍了 Java 指针分析的重要…

微信小程序:实名认证登录 [2018年]

1、[微信开发社区]微信支付实名信息小程序授权接口能力&#xff08;用户获取用户真实姓名&#xff0c;身份证号码&#xff09; 微信开放社区 2、注意事项 四、接口文档 略。