Batch Norm 与 Layer Norm

news2025/3/1 23:59:17

这里写自定义目录标题

1 为何要对输入数据做 Normalization
2 Batch Normalization
3 Layer Normalization
4 实际应用
参考

1 为何要对输入数据做 Normalization

可以比较好的抑制梯度消失和梯度爆炸的情况

归一化技术就是让每一层的分布稳定下来，让后面的层能在前面层的基础上“安心学习”。BatchNorm 就是通过对 batch size 这个维度归一化来让分布稳定下来。LayerNorm 则是通过对 Hidden size 这个维度归一。

不管是 Batch Normalization 还是 Layer Normalization，Normalization 的目的是为了把输入转化成均值为 0 方差为 1 的数据。换句话说，这里的 Normalization 其实应称为 Standardization（标准化），而不是 Normalization（归一化）

Normalization：
在这里插入图片描述

Standardization:
在这里插入图片描述
在实际应用中 normalization 代指 Standardization

2 Batch Normalization

假如有 Batch 中有三个样本，x_1、x_2、x_3、x_4 表示 4 个特征。Batch Normalization 对每个特征计算均值和方差，随后归一化。

在这里插入图片描述

3 Layer Normalization

Layer Normalization 对每个样本计算均值和方差，随后归一化。

在这里插入图片描述

4 实际应用

Batch Normalization：
BN 不适合 RNN、transformer 等序列网络，不适合文本长度不定和batchsize 较小的情况，适合于 CV 中的 CNN 等网络

Layer Normalization：
LN 适合用于 NLP 中的 RNN、transformer 等网络，因为 sequence 的长度可能是不一致的

参考

NLP中 batch normalization与 layer normalization
Build Better Deep Learning Models with Batch and Layer Normalization
深度学习 batch normalization和layer normalization区别

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/93986.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

HashMap(一)

HashMap(一)

HashMap集合简介 HashMap基于哈希表的Map接口实现，是以key-value存储形式存在，即主要用来存放键值对。HashMap 的实现不是同步的，这意味着它不是线程安全的。它的key、value都可以为null。此外，HashMap中的映射不是有序的。 JDK1…

阅读更多...

灵活就业潮带热职业技能培训，河南00后Python学习人数翻倍

灵活就业潮带热职业技能培训，河南00后Python学习人数翻倍

前言短视频带货、直播带货、在线接单修图、开工作室……时间自由、收入更高的灵活就业，正在成为年轻人的就业新选择，职业技能培训焦点也在转移。5月12日，腾讯课堂数据显示，近半年（2021年11月至2022年4月）…

阅读更多...

主键顺序影响——如何优化 ClickHouse 索引（二）

主键顺序影响——如何优化 ClickHouse 索引（二）

回顾一下上一篇文章，ClickHouse 的存储设计，从存储目录出发，讲 ClickHouse 的数据读取： 第一阶段，通过隐含的 granule 单位读取主键索引 idx 文件通过二分搜索过滤不需要的 Granule，再关联对应的 mk2 文件…

阅读更多...

elasticsearch7.17 与minio集成，并快照备份与恢复

elasticsearch7.17 与minio集成，并快照备份与恢复

elasticsearch 7.6以支持一、monio 1、部暑minio mkdir -p /data/minio/{data,config}cat > /data/minio/start.sh << EOF docker run -d \ -p 9000:9000 \ -p 9001:9001 \ --name minio \ --restartalways \ -e "MINIO_ROOT_USERadmin" \ -e "MINI…

阅读更多...

Linux学习01-Linux基础认知

Linux学习01-Linux基础认知

笔记来源于鸟哥的Linux私房菜（第四版），这本书写的真的非常好。 1 简介早期的Linux是针对386的计算来开发的，由于Linux只是一个操作系统，并不含有其他的应用程序，因此很多工程师在下载了Linux内核并安装&a…

阅读更多...

【Linux】进程的程序替换（execl、execlp、execle、execvpe等替换函数）

【Linux】进程的程序替换（execl、execlp、execle、execvpe等替换函数）

文章目录1、进程程序替换1.1 理解进程替换原理1.2 进程相应替换函数1.3 进一步理解程序替换1、进程程序替换父进程创建子进程的目的： 1.想让子进程执行父进程代码的一部分。（子承父业） 2.想让子进程执行一个全新的程序。进程程序替换讨…

阅读更多...

深圳大学数学文化赏析MOOC第一次作业答案（满分）

深圳大学数学文化赏析MOOC第一次作业答案（满分）

一、单选题 (共 40.00 分) 1. 关于归纳推理，以下说法错误的是 A. 归纳推理是从特殊到一般的推理。 B. 归纳推理属于发散性思维。 C. 归纳推理的结论一定是正确的。 D. 归纳推理具有创新性。满分：2.00 分得分：2.00 分你的答案&a…

阅读更多...

[MySQL]-数据库恢复工具之binlog2sql

[MySQL]-数据库恢复工具之binlog2sql

[MySQL]-数据库恢复工具之binlog2sql 森格 | 2022年12月本文主要介绍工具binlog的使用，它可以帮助我们快速解析出原始SQL、回滚SQL、去除主键的INSERT SQL等。一、工具介绍 1.1 概述我们可以去设想，当开发人员使用了delete语句误删除了某表的数据&…

阅读更多...

微服务实用篇5-分布式搜索elasticsearch篇1

微服务实用篇5-分布式搜索elasticsearch篇1

今天的主要学习任务是分布式搜索，首先了解elasticsearch，然后学习索引库的操作、文档的操作、RestAPI等。elasticsearch是非常强大的开源搜索引擎，可以帮助我们从海量数据中快速定位到我们需要的内容。这一篇主要学习ES的基本使用&#xff0c…

阅读更多...

rocketmq源码-关于消费者push模式和pull模式的对比

rocketmq源码-关于消费者push模式和pull模式的对比

在rocketmq中，对于消费者而言，有两种模式，push和pull 我在没有看源码之前，看其他博客的时候，大部分的说法是： mq中有两种获取消息的模式，一种是push，一种是pull；pull这种…

阅读更多...

技术人员必备的便携版卸载清理工具 - Uninstall Tool 3 便携版直接U盘中启动软件，专为单个用户在多台电脑上使用而设计的。

技术人员必备的便携版卸载清理工具 - Uninstall Tool 3 便携版直接U盘中启动软件，专为单个用户在多台电脑上使用而设计的。

Uninstall Tool ，快速、强大的卸载清理软件，可完全彻底删除已安装软件。彻底删除不需要的应用程序，实时安装监视器。控制在系统启动时运行的应用。有效，强大的应用程序，具有简单而直观的界面。删除不需要的软件&#…

阅读更多...

马斯克都不懂的 GraphQL，API 网关又能对其如何理解？

马斯克都不懂的 GraphQL，API 网关又能对其如何理解？

作者，罗泽轩上个月马斯克评论 Twitter App 滥用 RPC 后，与一些 Twitter 的技术主管发生了矛盾 —— 直言马斯克不懂技术。那这个马斯克都不懂的 GraphQL 到底是什么？ 什么是 GraphQL？它有多流行？ GraphQL 是一套由 F…

阅读更多...

【javascript】值，类型，变量，函数，noi103题目，if语句，调试

【javascript】值，类型，变量，函数，noi103题目，if语句，调试

❤️ Author： 老九 ☕️ 个人博客：老九的CSDN博客 🙏 个人名言：不可控之事乐观面对 😍 系列专栏： 文章目录基本类型NumberStringboolean例子变量求二元一次方程函数1.3题目if例子1.4题目调试下面我们会随着…

阅读更多...

SpringMVC：SpringMVC五种类型参数传递（4）

SpringMVC：SpringMVC五种类型参数传递（4）

请求参数1. 环境准备2. 参数传递2.1 GET请求2.1.1 GET发送一个参数2.1.2 GET发送多个参数2.1.3 GET请求中文乱码2.2 POST请求2.2.1 POST发送一个参数2.2.2 POST发送多个参数2.2.3 POST请求中文乱码问题3. 五种类型参数传递3.1 普通参数3.2 POJO类型参数3.3 嵌套POJO类型参数3.4…

阅读更多...

HashMap(二)扩容

HashMap(二)扩容

想要了解HashMap的扩容机制你要有这两个问题 1、什么时候才需要扩容 2、HashMap的扩容是什么 1、什么时候才需要扩容当HashMap中的元素个数超过数组大小（数组长度）* loadFactor(负载因子)时，就会进行数组扩容，loadFactor的默认值…

阅读更多...

Pytest框架运行常用参数解析

Pytest框架运行常用参数解析

-s：表示输出调试信息，用于显示测试函数中print()打印的信息。我们在用例中加上一句 print(driver.title)，我们再运行一下我们的用例看看，调试信息输出-v：未加前只打印模块名，加v后--verbose打印类名、模块名…

阅读更多...

Java中的八大包装类(Wrapper)

Java中的八大包装类(Wrapper)

目录一、八大包装类 1、八大包装类的体系图： 二、装箱和拆箱三、intValue()和valueOf()方法 1、intValue() 2、valueOf() 四、包装类型和String类型的相互转换五、包装类的常用方法（以Integer和Character为例） 一、八大包装类包装…

阅读更多...

Scala环境搭建

Scala环境搭建

目录1）安装步骤2）测试3）IDEA安装Scala 插件1）安装步骤 1.首先确保 JDK1.8 安装成功 2.下载对应的 Scala 安装文件 scala-2.x.zip 3.解压 scala-2.12.11.zip，我这里解压到 F:\software 4.配置 Scala 的环境变量 …

阅读更多...

使用Python和GDAL处理遥感影像数据超详细教程

使用Python和GDAL处理遥感影像数据超详细教程

提示：文章末尾有强化学习代码资源 : ) 前言在本教程中，我们将学习使用 Python 和地理空间数据抽象库 GDAL 自动处理栅格数据的基本技术。栅格文件通常用于存储地形模型和遥感数据及其衍生产品，例如植被指数和其他环境数据集。栅格文件往往…

阅读更多...

windows 连接蓝牙耳机失败解决方法

windows 连接蓝牙耳机失败解决方法

windows 连接蓝牙耳机失败解决方法如果我们在windows7或windows10电脑中连接蓝牙却出现了连接失败的状况，这要怎么办呢，可能是我们没有打开电脑的蓝牙功能，这时我们点击打开蓝牙网络的属性，勾选Bluetooth设置的选项即可&#x…

阅读更多...

推荐文章

最新文章