机器学习的特征归一化Normalization

news2025/4/6 16:06:57

为什么需要做归一化？

为了消除数据特征之间的量纲影响，就需要对特征进行归一化处理，使得不同指标之间具有可比性。对特征归一化可以将所有特征都统一到一个大致相同的数值区间内。

为了后⾯数据处理的⽅便，归⼀化可以避免⼀些不必要的数值问题。
为了程序运⾏时收敛加快。
统一量纲。
保证输出数据中数值⼩的不被吞⾷。
避免神经元饱和。

在这里插入图片描述

两种常用的归一化方法

线性归⼀化（最大最小归一化，Min-Max Scaling）
标准差标准化（零均值归一化，Z-Score Scaling）

经过处理的数据符合标准正态分布，即均值为 0，标准差为 1。

批归⼀化（Batch Normalization）

局部响应归⼀化

局部响应归⼀化（Local Response Normalization ，LRN）是AlexNet中首次引入的归一化方法。

使用LRN的原因是为了鼓励横向抑制。

横向抑制：这是神经生物学中的一个概念，是指神经元减少其邻居活动的能力。在深度神经网络中，这种横向抑制的目的是进行局部对比度增强，以便使局部最大像素值用作下一层的激励。

批归⼀化（Batch Normalization）

以前在神经⽹络训练中，只是对输⼊层数据进⾏归⼀化处理，却没有在中间层进⾏归⼀化处理。要知道，虽然我们对输⼊数据进⾏了归⼀化处理，但是输⼊数据运算之后，其数据分布很可能被改变，⽽随着深度⽹络的多层运算之后，数据分布的变化将越来越⼤。

这种在神经⽹络中间层也进行归⼀化处理，使训练效果更好的方法，就是批归⼀化。

批归一化的算法流程：

输⼊：上⼀层输出结果X = {x₁, x₂, …, x_m}

计算上⼀层输出数据的均值:
计算上⼀层输出数据的标准差
归一化
重构
γ和β为可学习的参数。

批归一化的适用场景及优点

在CNN中，批归一化应作⽤在⾮线性映射前。在神经⽹络训练时遇到收敛速度很慢，或梯度爆炸等⽆法训练的状况时可以尝试BN来解决。

当BatchSize比较大，数据分布比较接近，并在训练前对数据充分shuffle。
批归一化不适⽤于动态的⽹络结构和RNN⽹络。

使用批归一化具有以下优点：

减少了人为选择参数。
减少了对学习率的要求。
破坏原来的数据分布，⼀定程度上缓解过拟合。
减少梯度消失，加快收敛速度，提⾼训练精度。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/378141.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Pycharm和跳板机连接内网服务器

Pycharm和跳板机连接内网服务器

Pycharm和跳板机连接内网服务器建立配置文件本地配置 .ssh 文件夹下配置 config 文件 Host jumpHostName xxxPort 22User xxxServerAliveInterval 30IdentityFile C:\Users\15284\.ssh\id_rsa # 通过密钥连接Host server # 同样，任意名字，随…

阅读更多...

vxe自定义表头设置+前端本地数据存储

vxe自定义表头设置+前端本地数据存储

业务要求支持拖动排序，按现有内容排序支持显示/隐藏，默认全部显示列表增加顶部格线，用户可以自己调整列宽设置内容仅对该账号有效，前端存储最终实现的效果图哪些改动静态表格改动态表格 table > grid vxe-grid 高级表格…

阅读更多...

一文深度解读音视频行业技术发展历程

一文深度解读音视频行业技术发展历程

从1948年的香农定律，到音视频的今天。IMMENSE、36氪｜作者北京时间2月28日凌晨，FIFA年度颁奖典礼在巴黎举行。梅西荣膺年度最佳球员，斯卡洛尼当选年度最佳男足主帅，马丁内斯荣获年度最佳男足门将！阿根廷因…

阅读更多...

自动售卖机的类型和工作流程分析

自动售卖机的类型和工作流程分析

线上经济的崛起提高了人们的生活品质，促进了我国市场经济的发展。随着互联网的快速发展，线上经济资源已经饱和，线上和线下资源整合已经成为市场经济发展的方向，而自动售卖机正是线上和线下经济发展的连接纽带。自动售卖机作为无人…

阅读更多...

3.查找算法：顺序查找和二分查找

3.查找算法：顺序查找和二分查找

查找查找，是指在一些数据元素中，通过一定的方法找出与给定关键字相同的数据元素的过程。列表查找（线性表查找）：从列表中查找指定元素输入：列表，待查找元素输出：元素下标（…

阅读更多...

多线程随便起的

多线程随便起的

进程：进程可以看成程序执行的一个实例。进程是系统资源分配的独立实体，每个进程都拥有独立的地址空间。一个进程无法访问另一个进程的变量和数据结构如果想让-一个进程访问另一个进程的资源，需要使用进程间通信，比如管道&#xff…

阅读更多...

LAMP项目部署实战1

LAMP项目部署实战1

一、说明： LAMP：Linux Apache MySQL PHP Apache： Apache是世界使用排名第一的Web服务器软件。主要用于接收用户的请求，处理业务逻辑，返回结果给客户端（浏览器）。 PHP：一种专门…

阅读更多...

SQL 层功能改进 - lookupJoin 的优化

SQL 层功能改进 - lookupJoin 的优化

一、传统 join 算法lookupJoin 是 join 查询的一种，传统 join 算法为：1. 遍历 A 表，读取一条数据 r2. 遍历 B 表，对于每条数据，与 r 进行 join 操作3. 重复 1、2 操作，直到 A 表遍历完所有数据二、lookupJo…

阅读更多...

在 WIndows 下安装 Apache Tinkerpop (Gremlin)

在 WIndows 下安装 Apache Tinkerpop (Gremlin)

一、安装 JDK 首先安装 Java JDK，这个去官网下载即可，我下载安装的 JDK19（jdk-19_windows-x64_bin.msi），细节不赘述。二、去 Tinkerpop 网站下载 Gremlin 网址：https://tinkerpop.apache.org/ 点击下面…

阅读更多...

用cpolar发布本地的论坛网站 1

用cpolar发布本地的论坛网站 1

网页论坛向来是个很神奇的地方，曾经的天涯论坛和各种BBS，大家聚在在一起讨论某个问题，也能通过论坛发布想法，各种思维碰撞在一起，发生很多有趣的故事，也产生了很多流传一时的流行语录。当然，如果…

阅读更多...

推荐5款免费无广告的精品软件

推荐5款免费无广告的精品软件

检查一下你最近安装的软件，他们是不是都一样无法避免最终被你打入冷宫的命运？我们明明很懂“在精不在多”的道理，却依然让我们的电脑塞满了形形色色无用的软件。你需要知道的是，如何找到一款适合自己且真正实用的电脑软件。 1.多…

阅读更多...

元宇宙营业厅，数字技术融合，赋能实体经济

元宇宙营业厅，数字技术融合，赋能实体经济

在我国数字经济与虚拟服务市场规模扩大下，元宇宙营业厅强势来袭，从多场景、多内容，深耕高效协同的特色功能，基于多元化、灵活的交互体验，更大程度上解决线上业务办理抽象繁琐，线下业务办理的时空受限、业务…

阅读更多...

4.Spring【Java面试第三季】

4.Spring【Java面试第三季】

4.Spring【Java面试第三季】前言推荐4.Spring27_Aop的题目说明要求Spring的AOP顺序AOP常用注解面试题28_spring4下的aop测试案例业务类新建一个切面类MyAspect并为切面类新增两个注解：spring4springboot1.5.9pom测试类29_spring4下的aop测试结果aop正常顺序异常顺序…

阅读更多...

求极限方法总结

求极限方法总结

1.利用四则运算法则求极限 2.利用两个重要极限求极限 //0除以0型 //1的无穷次方型 3.利用等价无穷小替换替换求极限 //在等价替换时注意和差项 4.利用洛必达法则求极限 5.利用夹逼准则求极限 6.利用单调有界数列极限准则求极限 7.利用无穷小的性质求极限 8.利用函数的连续性…

阅读更多...

来面试阿里测开工程师，HR问我未来3-5年规划，我给HR画个大饼。

来面试阿里测开工程师，HR问我未来3-5年规划，我给HR画个大饼。

在面试的过程中是不是经常被面试官问未来几年的职业规划?你会答吗？是不是经常脑袋里一片空白，未来规划？我只是想赚更多的钱啊，哈哈哈，今天我来教大家，如何给面试官画一个大饼，让他吃的不亦乐乎…

阅读更多...

MySQL高级第二讲

MySQL高级第二讲

目录二、MySQL高级02 2.1 触发器 2.1.1 触发器介绍 2.1.2 创建触发器 2.2 MySQL的体系结构 2.3 存储引擎 2.3.1 存储引擎概述 2.3.2 各种存储引擎特性 2.3.3 InnoDB 2.3.4 MyISAM 2.3.5 MEMORY 2.3.6 MERGE 2.3.7 存储引擎的选择 2.4 优化sql 2.4.1 查看sql执行…

阅读更多...

二分查找重复情况找最左边或最右边的位置下标

二分查找重复情况找最左边或最右边的位置下标

目录二分找最左边二分找最右边综合应用(剑指offer)二分找最左边核心思想: 先mid (lr)/2每次向左取整; 然后命中target的时候，右边界逼近到mid; 因为每次mid向左取整，mid命中target时l代替mid位置，则循环迭代最后会卡出重复数字最左侧的位置…

阅读更多...

糖化学试剂55520-67-7，5-vinyl-2-deoxyuridine，5-乙烯基-2-脱氧尿苷特点分析说明

糖化学试剂55520-67-7，5-vinyl-2-deoxyuridine，5-乙烯基-2-脱氧尿苷特点分析说明

5-vinyl-2-deoxyuridine(5-VdU)，5-vinyl-2-deoxyuridine，5-Vinyldeoxyuridine5-乙烯基-2-脱氧尿苷 | CAS：55520-67-7 | 纯度：95%试剂信息：CAS：55520-67-7所属类别：糖化学分子量：C11H…

阅读更多...

信息系统基本知识（一）

信息系统基本知识（一）

1.1 信息系统与信息化信息论已发展成为一个内涵非常丰富的学科，与控制论和系统论并称为现代科学的“三论” 1.1.1 信息的基本概念香农指出：信息是能够用来消除不确定性的东西。信息量的单位：比特信息的特征客观性：信息是…

阅读更多...

四信塔式起重机监控系统应用方案

四信塔式起重机监控系统应用方案

方案背景塔式起重机是当前工业建设进行起重运输作业的重要设备，其设备性能、参数、技术指标的可靠性都关系起重机设备的危险，塔式起重机安全事故关系国计民生、危害面广，给国家财产和生命安全带来严重损失。目前众多塔式起重机司机虽然有上…

阅读更多...

推荐文章

最新文章