机器学习 00 归一化/标准化

news2026/2/13 22:54:02

目录

一、归一化/标准化

1.1 为什么我们要进行归一化/标准化?

二、归一化

2.1 定义

2.2 公式

2.3 归一化总结

三、标准化

3.1 定义

3.2 公式

3.3 标准化总结

一、归一化/标准化

1.1 为什么我们要进行归一化/标准化?

特征的单位或者大小相差较大，或者某特征的方差相比其他的特征要大出几个数量级，容易影响(支配)目标结果，使得一些算法无法学习到其它的特征。

举例:约会对象数据
相亲约会对象数据，这个样本时男士的数据，三个特征(玩游戏所消耗时间的百分比、每年获得的飞行常客里程数、每周消费的冰淇淋公升数)。然后有一个所属类别，被女士评价的三个类别(不喜欢didnt、魅力一般small、极具魅力large)，也许也就是说飞行里程数对于计算结果或者说相亲结果影响较大，但是统计的人觉得这三个特征同等重要。

二、归一化

2.1 定义

通过对原始数据进行变换把数据映射到(默认为[0,1])之间。

2.2 公式

那么怎么理解这个过程呢?我们通过一个例子

1、作用于每一列，max为一列的最大值，min为一列的最小值,那么X”为最终结果。

2、mx，mi分别为指定区间值，如制定区间[mx，mi]。默认mx为1,mi为0。

2.3 归一化总结

注意最大值最小值是变化的，最大值与最小值非常容易受异常点影响，所以这种方法鲁棒性较差；

只适合传统精确小数据场景；

三、标准化

3.1 定义

通过对原始数据进行变换把数据变换到均值为0，标准差为1范围内。

3.2 公式

作用于每一列，mean为平均值，o为标准差，x为当前值

对于归一化来说:如果出现异常点，影响了最大值和最小值，那么结果显然会发生改变；

对于标准化来说:如果出现异常点，由于具有一定数据量，少量的异常点对于平均值的影响并不大，从而方差改变较小。

3.3 标准化总结

在已有样本足够多的情况下比较稳定，适合现代嘈杂大数据场景。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/410810.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

我的软件研发套路

我的软件研发套路

春节回来之后，调整到一个新的团队工作。团队，是已有的；所用的技术栈，不熟悉；所做的业务领域，也涉猎甚少。挑战比较大。管理层对团队的产出不满。我的首要任务，是提升团队的效能。目前团队…

阅读更多...

左中右三栏式布局

左中右三栏式布局

一、中间自适应，左右两边宽度固定方法1：box容器 Flex布局，center设置为 flex:1 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible&q…

阅读更多...

神经网络/深度学习（一）

神经网络/深度学习（一）

感知机多层感知机（神经网络） 误差逆传播（error BackPropagation，简称BP）算法深度学习卷积神经网络（Convolutional Neural Networks, CNN） 递归（循环）神经网络&#xf…

阅读更多...

sonar覆盖率、代码覆盖率、分支覆盖率的计算方式

sonar覆盖率、代码覆盖率、分支覆盖率的计算方式

代码质量的覆盖率分为三种，覆盖率、代码覆盖率、分支覆盖率，那每一种的计算方式是怎么样的呢？ 举例： 上面最有疑惑的是覆盖率，不知道怎么算出了来的，后面再说。通过sonarqube可以分析出： 指标…

阅读更多...

232：vue+openlayers选择左右两部分的地图，不重复，横向卷帘

232：vue+openlayers选择左右两部分的地图，不重复，横向卷帘

第232个点击查看专栏目录本示例的目的是介绍演示如何在vue+openlayers项目中自定义js实现横向卷帘。这个示例中从左右两个选择框中来选择不同的地图，做了不重复的处理，即同一个数组，两部分根据选择后的状态做disabled处理，避免重复选择。直接复制下面的 vue+openlayers…

阅读更多...

springmvc入门和两个配置类放置时的问题

springmvc入门和两个配置类放置时的问题

springmvc 替换之前的servlet，用注解型标记进行操作的servlet类（就是之前servlet类上面的Webservlet注解中参数：当前类的访问路径名），然后响应也用注解，据体如下： 先创建web项目再导入需要的包…

阅读更多...

$边学边记——Java数据结构☞树和二叉树$

边学边记——Java数据结构☞树和二叉树

目录一.树 1.定义 2.一些基本概念 3.树的表示形式二.二叉树 1.概念 2.两种特殊的二叉树 3.二叉树的性质 4.二叉树的存储 5.二叉树的遍历（The traversal of A binary Tree） 一.树 1.定义树是一种非线性的数据结构，它是由n&#x…

阅读更多...

1676_MIT 6.828 xv6中的CPU alarm_资料翻译整理

1676_MIT 6.828 xv6中的CPU alarm_资料翻译整理

全部学习汇总： GreyZhang/g_unix: some basic learning about unix operating system. (github.com) 我觉得看了几个MIT的课程之后让我觉得我的大学四年有点浪费时光，看起来MIT的课程的确是很有饱满度。这里，再整理一份课程中的作业要求。 …

阅读更多...

每天分享五款工具，让你的工作办公更顺心

每天分享五款工具，让你的工作办公更顺心

快乐不是在于拥有什么,而在于我们和别人分享什么。每天分享五款工具，让大家工作办公更顺心就是我最大的快乐。 1.绘画——Krita Krita是一款免费的开源绘画软件，适合专业和业余的绘画爱好者，支持多种画笔和图层。你可以使用Krita来创作各种…

阅读更多...

HTTP与TCP区别

HTTP与TCP区别

1、TCP对应与传输层、而HTTP对应于应用层，所以HTTP协议是建立在TCP协议之上的； 2、HTTP底层是利用TCP协议传输的，所以支持http也就一定支持TCP； 3、TCP是网络传输协议， HTTP是超文本传输协议； TCP是底层协…

阅读更多...

Java中创建线程的方式以及线程池创建的方式、推荐使用ThreadPoolExecutor以及示例

Java中创建线程的方式以及线程池创建的方式、推荐使用ThreadPoolExecutor以及示例

场景 Java中创建线程的方式有三种 1、通过继承Thread类来创建线程定义一个线程类使其继承Thread类，并重写其中的run方法，run方法内部就是线程要完成的任务， 因此run方法也被称为执行体，使用start方法来启动线程。 2、通过实…

阅读更多...

盘点手机Type-c充电接口5个实用功能

盘点手机Type-c充电接口5个实用功能

目录 1、手机通过Type-c转HDMI，高清输出电视 2、通过OTG Type-c扩展手机功能 3、实现手机通过网卡有线上网 4、电脑通过手机Type-C有线上网 5、手机通过Type-C收听高清音频今天给大家聊聊手机Type-c充电接口的5个实用功能，希望对大家日常使用…

阅读更多...

Java每日一练(20230410)

Java每日一练(20230410)

目录 1. 二叉树的锯齿形层序遍历 🌟🌟 2. 从中序与后序遍历序列构造二叉树 🌟🌟 3. 平衡二叉树 🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练专栏 Python每日一练专栏 C/C每日一练专…

阅读更多...

UE4 Niagara 烟花制作工程

UE4 Niagara 烟花制作工程

效果图： 第一个做的是网上射出的粒子： 用了事件，把ID给启用，不然会报错第一个发射的炮弹粒子制作完成第二制作炮弹的拖尾： 很明显会用到Ribbon 让宽度从宽到窄让位置和颜色与第一个做的粒子一致，所以…

阅读更多...

【分享】集简云审批支付助手，实现OA付款单自动到招商银行支付

【分享】集简云审批支付助手，实现OA付款单自动到招商银行支付

场景描述支付管理是企业财务管理中的重要一环，直接涉及企业现金流的管理和资金的运用。在现代商业环境下，企业支付管理越来越复杂，许多公司都存在支付流程不规范、支付环节复杂的问题，导致企业支付效率低下。一方面&#xff0…

阅读更多...

CocosCreator实战篇｜CocosCreator实现《飞机大战》

CocosCreator实战篇｜CocosCreator实现《飞机大战》

📢博客主页：肩匣与橘 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正！ 📢本文由肩匣与橘编写，首发于CSDN🙉 📢生活依旧是美好而又温柔的，你也…

阅读更多...

论文赏析——约翰·科斯塔斯：线性系统编码

论文赏析——约翰·科斯塔斯：线性系统编码

© 1952 J. P. Costas © 2023 Conmajia 作者简介约翰彼得科斯塔斯（1923-2008），美国电气工程师，曾发明科斯塔斯环和科斯塔斯数组。科斯塔斯参加过第二次世界大战，并在战后进入麻省理工学院攻读博士学位&#…

阅读更多...

Java反序列化漏洞及实例详解

Java反序列化漏洞及实例详解

目录一、序列化和反序列化序列化用途二、Java反序列化漏洞数据出现函数接口漏洞发现漏洞利用三、Java序列化反序列化演示四、靶场演示一、序列化和反序列化序列化把 Java 对象转换为字节序列（字节流）的过程。反序列化把字节序…

阅读更多...

WebRTC 系列（一、简介）

WebRTC 系列（一、简介）

一、什么是 WebRTC WebRTC 全称是 Web RealTime Communication，是一个用于实时通讯的技术，Google 公司在 2010 年用 6829 万美元将其从 Global IP Solutions 公司收购，并于 2011 年开源，不得不说 Google 确实是一家伟大的公司&am…

阅读更多...

uniapp 引入插件市场的echart插件，使用指南！+踩坑记录！！血泪史！！！

uniapp 引入插件市场的echart插件，使用指南！+踩坑记录！！血泪史！！！

此文章适用于微信小程序中，在uniapp做的小程序中使用echarts 插件地址：echarts-for-wx - DCloud 插件市场插件网页往下翻有详细的使用步骤，这里简短的贴上几张图片以下是我项目中的使用情况，分享给大家： 1.一键导…

阅读更多...

推荐文章

最新文章