5. 统计学基础1:平均值...四分位数、方差、标准差(均方差)、标准误(标准误差、均方根误差)、 标准分

news2025/1/12 7:51:24

文章目录

  • 1. 平均值、中位数、众数、极差、四分位数(即下、中、上四份位数)
  • 2. 方差(Var、D(X) 、σ^2^)、标准差【也叫均方差】(SD 、σ)
  • 3. 标准误【也叫标准误差、均方根误差】(SE)
  • 4. 标准分

总结不易,还望各位友友,多多支持&&点赞🙏🙏你的鼓励是我更新的动力!!

描述性统计分析用几个关键的数字来描述数据集的整体情况 <集中性和离散型(波动性大小)>。

描述数据集常用4个指标: 平均值 四分位数 标准差 标准分
利用这些指标可以进行数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。


1. 平均值、中位数、众数、极差、四分位数(即下、中、上四份位数)

1️⃣平均值

均值容易受极值的影响,当数据集中出现极值时,所得到的的均值结果将会出现较大的偏差。

2️⃣中位数

数据按照从小到大的顺序排列时,最中间的数据即为中位数。

当数据个数为奇数时,中位数即最中间的数,即位置为(N+1)/2 所对应的值;
当数据个数为偶数时,中位数为中间两个数的平均值

中位数不受极值影响,因此对极值缺乏敏感性。

3️⃣众数

数据中出现次数最多的数字,即频数最大的数值。
众数可能不止一个,众数不仅能用于数值型数据,还可用于非数值型数据,不受极值影响。

4️⃣极差

极差 =最大值-最小值,是描述数据分散程度的量,极差描述了数据的范围,但无法描述其分布状态。
且对异常值敏感,异常值的出现使得数据集的极差有很强的误导性。

5️⃣四分位数(即下、中、上四份位数)

数据从小到大排列,并分成四等份,处于三个分割点位置的数值,即为四分位数。

下四分位数(数据从小到大排列排在第25%位置的数字,即最小的四分位数)、
中间的四分位数即为中位数
上四分位数(数据从小到大排列排在第75%的数字,即最大的四分位数)、

四分位数可以很容易地识别异常值。(一般通过箱线图表示数据更直观)

在上下边缘之外的数据一般认为是异常值。



2. 方差(Var、D(X) 、σ2)、标准差【也叫均方差】(SD 、σ)

1️⃣总体方差 (variance / deviation Var,D(X) )

定义:是每个样本值与 全体样本值的平均数之差的平方值的平均数

意义:表示数据离散程度。

公式:

实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式:将 1/N 换成1/(N-1)


2️⃣总体标准差 (Standard Deviation,SD,σ)

别名:均方差(Mean square error)

定义:是方差的平方根。

意义:由于方差是数据的平方,与检测值本身相差太大,所以常用方差开根号换算回来,这就是我们要说的标准差。

公式:

如是估算样本方差,则将公式中的 1/N 换成1/(N-1)
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)。


在这里插入图片描述


3. 标准误【也叫标准误差、均方根误差】(SE)

标准误差(Standard error),也称均方根误差(Root mean squared error)

标准差与标准误既有明显区别,又密切相关:
标准误是标准差的1/sqrt{n};二者都是衡量样本变量(观测值)随机性的指标,只是从不同角度来反映误差;

公式:

详细见:https://wiki.mbalib.com/wiki/标准误
 在这里插入图片描述



4. 标准分

标准分又叫标准差σ的标准化值,每个数据距离平均值多少个标准差。
标准分布又称正态分布。

正态分布中,
至少有68%的数据,位于平均数1个标准差范围内。【即(u-σ ,u+σ)】。
至少有95%的数据,位于平均数2个标准差范围内。【即(u-2σ ,u+2σ)】
至少有99.8%的数据,位于平均数3个标准差范围内。【即(u-3σ ,u+3σ)】



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/163106.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高空探测数据处理--对流层顶选取

对流层的概念(维基百科) 对流层(英语:Troposphere)是地球大气层中最靠近地面的一层,也是地球大气层里密度最高的一层。它蕴含了整个大气层约75%的质量,以及几乎所有的水蒸气及气溶胶。 对流层从地球表面开始向高空伸展,直至对流层顶,即平流层的起点为止。对流层的上…

【Labview】每日一题

&#x1f6a9;write in front&#x1f6a9; &#x1f50e;大家好&#xff0c;我是謓泽&#xff0c;希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流&#x1f50e; &#x1f3c5;2021年度博客之星物联网与嵌入式开发TOP5&#xff5…

The ATIS Spoken Language Systems Pilot Corpus

摘要 语音研究有巨大的进步在过去使用以下的模式: 定义研究问题收集语料针对性的衡量进展解决这个研究问题 自然语言研究&#xff0c;另一方面&#xff0c;取得了典型的进步在没有任何数据语料的情况下&#xff0c;这能够测试研究的假设。 我们描述了ATISATISATIS试点语料库…

从C到C++及类与对象

目录 从C到C 嵌入式领域常用的GUI 语法的升级 引用 默认参数 函数重载 堆内存 概念和思维的升级 类和对象 类的申明 类的成员函数 常成员、常对象&#xff08;C推荐const而不用#define&#xff0c; mutable &#xff09; 静态成员(属于类不属于对象) 友元(破坏…

Opencv实战案例——模板匹配实现银行卡号识别(附详细介绍及完整代码下载地址)

Opencv目录1.项目意义2.模板匹配3.图像二值化3.1全局阈值3.2全局阈值代码即效果展示3.3 自适应阈值3.4自适应阈值代码即效果展示4.轮廓筛选4.1轮廓检测4.2绘制轮廓4.3轮廓筛选代码及效果展示5.形态学变化5.1腐蚀5.2膨胀5.3开运算和闭运算、礼帽和黑帽6.项目实战6.1读取图片转化…

next_permutation函数讲解

目录 前言&#xff1a; 简要概述&#xff1a; 例题&#xff08;1&#xff09;&#xff1a; P1088 [NOIP2004 普及组] 火星人 题目描述 输入格式 输出格式 输入输出样例 说明/提示 代码&#xff08;1&#xff09;&#xff1a; 例题&#xff08;2&#xff09;&#xf…

如何开发 Vite 3 插件构建 Electron 开发环境?(文末附视频讲解)

开发新版本 Vue 项目推荐你使用 Vite 脚手架构建开发环境&#xff0c;然而 Vite 脚手架更倾向于构建纯 Web 页面&#xff0c;而不是桌面应用&#xff0c;因此开发者要做很多额外的配置和开发工作才能把 Electron 引入到 Vue 项目中&#xff0c;这也是很多开发者都基于开源工具来…

用户多兴趣建模MIND

1. 概述 在工业界&#xff0c;一个完整的推荐系统中通常包括两个阶段&#xff0c;分别为召回阶段和排序阶段。在召回阶段&#xff0c;根据用户的兴趣从海量的商品中去检索出用户&#xff08;User&#xff09;可能感兴趣的候选商品&#xff08; Item&#xff09;&#xff0c;满…

JavaEE进阶第二课:Spring创建与使用

上一篇我们介绍了Spring的概念&#xff0c;知道了Spring是众多工具方法的IoC容器。 但是纸上谈兵终觉浅&#xff0c;这一篇文章就来介绍Spring创建与使用&#xff0c; 注之后我们对对象的称呼就叫Bean 1.1Spring项目的创建与配置 1.创建maven项目&#xff0c;语言选java&…

【1819. 序列中不同最大公约数的数目】

来源&#xff1a;力扣&#xff08;LeetCode&#xff09; 描述&#xff1a; 给你一个由正整数组成的数组 nums 。 数字序列的 最大公约数 定义为序列中所有整数的共有约数中的最大整数。 例如&#xff0c;序列 [4,6,16] 的最大公约数是 2 。 数组的一个 子序列 本质是一个序…

Python(16):Numpy之array数组的数值计算

目录 0. 相关文章链接 1. 创建Array数组 2. 基本数值计算 2.1. numpy中的函数 2.2. 数组中的函数 3. 指定维度进行计算 3.1. numpy中的函数 3.2. 数组中的函数 4. 复杂计算 4.1. 统计乘机 4.2. 获取对应值的索引位置 4.3. 求平均值 4.4. 求标准差 4.5. 求方差 4…

【MFEN:轻量级多尺度特征提取:SR网络】

MFEN: Lightweight multi-scale feature extraction super-resolution network in embedded system &#xff08;MFEN&#xff1a;嵌入式轻量级多尺度特征提取超分辨率网络&#xff09; 深度卷积神经网络&#xff08;CNN&#xff09;在超分辨率&#xff08;SR&#xff09;方面…

基于java springboot+mybatis爱游旅行平台前台+后台设计实现

基于java springbootmybatis爱游旅行平台前台后台设计实现 博主介绍&#xff1a;5年java开发经验&#xff0c;专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文末获…

PCI、PCI-X、PCI-E、PCI-E Card、Mini PCI-E、M.2、Add-in Card 这些概念你搞清楚了吗

搞硬件或通信的“攻城狮”们&#xff0c;免不了要和各种通信协议及接口打交道。比如&#xff0c;我们经常接触PCI、PCI-X、PCI-E、PCI-E Card、Mini PCI-E、M.2(NGFF)、Add-in Card这些概念&#xff0c;作为“攻城狮”队伍中的一员&#xff0c;你搞清楚它们之间的关系了吗&…

Linux第一个小程序-进度条

目录 \r&&\n 行缓冲区概念 倒计时程序 进度条代码 \r&&\n 回车概念换行概念 \n[rootVM-12-17-centos lesson8]# touch test.c [rootVM-12-17-centos lesson8]# touoch Makefile bash: touoch: command not found [rootVM-12-17-centos lesson8]# touch Mak…

Python:每日一题之完全二叉树的权值

题目描述 给定一棵包含 N 个节点的完全二叉树&#xff0c;树上每个节点都有一个权值&#xff0c;按从 上到下、从左到右的顺序依次是 A1​,A2​,⋅⋅⋅AN​&#xff0c;如下图所示&#xff1a; 现在小张要把相同深度的节点的权值加在一起&#xff0c;他想知道哪个深度的节点 权…

【Linux操作系统】Linux进程状态和两个特殊进程

文章目录一.一套普适性的进程状态理论1.运行2.阻塞3.挂起二.一套具体的Linux进程状态1.R-运行2.S-睡眠3.T-暂停5.t-被追踪三.僵尸进程和孤儿进程1.僵尸进程2.孤儿进程一.一套普适性的进程状态理论 1.运行 由于CPU数量相对于进程数量来说少之又少,所以CPU维护了一个运行队列,方…

Synchronized底层原理系列之Synchronized的偏向锁实现原理

作者简介&#xff1a;专注于研究Linux内核、Hotspot虚拟机、汇编语言、JDK源码、各大中间件源码等等喜欢的话&#xff0c;可以三连关注~上篇文章已经对Synchronized关键字做了初步的介绍&#xff0c;从字节码层面介绍了Synchronized关键字&#xff0c;最终字节码层面就是monito…

【Linux】 iptables 入门简介

文章目录前言作用持久化和恢复执行的顺序前言 简单地说&#xff0c;iptables是Linux的防火墙程序。它将使用表监控进出服务器的流量。这些表包含称为链的规则集&#xff0c;这些规则将过滤传入和传出数据包。 作用 当数据包与规则匹配的时候&#xff0c;会为其指定一个目标&a…

基于幂等表思想的幂等实践

一、为什么需要幂等 分布式场景下&#xff0c;多个业务系统间实现强一致的协议是极其困难的。一个最简单和可实现的假设就是保证最终一致性&#xff0c;这要求服务端在处理一个重复的请求时需要给出相同的回应&#xff0c;同时不会对持久化数据产生副作用&#xff08;即多次操…