正态性检验全流程

news2024/11/18 17:48:07

正态性检验处理流程

一、分析问题

在实际研究中,正态性是很多研究方法在进行分析时需要满足的前提条件。常见的比如方差分析、T检验、相关分析、回归分析等等,这些分析方法使用的前提假定就是需要数据满足正态分布。

但是这一点经常被分析人员有意或无意的忽略掉。原因一可能在于大家“心照不宣”的默认数据满足正态性;原因二可能是分析人员的数据分析基础知识不够,不知道需要进行正态性检验;原因三可能在于知道数据需要满足正态分布,但是数据无论如何都无法满足正态性,就放弃了。

如果说数据分析方法没有满足需要的前提条件,那么分析得到的结果就是不够科学、不够严谨的,甚至得到的分析结论也会“本末倒置”。这就提示我们数据分析一定要严谨,正态性检验必不可少,接下来将介绍一下正态性检验方式。

二、检验方式

正态性检验方式主要有统计检验法、描述法、图示法这三大类。

当前有3个班级90名同学的期中考试成绩,现在要检验成绩是否满足正态分布,部分数据如下:

我们将分别使用这三类分析方法进行正态性检验,这三类方法都可以在SPSSAU系统找到,下面将一一进行介绍说明。

  1. 统计检验法
    统计检验法是检验正态性的最严格方法,对数据要求最为严格。统计检验法包括两种检验方式,分别是Kolmogorov-Smirnov检验和Shapiro-Wilk检验。如果样本量大于50,则使用K-S检验(Kolmogorov-Smirnov检验),反之则使用S-W检验(Shapiro-Wilk检验)。
    SPSSAU正态性检验分析结果如下:


因为样本量为90,大于50,所以使用K-S检验进行,具体来看,成绩全部均没有呈现显著性(p>0.05),所以成绩全部具有正态性特质,满足正态分布。

  1. 描述法
    统计检验法一般来讲是很难满足的,所以在正态性检验分析结果中,还可以看峰度和偏度两个指标,描述法是使用峰度和偏度考察数据的正态性。一般认为,如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。


从上图通过查看偏度和峰度,也可以得到数据满足正态分布的性质。

  1. 图示法

大部分情况下,如果对数据要求不是特别严格,一般使用图示法进行数据的正态性检验。图示法包括查看数据直方图、P-P图和Q-Q图三种。

3.1 直方图

如果直方图的形状近似满足“中间高,两头低”的钟形分布,则说明数据近似满足正态分布特性,不必过多纠结数据的正态性。

SPSSAU直方图输出结果如下:

从上图可以看出,成绩的直方图基本满足“中间高,两头低”的钟形分布,说明数据满足正态分布特性。

3.2 P-P图

P-P图其原理在于如果数据正态,那么数据的累积比例与正态分布累积比例基本保持一致。分别计算出数据累积比例,和假定正态时的数据分布累积比例;并且将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图。

SPSSAU的P-P图输出结果如下:

从P-P图可以看出,散点图近似呈现一条对角直线,说明成绩呈现正态分布。

3.3 Q-Q图

Q-Q图其原理在于如果数据正态,那么其假定的正态分位数会与实际数据基本一致。计算出假定正态时的数据分位数;并且将实际数据作为X轴,将假定正态时的数据分位数作为Y轴,作散点图。

SPSSAU的Q-Q图输出结果如下:

从Q-Q图可以看出,散点图近似呈现一条对角直线,说明成绩呈现正态分布。

三、非正态转化

从理论上讲,很多研究方法需要满足正态分布特质,但现实情况下,很难满足正态分布性。这样就需要进行非正态转化,想办法将不满足正态性特性的数据,经过一些方法,转化为满足正态分布的数据。非正态转化为正态数据的常见方法有以下几种:

  1. 取对数
    a'=log(a)将原始数据a的对数值作为新的数据再进行分析;当原始数据中含有0或者负数时,可以根据内容自主进行相应改动:如 a'=log(a+x)。
  2. 开根号
    a'=sqrt(a)将原始数据a的平方根作为新的数据再进行分析;同样的,如果a为0,可以将a加上一个合适的值进行变换。
  3. 取倒数
    a'=1/a将原始数据a的倒数值作为新的数据再进行分析。
  4. 移除异常值
    异常值,也称离群值,是指样本中的个别值,其数值明显偏离所属样本的绝大部分观测值。不论进行什么分析,如果数据中存在异常值,都应该在分析前进行处理,否则很可能影响分析结果,甚至扭曲结论。异常值可在SPSSAU->数据处理->异常值中进行处理。
  5. BOX-COX转换
    针对数据进行Box-Cox变换,尽量让数据满足正态性。
    例如现在有一份数据,在进行正态性检验时,p值为0.019<0.05,说明数据不具有正态性特质。将数据进行BOX-COX转换后,二者进行正态性检验得到分析结果如下表:


从上表可以看出,虽然再经过BOX-COX转换后p值仍小于0.05,没有通过正态性检验,但p值从0.019变为0.042,明显接近0.05,说明BOX-COX转换对于正态性的改善是有作用的。

  1. Johnson转换
    同样的,Johnson转换与BOX-COX转换一样,都是通过某种变换使得数据尽量满足正态性。


从上表可以明显看出,虽然再经过Johnson转换后p值仍小于0.05,没有通过正态性检验,但p值从0.019变为0.042,明显接近0.05,说明Johnson转换对于正态性的改善是有作用的。

  1. 加大样本量

一般认为,有可能随着样本数增加越倾向于拒绝原假设(服从正态分布)。即样本数据量越大,则可以认为数据越具有正态性特质。所以可以通过加大样本量的方法提高数据的正态性。但这种方法在实际情况中很难实现,因为数据一般都是已经收集完成再进行分析的,此时再去收集数据加大样本量并不现实。

四、正态转化优劣对比

并不是所有数据在进行以上非正态转化后都可以呈现出正态性特征的。如果在进行非正态转化后数据仍不满足正态性,此时说明数据并不适合使用方差分析、t检验等方法,可以选择其他方法进行分析。举例说明如下图:

五、总结

在实际研究中,很多分析方法的前提条件都要求数据满足正态性特征,所以在分析前需要进行正态性检验。正态性检验的方法包括统计检验法、描述法、图示法三大类。其中,统计检验法对于数据正态性要求最为严格,绝对正态数据一般很难达到。一般使用描述法或图示法进行检验,数据近似满足正态性特征即可。如果经过检验发现数据并不满足正态性特征,这个时候可以先进行数据的非正态转化,但是转化并不能保证数据一定能满足正态性特征。同时需要注意,有实际意义的数据经过转化后可能失去实际意义。如果无论如何数据都不能满足正态性,此时可以考虑使用非参数检验等方法进行分析。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/374854.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

潜伏的 Linux Rootkit:Syslogk

Rootkit 是非常危险的恶意软件&#xff0c;一旦侵入就很难被发现。开发 Rootkit 通常更加困难&#xff0c;很多攻击者都倾向于重用开源项目。 Adore-Ng 是一个相对较老的、开源的 Linux 内核 Rootkit&#xff0c;最初针对内核 2.x 版本开发&#xff0c;但目前已更新为针对内核…

【黑马JVM(1)】内存结构

JVMJVM/JRE/JDK示例JVM内存管理JVM整体架构程序计数器虚拟机栈栈内存溢出线程诊断 top/ps -H/jstack案例一&#xff1a;CPU占用过多案例二&#xff1a; 程序运行很长时间没结果本地方法栈堆堆内存溢出堆内存诊断案例一&#xff1a;jps/jmap/jconsole工具使用案例二&#xff1a;…

Java---打家劫舍ⅠⅡ

目录 打家劫舍Ⅰ 题目分析 代码一 代码二 打家劫舍Ⅱ 打家劫舍Ⅰ 你是一个专业的小偷&#xff0c;计划偷窃沿街的房屋。每间房内都藏有一定的现金&#xff0c;影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统&#xff0c;如果两间相邻的房屋在同一晚上被…

设备树实践操作

目录一、使用设备树给DM9000网卡_触摸屏指定中断1、修改方法2、实验方法二、在设备树中时钟的简单使用1、参考文档2、知识讲解三、在设备树中pinctrl的简单使用1、几个概念2、设备树中pinctrl节点3、platform_device, platform_driver匹配4、驱动中想选择、设置某个状态的引脚四…

ESP32设备驱动-BMI160惯性测量传感器驱动

BMI160惯性测量传感器驱动 BMI160 是一种高度集成的低功耗惯性测量单元 (IMU),可提供精确的加速度和角速率(陀螺仪)测量。 BMI160 集成: 16位数字,三轴加速度计16位数字,三轴陀螺仪BMI160特性: 高性能加速度计和陀螺仪(硬件同步) 极低功耗:typ.925A(加速度计和陀螺…

BIM小技巧丨关于如何在Revit明细表中显示门窗面积

在明细表中显示门窗面积(以门明细表为例)在新建一个门明细表后&#xff0c;可以发现在Revit中不能直接使用明细表统计门窗面积。 这时&#xff0c;可以通过使用添加“计算值”的方式来处理&#xff0c;得到如下图所示&#xff0c;两种不同的面积统计结果&#xff1a; 除此之外&…

Android 12 快速适配

Android 12 需要更新适配点并不多&#xff0c;本篇主要介绍最常见的两个需要适配的点&#xff1a;android:exported[1] 和 SplashScreen[2] 。一、android:exported它主要是设置 Activity 是否可由其他应用的组件启动&#xff0c; “true” 则表示可以&#xff0c;而“false”表…

满汉楼练习 马踏棋盘

1. 满汉楼 1.结构图 2. 数据库 pwd CHAR(32) NOT NULL DEFAULT ‘’,# 密码&#xff0c;32位 INSERT INTO employee VALUES(NULL, ‘666’, MD5(‘123456’), ‘老韩’, ‘经理’); MD5(‘123456’)是经过MD5加密过后的32位的字符串&#xff0c;用来保存密码 select * fro…

辉光管时钟学习制作及开源软硬件工程

文章目录前言开源地址辉光管项目介绍辉光管的工作条件硬件部分部分介绍充电电路驱动电路不足之处软件部分总结前言 作为一个电子人&#xff0c;一直想做一个辉光管时钟&#xff0c;算是大学的一个心愿&#xff0c;终于在快要毕业前做了一个&#xff0c;下面把软件和硬件的部分…

Windows事件日志监控

大多数数据泄露属内部人员而为&#xff0c;但各企业在监控内部网络活动方面仍存在不足。无论是大型还是小型企业&#xff0c;监控内部网络活动已成为其主要要求。要保护网络安全以防范泄露和威胁&#xff0c;各企业需要采取积极的措施来保证其网络和数据的安全性。监控事件日志…

NCRE计算机等级考试Python真题(四)

第四套试题1、以下选项中&#xff0c;不属于需求分析阶段的任务是&#xff1a;A.需求规格说明书评审B.确定软件系统的性能需求C.确定软件系统的功能需求D.制定软件集成测试计划正确答案&#xff1a; D2、关于数据流图&#xff08;DFD&#xff09;的描述&#xff0c;以下选项中正…

跨境人都在用的指纹浏览器到底有什么魔力?三分钟带你了解透彻

什么是指纹浏览器&#xff1f;这是东哥近期收到最多的粉丝私信咨询&#xff0c;指纹两个字大家都很熟悉&#xff0c;指纹浏览器就变得陌生起来。之前东哥也跟大家分享过很多次指纹浏览器的用法&#xff0c;鉴于还是很多人不认识这个好用的工具&#xff0c;东哥今天就来详细给大…

【ICCV2022】 CAPAO:一种高效的单阶段人体姿态估计模型

CAPAO&#xff1a;一种高效的单阶段人体姿态估计模型 重新思考关键点表示&#xff1a;将关键点和姿态建模作为多人姿态估计的对象&#xff08;Rethinking Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human Pose Estimation&#xf…

k8s学习之路 | Day16 k8s 中的容器初探

文章目录容器镜像镜像名称镜像拉取策略私有仓库的拉取策略容器的环境变量和启动命令容器的环境变量容器的启动命令容器的生命周期钩子postStartpreStop容器的探针startupProbelivenessProbereadinessProbek8s 集群中最小的管理单元就是一个Pod&#xff0c;而Pod里面才是容器&am…

linux下devmem访问物理寄存器MT7621 mdio控制

在同专栏的mdio访问phy的三种方式篇&#xff0c;我们着重介绍了通过ioctrl的方式将mdio总线与网卡绑定进行访问&#xff0c;但是实时上数据接口和管理接口可以独立去控制&#xff0c;很不幸&#xff0c;作者现在必须把mdio与网卡解除绑定并独立操控&#xff0c;因此接下来将详细…

【elementUI】基于elementUI自定义封装分页内容

文章目录前端分页的封装后端进行分页的封装&#xff0c;利用el-pagination网页获取数据进行分页主要有前端分页和后端分页&#xff0c;对于数据量较小的数据&#xff0c;可以使用前端分页进行实现。但是一般的分页都是后端获取分页实现前端分页的封装 思路&#xff1a; 1.假设一…

Mybatis源码学习笔记(五)之Mybatis框架缓存机制原理解析

1 Mybatis框架的缓存模块 MyBatis 内置了一个强大的事务性查询缓存机制&#xff0c;它可以非常方便地配置和定制。Mybatis框架中的缓存分为一级缓存和二级缓存&#xff0c;三级缓存基本都要借助自定义缓存或第三方服务来进行实现。但本质上是一样的&#xff0c;都是借助Cache接…

只会手工测试,裸辞后怎么才能找到工作

我们可以从以下几个方面来具体分析下&#xff0c;想通了&#xff0c;理解透了&#xff0c;才能更好的利用资源提升自己。 一、我会什么&#xff1f; 先说第一个我会什么&#xff1f;第一反应&#xff1a;我只会功能测试&#xff0c;在之前的4年的中我只做了功能测试。内心存在…

如何改变照片的大小kb?照片怎么改到100kb?

在平时的日常工作生活当中&#xff0c;我们都会遇到需要上传照片的情况&#xff0c;但是随着拍摄的照片越来越清晰照片体积也越来越大&#xff0c;很容易遇到图片太大上传不成功的情况&#xff0c;那么这时候应该怎么办呢&#xff1f;今天来给大家分享一款照片压缩器&#xff0…

TCP/IP协议,网络工程部分

这个博客参考了许多up主的视频和网上其他的博主的文章&#xff0c;还有我老师的ppt 这里是目录一、osi七层模型&#xff08;参考模型&#xff09;1.物理层2.数据链路层&#xff08;数据一跳一跳进行传递&#xff09;3.网络层&#xff08;端到端传输&#xff09;4.传输层&#x…