excel统计分析——S-W正态性检验

news2024/11/25 3:23:43

参考资料:

[1]马兴华,张晋昕.数值变量正态性检验常用方法的对比[J].循证医学,2014,14(02):123-128.

统计推断——正态性检验(图形方法、偏度和峰度、统计(拟合优度)检验)_sm.distributions.ecdf-CSDN博客

【统计学】利用spss正态分布假定检验 S-W检验 K-S检验 直方图 Q-Q图

https://real-statistics.com/tests-normality-and-symmetry/statistical-tests-normality-symmetry/shapiro-wilk-test/

https://real-statistics.com/tests-normality-and-symmetry/statistical-tests-normality-symmetry/shapiro-wilk-expanded-test/

       S-W正态性检验法由Shapiro和Wilk1965年提出的,又称W检验。使用原始的S-W检验,在8≤n≤50时可以利用,小样本(n<8)对偏离正态分布的检验不太有效。不幸的是,针对大多数n统计量W的分布是未知的,必须通过模拟,造表或者近似方法获得。

       而J. P. Royston就是通过近似的方法改进了S-W方法,对样本量的要求为12≤n≤5000,甚至更多;但建议样本量不低于20;该方法被用在了很多软件中(如SAS和SPSS)。

原始版S-W检验,具体步骤如下:

1、将n个样本观测值按由小到大的次序排序。

2、计算S-W正态性检验统计量。

W=\frac{b^{2}}{SS}=\frac{(\sum_{i=1}^{m}a_{i}(x_{n+1-i}-x_{i}))^{2}}{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}}

其中,当n为偶数时,m=n/2;当n为奇数时,m=(n-1)/2。

3、根据给定的检验水平α和样本容量n计算统计量W的临界值W_{\alpha}

4、做出统计判断。若W<W_{\alpha},则认为样本数据所来自的总体不服从正态分布;若W>W_{\alpha},则认为服从正态分布。

上述中的a_{i}W_{\alpha}均为查表所得。

excel实现步骤如下:

注:已提前将需要查表的信息放到excel中,信息来源参考https://real-statistics.com/statistics-tables/shapiro-wilk-table/

Royston的改进版S-W方法:

1、将n个样本观测值按由小到大的次序排序。

2、利用excel统计分析——Q-Q图_excel 分位数图-CSDN博客中介绍的累计分布函数,取CDF=\frac{k-0.375}{n+0.25},获得n个数据对应累计概率值。

3、利用标准正态分布的概率密度函数的反函数,对得到的CDF进行计算,记作m_{i}(i=1...n)。

4、对m_{i}的平方求和,m=\sum_{i=1}^{n}m_{i}^{2}

5、系数a_{i},取u=1/\sqrt{n}

a_{n}=-2.706056u^{5}+4.434685u^{4}-2.071190u^{3}-0.147981u^{2}+0.221157u+m_{n}m^{-0.5}

a_{n-1}=-3.582633u^{5}+5.682633u^{4}-1.752461u^{3}-0.293762u^{2}+0.042981u+m_{n-1}m^{-0.5}

a_{i}=m_{i}/\sqrt{\epsilon } ,其中,2<i<n-1,\epsilon =\frac{m-2m_{n}^{2}-2m_{n-1}^{2}}{1-2a_{n}^{2}-2a_{n-1}^{2}}

a_{2}=-a_{n-1}

a_{1}=-a_{n}

系数a_{i}之间的关系为:\sum_{i=1}^{n}a_{i}^{2}=1

6、计算统计量:

W=\frac{(\sum_{i=1}^{n}a_{i}x_{i})^2}{\sum_{i=1}^{n}(x_{i}-\bar{x})^2}

根据W的公式可推算出,W是a与x之间的相关系数的平方,W的取值范围始终在0和1之间。

同样可以根据公式推算出:当n取值在12到5000之间时,ln(1-W)是近似服从正态分布的,其中μ和σ取值如下:

\mu =0.0038915(\mathrm{ln } n)^{3}-0.083751(\mathrm{ln } n)^{2}-0.31082\mathrm{ln } n-1.5861

\sigma =e^{0.0030302(\mathrm{ln }n)^{2}-0.082676\mathrm{ln }n-0.4803}

7、W统计量转换为z统计量:

z=\frac{\mathrm{ln}(1-W)-\mu}{\sigma}

如果z值对应的p值小于α,则认为不服从正态分布。

excel实现步骤如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1332933.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux操作系统基础 – 修改文件权限

Linux操作系统基础 – 修改文件权限 Linux Operating System Essentials - Modify File Rights By JacksonML 文件是Linux操作系统存储信息的基本结构。文件是一组信息的集合。 在Linux操作系统和Windows操作系统相比较的最大不同&#xff0c;是Linux文件没有扩展名&#xff…

2023年全球前端大技术大会(GMTC北京站2023)-核心PPT资料下载

一、峰会简介 大会以“业务至上&#xff0c;效率为王”为主题&#xff0c;策划了 1 个主会场&#xff0c;10 个技术专场。会议议题包含前端 DevOps 实践、低代码、大前端监控、跨端技术选型、团队可持续发展、IoT 动态应用开发、移动端性能与效率优化、TypeScript、大前端技术…

等腰三角形两底角相等

等腰三角形定义: 是指至少有两边相等的三角形。相等的两个边称为这个三角形的腰 二.证明 有等腰△ABC,AB和AC是腰,p是BC的中点 证明等腰三角形两底角相等 即 ∠ A B P ∠ P C A ∠ABP∠PCA ∠ABP∠PCA ∴ ∴ ∴ 三角形内角和为180 ∵ { ∠ A B P ∠ A P B ∠ B A P 180 …

形态学处理

形态学处理的相关内容 &#xff08;1&#xff09;基于图像形态进行处理的一般方法 &#xff08;2&#xff09;这些处理方法基本是对二进制图像进行处理 &#xff08;3&#xff09;卷积核决定着图像处理后的结果 形态学图像处理 &#xff08;1&#xff09;腐蚀&#xff08;…

如何打包鸿蒙应用并发布到应用市场

知识点&#xff1a; HarmonyOS 应用打包后的文件为.app 格式&#xff0c; android 打包后的文件为.apk&#xff0c;IOS 打包后的文件为.apa HarmonyOS通过数字证书&#xff08;.cer文件&#xff09;和Profile文件&#xff08;.p7b文件&#xff09;等签名信息来保证应用的完整性…

最常见的SQL报错注入函数(floor、updatexml、extractvalue)及payload总结

SQL报错注入是一种常见的SQL注入攻击方式&#xff0c;攻击者通过注入恶意代码&#xff0c;触发数据库的错误响应&#xff0c;并从错误信息中获取有用的信息。 下面介绍最常见的三个报错注入函数用法及payload总结&#xff1a; 1、floor() 使用floor报错注入&#xff0c;需要…

VS2020使用MFC开发一个贪吃蛇游戏

背景&#xff1a; 贪吃蛇游戏 按照如下步骤实现:。初始化地图 。通过键盘控制蛇运动方向&#xff0c;注意重新设置运动方向操作。 。制造食物。 。让蛇移动&#xff0c;如果吃掉食物就重新生成一个食物&#xff0c;如果会死亡就break。用蛇的坐标将地图中的空格替换为 #和”将…

[动态规划]完全背包问题及其优化

题目描述 有N种物品和一个容量为 V 的背包&#xff0c;每种物品都有无限件可用。 第 i 种物品的体积是Ci&#xff0c;价值是Wi。求解在不超过背包容量的情况下&#xff0c;能够获得的最大价值。 输入 第一行为两个整数N、V(1≤N,V≤10000)&#xff0c;分别代表题目描述中的物…

java 怎么读取文件创建时间?

Java读取文件创建时间的实现方法 在工作时候&#xff0c;我们有时候需要获取到文件的最后更新时间&#xff0c;根据最近更新时间&#xff0c;来处理其他业务。那么&#xff0c;在Java中&#xff0c;怎么获取到文件最后更新时间呢&#xff1f;接下来凯哥(个人号&#xff1a;凯哥…

教你应对Github最新的2FA二次验证! 无地区限制, 你的Github账户可能被封禁!

文章目录 2FA 定义2FA验证方法1 硬件令牌2.推送通知3.SMS 验证4 基于语音的身份验证 解决方案安装身份验证器的谷歌浏览器插件打开 github 的二维码&#xff0c;直接扫描 2FA 定义 双因素身份验证 (2FA) 是一种身份和访管理安全方法&#xff0c;需要经过两种形式的身份验证才能…

大数据----MapReduce实现统计单词

目录 一、简介二、实现单词统计数据准备编程MapReduceJob 三、运行四、结果 一、简介 Hadoop MapReduce 是一个编程框架&#xff0c;它可以轻松地编写应用程序&#xff0c;以可靠的、容错的方式处理大量的数据(数千个节点)。 正如其名&#xff0c;MapReduce 的工作模式主要分…

每日一题——Leetcode908

方法一 数学思想&#xff1a; 其实就是看数组中最大值和最小值一个加上k一个减去k是否能刚好凑到0&#xff0c;如果不能就是两者之差 var smallestRangeI function(nums, k) {var min9999,max-1for(var i0;i<nums.length;i){min Math.min(min,nums[i])max Math.max(max…

Python数据分析 Matplotlib篇 基本方法初识 (第1讲)

Python数据分析 Matplotlib篇(第1讲)         🍹博主 侯小啾 感谢您的支持与信赖。☀️ 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹…

leetcode 1576. 替换所有的问号(easy)(优质解法)

链接&#xff1a;1576. 替换所有的问号 代码&#xff1a; class Solution {public String modifyString(String s) {char[] charSs.toCharArray();int lengthcharS.length;//遍历找到 &#xff1f;for(int i0;i<length;i){if(charS[i]?){//遍历 a ~ z 选择一个合适的字符来…

Linux怎么解压zip格式文件?

Linux解压命令zip是一种常见的文件压缩格式&#xff0c;用于把文件打包成一个zip文件&#xff0c;当我们需要共享或是发送时&#xff0c;能够更快速的发送&#xff0c;储存起来能够减少储存空间。那我们在Linux上怎么使用解压命令zip来解压zip格式文件呢&#xff1f;我们一起来…

MySQL 大数量left join 太慢语句拆分的一种办法

最近做点股市分析&#xff0c;发现日线数据已经达到了千万级&#xff0c;想做个两个日期之间的收盘价比较&#xff0c;例如第一周1月3日和1月6日的涨幅&#xff0c;很简单的语句&#xff0c;如下&#xff1a; select a.scode,s. name,a.sdate sdate1,a.close close1, b.sdate …

nodejs+vue+ElementUi房屋房产销售预约看房系统bqv00

完成房产销售系统&#xff0c;对房源的信息、用户信息及各种资料进行收集和科学的管理&#xff0c;该系统的功能基本可以满足当前市面上的小型房产企业对于房产销售的基本要求&#xff0c;收集各个地区的房源信息并进行分类管理&#xff0c;用户通过注册账号登录网站查询房源信…

小狐狸ChatGPT付费创作系统 前端对话提示undefined index:temperature解决方法

很多会员使用着ChatGPT付费创作系统&#xff0c;特别是新安装系统后前端输入对话时提示错误undefined index:temperature&#xff0c;检查了反代、检查了KEY均正常&#xff0c;这问题主要是因为后台设置里新用户免费送对话次数为空&#xff0c;没设置赠送次数原因&#xff0c;导…

【BEV感知算法概述——下一代自动驾驶感知算法】

文章目录 BEV感知算法概念BEV感知算法数据集介绍BEV感知算法分类BEV感知算法的优劣小结 BEV感知算法概念 Bird’s-Eye-View&#xff0c;鸟瞰图&#xff08;俯视图&#xff09;。BEV感知算法存在许多的优势。 首先&#xff0c;BEV视图存在遮挡小的优点&#xff0c;由于视觉的透…

腾讯面试:SaaS多租户,如何设计?

尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50)中&#xff0c;最近有小伙伴拿到了一线互联网企业网易、美团、字节、如阿里、滴滴、极兔、有赞、希音、百度、美团的面试资格&#xff0c;遇到很多很重要的面试题&#xff1a; 多租户设计&#xff0c;如何 技术选型&#xff…