统计的基本概念及抽样分布

news2024/12/23 9:26:17

文章目录

  • 🍋引言
  • 🍋总体(Population)
    • 🍋总体参数
  • 🍋样本(Sample)
    • 🍋随机样本
    • 🍋样本统计量
  • 🍋统计量(Statistic)
    • 🍋样本均值(Sample Mean)
    • 🍋样本方差和标准差(Sample Variance and Standard Deviation)
  • 🍋常用分布和分位点
    • 🍋1. 正态分布(Normal Distribution)
    • 🍋2. t分布(t-distribution)
    • 🍋3. χ²分布(Chi-Squared Distribution)
  • 🍋统计学中的应用
  • 🍋单个正态总体的抽样分布
  • 🍋两个正态总体的抽样分布

🍋引言

统计学作为一门重要的科学领域,涵盖了众多的概念和方法。本文将重点介绍统计学的基本概念,包括总体、样本以及统计量,并将通过数学公式来解释它们之间的关系。

🍋总体(Population)

总体是我们感兴趣的全体对象或观察单元的集合。在统计学中,总体可以包括人口、产品、事件等等。总体通常用大写字母N表示,总体的某一属性通常用大写字母X表示。例如,总体平均值用μ表示,总体标准差用σ表示。

🍋总体参数

总体的属性可以通过各种参数来描述。例如,总体的均值、方差、标准差等都是描述总体性质的参数。这些参数通常是未知的,我们的目标是通过样本数据对它们进行估计。

🍋样本(Sample)

由于通常不可能获取总体的全部数据,我们使用样本来代表总体。样本是总体中的一个子集,通常用小写字母n表示样本大小。样本的属性通常用小写字母x表示,例如样本均值用x̄表示。

🍋随机样本

为了保证结果的代表性,样本需要是随机抽取的,这意味着每个总体成员被选中的概率应该是相等的。

🍋样本统计量

样本统计量是从样本中计算出来的数值,用来估计总体参数。最常见的样本统计量包括样本均值、样本方差和样本标准差。这些统计量通常用帽子符号(^)表示,例如样本均值用x̄表示,样本标准差用s表示。

🍋统计量(Statistic)

统计量是从样本数据计算出来的数值,用于对总体参数进行估计。统计量可以是点估计或区间估计。

🍋样本均值(Sample Mean)

样本均值是样本中所有数据值的平均数,它通常用以下公式表示:

x̄ = (Σxi) / n

其中,x̄表示样本均值,Σxi表示所有样本数据的总和,n表示样本大小。

🍋样本方差和标准差(Sample Variance and Standard Deviation)

样本方差是样本数据偏离均值的平方和的平均值,它通常用以下公式表示:

s² = Σ(xi - x̄)² / (n - 1)

样本标准差则是样本方差的平方根,它通常用以下公式表示:

s = √(Σ(xi - x̄)² / (n - 1))

其中,s²表示样本方差,s表示样本标准差,xi表示样本中的每个数据点,x̄表示样本均值,n表示样本大小。

🍋常用分布和分位点

在统计学中,有一些常用的概率分布,它们用于描述不同类型的数据分布。这些分布在许多统计分析中都起着重要作用。本文将介绍一些常见的分布,包括正态分布、t分布和卡方分布,并讨论分位点的概念。

🍋1. 正态分布(Normal Distribution)

正态分布也被称为高斯分布,它是最常见的概率分布之一。正态分布的概率密度函数(Probability Density Function,PDF)如下:
在这里插入图片描述

其中,xx 表示随机变量的取值,μμ 是均值,σσ 是标准差。正态分布是钟形曲线,均值位于分布的中心,标准差决定了曲线的宽度。
正态分布的分位点

正态分布的分位点是指分割概率分布的数值,通常以 zz 表示。正态分布的分位点可以用来计算概率或查找给定概率下的值。例如,第 αα 个百分位点(Percentile)表示在正态分布中,有 αα 的概率小于或等于该值。正态分布的分位点通常用 zαzα​ 表示,可以通过查找标准正态分布表格或计算得到。

🍋2. t分布(t-distribution)

t分布是用于小样本中的统计推断的分布,它更广泛地适用于总体标准差未知的情况。t分布的PDF为:

f ( t ) = ( Γ ( ( ν + 1 ) / 2 ) / ( s q r t ( ν π ) ∗ Γ ( ν / 2 ) ) ) ∗ ( 1 + ( t 2 / ν ) ) ( − ( ν + 1 ) / 2 ) f(t) = (Γ((ν+1)/2) / (sqrt(νπ) * Γ(ν/2))) * (1 + (t²/ν))^(-(ν+1)/2) f(t)=(Γ((ν+1)/2)/(sqrt(νπ)Γ(ν/2)))(1+(t2/ν))((ν+1)/2)

其中,f(t)表示在t处的概率密度,ν表示自由度,Γ表示伽马函数。

分位点: t分布的分位点与自由度有关。例如,t分布的95%置信水平的上下分位点对应于自由度为n-1时,使得在这两个点之间的面积为0.95。

🍋3. χ²分布(Chi-Squared Distribution)

χ²分布是用于分析卡方检验和构建置信区间的分布。它的PDF为:

f ( x ) = ( 1 / ( 2 ( k / 2 ) ∗ Γ ( k / 2 ) ) ) ∗ x ( k / 2 − 1 ) ∗ e ( − x / 2 ) f(x) = (1 / (2^(k/2) * Γ(k/2))) * x^(k/2 - 1) * e^(-x/2) f(x)=(1/(2(k/2)Γ(k/2)))x(k/21)e(x/2)

其中,f(x)表示在x处的概率密度,k表示自由度,Γ表示伽马函数。

分位点: χ²分布的分位点同样与自由度有关。例如,χ²分布的95%置信水平的上下分位点对应于自由度为k时,使得在这两个点之间的面积为0.95。

🍋统计学中的应用

这些常用分布和分位点在统计学中有广泛的应用。例如,正态分布用于描述许多自然现象,t分布用于小样本中的参数估计和假设检验,χ²分布用于分析离散型数据。分位点帮助我们计算概率、构建置信区间和进行假设检验,是统计学中不可或缺的工具。

总之,了解这些常用分布和分位点有助于我们更好地理解数据的分布特征,进行准确的统计分析,做出科学的决策。这些概念和数学工具为数据科学、经济学、医学研究等领域提供了坚实的基础。

🍋单个正态总体的抽样分布

正态总体

首先,让我们简要介绍一下单个正态总体。正态总体(或称为正态分布总体)是一种连续概率分布,通常由其均值(μ)和标准差(σ)来描述。正态分布总体的概率密度函数(PDF)如下:

在这里插入图片描述
单个正态总体的抽样分布

抽样分布是从一个总体中抽取多个样本,并计算每个样本的统计量(如样本均值)的分布。对于单个正态总体,如果我们从中抽取多个大小为 n 的随机样本,并计算每个样本的均值,那么这些样本均值的分布将近似于正态分布。这个近似性质可以通过中心极限定理来解释。

中心极限定理指出,当样本容量足够大时,这些样本均值的抽样分布将近似于正态分布,其均值等于总体均值 μ,标准差等于总体标准差 σ 除以 √n。这可以表示为:

在这里插入图片描述
这个结果对于统计推断非常重要,因为它允许我们使用正态分布的性质来进行置信区间估计和假设检验,即使我们不知道总体的分布形状。

🍋两个正态总体的抽样分布

两个正态总体

现在,让我们考虑两个正态总体的情况。假设我们有两个独立的正态分布总体,分别具有均值 μ1 和 μ2,标准差 σ1 和 σ2。我们想要了解两个总体之间是否存在显著差异。
两个正态总体的抽样分布

当我们从两个正态总体中分别抽取两组样本,并计算这两组样本的差异(通常是均值之差)时,差异的抽样分布遵循一个特殊的分布,称为 t 分布。

具体来说,如果我们有两个独立的样本,每个样本大小为 n1 和 n2,且这两个样本分别来自两个正态总体,那么这两个样本均值之差的抽样分布近似于 t 分布。这个 t 分布的均值等于两个总体均值之差(μ1 - μ2),标准差由公式给出:
在这里插入图片描述
这个 t 分布在假设检验中经常用于比较两个总体均值是否有显著差异。通常,我们计算 t 统计量并与 t 分布的临界值进行比较,以确定是否拒绝假设。

总结起来,单个正态总体的抽样分布基于中心极限定理近似为正态分布,而两个正态总体的抽样分布涉及 t 分布,用于比较两个总体的均值差异。这些概念在统计学中是非常重要的,它们为数据分析和统计推断提供了强大的工具。

请添加图片描述

挑战与创造都是很痛苦的,但是很充实。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1043757.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

印度市场最全开发攻略,收藏一篇就够了

一提到印度市场,很多外贸人都会感到望而却步,他们说做一个印度客户,就等于经历了人生的酸甜苦辣…… 然而,印度市场也是全球一块潜力无穷的大蛋糕,这体现在其庞大的人口和雄厚的银行资金上(这也是市场容量…

想学python找不到合适的书籍?它来了!入门python只需要这一本书就够了!

想学python找不到合适的书籍?看了视频还是不知如何下手? 《python王者归来》 它来了!由清华大学出版社出版!入门python只需要这一本书就够了! 【PDF版领取见文末】 这是一本python入门书。无论你是计算机专业的大学生…

愿你放飞梦想,国庆快乐!Wish you a happy National Day!

国庆节是一个国家为纪念自己而设立的法定节日。它们通常是国家独立 、宪法签署、国家元首诞生或其他重要纪念日,有些是国家守护神的圣日。National Day is a legal holiday made by a country to commemorate the country itself. They are usually the independenc…

vue3 + elementPlus实现select下拉框插入确定和取消按钮。

实现思路 Select 选择器 | Element Plus 1、select方法visible-change这个方法是下拉框出现/隐藏时触发,当显示的时候将两个按钮插入到下拉框里面,是基于原生插入DOM的这种方式; 2、通过vue3 ref获取selectDOM,在获取select的p…

Konva基本处理流程和相关架构设计

前言 canvas是使用JavaScript基于上下文对象进行2D图形的绘制的HTML元素,通常用于动画、游戏画面、数据可视化、图片编辑以及实时视频处理等方面。基于Canvas之上,诞生了例如 PIXI、ZRender、Fabric、Konva等 Canvas渲染引擎,兼顾易用的同时…

Java项目实战-查询用户列表接口服务搭建

概述 这里通过设计一个对用户进行增删改查的接口服务,来练习java项目工程化、Spring框架、Mybatis框架的实际应用 本项目目录 上一节初始化项目,已经controller层了,下方新建包:pojo、mapper、service pojo:所有的实体类都放这…

ternsor合并与分割

拼接:拆分:Cat、StackSplit、Chunk 1、cat(concat) 统计班级学生成绩: [class1-4, students, scores] [class5-9, students, scores] 将这九名学生的成绩进行合并 a torch.rand(4, 32, 8) b torch.rand(5, 32, 8…

A股风格因子看板 (2023.09 第09期)

该因子看板跟踪A股风格因子,该因子主要解释沪深两市的市场收益、刻画市场风格趋势的系列风格因子,用以分析市场风格切换、组合风格景露等。 今日为该因子跟踪第9期,指数组合数据截止日2023-08-31,要点如下 近1年A股风格因子收益走…

2023年最新电商某东app端sign签名算法与cipher加解密逆向分析(2023-09-26)

前言: 本文仅供学习交流,只提供关键思路不会给出完整代码,严禁用于非法用途,若有侵权请联系我删除!技术交流合作请私信! 一.工具的选择(抓包工具的选择,是门学问) 用…

智能交通RFID设备的实际应用有哪些?

随着RFID应用的不断普及,交通系统中也引入了RFID来用作车辆的识别和监控,如我们常见的车辆前挡风玻璃内侧安装的RFID电子标签进行通信,可以实现对车辆的自动、非接触、不停车识别和监控。下面我们就一起来了解一下,智能交通RFID设…

《学术小白学习之路11》DTM主题动态模型原理与基础构建

《学术小白学习之路》DTM主题动态模型构建 一、LDA与DTM的区别二、代码实操2.1 数据2.2 获取数据向量2.3 参数设置与模型构建2.4 结果的输出一、LDA与DTM的区别 LDA主题模型主要针对一段段的文档 可以得出每个主题,所对应主题词的词语的概率 该模型的主题概率的生成是基于文…

大规模语言模型的模型结构---编码器-解码器结构(GLM,UL2系列)

2020 年 Open AI 发布了由包含 1750 亿参数的神经网络构成的生成式大规模预训练语言模型 GPT-3 (Gener- ative Pre-trained Transformer 3)。开启了大规模语言模型的新时代。由于大规模语言模型的参数量巨大, 如果在 不同任务上都进行微调需要消耗大量的计算资源&a…

单元测试、集成测试、系统测试到底有什么不同?

单元测试、集成测试和系统测试是软件测试开发中不可或缺的部分。 单元测试 范围:单元测试是对软件中最小的可测试单元的测试,通常是函数、方法或类。 目的:它的目标是验证每个单独的单元是否按照预期工作,以增加代码的可靠性和稳…

斩获双奖!人大金仓亮相第六届智慧医疗创新大赛全国总决赛

9月22日,2023数字健康创新大会暨第六届智慧医疗创新大赛全国总决赛圆满结束。凭借在智慧医疗领域的创新成果,人大金仓荣获“最佳原创奖”以及医疗信创赛道“二等奖”,获得业内专家、用户、相关单位领导及医疗伙伴的高度认可。 获奖证书 左右滑…

MySQL的时间差函数、日期转换计算函数

MySQL的时间差函数(TIMESTAMPDIFF、DATEDIFF)、日期转换计算函数(date_add、day、date_format、str_to_date) 时间差函数(TIMESTAMPDIFF、DATEDIFF) 需要用MySQL计算时间差,使用TIMESTAMPDIFF、DATEDIFF,记录一下实验结果 --0 …

如何学习maya mel语言的经验分享

一、前言 总结一下这十几年来学习和使用mel语言的一些经验,供初学朋参考,哈哈。 这里不说深奥理论,只是朴实经历陈述。 其实,早在2003年,最初接触maya时,就已经涉及到mel的学习,当时在大学里接…

究竟是什么样的讲解二分查找算法的博客让我写了三小时???

版本说明 当前版本号[20230926]。 版本修改说明20230926初版 目录 文章目录 版本说明目录二分查找基础版算法描述分步演示情况一:能在有序数组找到待查值情况二:不能在有序数组找到待查值 翻译成代码基础版代码(包括测试类)疑惑…

regsvr32 initpki.dll找不到指定模块要怎么解决?教你快速修复initpki.dll文件

当你尝试在 Windows 操作系统中注册 DLL 文件时,可能会遇到错误消息:“regsvr32 initpki.dll找不到指定模块”。它通常是由于一个或多个 DLL 文件缺失或损坏所导致的。这是一个常见的错误,并且可以遇到在 Windows 7、Windows 8 和 Windows 10…

百度实习一面(知识图谱部门)

百度面经(知识图谱部)一面 1.自我介绍 介绍完了,打开共享,对着简历一点一点问 2.ffmpeg在项目中是怎么使用的 回答了ffmpeg在项目中使用的命令,用来干了什么 3.为什么使用toml配置,了解过yml配置吗&am…

【Vue3 源码解析】computed

export function computed<T>(getter: ComputedGetter<T>,debugOptions?: DebuggerOptions ): ComputedRef<T> export function computed<T>(options: WritableComputedOptions<T>,debugOptions?: DebuggerOptions ): WritableComputedRef<…