【统计推断】-01 抽样原理之(六):三个示例

news2024/11/25 8:16:48

目录

  • 一、说明
  • 二、处理有限的、大尺度的母体抽样
  • 三、非参数的估计
  • 四、连续母体抽样技巧--分箱

一、说明

   对于抽样问题,前几期文章都是理论探讨。本篇给出若干示例,展现具体的情况下,面对数据,如何给出处理策略。

二、处理有限的、大尺度的母体抽样

   【问题1】一所大学有3000名男生,身高服从均值为68.8英寸,标准差为3.0英寸的正态分布。设计抽样为80组样本,每组25名学生。
问题:1)有放回抽样。2)无放回抽样。问抽样均值抽样的均值和标准差是多少?
分析:抽样分布的空间:
   在有放回抽样中,样本分布的抽样组数量是 300 0 2 5 3000^25 300025,显然数量庞大。
   在不放回抽样中,样本分布的抽样组数量是 C 3000 25 C_{3000}^{25} C300025,显然数量庞大。
   因此,大数定律成立。
   无论是有放回抽样中,还是不放回抽样中,抽样分布的样本数量远远高于80,因此,真实的的抽样分布无法获得,只能获得经验的抽样分布。
   1)对于有限母体,无放回抽样,以下公式成立
在这里插入图片描述
μ x ˉ = μ = 68.0 \mu_{\bar{x}}=\mu=68.0 μxˉ=μ=68.0
σ x ˉ = σ N = σ N N p − N N p − 1 = 3 25 3000 − 25 3000 − 1 = 0.6 \sigma_{\bar{x}}=\frac{\sigma}{\sqrt{N}}=\frac{\sigma}{\sqrt{N}}\sqrt{\frac{N_p-N}{N_p-1}}=\frac{3}{\sqrt{25}}\sqrt{\frac{3000-25}{3000-1}}=0.6 σxˉ=N σ=N σNp1NpN =25 330001300025 =0.6
2)对于有限母体,有放回抽样,以下公式成立
μ x ˉ = μ \mu_{\bar{x}}=\mu μxˉ=μ
σ x ˉ = σ N \sigma_{\bar{x}}=\frac{\sigma}{\sqrt{N}} σxˉ=N σ
μ x ˉ = μ = 68.0 \mu_{\bar{x}}=\mu=68.0 μxˉ=μ=68.0; σ x ˉ = 4 25 = 0.6 \sigma_{\bar{x}}=\frac{4}{\sqrt{25}}=0.6 σxˉ=25 4=0.6

   结论:
   1)对于大容量的有限母体,因为抽样分布过于庞大,可以按无限母体处理。
   2)对于大容量的抽样分布,有放回和无放回抽样区别不大。
   3)上述样本均值的经验分布,可近似看成均值为68.8英寸,标准差为0,6的正态分布。

三、非参数的估计

   注意,抽样的参数估计并不是我们最后的目的,最后的目的是在样本参数估计的基础上,发掘出更多的特点。

   【问题2】在问题1中,在80个样本中,能够找到几个样本抽样,它们的特征是1)均值在66.8英寸和68.3英寸之间 2)均值小于66.4英寸。

   【分析】
   抽样分布的整体很大,因此无法穷举,因此,抽样分布也是一个估计而已。
通过上述计算,均值抽样满足 N ( 68 , 0. 6 2 ) N(68,0.6^2) N(68,0.62)的正态分布。
在这里插入图片描述
   因此,按照抽样分布中,均值抽样的样本落在【66.8,68.3】的概率是: P ( 66.8 ⩽ x ⩽ 68.3 ) P(66.8\leqslant x \leqslant 68.3) P(66.8x68.3)
   以上是个非标准的,转化成标准正态分布后,可以查表得到P;通过s=P*80可以得到满足以上所条件的抽样数s。

【解决】样本标准化,一般指向以下步骤:
z = X ˉ − μ X ˉ σ X ˉ = X ˉ − 68.0 0.6 z=\frac{\bar{X}-\mu_{\bar{X}}}{\sigma_{\bar{X}}}=\frac{\bar{X}-68.0}{0.6} z=σXˉXˉμXˉ=0.6Xˉ68.0
66.8 的标准值 = 66.8 − 68.0 0.6 = − 2 66.8的标准值=\frac{66.8-68.0}{0.6}=-2 66.8的标准值=0.666.868.0=2
68.3 的标准值 = 68.4 − 68.0 0.6 = 0.5 68.3的标准值=\frac{68.4-68.0}{0.6}=0.5 68.3的标准值=0.668.468.0=0.5
从网上随便查找一个标准正态表:
在这里插入图片描述
   P(-2, 0.5) = 0.6915 - (1-0.9772) = 0.6687
s = 80*0.6687 = 53.49
   即在80组抽样中,估计有53个均值在66.8-68.3之间。

四、连续母体抽样技巧–分箱

   在数据分析过程中,常常遇到母体是连续分布的情况;按照理论上说,抽样数据在任意区间都应该是无限的,那么如何抽样?答案是用分箱技术,所谓分箱技术,就是将连续无限集合划分成有限集合的过程。这个过程当然是近似的。
在这里插入图片描述

   下面举出一个具体示例。
   对XYZ大学的100个男生进行抽样。这里母体就是有限100;对母体进行分箱后数据如下:
在这里插入图片描述

  1. 以下是对分箱后的均值计算方法
    在这里插入图片描述
    在没有任何信息的情况,均值计算如下:
    X ˉ = 0.05 × 61 + 0.18 × 64 + 0.42 × 67 + 0.27 × 70 + 0.08 × 73 0.05 + 0.18 + 0.42 + 0.27 + 0.08 = 67.45 \bar{X}=\frac{0.05\times 61+ 0.18\times64+ 0.42\times67+0.27\times70+0.08\times73}{0.05+0.18+0.42+0.27+0.08}=67.45 Xˉ=0.05+0.18+0.42+0.27+0.080.05×61+0.18×64+0.42×67+0.27×70+0.08×73=67.45

2)在有如下抽样后,如何处理?
在这里插入图片描述
1)均值:通过【 67.75,66.25,67.75,69.25,67.0,66.25,65.5,68.5,68.5,67.0,66.25,68.5,68.5,67.75,67.0,66.25,69.25,69.25,68.5,66.25,69.25,64,67.75,69.25,66.25,67.0,70.0,68.5,68.5,65.5】输入python代码。很容易得到。

import statistics
data = [67.75,66.25,67.75,69.25,67.0,66.25,65.5,68.5,68.5,67.0,66.25,68.5,68.5,67.75,67.0,66.25,69.25,69.25,68.5,66.25,69.25,64,67.75,69.25,66.25,67.0,70.0,68.5,68.5,65.5]
mean = statistics.mean(data)
dev  = statistics.pstdev(data)

mean = 67.57

2)标准差
在这里插入图片描述
可以得到:
dev=1.40

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1647133.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

4步快速配置Java和MySQL环境

每次入职一家新公司或者用一台其他的临时电脑或者新电脑时都要重新配置Java开发环境,很麻烦,因此我在这里记录一下快速配置环境的方式,四步搞定!此处以win为操作系统进行讲解。 第一步:下载链接 下载链接&#xff1a…

CMakeLists.txt语法规则:foreach循环的关键字

一. 简介 前一篇文章学习了 CMakeLists.txt语法中 foreach循环的基本用法。文章如下: CMakeLists.txt语法规则:foreach 循环基本用法-CSDN博客 本文继续 CMakeLists.txt语法中 foreach循环语句,主要学习 foreach循环中的关键字。 二. CM…

代码随想录打卡第14天第18天

二叉树 1 二叉树部分的一些新知 (1)二叉树的定义,C方法一定要知道,相对于链表而言,二叉树就是多了两个指针,即左右子节点 struct TreeNode {int val;TreeNode *left;TreeNode *right;TreeNode(int x) : …

C#上位机源程序 下位机单片机实现控制电机

基于C#的上位机编程程序&#xff0c;通过上位机控制下位机实现电脑操作控制步进电机的转动 程序 #include<reg52.h>#define uchar unsigned char#define uint unsigned int#include "2401.h"#include "delay.h"#include "ds18b20.h"sbit I…

LLM——用于微调预训练大型语言模型(LLM)的GPU内存优化与微调

前言 GPT-4、Bloom 和 LLaMA 等大型语言模型&#xff08;LLM&#xff09;通过扩展至数十亿参数&#xff0c;实现了卓越的性能。然而&#xff0c;这些模型因其庞大的内存需求&#xff0c;在部署进行推理或微调时面临挑战。这里将探讨关于内存的优化技术&#xff0c;旨在估计并优…

easy_ssti_ctfshow_2023愚人杯

https://ctf.show/challenges#easy_ssti-3969 2023愚人杯有提示app.zip&#xff0c;访问 https://1f660587-5340-4b20-b929-c4549d9a5d4b.challenge.ctf.show/app.zip得到压缩包&#xff0c;拿到一个py文件 可以看到参数名是name&#xff0c;对参数进行筛选&#xff0c;包含ge…

Hbase 常用shell操作

目录 1、创建表 1.1、启动HBase Shell 1.2、创建表 1.3、查看表 1.4、删除表 2、插入数据 2.1、put命令 3、查看数据 3.1、get命令 3.2、查询数据中文显示 4、更新数据 4.1、使用put来更新数据 5、删除数据 5.1、delete命令 5.2、删除指定列的数据 5.3、delete…

STM32——TIMER(定时器)篇

技术笔记&#xff01; 1. 定时器概述&#xff08;了解&#xff09; 1.1 软件定时器原理 使用纯软件&#xff08;CPU死等&#xff09;的方式实现定时&#xff08;延时&#xff09;功能 缺点&#xff1a;1. 延时不准确 2. CPU死等。 1.2 定时器定时原理 1.…

StarryCoding入门教育赛2 题解 C++代码(推荐学习)

比赛地址&#xff1a;https://www.starrycoding.com/contest/6 比赛介绍 系列赛名称&#xff1a;StarryCoding 入门教育赛难度&#xff1a;语法~较低时长&#xff1a; 1.5 1.5 1.5小时比赛时间&#xff1a;约每2-3天一场&#xff0c;一般为晚上18:30~20:00赛后题解&#xff1…

饥荒服务器搭建centos

服务器环境需要64位32位不可用 uname -r 查看服务器版本 更新yum sudo yum update 安装依赖环境 sudo yum -y install glibc.i686 libstdc.i686 libcurl4-gnutls-dev.i686 libcurl.i686 screen 安装steam cd /home && mkdir steamcmd && cd steamcmd 国…

人工智能的发展将如何重塑网络安全

微信搜索关注公众号网络研究观&#xff0c;获取更多信息。 人们很容易认为人工智能 (AI) 真正出现是在 2019 年&#xff0c;当时 OpenAI 推出了 ChatGPT 的前身 GPT-2。 但现实却有些不同。人工智能的基础可以追溯到 1950 年&#xff0c;当时数学家艾伦图灵发表了题为“计算机…

资源池管理

资源池相关概念 1、什么是资源池 资源池是灵活管理资源的逻辑抽象。资源池可以分组为层次结构&#xff0c;用于对可用的CPU和内存资源按层次结构进行分区。 2、为什么使用资源池 使用资源池可以委派对主机(或集群)资源的控制权&#xff0c;在使用资源池划分群集内的所有资 源时…

PopChar for Mac v10.1激活版:特殊字符输入工具

PopChar for Mac是一款专为Mac用户设计的字符输入工具&#xff0c;其简单直观的功能使得查找和插入特殊字符变得轻而易举。 PopChar for Mac v10.1激活版下载 首先&#xff0c;PopChar为Mac提供了访问所有字体字符的能力&#xff0c;包括那些难以通过键盘直接输入的字符。用户只…

延时任务通知服务的设计及实现(三)-- JDK的延迟队列DelayQueue

一、接着上文 上文我们讲述了使用redisson的RDelayedQueue实现分布式延迟队列&#xff0c;本文我们将自己JDK的延迟队列DelayQueue实现。 相比前者的实现&#xff0c;作为进程内的延迟队列&#xff0c;它会遇到许多技术难点&#xff1a; 如何支持分布式的多个节点部署场景应…

vue cli 自定义项目架子,vue自定义项目架子,超详细

脚手架Vue CLI基本介绍&#xff1a; Vue CLI 是Vue官方提供的一个全局命令工具 可以帮助我们快速创建一个开发Vue项目的标准化基础架子【集成了webpack配置】 脚手架优点&#xff1a; 开箱即用&#xff0c;零配置内置babel等工具标准化的webpack配置 脚手架 VueCLI相关命令…

Mac跑llama.cpp过程中遇到的问题

原repo 在华为手机上安装termux、下载库&#xff1a;顺利在电脑上安装Android NDK&#xff1a;先下载Android Studio&#xff0c;再在里面下载Android SDK 安装Android Studio时&#xff0c;SDK的某些组件总是下载不成功。后来关了梯子、改了hosts&#xff0c;重新安装就成功了…

汇编语言——比较两个字符串STRING1和STRING2所含字符是否完全相同,若相同则显示MATCH, 不相同则显示NO MATCH

CMPS 串比较指令&#xff1a; CMPS SRC, DST CMPSB &#xff08;字节&#xff09; CMPSW &#xff08;字&#xff09; 执行操作&#xff1a; ((SI)) - ((DI)) 根据比较结果置条件标志位&#xff1a;相等 ZF1&#xff1b;不等 ZF0 字节操作&#xff1a;(SI)←(SI)1, (DI)←(DI…

【算法系列】链表

目录 常用技巧 常用操作 leetcode/牛客题目 一、移除链表元素 二、反转链表 三、链表的中间结点 四、返回倒数第k个节点 五、合并两个有序链表 六、链表分割 七、链表的回文结构 八、相交链表 九、环形链表 十、环形链表 II 十一、随机链表的复制 十二、两数相加…

英语学习笔记2——Is this your ...?

Is this your …? 这是你的 … 吗&#xff1f; 词汇 Vocabulary pen n. 笔 不仅指钢笔&#xff0c;是笔的统称 相关&#xff1a;ball pen n. 圆珠笔    pencil n. 铅笔    marker n. 记号笔 book n. 书 横着翻的本子或书 补充&#xff1a;pad n. 本子 竖着翻的本子或…

在Codelab对llama3做Lora Fine tune微调

Unsloth 高效微调大模型的工具&#xff0c;通过Unsloth微调Llama3, Mistral, Gemma 速度提升2-5倍&#xff0c;内存减少70%&#xff01; Codelab 创建一个jupyter notebook 选择 T4 GPU 安装Fine tune 相关的lib %%capture import torch major_version, minor_version torch…