R实验 随机变量及其分布

news2024/11/15 11:20:47

  • 实验目的:
  1. 掌握常见几种离散性随机变量及其分布在R语言中对应的函数用法;
  2. 掌握常见几种连续性随机变量及其分布在R语言中对应的函数用法;
  3. 掌握统计量的定义及统计三大抽样分布在R语言中对应的函数用法。

实验内容:

(习题4.5)通过对学生成绩的统计,高等数学课程的不及格率为20%。现随机地抽查了学习该课程的20名学生,试计算:(提示:这是一个二项分布,参考例4.7)

(1)有2名或2名以下学生不及格的概率是多少?(提示:累积分布函数pbinom(),答案:0.2061)

p1<-pbinom(2,size = 20,prob = 0.2)

p1

(2)有4名学生不及格的概率是多少?(提示:概率密度函数dbinom(),答案:0.2182)

p2<-dbinom(4,size = 20,prob = 0.2)

p2

(3)超过3名学生不及格的概率是多少?(提示:累积分布函数pbinom(),答案:0.5886)

p3<-pbinom(3,size = 20,prob = 0.2)

p4<-1 - p3

p4

(习题4.14)设某城市男子的身高服从均值为168cm,标准差为6cm的正态分布。求:

(1)该市男子身高在170cm以上的概率;(提示:累积分布函数pnorm(),答案:0.3694)

p<-pnorm(170,mean = 168,6)

p1<-1-p

p1

(2)为了使99%以上的男子上公共汽车不至于在车门上沿碰头,当地的公共汽车门框应设计多高?(提示:即求身高为哪个值以下的概率超过0.99,亦即:求k的值,使得P{X≤k}≥.0.99。显然题目是求分位数k,需要用到分位数函数qnorm()。注意到在R语言中,分位数函数默认是下分位数,大家可以看一下,R语言中下分位数函数中有一个参数lower.tail=TRUE,这个参数就是表示下分位数,默认值为TRUE。可参考例4.14。答案:181.9581)

p<-pnorm(170,mean = 168,6)

p1<-1-p

p1

按照参考代码,在一个图中绘制如下图所示的三个正态分布的概率密度函数曲线。要求(第4-7题要求与此类似,不再重复说明):

(1)生成图形后,点击RStudio右下角区域中的“Plot”标签下的“Export”按钮,在弹出的菜单中选择“Save as Image…”,保存为PNG格式。然后将此PNG图片插入到此文档中,替换掉原来的样例图。

(2)删除参考代码截图,并粘贴代码文字到此文档中(不是截图)。

(3)对其中的一些参数,可以修改其值或者注释掉该参数,看看生成的图形有什么变化,从而加深理解这些参数的意义。

参考代码:

x <- seq(-4,4,length.out =1000)

y1 <- dnorm(x)

y2 <- dnorm(x,mean = 2,sd = 0.5)

y3 <-dnorm(x,mean = 0,sd = 0.5)

plot(

  x,

  y1,

  type = "l",

  lty =4,

  col ="green3",

  lwd = 2,

  xlim = c(-3,4),

  ylim = c(0,0.8),

  xlab = "x",

  ylab = "density",

  xaxt = "n",

  yaxt = "n",



)



lines(

    x,

    y2,

    lty = 5,

    col = "red"

)

lines(

    x,

    y3,

    lty = 1,

    lwd = 2,

    col = "blue"

)

axis(side = 1,at = seq(-3,4,by = 1))

axis(side = 2,at = seq(0,0.8,by = 0.2))

abline(v = 0)

abline(v = 2)

abline(h = max(y1),lty = 3)

legend(

  "topleft",

  inset = 0.02,

  title = "normal distribution",

  c("μ=0,σ=0.5","μ=2,σ=0.5","μ=0,σ=1"),

  cex = 0.8,

  lty = c(1,5,4),

  lwd = 2,

  col = c("blue","red","green3")



  )



在一个图中,绘制第3题中三个正态分布函数的累积分布函数曲线。(注意为了让曲线完整显示,纵轴的范围需要调整为0到1之间,同时将纵坐标的标签改为CDF,即累积分布函数(Cumulative Distribution Function))

替换以上样例图,并粘贴代码文字于下(非截图)

代码:

x <- seq(-4,4,length.out =1000)

y1 <- pnorm(x)

y2 <- pnorm(x,mean = 2,sd = 0.5)

y3 <-pnorm(x,mean = 0,sd = 0.5)

plot(

  x,

  y1,

  type = "l",

  lty =4,

  col ="green",

  lwd = 2,

  xlim = c(-4,4),

  ylim = c(0,1),

  xlab = "x",

  ylab = "density",

  xaxt = "n",

  yaxt = "n",



)



lines(

    x,

    y2,

    lty = 5,

    col = "red"

)

lines(

    x,

    y3,

    lty = 1,

    lwd = 2,

    col = "blue"

)

axis(side = 1,at = seq(-4,4,by = 2))

axis(side = 2,at = seq(0,1,by = 0.2))

abline(v = 0)

abline(v = 2)

#abline(h = max(y1),lty = 3)



legend(

  "topleft",

  inset = 0.02,

  title = "累积密度函数曲线",

  c("μ=0,σ=0.5","μ=2,σ=0.5","μ=0,σ=1"),

  cex = 0.8,

  lty = c(1,5,4),

  lwd = 2,

  col = c("blue","red","green3")



  )

模仿第3题,绘制下图所示的三个c2分布的概率密度函数曲线。(注意坐标轴刻度、图例等的变化)

替换以上样例图,并粘贴代码文字于下(非截图)

代码:

x <- seq(0,15, length.out = 1000)

y1 <- dchisq(x, df = 1)

y2 <- dchisq(x, df = 4)

y3 <- dchisq(x, df = 10)



plot(

  x,

  y1,

  type = "l",

  lty = 4,

  col = "green3",

  lwd = 2,

  xlim = c(0, 15),

  ylim = c(0.00, 0.30),

  xlab = "x",

  ylab = "density",

  xaxt = "n",

  yaxt = "n"

)



lines(

  x,

  y2,

  lty = 5,

  col = "red"

)



lines(

  x,

  y3,

  lty = 1,

  lwd = 2,

  col = "blue"

)



axis(side = 1, at = seq(0, 15, by = 5))

axis(side = 2, at = seq(0, 0.30, by = 0.05))

#abline(v = 0)

#abline(v = 2)

#abline(h = max(y1), lty = 3)



legend(

  "topright",

  inset = 0.02,

  title = "chi-square distribution",

  c("n = 10", "n = 4", "n = 1"),

  cex = 0.8,

  lty = c(1, 5, 4),

  lwd = 2,

  col = c("blue", "red", "green3")

)

模仿第3题,绘制下图所示的三个t分布的概率密度函数曲线。(注意坐标轴刻度、图例等的变化)

替换以上样例图,并粘贴代码文字于下(非截图)

代码:

x <- seq(0,15, length.out = 1000)

y1 <- dchisq(x, df = 1)

y2 <- dchisq(x, df = 4)

y3 <- dchisq(x, df = 10)



plot(

  x,

  y1,

  type = "l",

  lty = 4,

  col = "green3",

  lwd = 2,

  xlim = c(0, 15),

  ylim = c(0.00, 0.30),

  xlab = "x",

  ylab = "density",

  xaxt = "n",

  yaxt = "n"

)



lines(

  x,

  y2,

  lty = 5,

  col = "red"

)



lines(

  x,

  y3,

  lty = 1,

  lwd = 2,

  col = "blue"

)



axis(side = 1, at = seq(0, 15, by = 5))

axis(side = 2, at = seq(0, 0.30, by = 0.05))

#abline(v = 0)

#abline(v = 2)

#abline(h = max(y1), lty = 3)



legend(

  "topright",

  inset = 0.02,

  title = "chi-square distribution",

  c("n = 10", "n = 4", "n = 1"),

  cex = 0.8,

  lty = c(1, 5, 4),

  lwd = 2,

  col = c("blue", "red", "green3")

)

模仿第3题,绘制下图所示的三个F分布的概率密度函数曲线。(注意坐标轴刻度、图例等的变化。图例中字符的下标不做要求)

替换以上样例图,并粘贴代码文字于下(非截图)

代码:

x <- seq(0,4, length.out = 1000)

y1 <- df(x,3,15)

y2 <- df(x,7,15)

y3 <- df(x,15,15)



plot(

  x,

  y1,

  type = "l",

  lty = 4,

  col = "green3",

  lwd = 2,

  xlim = c(0, 4),

  ylim = c(0.00, 1.0),

  xlab = "x",

  ylab = "density",

  xaxt = "n",

  yaxt = "n"

)



lines(

  x,

  y2,

  lty = 5,

  col = "red"

)



lines(

  x,

  y3,

  lty = 1,

  lwd = 2,

  col = "blue"

)



axis(side = 1, at = seq(0, 4, by = 1))

axis(side = 2, at = seq(0, 0.8, by = 0.2))

#abline(v = 0)

#abline(h = max(y1), lty = 3)



legend(

  "topright",

  inset = 0.02,

  title = "F distribution",

  c("n1=3,n2=15", "n1=7,n2=15","n1=15,n2=15"),

  cex = 0.8,

  lty = c(1, 5, 4),

  lwd = 2,

  col = c("green3", "red", "blue")

)

思考:

常见离散型随机变量的分布有哪些?

伯努利分布、二项分布、泊松分布、几何分布、超几何分布

常见连续型随机变量的分布有哪些?

正态分布、指数分布、均匀分布、伽马分布、卡方分布、t分布、F分布

二项分布适用于____放回的抽样,超几何分布适用于____放回的抽样。(填“有”或“无”)

描述某一特定时间段内或空间段内事件发生次数的随机变量,通常服从什么分布?

泊松分布

描述两个事件间隔时间长度的随机变量,通常服从什么分布?

指数分布

统计量是样本的函数,且不包含总体的未知参数,它是随机变量吗?

统计量是随机变量

常用的抽样方法有两大类:概率型抽样方法和非概率抽样方法。它们各自又含有哪些具体的方法?

概率型抽样方法包括简单随机抽样、分层抽样、整群抽样、多阶段抽样等;

非概率抽样方法包括方便抽样、判断抽样、整齐抽样、比例抽样等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1701767.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyTorch的数据处理

&#x1f4a5;今天看一下 PyTorch数据通常的处理方法~ 一般我们会将dataset用来封装自己的数据集&#xff0c;dataloader用于读取数据 Dataset格式说明 &#x1f4ac;dataset定义了这个数据集的总长度&#xff0c;以及会返回哪些参数&#xff0c;模板&#xff1a; from tor…

element ui 的el-input输入一个字后失去焦点,需重新点击输入框才能再次输入!

解决方案&#xff1a; 我是form表单嵌套表格&#xff0c;里面的el-input输入框&#xff0c;输入第一个值的时候会突然失去焦点&#xff0c;需要再次点击输入框才能正常输入&#xff0c;原因是table的key值&#xff0c;需要改成正常的index即可&#xff0c;如果你是循环的&…

进化计算引领深度学习新纪元

《进化深度学习》介绍了进化计算(EC)&#xff0c;并为你提供了一套实用的技术工具&#xff0c;你可以在整个深度学习过程中应用这些技术。本书提供了遗传算法和进化计算方法在网络拓扑、生成模型、强化学习等方面的应用。通过交互式的Colab notebook使你有机会在探索过程中进行…

day15

第一题 1419. 数青蛙 本题主要是采用模拟的解题思路&#xff0c;用一个croak来模拟青蛙的叫声&#xff0c;在一堆字符串中来找到几个croak&#xff0c;并判断这是由几个青蛙叫的&#xff1b; 首先我们使用数组来模拟hash表&#xff0c;其次我们使用hash表来映射青蛙叫的字符中…

smart-link + STP的vlan映射 + monitor-link实现二层链路的负载均衡+主备切换

一、适用场景 1、保护原有投资&#xff0c;不浪费原有网络设备及链路的投资&#xff1b; 2、对高可靠、高可用要求的业务&#xff0c;链路中的设备、接头、线路故障时&#xff0c;毫秒级切换&#xff0c;不影响业务的运行&#xff1b; 3、使用华为、华三智能管理型的交换设备&…

香橙派 AIpro评测

一. 香橙派AIpro开箱 官网外观&#xff1a; ​ ​ 外观实测&#xff1a;做工精致&#xff0c;散热片有精致的金属感 ​ ​ 反面&#xff1a;由于加装了wifi蓝牙模块&#xff0c;如果需要做外壳&#xff0c;需要注意保护天线贴片。在树莓派pi5的前面一版&#xff0c;增加了wifi…

MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model 论文总结

题目&#xff1a;MedSegDiff: Medical Image Segmentation&#xff08;图像分割&#xff09;with Diffusion Probabilistic Model&#xff08;扩散概率模型&#xff09; 论文&#xff08;MIDL会议&#xff09;&#xff1a;MedSegDiff: Medical Image Segmentation with Diffusi…

【数组】Leetcode 452. 用最少数量的箭引爆气球【中等】

用最少数量的箭引爆气球 有一些球形气球贴在一堵用 XY 平面表示的墙面上。墙面上的气球记录在整数数组 points &#xff0c;其中points[i] [xstart, xend] 表示水平直径在 xstart 和 xend之间的气球。你不知道气球的确切 y 坐标。 一支弓箭可以沿着 x 轴从不同点 完全垂直 地…

Linux C++ Socket 套接字、select、poll、epoll 实例

文章目录 1. 概述2. TCP 网络编程实例2.1 服务器端2.2 客户端2.3 运行截图 3. I/O 模型3.1 阻塞式I/O模型3.2 非阻塞I/O模型3.3 I/O 复用模型3.4 信号驱动式I/O3.5 异步I/O模型 4. I/O复用之 select4.1 select 函数描述4.2 服务端代码4.3 客户端代码4.4 运行截图 5. I/O复用之 …

虚拟海外仓用什么系统最好?5个步骤帮你选出适合自己仓库的WMS系统

面对国际市场越来越大的仓储需求&#xff0c;虚拟海外仓的受众还是非常广泛的。不过很多经营虚拟海外仓的企业往往都会陷入管理混乱&#xff0c;低效的怪圈。 要想突破这个经营的瓶颈&#xff0c;快速发展企业&#xff0c;选择一个适合自己的海外仓WMS系统是个不错的选择。 1…

Java中Stack的使用详解

Stack是一种运算受限的线性表&#xff0c;其特点在于仅允许在表的一端&#xff08;即表尾&#xff09;进行插入和删除操作。这一端被称为栈顶&#xff0c;而相对的另一端则称为栈底。向一个栈插入新元素的操作称为进栈或入栈&#xff0c;它将新元素放到栈顶元素的上面&#xff…

昂达固态硬盘数据恢复方法:全面解析与操作指南

在数字化时代&#xff0c;数据已经成为我们生活和工作中不可或缺的一部分。而固态硬盘&#xff08;SSD&#xff09;由于其读写速度快、抗震性强等优点&#xff0c;慢慢取代了传统的机械硬盘&#xff0c;成为我们存储数据的主要选择。然而&#xff0c;即便再先进的存储设备&…

如何远程访问Redis?

远程访问Redis是一种常见的需求&#xff0c;特别是在分布式系统或跨地域网络中。通过远程访问&#xff0c;我们可以轻松地对远程的Redis数据库进行操作和管理。 天联保障数据安全 对于远程访问Redis的安全性问题&#xff0c;我们可以借助天联来保障数据的安全。天联是一种基于…

Oracle-修改用户名

1、项目背景 需要将导入一份最新的用户数据在tbl用户上&#xff0c;但需要将原来的tbl用户数据保留并能实现两个用户的比对。 2、解决思路 思路一&#xff1a;1&#xff09;新建用户tbl_feng,导入数据&#xff1b;2&#xff09;将两个用户换名称 3&#xff09;比对 思路二&…

STM32实现HAL库LED点灯

目录 一、相关环境 STM32CubeMX 介绍 安装下载 相关配置完善 尝试使用该软件&#xff0c;点亮LED灯 项目创建 代码示例 二、任务实现 1、使用HAL库方式完成LED灯的周期闪烁 要求1 项目创建 代码示例 要求2 项目创建 代码示例 2、使用仿真软件分析仪功能观察…

VS2022配合Qt与boost.asio实现一个TCP异步通信系统远程操作mysql数据库

上一篇博客我们通过boost.asio搭建了一个简单的异步服务器&#xff0c;但是那是基于命令行的&#xff0c;所有用起来还是相当枯燥的&#xff0c;这次我们配合Qt实现一个简陋的前端页面来控制后端mysql数据库中的表&#xff0c;实现添加密钥的功能(本次博客使用的boost版本是1.8…

为什么大部分新手做抖音小店赚不到钱?

大家好&#xff0c;我是喷火龙。 今天来给大家聊聊&#xff0c;为什么大部分新手做抖店赚不到钱&#xff1f; 不知道大家想过这个问题没有&#xff0c;可能有些人把赚不到钱的原因归结于市场、或者平台、又或者运营技术以及做店经验。 但我觉得这些都不是重点&#xff0c;重…

关于RAG(检索增强生成)的一些知识

写在前面 最近一直在看AI相关的文章&#xff0c;不出意外的话&#xff0c;后续几篇应该都是关于这方面的。希望能和大家一起了解这方面的技术。 什么是RAG 检索增强生成 (RAG,全称Retrieval-Augmented Generation) 是一种利用从外部来源获取的事实来提高生成式 AI 模型的准确…

视频监控管理平台LntonCVS安防监控平台实现接入监控视频资源的视频汇聚方案

随着各行业数字化转型的不断推进&#xff0c;视频监控技术在行业内的安防应用及管理支撑日益增多。然而&#xff0c;由于前期规划不清晰、管理不到位等问题&#xff0c;视频监管系统普遍存在以下问题&#xff1a; 1. 各部门单位在视频平台建设中以所属领域为单位&#xff0c;导…

Intellij IDEA创建springboot 3.2.5 项目

1、idea file -> new ->Project 点击 2、创建项目配置 完成配置-> 点击Next 3、选择对应jar 包 -> 点击Create 4、删除 .mvn、mvnw、mvnw.cmd