从0开始学统计-多个婴儿连续夭折是谋杀吗?

news2025/3/12 22:27:00

1.什么是小概率事件?

小概率事件是指在一次随机试验中发生概率非常低的事件。一般来说,小概率事件的发生概率远低于一定的阈值,通常取0.05或0.01。在统计学中,这些阈值被称为显著性水平(significance level),一般用α表示。

P值(P-value)是统计学中用于衡量样本数据对原假设的支持程度的一个指标。在假设检验中,P值表示在原假设为真的情况下,观察到的样本数据或更极端情况出现的概率。

如果观察到的P值小于显著性水平(通常是0.05或0.01),我们通常会拒绝原假设,认为观察到的样本数据在给定的显著性水平下是统计上显著的,即我们有足够的证据拒绝原假设,接受备择假设。这意味着我们认为观察到的样本数据对应的事件是小概率事件,即在原假设为真的情况下,观察到这种极端情况的概率非常低。

总之,小概率事件指的是在一次随机试验中发生概率非常低的事件,而P值则是在统计学中用于衡量样本数据对原假设的支持程度的一个指标。

2.什么是概率独立性?

概率独立性是指两个或多个事件之间的发生不受彼此影响的情况。简而言之,如果事件A 的发生与否不会对事件B 的发生概率产生影响,或者反之亦然,则称事件A 和事件 B 是概率独立的。

具体来说,如果事件A 的发生概率与事件 B的发生概率之间不存在任何关系,并且知道事件A 是否发生对于预测事件B 的发生没有任何帮助,那么我们就可以说事件A 和事件 B 是概率独立的。

概率独立性是概率论中的一个重要概念,它在许多领域都有广泛的应用,例如统计学、生物学、经济学等。在实际问题中,概率独立性通常是假设条件之一,用于简化问题的分析和计算。

突发性婴儿猝死综合征(SIDS)与英国法律的故事,涉及到概率独立性的问题。

SIDS是指在婴儿睡眠期间突然死亡的情况,发生概率非常低,大概在八千五百分之一,原因至今未明。我们认为发生SIDS是小概率事件。如果小概率事件频繁发生,那么就要怀疑背后有什么样的故事。英国的警方跟法庭认为。如果一个家庭先后发生多起婴儿猝死的事件,那么就可以是疏忽致死而非自然死亡,就要追究家庭的责任。这个就是小概率事件的应用,因此英国著名的儿科医生就用这个观点来做专家证人。他认为一个家庭连续出现两个SIDS的概率是:

在这里插入图片描述
但英国皇家统计协会指出,同一个家庭,猝死的婴儿之间,它并不是一个独立随机事件,而是存在一个关联。比如说基因,同一个家庭生的婴儿,他的基因可能有高度的相似性,从而让一个已经遭受打击的家庭再次遭受打击。所以上述计算方法是不成立的。因为这个原因,2004年,英国政府宣布对258起已经结案的家长谋杀婴儿案件重新进行审理。

3.统计学中有哪些常见的数据类型?

在统计学中,常见的数据类型包括以下几种:

(1) 定性数据(Qualitative Data):也称为分类数据,是描述性质或特征的数据,通常是非数字型的。定性数据可以进一步分为名义数据和有序数据。

  • 名义数据:数据之间没有顺序或等级关系,仅表示分类或标签。例如:性别、颜色、品牌等。

  • 有序数据:数据之间存在一定的顺序或等级关系,但没有固定的数值差距。例如:教育程度(小学、初中、高中)。

(2) 定量数据(Quantitative Data):也称为数值数据,是用数字表示的数据,用于量化特征或属性。

  • 连续型数据:可以取任意值的数据,通常表示测量的结果。例如:身高、体重、温度等。

  • 离散型数据:只能取有限个数值的数据,通常表示计数结果。例如:家庭成员数、学生人数等。

这些数据类型在统计学中用于描述和分析不同类型的数据,并采用不同的统计方法和技术进行处理和解释。

4.定量数据的分布形式?

定量数据的分布形式通常可以分为对称分布和非对称分布两种。

(1)对称分布(Symmetric Distribution):在对称分布中,数据的分布形状相对均匀,以中心点对称分布。也就是说,数据在中心点(均值)的两侧是对称的。典型的对称分布包括正态分布(也称为高斯分布)和均匀分布。

-正态分布:正态分布是最常见的对称分布,其形状呈钟形曲线,两侧尾部逐渐变细。在正态分布中,均值、中位数和众数重合,且相等。

-均匀分布:在均匀分布中,数据在给定的范围内等可能地分布,没有出现任何偏向某个方向的情况。

(2)非对称分布(Skewed Distribution):在非对称分布中,数据的分布形状不对称,呈现出一个尾部比另一个长或短的情况。非对称分布可以进一步分为正偏态分布和负偏态分布。

-正偏态分布(右偏态):在正偏态分布中,数据的尾部向右延伸,即数据分布的右侧尾部比左侧更长。也就是说,大部分数据分布在左侧,而右侧存在少量极端值。均值大于中位数,且众数位于最左侧。

-负偏态分布(左偏态):在负偏态分布中,数据的尾部向左延伸,即数据分布的左侧尾部比右侧更长。也就是说,大部分数据分布在右侧,而左侧存在少量极端值。均值小于中位数,且众数位于最右侧。

对称分布和非对称分布形态的特征对于数据分析和解释具有重要意义,可以帮助我们了解数据的分布情况及其可能的影响。

老张选健身班的故事可以说明数据分布形式的重要性:

48岁的老张想选一个成员们年龄和自己年龄相仿的健身班,分别有以下三个班的平均年龄:17岁,25岁和38岁。老张自然而然地选择了平均年龄为38岁的班级。结果一去上课傻眼了,班上绝大部分学员年龄都在20左右。但是有几位祖师爷的年龄远远超过20岁,在这里,平均年龄被这几位祖师爷拉大了。祖师爷的年龄在这里显得很不协调,虽然均值是38岁,但班上没有一个人在38岁上下。

为什么会这样呢,因为班级的年龄分布是非对称分布而不是正态分布,此时的均值不等于中位数和众数。

5.对称分布数据和非对称分布数据,如何描述数据的集中度?

对称分布数据描述数据集中度:

(1) 均值(Mean):

  • 对称分布数据的均值通常位于分布的中心,因为数据在均值两侧是对称的。

  • 均值可以作为数据集中度的一个指标,但需要注意异常值对均值的影响。

(2)中位数(Median):

  • 对称分布数据的中位数与均值相等,因为数据在中心对称,中位数是将数据分为两等分的数值。

  • 中位数是对称分布数据集中度的一个稳健指标,不受异常值的影响。

    (3) 众数(Mode):

  • 对称分布数据的众数与均值和中位数相等,因为数据在分布形状上呈现对称的特点。

  • 众数是数据集中出现频率最高的数值。

(4)标准差(Standard Deviation):

  • 标准差是数据集各数据点与均值之间的平均偏差的平方根,它能够反映数据的离散程度。标准差越大,数据集的分散程度越高,集中度越低;标准差越小,数据集的分散程度越低,集中度越高。

非对称分布数据的描述数据集中度:

(1) 中位数(Median):

  • 非对称分布数据的中位数是更稳健的集中度指标,因为它不受异常值的影响。

  • 中位数反映了数据集中度的中心位置,通常比均值更适用于描述非对称分布数据的集中度。

(2) 四分位数(Quartiles):四分位数将数据集分为四个等分,有三个数,分别是第一四分位数(Q1)、第二四分位数(Q2)、第三四分位数(Q3)。第一四分位数和第三四分位数能够帮助我们了解数据的分布情况和集中度。

综上所述,对称分布数据和非对称分布数据在描述数据集中度时,采用的统计指标和解释可能存在差异。对称分布数据的均值、中位数和众数通常一致,而非对称分布数据则需要更谨慎地选择适当的集中度指标,以更准确地描述数据的中心位置。这些方法可以帮助我们了解数据集中度的不同方面,从而更好地理解数据的分布特征和数据集的形态。

打印机报修的故事可以帮助我们理解判断数据集中度的重要性:

假设你是一家打印机生产商的分析员,你的老板给了你去年一年公司销售的57334台打印机的报修情况,同时给了你对手公司994773台打印机的报修情况,让你对比两家打印机的质量。你很快分析完了,对手每台打印机在保修期内平均反馈问题2.8个,而你的公司平均反馈问题是9.1个,数据结果显示你公司的产品质量不如对手公司。分析完之后你就把信息发给老板了,刷起了手机,碰巧就看了这篇推文,里面提到如果数据不是对称分布,那么平均数不能够代表数据集中度,而且平均数很容易受到异常值的影响。

你马上开始分析两组数据的中位数,发现对手公司的中位数是2,而你公司的中位数是1,这说明在你公司的数据中有异常值抬高了平均数。你很快找到了问题所在,原来是你公司有一个批次的产品质量不稳定,被频繁报修,而其他批次的产品质量没有问题。也就是说公司不需要更新或者重组整个生产流程和设备,只需要找到那一个批次产品的问题就行了。也说明你公司的产品并不比对手公司差。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1695697.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CIC滤波器

CIC滤波器结构简单,没有乘法器,只有加法器、积分器和寄存器,适合工作在高抽样率条件下,而且CIC滤波器是一种基于零点相消的FIR滤波器。 CIC滤波器分为单级和多级滤波器。 1.在单极滤波器中: 当CIC滤波器的长度M远大于…

【css3】04-css3转换

目录 1 2D转换 2 3D转换 3 案例:旋转的魔方 1 2D转换 ## 2D转换 ☞ 位移 transform: translate(100px,100px); 备注: 位移是相对元素自身的位置发生位置改变 ☞ 旋转 transform: rotate(60deg); 备注&am…

LabVIEW虚拟测试实验室开发

LabVIEW虚拟测试实验室开发 在当代的科技和工业进步中,测试与测量扮演着至关重要的角色。随着技术的发展,测试系统也变得日益复杂和成本昂贵,同时对测试结果的准确性和测试过程的效率要求越来越高。开发了一种基于LabVIEW的虚拟测试实验室的…

新能源汽车的电驱热管理

前言 新能源汽车的电驱热管理是指维持电动汽车电池、电机和电控系统在适宜的工作温度范围内,保障车辆高效、安全、稳定运行的技术方案。随着新能源汽车的快速发展和普及,电驱热管理技术也日益成为关注焦点。本文将从电池、电机和电控系统三个方面介绍新…

k8s集群的声明式管理资源

一 声明式管理方法 1 适合于对资源的修改操作(陈述式方式修改资源非常不方便) 2 声明式资源管理方法依赖于yaml资源配置清单文件对资源进行管理 资源配置清单文件有两种格式:yaml(人性化,易读)&#xff…

中国科学院植物研究所宋献军课题组揭示不同的翻译后修饰协作调控水稻种子大小的新机制

公众号:生信漫谈,获取最新科研信息! 中国科学院植物研究所宋献军课题组揭示不同的翻译后修饰协作调控水稻种子大小的新机制https://mp.weixin.qq.com/s/ycNgYzACwkYZbo6k0Zqtcw 未来20年,我国将决战全面建成社会主义现代化国家&…

杰理-耳机进入关机关闭内内置触摸-节省功耗

杰理-耳机进入关机关闭内内置触摸-节省功耗 if (__this->init 0) {return LP_TOUCH_SOFTOFF_MODE_LEGACY; }if ((__this -> softoff_mode LP_TOUCH_SOFTOFF_MODE_ADVANCE) && (__this->softoff_keep 0)) {lp_touch_key_disable(); } __this->softoff_k…

安全设计 | Microsoft 威胁建模工具Threat Modeling Tool安装、使用及威胁生成原理详解(文末附样例)

1. 概览 微软威胁建模工具(Threat Modeling Tool)是 Microsoft 安全开发生命周期 (SDL,Security Development LifeCycle) 的核心要素。 当潜在安全问题处于无需花费过多成本即可相对容易解决的阶段,软件架构师可以使用威胁建模工…

对vue3/core源码ref.ts文件API的认识过程

对toRef()API的认识的过程: 最开始认识toRef()是从vue3源码中的ref.ts看见的,右侧GPT已经举了例子 然后根据例子,在控制台输出ref对象是什么样子的: 这就是ref对象了,我们根据对象中有没有__v_isRef来判断是不是一个ref对象,当对象存在且__v_isRef true的时候他就判定为是一个…

F28034中断

DSP中断 中断中断概述中断机制 中断 当CPU正在执行程序时,由于发生了某种随机的事件(外部或内部),使CPU的执行中断,转而去执行某一段特殊的程序(中断子程序或中断处理程序),以处理该…

cs与msf权限传递,以及mimikatz抓取win2012明文密码

目录 解释参数 foreign http foreign https cs与msf权限传递 Cobalt Strike会话传递到Metasploit Framework Cobalt strike上的操作 ​编辑​编辑​编辑 Metasploit Framework上的操作 传递会话 Metasploit Framework会话传递到Cobalt Strike Cobalt strike上的操作…

Tina-Linux -- 3. LVGL测试

参考韦东山 – Tina_Linux_图形系统_开发指南 Tina-linux lvgl 配置 环境配置 进入Tina-SDK根目录 source build/envsetup.sh lunch XXX平台名称 make menuconfigLVGL Gui --->Littlevgl --->< > lv_demo<*> lv_examples &#xff08;lvgl官方demo&#…

监控监测管理系统产品规格说明书(实际原件参考)

【智慧工地】监控监测管理系统产品规格说明书编制模板 一、引言 二、 项目概述 三、 总体需求 四、 功能需求 4.1 概述 4.2 业务功能概要描述 4.3 功能性需求 4.4 功能描述 五、 非功能性需求 5.1 用户界面需求 5.2 软硬件环境需求 5.3 产品质量需求 5.4 接口需求 5.5 其他需求…

HarmonyOS 鸿蒙应用开发 - 多态样式 stateStyles

前言&#xff1a;Styles和Extend仅仅应用于静态页面的样式复用&#xff0c;stateStyles可以依据组件的内部状态的不同&#xff0c;快速设置不同样式&#xff0c;类似于css伪类&#xff0c;但语法不同。 ArkUI提供以下四种状态&#xff1a; focused&#xff1a;获焦态。normal&…

MySQL库/表/数据的操作

文章目录 1.数据库操作1.1 创建、删除、查看和修改1.2 编码格式1.3 备份和恢复 2.表的操作2.1 创建表2.2 存储引擎2.3 查看表、修改表、删除表 3.数据类型3.1整数类型3.2字节类型(bit)3.3浮点类型(bit)3.4 decimal3.5 字符串类型3.6 日期和时间类型3.7 enum和set关于如何查找想…

ES 查询踩坑-全字段匹配

需求&#xff1a;name字段需要全匹配查询 name的映射 普通的must查询 GET power_engin/_search {"from": 0,"size": 10,"query": {"bool": {"must": [{"term": {"name": {"value": "尼…

解决Flutter位于悬浮窗口时,应用Logo不更新问题

问题描述 我已经更换了应用Logo&#xff0c;但是发现应用处于悬浮窗口时&#xff0c;logo还是更改之前的&#xff1f;下面的图片只是示意。 解决方案 终端命令 rm -rf ~/Library/Developer/Xcode/DerivedData2.xcode视图内解决 先在顶部找到 Xcode --> Setting --> Lo…

光速入门python的OpenCV

前言 欢迎来到我的博客 个人主页:北岭敲键盘的荒漠猫-CSDN博客 本文整理python的OpenCV模块的关键知识点 争取用最短的时间入门OpenCV 并且做到笔记功能直接复制使用 OpenCV简介 不浪费时间的介绍: 就是类似于ps操作图片。 至于为什么不直接用ps&#xff0c;因为只有程序能…

AI菜鸟向前飞 — LangChain系列之十四 - Agent系列:从现象看机制(上篇)

上一篇介绍了Agent与LangGraph的基础技能Tool的必知必会 AI菜鸟向前飞 — LangChain系列之十三 - 关于Tool的必知必会 前面已经详细介绍了Promp、RAG&#xff0c;终于来到Agent系列&#xff08;别急后面还有LangGraph&#xff09;&#xff0c;大家可以先看下这张图&#xff1…

Centos修改系統語言

一、使用命令行修系统语言 1、显示系统当前语言环 [rootkvm-suma ~]# localectl System Locale: LANGen_US.utf8 VC Keymap: cn X11 Layout: cn 2、查看系统支持字符集 [rootkvm-suma ~]# locale -a 2、设置系统语言环境 [rootkvm-suma ~]# localectl set-locale LANGz…