第三章《补基础:不怕学不懂概率统计》笔记

news2024/11/25 2:02:55

3.1 什么是概率

概率亦称“或然率”,它反映随机事件出现的可能性大小,在现实生活中有着极其普遍的应用。

3.1.1 最简单的概率的例子

3.1.2 概率论与数理统计的关系

概率论与数理统计的关系可以概括为,概率论是数理统计的理论基础,数理统计是概率论 的一种应用。

3.2 搞懂大数定律与中心极限定理

3.2.1 大数定律想表达什么

1.大数定律是什么

最早的大数定律由伯努利在他的著作《推测术》 中提出并给出了证明。

大数定律告诉我们大量重复出现的随机事件中蕴含着某种必然的规律。保持试 验条件不变,多次地重复试验,随机事件出现的概率近似于它出现的频率。

大数定律有多种表达方式,例如切比雪夫大数定律、伯努利大数定律、辛钦(又译为欣钦) 大数定律等。

对一般人来说,大数定律非严格的表述是这样的:X1,...,Xn 是独立同分布随机变量序列,期

望为 u,且 ,则 收敛到 u。大数定律分为弱大数定律和强大数定律,如果说上述 收敛是指依概率收敛,那就是弱大数定律;如果说上述收敛是指几乎必然收敛,那就是强大数定律。大数定律是概率论甚至数学领域最直观的定律之一。

2.代码演示理解大数定律

3.2.2 中心极限定理想表达什么

1.中心极限定理是什么

中心极限定理告诉我们,当样本量足够大时,样本均值的分布围绕总体均值呈现正态分布。

2.代码演示理解中心极限定理

3.2.3 大数定律与中心极限定理的区别

大数定律表达的核心:随着样本容量的增加,样本均值将接近总体均值。

中心极限定理表达的核心:样本独立同分布的情况下,抽样样本均值围绕总体样本均值呈现 正态分布。

大数定律揭示了大量随机变量的平均结果,但没有涉及随机变量的分布问题。而中心极限定理说明在一定条件下大量独立随机变量的平均数是以正态分布为极限的。

3.3 理解概率统计中的重要分布

3.3.1 真正搞懂正态分布

1.正态分布是什么

以一维数据为例,正态分布的定义:若随机变量 X 服从一个数学期望为 μ、方差为 σ2 的正态分布,则可记为 N(μ,σ2)。其概率密度函数决定了正态分布的期望值 μ 的位置,其标准差 σ 决定了分布的幅度。μ = 0,σ = 1 的正态分布就是标准正态分布。

2.正态分布背后的原理是什么

正态分布背后的原理就是我们前文讲述的中心极限定理。中心极限定理还指出一个重要的结论:无论随机变量呈现出 什么分布,只要我们抽样次数足够多,抽取样本的均值就围绕总体的均值呈现正态分布。随着 抽取组数的增多,每次抽样的均值分布越来越趋近正态分布。

中心极限定理指出大量相互独立的随机变量的均值经适当标准化后依分布收敛于正态分布, 其中有 3 个要素:独立、随机、相加。

3.3.2 真正搞懂泊松分布

1.泊松分布是什么

泊松分布的概率函数为 ,k=0,1,2,3...,其中,参数λ指单位时间(或单位面积)内事件发生的平均概率。泊松分布表达的含义是,单位时间里某事件发生了 λ 次, 那么事件发生 k 次的概率是多少。泊松分布适用的事件需要满足以下 3 个条件:第一,事件是小概率事件;第二,事 件之间相互独立;第三,事件的概率是稳定的。

2.泊松分布背后的原理是什么

泊松分布是二项分布的一种极 限形式,可以通过二项分布公式取极限推导出来。

泊松分布可作为二项分布的极限而得到。一般来说,若 ,其中 n 很 大、p 很小,则当 不太大时,X 的分布接近于泊松分布 

3.4 理解朴素贝叶斯思想很重要

3.4.1 如何理解条件概率

已知事件 A 发生而求事件 B 发生的概率 P(B|A) 就是条件概率。

3.4.2 如何理解贝叶斯公式

3.4.3 贝叶斯公式的应用

3.4.4 最大似然估计

最大似然原理中的“最大似然”表示“最大概率看起来是这个样子”。

最大似然原理应该表述为,若一次试验有 n 个可能的结果, 分别为 A1,A2,...,An,现在做一次试验的结果为 Ai,那么我们可以认为本次试验的结果事件 Ai 在 这 n 个可能的结果中出现的概率最大。

最大似然估计实际上就是利用 最大似然原理完成一项任务:参数估计。

最大似然估计的目的是,利用已知样本结果,反推最有可能(最大概率)导致出现这样结 果的参数值是多少。最大似然估计是一种统计方法,属于统计学的范畴。最大似然原理是一种 基础原理,属于概率论的范畴。最大似然估计是建立在最大似然原理基础上的一种统计方法。 它通过现实中已经给定的观察数据来倒推和评估模型参数,例如经过若干次试验并观察结果, 构造试验结果概率的某个含参表达式,通过假定该概率值最大来求解参数值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1186867.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

fastspar微生物相关性推断

fastspar 简介 fastspar是基于Sparcc通过C编写的,速度更快,内存消耗更少。sparcc是基于OTU的原始count数,通过log转换和标准化去除传统相对丰度的天然负相关(因为所有OTU之和为1,某些OTU丰度高另外一些自然就少&…

nssm部署nginx

nssm install Nginx8098 --安装nginx nssm start Nginx8098 --启用nginx nginx 选择nginx路径,安装

Kyligence Copilot 亮相第六届进博会,增添数智新活力

11月5日,第六届中国国际进口博览会(以下简称“进博会”)在上海国家会展中心盛大启幕,众多新科技、新成果、新展品亮相本届进博会。作为阿斯利康(AstraZeneca)合作伙伴,跬智信息(Kyli…

ApiFox添加全局参数

文章目录 Apifox右上角打开 管理环境Apifox右上角打开 管理环境 我们发现,从登录以后,在请求其他接口,每次都需要添加一个Header 头信息.这样很繁琐.那Apifox是否支持我们设置全局参数呢?方便我们每次调用需要添加Header参数的接口需要每次都重新编写.当然支持,下面带着大家配…

Hikyuu 1.3.0 发布,高性能量化交易研究框架

Hikyuu 是一款基于 C/Python 的高性能开源量化交易研究框架,用于快速策略分析及回测。与其他量化平台或回测软件相比,具备: 超快的回测速度;对完整的系统交易理念进行抽象,并分解为不同的组件,通过重用不同…

Redis被攻击纪实

一、前言 声明:本文仅供技术交流使用,严禁采用本文的方法进行任何非法活动。 上周新来的同事分享Redis的原理和机制,想起2017年的时候测试环境Redis被攻击,最后只能重新安装服务器,今天试验一把利用Redis漏洞进行攻击…

Hybrid综合应用

1、需求 实现不同vlan间PC不可互访,而不同vlan的PC均可访问服务器的特殊效果,具体要求如下。 1)在交换机中创建相关vlan 2)修改端口模式与pvid 3)修改端口允许通过的数据帧 4)结果验证,vlan5与…

docker搭建mysql环境

1. 基础环境 名称描述CentOS 7.6Linux操作系统版本docker 20.10.5docker版本mysql 8.0.29mysql镜像版本 2. 下载安装 使用docker命令下载mysql镜像 [rootzhouwei ~]# docker pull mysql:8.0.29查看docker仓库是否已经下载了mysql镜像 [rootzhouwei ~]# docker images将mys…

一体化HIS医疗信息管理系统源码:云HIS、云电子病历、云LIS

基于云计算技术的B/S架构的HIS系统,为医疗机构提供标准化的、信息化的、可共享的医疗信息管理系统,实现医患事务管理和临床诊疗管理等标准医疗管理信息系统的功能。系统利用云计算平台的技术优势,建立统一的云HIS、云病历、云LIS,…

Android:OkHttp同步请求和异步请求

一、前言 网络请求之前工作中用到的是post请求,然后了解之后发现请求的种类还有很多种。下面着重讲到是get和post的同步请求和异步请求。 二、具体内容 1.Okhttp的特点: 支持Http/2并允许对同一主机的所有请求共享一套接字;如果非HTTP/2&…

jenkins2

jenkins插件管理安装:docker-build jenkins安装了docker 配置docke builder 添加 unix:///var/run/docker.sock rootubuntu20:~# usermod -G docker jenkins 修改docker中service文件添加 -H tcp://0.0.0.0:2376 jenkins中系统管理中 tcp://localhost:2376

不同规模的企业如何借助宁盾LDAP统一用户认证实现安全和效率需求?

中小企业要解决安全和业务效率问题,须提前规划软件基础设施,其中最基础的部分是建立统一账号和统一用户身份认证体系。这个体系相当于在软件系统之间建立了一套统一的身份标准,基于这套标准创建的账号让员工方便、高效地访问公司内的大部分软…

项目文件下载器,基于Thread多线程

目录 1、Http 工具类 2、关于下载的关系类 2.1 展示下载信息 #下载信息展现线程类 #在主下载类中,进行调用上述线程类 2.2 文件的分块下载 #文件分块下载类 #文件按分块进行分别切分的方法 # 使用 LongAdder 类型,更改 DownLoadInfoThread 展现…

clang插件对llvm源码插桩,分析函数调用日志(1)

tick_plot__compile.ipynb 时长边界_时上链异数: 长短函数调用链列表 0. 用matplotlib找系统中字体文件大于1MB的 中文字体通常很大,这样过滤出的 通常有中文字体 结果中 看名字 ‘AR PL UMing CN’ 果然是中文字体 from matplotlib.font_manager import fontManag…

网页制作-引入icon

1.如何引入icon 1.1 进入https://www.iconfont.cn/ 1.2 登录或者注册一下 1.3 在搜索框输入你想搜索的内容 1.4 加入购物车 1.5 在购物车中点击下载代码 1.6 若是普通的html项目,则至需要将如下两个拷贝到你的项目中 1.7 在你需要的网页中引入iconfont.css就可以使…

教你解决msvcp140.dll丢失方法,全面分析msvcp140.dll丢失原因

msvcp140.dll是一个Microsoft Visual C库文件,主要用于支持C应用程序的运行。当找不到msvcp140.dll时,可能导致程序无法正常执行。下面是五个解决方法以及msvcp140.dll丢失的原因介绍: 一、msvcp140.dll丢失的原因: 系统故障&am…

Android T窗口动画添加移除流程(更新中)

APP侧窗口动画demo 如何创建一个窗口动画?我们通过先从APP创建一个窗口,以这个窗口的创建过程的窗口动画为例 这个demo就是点击BUTTON显示窗口,点击CLOSE WINDOW关闭窗口,下面简述关键代码 //定义WindowManager和LayoutParams…

第三阶段第一章——PySpark实战

学习了这么多python的知识,是时候来搞点真玩意儿了~~ 春风得意马蹄疾,一日看尽长安花 o(* ̄︶ ̄*)o 1.前言介绍 (1)什么是spark Apache Spark是一个开源的分布式计算框架,用于处理大规模数据集的…

万界星空科技MES系统软件体系架构及应用

MES系统是数字化车间的核心。MES通过数字化生产过程控制,借助自动化和智能化技术手段,实现车间制造控制智能化、生产过程透明化、制造装备数控化和生产信息集成化。生产管理MES系统主要包括车间管理系统、质量管理系统、资源管理系统及数据采集和分析系统…

Power Apps-库组件样式调整

数据表控件参考文档:Power Apps 中的 数据表 控件 - Power Apps | Microsoft Learn 修改每个item的布局 选中组件,点击左上角的🖊,可以进行调整 重新选择该组件的样式 点击布局中后面的选项可以重新选择 整合计数代表一行有几个…