16、参数估计

news2025/1/21 11:20:29

概率基本定义

先验分布:

似然函数:

后验分布:

贝叶斯公式:,其中

后验分布 = 似然函数 × 先验分布 / P(D)

贝叶斯公式

假设,现在有两个一定概率发生的事件A和B,且它们之间存在一定的关系

  • P(A) 表示事件A发生的概率

  • P(B) 表示事件A发生的概率

  • P(A|B) 表示事件B已经发生的前提下,事件A发生的概率

  • P(B|A) 表示事件A已经发生的前提下,事件B发生的概率

极大似然估计(MLE)

极大似然估计方法(Maximum Likelihood Estimate,MLE)也称为最大概似估计或最大似然估计,是求估计的方法之一

简单来讲,极大似然估计就是给定模型,然后通过收集数据,求该模型的参数。

似然函数形式:

连乘不好求解,通常会进行一个对数变换,转换为累加:

伯努利分布

每一个样本的概率可以表示为:,x=0 or 1,是成功的概率

假设有n个样本,

对数最大似然函数表达式:

对上式求导,解得当,似然函数取得最大值

正态分布

样本概率表示为:

假设有n个样本,

对数最大似然函数表达式:

对上式求导,解得当,似然函数取得最大值

例子

路人甲在一个不透明的袋里放了若干个黑色和白色的球;路人乙想知道袋中球的情况,就从袋中有放回式取球,一共取了10次,有7次是白球,3次是黑球。问白球的比例是多少?

在这个例子中,每一次实验都是服从伯努利分布,我们设白球的概率为 ,每一次实验可以表示为 ,样本为 ,似然函数为: ,取对数,求最大值为 = 0.7

最大后验估计(MAP)

Maximum A Posteriori Estimation

在最大似然估计的例子中,如果样本数量不够多,其实存在着很大的问题

MLE简单又客观,但是过分的客观有时会导致过拟合(Over fitting)。在样本点很少的情况下,MLE的效果并不好

一个最简单的例子就是,一个伯努利模型,我们知道通过最大似然估计得到的先验值为 ,那如果实验过程中,全部出现1或者0,那么估计出的参数显然是不对的

最大似然估计认为使似然函数 最大的参数 θ 即为最好的 θ ;

最大后验估计认为使 最大的参数 θ 即为最好的 θ ;

最大似然估计可以看作是一种特殊的最大后验估计,将 θ 看作是固定的, =1 。

最大后验概率估计的公式表示:(P(D)是一个常数,与 θ 无关)

要求解MAP,还需要知道参数的先验分布

正态分布

假设高斯分布方差已知,现在要估计均值,将均值记为 θ

每一个样本的概率可以表示为

假设 θ 服从高斯分布,,则

求解得到

例子

路人甲在一个不透明的袋里放了若干个黑色和白色的球,他感觉白色球更多;路人乙想知道袋中球的情况,就从袋中有放回式取球,一共取了10次,有7次是白球,3次是黑球。问白球的比例是多少?

每一次实验都是服从伯努利分布,我们设白球的概率为 θ ,所以每一次实验可以表示为: 样本为

路人甲的感觉是白色球更多,需要给出一个 θ 的分布,假设 P(θ) = 2θ

后验概率函数:
取对数,求最大值 θ = 0.73

当样本个数无穷多的时候,MAP上会逼近MLE,因为样本足够多了,就不需要先验了,或者比起先验更相信样本。

贝叶斯估计

最大似然估计和最大后验估计都是估计了参数的具体值,但更令人信服的其实是参数的分布,知道参数在取每个值时的概率。

与最大后验估计一样,需要用到贝叶斯定理

需要知道先验分布 P(θ),但此时不再求 ,而要求出

这里如果先验分布十分复杂,上式会很难求解(因为要分母积分),所以一般会选择共轭先验。

二项分布参数的共轭先验是Beta分布,多项式分布参数的共轭先验是Dirichlet分布,指数分布参数的共轭先验是Gamma分布,⾼斯分布均值的共轭先验是另⼀个⾼斯分布,泊松分布的共轭先验是Gamma分布。

最大后验估计和贝叶斯估计也存在一个问题,实际应用场景中的先验概率不是那么好求,很多都是拍脑袋决定的。一旦是拍脑袋决定的,自然也就不准了,先验概率不准,那么计算出的后验概率也就相应的不准了

贝叶斯估计用来预测新测量数据的概率,对于新出现的数据 x

例子

路人甲在一个不透明的袋里放了若干个黑色和白色的球,他感觉白色球更多;路人乙想知道袋中球的情况,就从袋中有放回式取球,一共取了10次,有7次是白球,3次是黑球。问白球的比例是多少?

每一次实验都是服从伯努利分布,我们设白球的概率为 θ ,所以每一次实验可以表示为: 样本为

路人甲的感觉是白色球更多,需要给出一个 θ 的分布,假设

后验概率函数

得到了参数的后验分布情况,得到

计算步骤

  1. 根据贝叶斯定理,计算后验概率P(θ|D)

  1. 计算新样本估计

总结

MLE、MAP是选择相对最好的一个模型, 贝叶斯方法则是通过观测数据来估计后验分布,并通过后验分布做群体决策,所以后者的目标并不是在去选择某一个最好的模型,而是去评估每一个模型的好坏。

参考于:一文解释 参数估计 - 知乎 (zhihu.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/397524.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UNIX网络编程卷一 学习笔记 第八章 基本UDP套接字编程

UDP是无连接不可靠的数据报协议,不同于TCP提供的面向连接的可靠字节流。使用UDP编写的常见程序有:DNS、NFS、SNMP。 以下是典型的UDP客户/服务器程序的函数调用,客户不与服务器建立连接,而是只使用sendto函数给服务器发送数据报&…

03_Linux压缩解压,用户用户组,文件权限

目录 Linux下常用的压缩格式 gzip 压缩工具 gzip 对文件夹进行压缩 bzip2 压缩工具 tar打包工具 对.tar.bz2 进行压缩和解压缩 对.tar.gz 进行压缩和解压缩 rar格式 zip格式 Linux用户 Linux用户组 创建用户和用户组 Linux文件权限 Linux文件权限修改 Linux下常用…

windows10安装nodejs

一、下载 官网 Download | Node.js 某云盘 链接:https://pan.baidu.com/s/1PCd4fh4ohEvAc8qSrb4-WA 提取码:yola 二、安裝 双击安装程序:具体步骤如下: 设置环境变量 验证安装是否安装成功 进入cmd命令行窗口,输入…

SQL优化操作1

一.存储过程建表 建两张30万条数据的表以做测试用 1.user_course_info delimiter $$ # 定义结束符 drop procedure if exists addTestDataOne; # 存储过程名叫:addTestData create procedure addTestDataOne() begin declare number int; set number 1; w…

node 配置 vue npm配置

下载node 版本16https://nodejs.org/download/release/v16.16.0/node-v16.16.0-x64.msi复制安装地址,省空间,生报错老老实实复制就好D:\Program\nodejs新建node_cache和node_globalD:\Program\nodejs\node_cacheD:\Program\nodejs\node_global运行命令np…

Sentinel架构篇 - 熔断降级

熔断降级 概念 除了流量控制以外,对调用链路中不稳定的资源进行熔断降级也是保障高可用的重要措施之一。一个服务常常会调用其它模块,可能是一个远程服务、数据库、或者第三方 API 等。然而,被依赖的服务的稳定性是不能保证的。如果依赖的服…

原生HTML放大镜

该放大区域用背景图片放大 <!DOCTYPE html> <html lang"zh"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><meta http-equiv"X-UA-Compat…

Linux - buff和cache的区别

free -h命令可以查看内存的使用情况 [rootzabbix-server ~]# free -htotal used free shared buff/cache available Mem: 1.8G 432M 894M 10M 492M 1.2G Swap: 2.0G 0B 2.0G为什…

抖音小程序实践四:实现小程序分享

有时候我们要把一个小程序分享给别人&#xff0c;去看套餐、买东西之类的&#xff0c;是一个很常见的功能&#xff0c;但是在接入抖音小程序的时候&#xff0c;初始化右上角三个点并没有分享的入口&#xff0c;那看来不是要申请&#xff0c;就是有别的开发的口子了。下面我们一…

《SQL基础》17. InnoDB引擎

InnoDB引擎InnoDB引擎逻辑存储结构架构内存结构磁盘结构后台线程事务原理事务基础redo logundo logMVCC基本概念隐式字段undo log版本链readView原理分析InnoDB引擎 逻辑存储结构 InnoDB的逻辑存储结构如下图所示&#xff1a; 表空间 表空间是InnoDB存储引擎逻辑结构的最高层…

React18 setState是同步还是异步?

相信大家对于react的setState肯定是不陌生了, 这是一个用于更新状态的函数. 但是在之前有一道非常经典的面试题就是关于setState是同步还是异步的问题, 具体可以参考我之前写的一篇文章: 一篇文章彻底理解setState是同步还是异步&#xff01;. 对于react 18之前的版本, 上文说的…

2019年MathorCup数学建模A题数据驱动的城市轨道交通网络优化策略解题全过程文档及程序

2019年第九届MathorCup高校数学建模挑战赛 A题 数据驱动的城市轨道交通网络优化策略 原题再现&#xff1a; 截至 2018 年 12 月 31 日&#xff0c;中国内地累计共有 35 座城市建成并投运城市轨道交通&#xff0c;里程共计 5766.6 公里。进入“十三五”以来&#xff0c;三年累…

Spring Bean实例创建装载过程分析-spring源码学习(2)

随着Spring框架的应用越来越广泛&#xff0c;对Spring Bean的实例创建装载过程的了解就显得尤为重要。本文将围绕这一主题&#xff0c;为大家详细介绍Spring Bean实例创建装载的整个过程&#xff0c;并透彻解析其细节。 时序图 一、Spring Bean实例的创建过程 Spring Bean实例…

Web前端学习:章三 -- JavaScript预热(二)

六五&#xff1a;作用域与function function&#xff1a;函数&#xff0c;不是数学上的函数&#xff0c;与写代码有关 JS中的函数&#xff1a;运用它&#xff0c;起个名字&#xff0c;然后对函数进行调用&#xff0c;即可将函数中的内容执行一遍 1、function 最基本的作用域…

CNCF x Alibaba云原生技术公开课 第五章 应用编排与管理

1、元数据的组成 用来识别资源的具有标识型的标签&#xff1a;Labels key valueselector(筛选/组合资源):多个相等条件&#xff0c;逻辑与的关系; 集合型,in notin 用来描述资源的非标识型的注解&#xff1a;Annotations 扩展资源的spec/status可以包含特殊字符可以结构化也可…

企业管理经典书籍推荐

几乎每一位成功的商业人士都有着良好的阅读习惯。并且他们阅读涉猎的范围也大多与企业管理和领导力有关。而关于企业管理经典书籍&#xff0c;我推荐你看以下这两本。一本是《经理人参阅&#xff1a;企业管理实务》&#xff0c;另一本是《经理人参阅&#xff1a;领导力提升》。…

无刷高速风筒方案介绍--【PCBA方案】

疫情三年过去&#xff0c;春节后&#xff0c;一个新的开始&#xff0c;大家满怀希望畅谈今年好气象。 三年来一波一波的封城、隔离、核酸&#xff0c;经济压抑到了无以复加的地步&#xff0c;也导致了诸多社会问题的出现。消费力被磨平&#xff0c;人们小心翼翼的生活。 常跟…

【第六课】Arcgis中基本操作

一、前言 前面课程已经对Arcgis主页面&#xff0c;相关板块进行介绍&#xff0c;相信大家也有了一定的了解&#xff0c;当然这部分内容其实不需要大家死记硬背&#xff0c;有一个初步印象即可&#xff0c;这一节课程可能更需要掌握&#xff0c;之后会慢慢有实例给大家展现&…

数据结构刷题(二十):17电话号码的字母组合、39组合总和、40组合总和II

一、电话号码的字母组合题目链接思路&#xff1a;回溯三部曲。确定回溯函数参数&#xff1a;题目中给的 digits&#xff0c;还要有一个参数就是int型的index&#xff08;记录遍历第几个数字&#xff0c;就是用来遍历digits的&#xff0c;同时也代表了递归的深度&#xff09;&am…

【牛客刷题专栏】0x10:JZ8 二叉树的下一个结点(C语言编程题)

前言 个人推荐在牛客网刷题(点击可以跳转)&#xff0c;它登陆后会保存刷题记录进度&#xff0c;重新登录时写过的题目代码不会丢失。个人刷题练习系列专栏&#xff1a;个人CSDN牛客刷题专栏。 题目来自&#xff1a;牛客/题库 / 在线编程 / 剑指offer&#xff1a; 目录前言问题…