常见推断方法一览:极大似然估计、最大后验估计、期望最大化、贝叶斯推断、马尔科夫链蒙特卡洛方法、变分推断

news2025/1/21 18:53:54

常见推断方法一览

    • 推断方法区别
    • 频率派
      • 极大似然估计 MLE
      • 最大后验估计 MAP
      • 期望最大化 EM
    • 贝叶斯推断 Bayesian
      • 马尔科夫链蒙特卡洛方法 MCMC
      • 变分推断 VI

 


推断方法区别

  1. 极大似然估计 (Maximum Likelihood Estimation, MLE):

    • 解释: 假设你有一堆骰子,你投掷它们很多次,然后记录下每次的结果。
    • 极大似然估计就是一种方法,用来估计这些骰子每一面出现的概率是多少。
    • 根据实际观察到的数据来找到一组参数,使得这些数据出现的可能性最大。
    • 是从已有的数据出发,然后去寻找最能解释这些数据的参数。
    • 应用领域: 在科学实验和社会调查中,用来估计未知参数,比如估计一个新药的有效率。
  2. 最大后验估计 (Maximum A Posteriori Estimation, MAP):

    • 解释: 这个方法和极大似然估计很像,但它还考虑了你之前已经知道的信息。
    • 比如,如果你在估计骰子的概率时,已经知道这个骰子可能是不均匀的,这个先验知识会影响你的估计结果。
    • 应用领域: 用于包含先验知识的统计问题,比如在医学图像处理中估计病变的位置。
  3. 期望最大化 (Expectation Maximization, EM):

    • 解释: 这是一种处理不完整数据的方法。
    • 假设你有一部分骰子的投掷数据丢失了,EM算法可以帮你估计这些丢失数据的最可能值,并据此来估计骰子的概率。
    • 应用领域: 用于处理不完整数据,如在经济学研究中处理缺失数据。
  4. 贝叶斯推断 (Bayesian Inference):

    • 解释: 贝叶斯推断是一种统计方法,它使用概率来量化不确定性。
    • 在贝叶斯推断中,你可以用新的数据来更新你对某个参数的信念。
    • 例如,你可以根据新的病例数据来更新一个疾病爆发的可能性。
    • 应用领域: 广泛应用于各种领域,包括医学研究、机器学习和金融市场分析。
  5. 马尔科夫链蒙特卡洛方法 (Markov Chain Monte Carlo, MCMC):

    • 解释: 这是一种通过构建“随机游走”来估计复杂概率分布的方法。
    • 想象你在一个棋盘上随机移动,每一步都基于某种规则,长时间后,你的位置可以帮助我们理解棋盘上的某些特性。
    • 应用领域: 在统计物理、金融和生态学中模拟复杂系统。
  6. 变分推断 (Variational Inference):

    • 解释: 这是一种使用简化的概率分布来近似复杂概率分布的方法。
    • 就像用一张简单的地图来代表一个复杂的地形,虽然不完全准确,但足以给出一个大概的理解。
    • 应用领域: 在机器学习中,特别是在大数据和高维数据中使用,如在自然语言处理和计算机视觉中。

搭建模型需要设计目标函数(比如神经网络),绝大多数机器学习的目标函数都是基于 MLE、MAP、Bayesian搭建的。

因为这些模型在学习时,都试图找到最佳的方式去解释数据,同时考虑到现有的知识和不确定性。

频率派

极大似然估计 MLE

MLE定义 给定 theta 的条件下,最大化看到所有样本的概率,最大化目标函数。

假设你有一组数据,并且你有一个模型,这个模型由一些参数(θ)控制。

MLE 的目标是找到这些参数的最佳值,使得这些参数下观察到的数据出现的概率最大,确保模型尽可能地反映出现实世界中的情况。

然后用这个接近现实世界的模式,去预测事情。

似然函数:在特定参数设定下,评估在给定模型参数下,观察到的特定数据集出现的概率。

假设你有一个硬币,想知道是不是公平的。你抛了10次,其中7次正面朝上。

似然函数会尝试不同的概率(比如50%,60%,70%…不同参数下),并计算每种情况下出现“7次正面,3次反面”的概率。

最大化似然函数:目标是找到一个概率值,使得这种结果出现的可能性最大。如果这个最大的概率发生在70%,那你就会说根据目前的数据,最有可能的情况是硬币正面朝上的概率是70%,参数就是这个。

基于实际观察到的数据来估计模型参数,这就是最大似然估计的核心思想。

但这种思想,结论可靠性高度依赖于样本的大小和实验的重复性。

如果我们只抛10次,我们得到的结论可能不太可靠。

但如果我们抛1000次,并且大约700次正面朝上,我们就更有信心认为硬币有偏差。

属于频率派搞法。

数学公式:

  • M L E ( θ ) = a r g m a x [ P ( X ∣ θ ) ] MLE(θ) = argmax [P(X|θ)] MLE(θ)=argmax[P(Xθ)]

在机器学习中的应用,一个神经网络模型,输入是图片,输出是图片属于“猫”或“狗”的概率。

  • 似然函数:在这个场景中,似然函数衡量的是,在给定网络当前参数的情况下,正确分类所有训练图片的概率。
  • 参数优化:通过调整网络的权重和偏置,我们尝试最大化这个似然函数。换句话说,我们在寻找一组参数,它们使得网络正确分类训练集中的猫和狗图片的概率最大。

最大似然估计在机器学习中的作用:它提供了一个强大的框架来指导模型参数的优化过程,使模型能够有效地从数据中学习。

这种基于概率的方法有助于确保模型不仅能够适应已见过的数据,而且能够泛化到新的、未见过的数据。

最大后验估计 MAP

极大似然估计只关注当前的样本,也就是只关注当前发生的事情,不考虑事情的先验情况。

MAP是在MLE的基础上增加了先验知识。

如果没有先验信息,或者先验信息是均匀分布的,那么MAP就简化为MLE。

MAP不仅考虑数据本身,还考虑了参数的先验概率。

试图找到使得参数在观测数据下,后验概率最大的参数值。

  • 先验概率:这是在观测数据之前对参数的信念。例如,如果你已经知道在大多数情况下,猫和狗的图片大致平分,这个信息就可以作为先验。

  • 直观理解:在同样的猫狗识别模型中,如果你已经知道猫的图片通常比狗的图片多(或者相反),MAP会利用这个先验知识来调整参数估计。

数学公式:

  • M A P ( θ ) = a r g m a x [ P ( θ ∣ X ) ] = a r g m a x [ ( P ( X ∣ θ ) ∗ P ( θ ) ) P ( X ) ] MAP(θ) = argmax [P(θ|X)] = argmax [\frac{(P(X|θ) * P(θ))}{P(X)}] MAP(θ)=argmax[P(θX)]=argmax[P(X)(P(Xθ)P(θ))]

    由于 P(X) 是固定的,我们通常简化为:

  • M A P ( θ ) = a r g m a x P ( X ∣ θ ) P ( θ ) MAP(θ) =argmax P(X|\theta)P(\theta) MAP(θ)=argmaxP(Xθ)P(θ)

    对比 MLE 公式,发现就是多了一个先验模块 P ( θ ) P(\theta) P(θ)

MLE纯粹基于数据来估计参数,而 MAP在估计参数时同时考虑了数据和先验知识。

在数据稀少或有强先验知识的情况下,MAP可能比MLE更有效。

期望最大化 EM

迭代算法,用于含有隐变量的统计模型中,交替计算期望步骤和最大化步骤,来寻找参数的最优估计。

比如看故事书,但故事中有一些缺失的部分(这些就是“隐变量”)。

你的目标是填补这些缺失部分,使得整个故事变得连贯和合理。

EM算法就像一个两步循环过程,帮助你逐渐完善这个故事:

  • 期望步骤 (E步骤): 在这一步,你根据目前所知的信息,对故事中缺失的部分做出最佳猜测。就好比你根据故事的上下文来推测这些缺失部分可能的内容。

  • 最大化步骤 (M步骤): 接下来,你根据这些猜测来重新讲述整个故事,并调整故事中其他已知部分的细节,使得整体故事更加合理。这个过程就像根据新的假设来优化故事的连贯性。M步骤可以使用MLE或MAP。

这个循环反复进行:你根据当前的故事版本来改善你对缺失部分的猜测,然后再用这些新猜测来优化整个故事。

随着每次迭代,故事变得越来越连贯,直到最终达到一个点,你觉得再怎么调整也无法使故事更好了。

这时,你就找到了最合适的版本来填补缺失部分,也就是说,你找到了模型参数的最优估计。

详情,请猛击:《期望最大化 EM》。

贝叶斯推断 Bayesian

用贝叶斯定理更新参数的概率分布,考虑到新的数据。

马尔科夫链蒙特卡洛方法 MCMC

构建马尔科夫链来抽样未知分布,用于复杂分布的参数估计和积分。

详情,请猛击:【史上最易懂】马尔科夫链-蒙特卡洛方法:基于马尔科夫链的采样方法,从概率分布中随机抽取样本,从而得到分布的近似

变分推断 VI

简化模型来近似复杂概率分布,常用于贝叶斯推断中处理复杂模型。

详情,请猛击:【史上最易懂】变分推断:从【求分布】的推断问题,变成【缩小距离】的优化问题,用简单的分布 q 去近似复杂的分布 p

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1347696.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue中目录以及文件内容简单分析

src文件下目录分析&#xff1a; App.vue文件中内容&#xff1a; vue文件中基本的三个结构&#xff0c;template&#xff08;结构&#xff09;、script&#xff08;行为&#xff09; 、style&#xff08;样式&#xff09;。 <template><!-- html结构 --><div cl…

Linux xxd命令分析视频文件Box教程(box分析box、视频box、分析atom分析)(xdd指令)

文章目录 Linux xxd命令分析视频文件Box教程一、理解MP4格式二、xxd命令简介三、使用xxd命令分析MP4文件四、解析MP4文件的疑难点1. Box的嵌套结构2. 长度和类型字段的字节序3. 非文本类型的数据 五、python代码解析box嵌套结构的示例 Linux xxd命令分析视频文件Box教程 本文主…

静物摄影在UE5里运用几点记要

被摄体&#xff0c;相机与光源的关系&#xff0c;要增强立体感&#xff0c;摄像机与光源的位置关系要错开&#xff1b;b的立体感要更强 漫反射与点光源&#xff0c;UE5太阳光属于漫反射&#xff0c;整体比较柔和&#xff0c;但是阴影处比较黑&#xff1b;摄影棚会用反光板来增亮…

计算机网络技术概述 习题答案及解析

1-1 因特网的前身是 1969 年创建的第一个分组交换网&#xff08; D &#xff09;。 A. internet B. Internet C. NSFNET D. ARPANET 【答案】D 1-2 因特网上的数据交换方式是&#xff08; C &#xff09;。 A. 电路交换 B. 报文交换 C. 分组交换 D…

ES应用_ES实战

依靠知识库使用es总结一些使用技巧。 1 快速入门 ES是将查询语句写成类似json的形式&#xff0c;通过关键字进行查询和调用。 1.1 创建 下面创建了一个主分片为5&#xff0c;副本分片为1的ES结构。ES本身是一种noschema的结构&#xff0c;但是可以通过指定mapping编程schema的…

Unity关于动画混合树(Blend Tree)的使用

在动画与动画的切换过程中&#xff0c;常因为两个动画之间的差距过大&#xff0c;而显得动画的切换很不自然。 这时候就需要动画混合树Blend Tree这个功能。使用混合树可以将多个动画混合在一起&#xff0c;例如在处理角色的移动中&#xff0c;走动画与跑动画切换的时候&#x…

Vue2 - Vue.observable 介绍

目录 1&#xff0c;介绍2&#xff0c;使用场景和 Vue 实例的区别 1&#xff0c;介绍 官网参考 可以让一个对象变成响应式数据。在 Vue 内部就是用它来处理传递给 Vue 的 data 对象&#xff0c;或是在单文件组件中 data() 返回的对象。 var vm new Vue({data: {count: 0} })…

qs.stringify 使用arrayFormat属性 + allowDots的数据处理 - 附示例

qs&#xff1a;将url中的参数转为对象&#xff1b;将对象转为url参数形式 一、介绍 1、官方文档&#xff1a; https://github.com/ljharb/qs https://github.com/ljharb/qshttps://github.com/ljharb/qs 二、准备工作 1、安装依赖包 npm install qs --save 2、示例版本 &…

Java循环高级(无限循环,break,continue,Random,逢七过,平方根,判断是否是质数,猜数字小游戏)

文章目录 1.无限循环概念&#xff1a;for格式&#xff1a;while格式&#xff1a;do...while格式&#xff1a;无限循环的注意事项&#xff1a; 2.条件控制语句break:continue: 3. Random使用步骤&#xff1a; 4. 逢七过5. 平方根6.判断是否为质数7. 猜数字小游戏 1.无限循环 概…

【开源项目】智慧交通~超经典开源项目实景三维数字孪生高速

数字孪生高速运营管理平台&#xff0c;以提升高速公路管理水平和方便出行为主要目标&#xff0c;充分利用云计算、AI、大数据等&#xff0c;实现对高速公路控制、指挥、运营的智能化。飞渡科技以实景三维数据为基础&#xff0c;基于大数据、高分遥感、数据分析以及数据融合等前…

QGIS003:【08选择工具栏】-按范围选择、按属性选择、按位置选择

摘要:QGIS工程工具栏包括按范围选择、按属性选择、按位置选择、取消选择等选项,本文介绍各选项的基本操作。 实验数据: 链接:https://pan.baidu.com/s/15GfuR15CxA2OQzURjmjwaQ?pwd=u8sf 提取码:u8sf 一、按范围选择 有矩形框选、多边形选择、手绘选择以及按半径扩展…

T 检验和 Z 检验之间的区别

在统计学领域&#xff0c;假设检验在从数据中得出有意义的结论方面发挥着至关重要的作用。两种常用的统计检验是 T 检验和 Z 检验。虽然这两种检验都用于评估假设&#xff0c;但它们的应用和假设有所不同。 t 检验和 z 检验都假设数据呈正态分布&#xff08;或近似正态分布&…

R_handbook_作图专题

ggplot基本作图 1 条形图 library(ggplot2) ggplot(biopics) geom_histogram(aes(x year_release),binwidth1,fill"gray") 2 堆砌柱状图 ggplot(biopics, aes(xyear_release)) geom_bar(aes(fillsubject_sex)) 3 堆砌比例柱状图 ggplot(biopics, aes(xyear_rele…

echarts常见的一些大屏示意图及配置项【好看】

双立体柱状图 示意图&#xff1a; 配置&#xff1a; initData() {let sideData [220, 182, 191, 234, 290, 330]let sideData1 [100, 110, 120, 134, 190, 230]let nameList [结算能力数, 结算金额]let yAxisData [(金额/亿元), (能力数/个)]let xData [1, 2, 3, 4, 5…

三角函数两角和差公式推导

一.几何推理 1.两角和公式 做一斜边为1的直角△ABC,任意旋转非 k Π , k N kΠ,kN kΠ,kN,补充如图,令 ∠ A B C ∠ α &#xff0c; ∠ C B F ∠ β ∠ABC∠α&#xff0c;∠CBF∠β ∠ABC∠α&#xff0c;∠CBF∠β ∴ ∠ D B F ∠ D B A ∠ α ∠ β 90 , ∠ D A …

vue3-13

token可以是后端api的访问依据&#xff0c;一般绝大多数时候&#xff0c;前端要访问后端的api,后端都要求前端请求需要携带一个有效的token,这个token用于用户的身份校验&#xff0c;通过了校验&#xff0c;后端才会向前端返回数据&#xff0c;进行相应的操作&#xff0c;如果没…

自动驾驶学习笔记(二十四)——车辆控制开发

#Apollo开发者# 学习课程的传送门如下&#xff0c;当您也准备学习自动驾驶时&#xff0c;可以和我一同前往&#xff1a; 《自动驾驶新人之旅》免费课程—> 传送门 《Apollo开放平台9.0专项技术公开课》免费报名—>传送门 文章目录 前言 控制算法 控制标定 控制协议…

【漏洞复现】企望制造ERP系统 RCE漏洞

漏洞描述 企望制造ERP系统是畅捷通公司开发的一款领先的生产管理系统&#xff0c;它以集成化管理为核心设计理念&#xff0c;通过模块化机制&#xff0c;帮助企业实现生产、采购、库存等方面的高效管理。该系统存在RCE远程命令执行漏洞&#xff0c;恶意攻击者可利用此漏洞进行…

【解决复杂链式任务打造全能助手】大模型思维链 CoT 应用:langchain 大模型 结合 做 AutoGPT

大模型思维链 CoT 应用&#xff1a;langchain 大模型 结合 做 AutoGPT&#xff0c;解决复杂链式任务打造全能助手 思维链 CoTlangchainlangchain 大模型结合打造 AutoGPT 思维链 CoT 最初的语言模型都是基于经验的&#xff0c;只能根据词汇之间的相关性输出答案&#xff0c;根…

Android 接入第三方数数科技平台

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、数数科技平台是什么&#xff1f;二、使用步骤1.集成SDK2. 初始化3. 发送事件和设置账号id4. 验证发送事件是否成功 小结 前言 一个成熟的App必然不可缺少对…