机器学习数学基础(2)--最大似然函数

news2025/1/12 6:56:34

声明:本文章是根据网上资料,加上自己整理和理解而成,仅为记录自己学习的点点滴滴。可能有错误,欢迎大家指正。


在机器学习和统计学领域中,似然函数(Likelihood Function)是一个至关重要的概念。它不仅是参数估计的基础,而且在模型选择、模型评估以及众多先进的算法和技术中都有着广泛的应用。

1. 似然VS概率

概率和似然是统计学中两个不同的概念,它们在概念上和应用上都有所区别。以下是通过一个具体例子来展示这两者之间的区别:

1.1  概率(Probability)

定义:概率是在给定的参数下,某个事件发生的可能性。它是未来事件发生的度量,通常用介于0和1之间的数值表示。

例子:假设我们有一个标准的六面骰子,每个面上有1到6的数字。当我们掷骰子时,得到数字6的概率是:𝑃(数字=6)=1/6

在这个例子中,参数是骰子的面数(6面),事件是掷出数字6,概率是已知的,并且是在掷骰子之前就确定的。这里的关键是,概率是在给定参数(骰子的公平性,即所有面出现概率相同)的情况下,事件发生的可能性。

1.2  似然(Likelihood)

定义:似然是在已知观测数据的情况下,这些数据对于不同参数值的支持程度。它不是数据发生的概率,而是在给定数据时参数值的相对合理性。

现在,假设我们不确定骰子是否公平,我们通过掷骰子20次,观察到数字6出现了5次。我们想要估计掷出数字6的真实概率 𝜃:

  • 似然函数 表示为 𝐿(𝜃∣5次6),是 𝜃 的函数,表示在参数 𝜃下观测数据(5次6)的相对可能性。似然函数是: 𝐿(𝜃∣5次6)=\theta ^{5}(1-\theta) ^{20-5}
  • 对𝜃的求解,可用最大似然方法,具体可看后面,这时求出的𝜃的值不一定是1/6。

对比上面的例子:

  • 概率函数 给出了在给定参数下事件发生的可能性。在我们的例子中,它告诉我们在假设骰子公平的情况下,掷出6的概率是 1/6​。

  • 似然函数 用于在已知观测数据的情况下,评估不同参数值的合理性。在我们的例子中,它帮助我们根据观测到的5次6来估计 𝜃 的值。

1.3 两者区别:

  • 概率是已知参数下事件的度量:在概率中,参数是已知的,我们计算的是某个事件发生的可能性。
  • 似然是已知数据下参数的度量:在似然中,数据是已知的,我们评估的是不同参数值对数据的支持程度。
  • 概率是绝对的:概率给出了在给定参数下事件发生的确切概率。
  • 似然是相对的:似然比较了在已知数据下,不同参数值的相对合理性。

总结来说,概率关注的是在给定参数下事件发生的可能性,而似然关注的是在给定数据下参数值的合理性。这两者在统计分析中扮演着不同的角色。

2. 概率函数VS似然函数

2.1 概率函数(Probability Function, PF)

  • 定义:概率函数是描述随机变量取各种可能值的概率。对于离散随机变量,它是一个定义在所有可能结果上的函数;对于连续随机变量,它是一个概率密度函数。

  • 用途:概率函数用于计算在给定参数下,随机变量取特定值或处于某个区间的概率。

(1)概率函数
  • 对于离散型随机变量,概率函数通常指的是概率质量函数(Probability Mass Function, PMF),它给出了随机变量取每个可能值的概率.
  • 对于离散随机变量 X,概率函数可以表示为 P(X=x),满足以下性质:。

    • 非负性:对于所有的 𝑥x,有 𝑃(𝑋=𝑥)≥0。
    • 归一性:所有可能的 𝑥x 上的概率之和为1,即: \sum_{x}^{} P(X=x)=1
    • 对于连续随机变量 X
(2) 概率密度函数(Probability Density Function, PDF)
  • 概率密度函数是用于描述连续型随机变量在某个值或某个区间内取值的概率的函数。
  • 对于连续型随机变量 X,其概率密度函数f(x)表示为 f(x)=\frac{d}{dx}F(x),其中 F(x) 是累积分布函数满足以下性质:
    • 非负性:对于所有的 𝑥,有 𝑓(𝑥)≥0。
    • 归一性:𝑋的整个取值范围内,概率密度函数的积分总和为1,即:\int_{-\infty }^{+\infty}f(x)dx=1

2.2  似然函数(Likelihood Function, LF)

  1. 定义:似然函数是在已知观测数据的情况下,这些数据对于不同参数值的相对可能性。它是参数的函数,用于估计参数。

  2. 用途:似然函数用于参数估计,特别是在最大似然估计中,通过找到使似然函数最大化的参数值。

  3. 数学表示:对于简单随机样本,似然函数可以表示为观测数据的概率函数的乘积: L(\theta )=\prod_{i=1}^{n}f(x_{i}|\theta )其中,𝜃 是参数,x_{i}是观测值,f(x_{i}|\theta ) 是给定参数 𝜃下第 𝑖个观测值的概率密度函数或概率质量函数。

2.3 两者区别:

  • 参数与数据的角色:在概率函数中,参数是已知的,数据是随机的;而在似然函数中,数据是已知的,参数是未知的。
  • 目的:概率函数用于计算特定事件发生的概率,似然函数用于估计模型参数。
  • 形式:概率函数通常与特定的概率分布相关联(如正态分布、二项分布等),而似然函数是观测数据对参数的函数。

例子:假设我们有一个骰子,并且想知道掷出6点的概率 𝜃。

  • 概率函数:如果我们假设骰子是公平的,那么掷出6点的概率函数是 𝑃(6点)=𝜃=1/6。
  • 似然函数:若我们掷了20次,观察到5次6点,似然函数将是 L(\theta )=\theta ^{5}(1-\theta) ^{20-5}。我们通过最大化这个似然函数来估计 𝜃 的值。

3.最大似然估计

极大似然估计(Maximum Likelihood Estimation, MLE)是一种在已知观测数据的情况下估计概率模型参数的方法。它基于以下原则:

  1. 似然函数:首先定义似然函数,它是在给定参数值 \theta 下观测数据 X的概率。对于独立同分布的观测数据 X=\left \{ x_{1},x_{2},...,x_{n}\right \},似然函数可以表示为所有观测数据X的概率密度函数(对于连续型随机变量)或概率质量函数(对于离散型随机变量)的乘积: L(\theta|X )=\prod_{i=1}^{n}f(x_{i}|\theta )

  2. 最大化似然:然后,选择使似然函数达到最大值的参数 \theta。这些参数值被称为极大似然估计值。

  3. 对数转换:为了简化计算,通常对似然函数取对数,因为对数是单调函数,可以将乘积转换为求和:ln L(\theta|X )=\sum_{i=1}^{n}lnf(x_{i}|\theta )

  4. 求解参数:对对数似然函数求导,并找到导数为零的点,这通常涉及到数值优化技术。

  5. 统计性质:在大样本情况下,极大似然估计具有一些良好的统计性质,如一致性(估计值随着样本量的增加而趋近于真实值)和渐近正态性(估计量的分布趋近于正态分布)。

仍然是上面的例子:现在,假设我们不确定骰子是否公平,我们通过掷骰子20次,观察到数字6出现了5次。我们想要估计掷出数字6的真实概率 𝜃:

  • 写出似然函数:根据观测结果(例如,掷20次得到5次6),写出似然函数: L(\theta )=\theta ^{5}(1-\theta )^{15}

  • 取对数:为了简化计算,通常对似然函数取对数,得到对数似然函数: lnL(\theta )=5ln\theta +15ln(1-\theta )

  • 求导数:对 𝜃 求导,并找到导数为零的点,这通常通过设置导数等于零并解方程来完成: \frac{d}{d\theta }[5ln\theta +15ln(1-\theta )]=\frac{5 }{\theta }-\frac{15 }{1-\theta } =0

  • 解方程:解上述导数等于零的方程,得到 𝜃 的值:\frac{5 }{\theta }=\frac{15 }{1-\theta },可得\theta =1/4

  • 得到最大似然估计:解得 \theta =1/4 或 0.25,这就是掷出数字6的最大似然估计概率。

如果骰子是完全公平的,我们期望 θ 接近 1/6,但由于我们的样本数据,我们得到的估计值是 1/4。这可能表明骰子存在偏差,或者仅仅是由于随机变异。

4. 似然比

似然比(Likelihood Ratio)是统计学中用于比较两个统计模型对同一数据集的拟合优度的量。它是两个似然函数值的比率,通常用于模型选择、假设检验和参数估计中。

定义:

似然比 𝜆λ 可以定义为两个模型的似然函数值的比值:​ $\lambda (\theta_{1}, \theta_{2} )=\frac{L(\theta_{1}|X)}{L(\theta_{2}|X)}$其中,L(\theta_{1}|X)L(\theta_{1}|X)分别是参数 𝜃1和 𝜃2​ 下观测数据 𝑋 的似然函数值。

应用:

  1. 模型选择:在比较两个模型时,似然比可以用来评估哪个模型对数据的拟合更好。
  2. 似然比检验:一种统计假设检验方法,用于比较零假设(𝐻0H​)和备择假设(𝐻1​)下的似然函数值。

例子:假设我们有一个简单的数据集,由10个观测值组成,我们想要比较以下两个模型:

  • 模型1(零假设 𝐻0​): 假设观测值来自均值为\mu _{0}​,标准差为 \sigma _{0}的正态分布。
  • 模型2(备择假设 𝐻1​): 假设观测值来自均值为\mu _{1}​,标准差为\sigma _{1}的正态分布。

假设我们观测到的数据是 X={2,3,4,5,6,7,8,9,10,11}。

  • 计算似然函数:首先,我们为每个模型计算似然函数。假设\sigma _{0}​ 和\sigma _{1}是已知的,我们只估计均值 𝜇。

  • 模型1的似然函数(假设 \mu= \mu _{0}​):$L(\mu _{0}|X )=\prod_{i=1}^{10}\frac{1}{\sqrt{2\pi \sigma _{0}^{2}}}exp(-\frac{(x_{i}-\mu _{0})^{^{2}}}{2\sigma _{0}^{2}})$ 

  • 模型2的似然函数(假设\mu= \mu _{1}​): $L(\mu _{1}|X )=\prod_{i=1}^{10}\frac{1}{\sqrt{2\pi \sigma _{1}^{2}}}exp(-\frac{(x_{i}-\mu _{1})^{^{2}}}{2\sigma _{1}^{2}})$

  • 计算似然比$\lambda (\mu _{0}, \mu_{1} )=\frac{L(\mu_{0}|X)}{L(\mu_{1}|X)}$

  • 评估似然比:如果似然比 𝜆 接近1,说明两个模型对数据的拟合程度相似;如果 𝜆 显著大于1,模型1可能更合适;如果 𝜆显著小于1,模型2可能更合适。

  • 似然比检验:在实际应用中,我们通常对数化似然比,并将其与特定的统计量进行比较,以决定是否拒绝零假设。

通过这个例子,我们可以看到似然比如何用于比较不同模型对同一数据集的拟合优度,并在模型选择和假设检验中发挥作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1946840.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

苍穹外卖跟练项目前端localhost打不开页面启动nginx报错[alert] could not open error log file问题解决

一、安装路径为纯英文 查看自己的安装路径是否为纯英文环境,刚开始下载的资料包是有中文路径的,要将资料包中的nginx-1.20.2文件夹复制一份然后粘贴到一个新建的纯英文的目录,我这里装到的是 D:\Program Files\nginx-1.20.2 二、删掉logs文件…

解决Pycharm找不到conda可执行文件

解决: 在 ‘Conda 可执行文件’ 的输入框里面,找到并选中 anaconda\library\bin 路径下的“ conda.bat ” ,再点击‘ 加载环境 ’,即可出现 ‘ 使用现有环境 ’ 的输入框,如图所示。

java8函数式编程学习(二):optional,函数式接口和并行流的学习

简介 java8函数式编程中optional的简单使用,函数式接口的了解,并行流的使用。 optional 可以更优雅的来避免空指针异常。类似于包装类,把具体的数据封装到optional对象内部,然后使用optional的方法去操作封装好的数据。 创建o…

Linux shell编程学习笔记67: tracepath命令 追踪数据包的路由信息

0 前言 网络信息是电脑网络信息安全检查中的一块重要内容,Linux和基于Linux的操作系统,提供了很多的网络命令,今天我们研究tracepath命令。 Tracepath 在大多数 Linux 发行版中都是可用的。如果在你的系统中没有预装,请根据你的…

四、GD32 MCU 常见外设介绍 (7) 7.I2C 模块介绍

7.1.I2C 基础知识 I2C(Inter-Integrated Circuit)总线是一种由Philips公司开发的两线式串行总线,用于内部IC控制的具有多端控制能力的双线双向串行数据总线系统,能够用于替代标准的并行总线,连接各种集成 电路和功能模块。I2C器件能够减少电…

Optima: 一个用于 Tapestri 平台的单细胞多组学数据分析的开源 R 包

分子条形码技术的最新进展使得在单细胞水平进行下一代转录组测序成为可能,例如10 Genomics Chromium和DropSeq。此外,CITE-seq 的出现使得可以在对单个细胞进行转录组分析的基础上同时对表面蛋白进行分析。同时,为了表征 DNA 和蛋白质谱&…

Harmony Next -- 图片选择库:宫格展示、全屏预览

hm_image_select_view OpenHarmony三方库中心仓:https://ohpm.openharmony.cn/#/cn/detail/image_select_view 介绍 Harmony Next 图片选择库,可设置最大选择数量、单行显示数量、横向竖向间隔;点击图片后全屏预览 软件架构 Harmony nex…

云计算复习--虚拟化技术

文章目录 虚拟化技术定义与原理虚拟机监视器(VMM)虚拟化技术服务器虚拟化存储虚拟化网络虚拟化应用虚拟化 关键技术新型虚拟化技术发展进展作业 虚拟化技术定义与原理 定义:虚拟化技术是一种将计算机物理实体(如服务器、存储设备…

NOIP图论 最小生成树——Prim算法(详细图解)

最小生成树的概念 经典题目 prim算法简介 prim算法解析 (详细图解) 代码实现 代码实战 最小生成树的概念 在一给定的无向图G (V, E) 中,(u, v) 代表连接顶点 u 与顶点 v 的边,而 w(u, v) 代表此的边权重,若存在 …

AI绘画进阶工具 ComfyUI 新版来啦!操作界面详解!取消悬浮面板,自带工作流管理功能!(附安装包)

大家好,我是画画的小强 在 7 月初的一次更新中,ComfyUI 官方推出了 Beta 版 UI,取消了原本的悬浮面板,还新增了工作流管理功能,整体使用体验比之前好了很多。今天就为大家详细介绍一些新版 UI 的特点和用法。 一、启…

GraphRAG + GPT-4o mini 低成本构建 AI 图谱知识库

更好的效果,更低的价格,听起来是不是像梦呓? 限制 首先,让我们来介绍一个词:RAG。 简单来说,RAG(Retrieval-Augmented Generation,检索增强生成) 的工作原理是将大型文档…

每日一题 二叉树的中序遍历

1.题目描述 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 2.题目思路 遇到二叉树问题,首先考虑用递归来实现,首先它是中序遍历.我们可以拆分成子问题来解决,即先遍历二叉树的左子树,在遍历自身,在遍历右子树即可 3.代码书写 List<Integer> list …

免杀笔记 -->API的整理Shellcode加密(过DeFender)

最近更新频率明显下降我懒&#xff0c;那么今天就来记录一下我们的一些常用的API的整理以及ShellCode的加密。 1.WinAPI整理 问我为什么要整理&#xff1f; 就是用起来的时候要左翻右翻 &#xff1a;&#xff1a; 烦死了 1.VirtualAlloc VirtualAlloc(NULL,sizeof(buf),MEM_…

声音克隆一键本地化部署 GPT-SoVITS

文章目录 GPT-SoVITS 介绍1:GPT-SoVITS安装2:GPT-SoVITS使用2.1 人声伴奏分离,去混响去延时工具2.2 语音切分工具2.3 语音降噪工具2.4 中文批量离线ASR工具2.5 语音文本校对标注工具GPT-SoVITS 介绍 GPT-SoVITS: 是一个由RVC变声器创始人“花儿不哭”推出的免费开源项目。…

php 做一个mqtt按钮,发布触发信号

在之前博客php 做一个文件下载服务器&#xff0c;得避免跨路径工具&#xff0c;安全很重要 中加了一个按钮&#xff0c;触发物联网设备返回数据。基于mqtt开发&#xff0c;如果想知道mqtt如何搭建&#xff0c;可以看我的博客【MQTT&#xff08;1&#xff09;】服务端的搭建 效…

JavaEE - HTTP状态码

Web服务器 浏览器和服务器两端进行数据交互&#xff0c;使用的就是HTTP协议&#xff08;HTTP客⼾端和 HTTP服务器之间的交互数据 的格式&#xff09;。 Web服务器就是对HTTP协议进⾏封装,程序员不需要直接对协议进⾏操作(⾃⼰写代码去解析http协议 规则)&#xff0c;让Web开发更…

2 YOLO8的使用

1 介绍 YOLOv8是YOLO (You Only Look Once) 目标检测模型系列的最新版本&#xff0c;由Ultralytics公司开发和维护。YOLOv8是在先前版本的基础上进行的重大更新&#xff0c;不仅提升了性能&#xff0c;还增加了更多的功能&#xff0c;它不仅能够进行目标检测&#xff0c;还能完…

构建智慧水利系统,优化水资源管理:结合物联网、云计算等先进技术,打造全方位、高效的水利管理系统,实现水资源的最大化利用

本文关键词&#xff1a;智慧水利、智慧水利工程、智慧水利发展前景、智慧水利技术、智慧水利信息化系统、智慧水利解决方案、数字水利和智慧水利、数字水利工程、数字水利建设、数字水利概念、人水和协、智慧水库、智慧水库管理平台、智慧水库建设方案、智慧水库解决方案、智慧…

RBAC权限管理设置

RBAC权限管理设置 RBAC&#xff08;Role-Based Access Control&#xff0c;基于角色的访问控制&#xff09;是一种常用的访问控制机制&#xff0c;用于管理系统中的用户权限。RBAC通过将用户分配给角色&#xff0c;并将权限授予角色&#xff0c;从而控制用户对资源的访问。 基…

BUU [BSidesCF 2020]Cards

BUU [BSidesCF 2020]Cards 开题&#xff1a; 做题目之前先了解一下21点的规则&#xff1a; 二十一点玩法规则和概率在二十一点游戏中&#xff0c;拥有最高点数的玩家获胜&#xff0c;其点数必须等于或低于21点&#xff1b;超过21点的玩家称为爆牌。 2点至10点的牌以牌面的点数…