机器学习 | 分类算法原理——似然函数

news2024/9/22 13:23:37

Hi,大家好,我是半亩花海。接着上次的逻辑回归继续更新《白话机器学习的数学》这本书的学习笔记,在此分享似然函数这一分类算法原理。本章的分类算法原理基于《基于图像大小进行分类》项目,欢迎大家交流学习!

目录

一、似然函数概述

二、案例分析

1. 设置问题

2. 定义模型

3. 似然函数


一、似然函数概述

数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的 似然性 。 似然函数在 推断统计学 (Statistical inference)中扮演重要角色,如在 最大似然估计 和费雪信息之中的应用等等。

“似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“或然性”或“概率”又有明确的区分。


二、案例分析

1. 设置问题

现在,我们就一起来先求参数的更新表达式吧,但是逻辑回归的目标函数与之前的不一样。

一开始我们把 \boldsymbol{x} 为横向的概率 P(y = 1|x) 定义为 f_{\boldsymbol{\theta}}(\boldsymbol{x}) 了。基于这一点,训练数据的标签 yf_{\boldsymbol{\theta}}(\boldsymbol{x}) 是什么样的关系会比较理想呢?既然 f_{\boldsymbol{\theta}}(\boldsymbol{x}) 是 \boldsymbol{x}横向时的概率,那么在 y = 1f_{\boldsymbol{\theta}}(\boldsymbol{x})=1y = 0f_{\boldsymbol{\theta}}(\boldsymbol{x})=0,这样的关系最为理想。

2. 定义模型

我们把这句话换成如下说法。

  • y = 1 的时候,我们希望概率 P(y = 1|x) (图像为横向的概率)是最大
  • y = 0 的时候,我们希望概率 P(y = 0|x) (图像为纵向的概率)是最大

这适用于全部的训练数据。对于一开始列举的那 6 个训练数据,我们期待的最大概率是这样的:

3. 似然函数

假定所有的训练数据都是互不影响、独立发生的,这种情况下整体的概率就可以用下面的联合概率来表示:

L(\boldsymbol{\theta})=P\left(y^{(1)}=0 \mid \boldsymbol{x}^{(1)}\right) P\left(y^{(2)}=0 \mid \boldsymbol{x}^{(2)}\right) \cdots P\left(y^{(6)}=1 \mid \boldsymbol{x}^{(6)}\right)

联合概率的表达式是可以一般化的,写法如下:

L(\boldsymbol{\theta})=\prod_{i=1}^n P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right)^{y^{(i)}} P\left(y^{(i)}=0 \mid \boldsymbol{x}^{(i)}\right)^{1-y^{(i)}}

虽然看起来有点乱,但就像之前说的那样, 只要把每一个组成部分都理解了就不会那么难了。我们可以分别考虑 y^{(i)}=1 或 y^{(i)}=0 时的 P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right)^{y^{(i)}} P\left(y^{(i)}=\right.\left.0 \mid \boldsymbol{x}^{(i)}\right)^{1-y^{(i)}}P 右上角的 y^{(i)}1-y^{(i)} 表示指数i 表示第 i 次迭代,表示次数

首先向指数 y^{(i)} 代入 1。

\begin{aligned} & P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right)^1 P\left(y^{(i)}=0 \mid \boldsymbol{x}^{(i)}\right)^{1-1} \\ & =P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right)^1 P\left(y^{(i)}=0 \mid \boldsymbol{x}^{(i)}\right)^0 \\ & =P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right) \end{aligned}

这样就只剩 y^{(i)}=1 的概率。同理,y^{(i)}=0 的时候也一样。

\begin{aligned} & P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right)^0 P\left(y^{(i)}=0 \mid \boldsymbol{x}^{(i)}\right)^{1-0} \\ & =P\left(y^{(i)}=1 \mid \boldsymbol{x}^{(i)}\right)^0 P\left(y^{(i)}=0 \mid \boldsymbol{x}^{(i)}\right)^1 \\ & =P\left(y^{(i)}=0 \mid \boldsymbol{x}^{(i)}\right) \end{aligned}

这个表达式利用了任何数字的 0 次方都是 1 的特性。比起区分各种情况的写法,还是汇总到一个表达式的写法更简单。现在我们总算知道它的目标函数。接下来考虑一下使这个目标函数最大化的参数 \theta 吧。(ps:回归的时候处理的是误差,所以要最小化,而现在考虑的是联合概率,我们希望概率尽可能大,所以要最大化

这里的目标函数 L(\theta) 也被称为似然。函数的名字 L 取自似然的英文单词 Likelihood 的首字母,它的意思是最近似的。我们可以认为似然函数 L(\theta) 中,使其值最大的参数 \theta 能够最近似地说明训练数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1964655.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

个性化你的生产力工具:待办事项App定制指南

国内外主流的10款待办事项软件对比:PingCode、Worktile、滴答清单、番茄ToDo、Teambition、Todoist、Microsoft To Do、TickTick、Any.do、Trello。 在寻找合适的待办事项软件时,你是否感到选择众多、难以决断?一个好的待办事项工具可以大大提…

stl-algorithm【1】

#include《algorithm》 交换两数swap(x,y) 不只可以交换两个“数”(数据类型) 翻转【借助迭代器】reverse(it1,it2) 仍是左闭右开

国产开源夜莺部署

使用二进制方式部署夜莺 - 快猫星云 (flashcat.cloud) # install mysql yum -y install mariadb* systemctl enable mariadb systemctl restart mariadb mysql -e "SET PASSWORD FOR rootlocalhost PASSWORD(1234);"# install redis yum install -y redis systemctl…

navicat 17 下载安装

百度网盘 通过网盘分享的文件:Navicat17 链接: https://pan.baidu.com/s/1nFFQzWhjxRUM_X6bVlWNGw?pwd8888 提取码: 8888 1.双击运行安装包 2.点击下一步 2.勾选我同意,点击下一步 3.自定义安装路径,点击下一步 4.注意勾选桌面快捷方式&a…

编程新手指南:从入门到精通

编程小白如何成为大神?大学新生的最佳入门攻略 编程已成为当代大学生的必备技能,但面对众多编程语言和学习资源,新生们常常感到迷茫。如何选择适合自己的编程语言?如何制定有效的学习计划?如何避免常见的学习陷阱&…

基于YOLOv8的高压输电线路异物检测系统

基于YOLOv8的高压输电线路异物检测系统 (价格88) 包含 【“鸟窝”,“风筝”,“气球”,“垃圾”】 4个类 通过PYQT构建UI界面,包含图片检测,视频检测,摄像头实时检测。 (该系统可以根据数…

众人帮蚂蚁帮任务平台修复版源码,含搭建教程。

全修复运营版本的任务平台,支持垂直领域细分,定向导流,带有排行榜功能,任务发布上传审核,用户信用等级,充值接口等等均完美可用。支付对接Z支付免签接口,环境配置及安装教程都已经打包。 搭建环…

ARM学习(31)编译器对overlay方式的支持

ARM学习(31)编译器对overlay方式的支持 1、overlay介绍 overlay:重叠得意思,就是可以重复利用得空间,一般在内存上使用这种空间。比如以Windows操作系统为例,其存储空间(ROM/FLASH)…

springboot垂钓服务系统-计算机毕业设计源码17434

摘要 本文旨在针对垂钓爱好者的需求,基于微信小程序平台,设计并实现一套垂钓服务系统。首先,通过对用户需求进行调研和分析,确定了系统的基本功能模块,包括垂钓点信息展示、用户预约和支付、钓具租赁信息等。接着&…

WebView加载数据的几种方式

之前客户端加载H5时遇到了一些问题,我为了方便解决问题,所以将对应场景复刻到了Demo中,从之前的网络加载模拟为了本地加载Html的方式,但是没想到无意被一个基础知识点卡了一些时间,翻看往昔笔记发现未曾记录这种基础场…

【MATLAB源码】机器视觉与图像识别技术(7)续---BP神经网络

系列文章目录在最后面,各位同仁感兴趣可以看看! BP神经网络 第一节、BP网络定义第二节、BP网络结构及其特点第三节、信息传播方式 信息的正向传播:实质是计算网络的输出误差的反向传播:实质是学习过程第四节、 BP网络的算法流程…

python:plotly 网页交互式数据可视化工具

pip install plotly plotly-5.22.0-py3-none-any.whl pip install plotly_express 包含:GDP数据、餐厅的订单流水数据、鸢尾花 Iris数据集 等等 pip show plotly Name: plotly Version: 5.22.0 Summary: An open-source, interactive data visualization librar…

每日OJ_牛客HJ60 查找组成一个偶数最接近的两个素数

目录 牛客HJ60 查找组成一个偶数最接近的两个素数 解析代码 牛客HJ60 查找组成一个偶数最接近的两个素数 查找组成一个偶数最接近的两个素数_牛客题霸_牛客网 解析代码 首先需要判断素数,素数表示除过1和本身,不能被其它数整除。通过循环遍历来判断一…

飞致云开源社区月度动态报告(2024年7月)

自2023年6月起,中国领先的开源软件公司FIT2CLOUD飞致云以月度为单位发布《飞致云开源社区月度动态报告》,旨在向广大社区用户同步飞致云旗下系列开源软件的发展情况,以及当月主要的产品新版本发布、社区运营成果等相关信息。 飞致云开源大屏…

pycharm怎么使用Anaconda和配置

打开Anaconda Prompt 要删除 Conda 环境 yolov5sconda,你可以使用以下命令: conda remove --name yolov5sconda --all这个命令会删除名为 yolov5sconda 的整个环境,包括其中安装的所有包和依赖项。请在命令提示符或终端中运行此命令。执行此…

Java线程池的设计与使用

Java线程池的设计与使用 多线程情景引入 情景分析 请求积压的情况 系统资源受限: 当大量用户请求同时到来时,服务器受限于内存、CPU、和网络带宽等资源,导致用户长时间等待。后端处理能力限制: 如频率限制措施(每秒或每几秒的访问限制&…

嵌入式day15

数组指针 能够指向整个数组 一维数组: &a,考察a的数据类型 int(*p)[10]:表示一个指向长度为10的一维整型数组的指针 二维数组: 指向函数的指针 函数的函数名,即为函数的入口地址&#x…

亲测推荐!PixPin便捷高效,让你的截图工作轻松搞定,还在等什么?

前言 如果你经常使用电脑,是不是也经常遇到这样的烦恼:需要频繁地截图、标注、编辑图片,可是手里的截图工具却总是那么不给力?要么功能单一,要么操作复杂,让人头疼不已;今天咱们的小江湖就要给大…

企业邮箱收发垃圾邮件拦截吗?

企业邮箱如何拦截垃圾邮件呢?企业邮箱拦截垃圾邮件是采用用户定制化和多层防御机制,确保信息安全。用户参与改进系统,提供技术支持。本文详细介绍了企业邮箱过滤垃圾邮件的机制以及企业邮箱的注册流程。 一、企业邮箱面临的垃圾邮件挑战 1、…

对 vllm 与 ollama 的一些研究

今天咱们来聊聊 vllm 和 ollama 这两个听起来就挺酷的玩意儿。这俩都是现在 AI 圈子里的大明星,专门用来让那些超大型的 AI 模型跑得更顺溜。 先说说 vllm 吧,这家伙的绝活儿是剪枝。啥叫剪枝呢?想象一下,你有个花园,…