【极大似然性】不同函数(均方误差、交叉熵、KL 散度)不同结局(1/2)

news2025/1/11 18:39:05

Kowshik chilamkurthy

 

一、说明

        很多时候,数据科学家和机器学习从业者并不欣赏不同损失指标之间的数学和直观关系,如负对数似然、交叉熵、最大似然估计、Kullback-Leibler (KL) 散度,以及最重要的均方误差。如果我说KL-散度和均方误差在数学上是相同的,你不会感到惊讶吗?
        作为一名经验丰富的数据科学家,我对这些数学关系在AI / ML课程和教科书中没有得到应有的重视这一事实感到困惑。在这篇博客中,我的目标是在这些不同的损失之间建立坚实的数学和直观关系,这些损失用于分类、回归、GANS等不同问题。

        该博客极大地帮助数据科学家加深对不同损失指标的理解,并帮助有抱负的数据科学家破解机器学习访谈。

二、所有损失函数之母:最大似然估计

        最大似然法用于参数估计。通常在机器学习中,每个模型都包含自己的一组参数,例如,线性模型y = mx + c:权重/斜率m和截距c是最终定义模型的参数。

        现在的挑战是在提供数据时找到模型参数。最大似然估计是一种确定参数值的方法。但是它是如何完成的呢?直观地找到参数值,使它们最大化预测接近观测值的可能性。

        总搜索空间中设置的最大化似然函数的参数称为最大似然估计。

三、多语教育背后的数学

        最大可能性的逻辑既直观又灵活。数学简单而优雅,随波逐流。

        1:假设我们要构建一个参数为 θ 的模型。 其中 θ: [θ₀, θ₁, θ₂,θ₃ ...θn]^T,例如线性回归 (y = mx + c) 模型 θ: [m, c]。其中 Θ 称为参数空间。在线性回归情况下,Θ 是 [(m, c), (m₀, c₀)、m, c₁)的不同组合的搜索空间......mn, cn]。

        2:多语教育的目标是找到最好的。 最大似然估计的目标是确定最佳参数 θk ∈ Θ。例如,在线性回归中,θk: mk, ck)。

        3: 找到正确参数集 θk 的方法是使用似然函数。如果仔细理解,这个概念很简单。让我们再次假设我们的线性(y = mx + c)模型,对于给定的数据点(xp,yp)和参数θkmk,ck)。

        4PDF:fpyp, θk) 告诉模型预测的概率 yp,如果实际标签是 yp。很简单,你掷硬币,看到正面pdf:f(Head)告诉我们你看到正面的可能性有多大。

概率密度函数

        5: fp(yp, θk) 针对一个数据点 p,但我们需要为所有数据点 y₀, y₁, y₂,y₃ ...YN)。我们如何做到这一点,我们可以使用联合概率分布来考虑所有数据点。

联合概率分布

        注意:

对于自变量和同分布随机变量,联合概率分布 fny; θ) 将是单变量密度函数 fpyp, θk) 的乘积

        6:对于给定的参数 θ k,联合密度函数 f(y, θk) 告诉我看到 y 分布等于观察到的 y 分布的可能性有多大。现在反过来,我们要找到 θk,以便我看到最接近观察到的 y 分布的 y 分布。这种反向JDF称为似然函数。

似然函数

        7:因此,我们搜索所有参数空间θΘ,使似然函数最大化的特定值θk称为最大似然估计(MLE)。

最大似然估计

8:在实践中,使用似然函数的自然对数通常很方便,称为对数似然:

对数似然

        最大化对数似然与最大化可能性相同。由于“log”是一个递增函数,因此最大化对数似然函数的 Θ 值也将最大化似然函数。

四、损失:负对数可能性(预告片)

        在结束博客之前,让我先提一个预告片:MLE的一个非常明显的损失是对数似然为负。它是多类分类中使用的损失函数。损失通常最小化,因此我们在上述等式中使用负号,因此称为负对数似然损失。我们最小化负对数似然损失,从而实现最大似然估计。

五、结论

        几乎所有常见的损失函数都可以从最大似然估计中导出。在我的下一篇文章中,我们将了解如何从数学上推导它们,并欣赏回归、分类和 GAN 中使用的这些看似不同的损失函数之间的相似之处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/815716.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

工业RFID读写器在食品饮料加工生产的应用!

当前食品饮料加工行业快速发展,得益于科技的应用,科技不仅提高了生产效率,还提升了食品生产质量和食品安全水平。其中,RFID技术在食品饮料行业中的应用对于加工生产帮助很大,RFID技术未来在食品饮料行业仍有巨大的潜力…

进阶高级测试专项,Pytest自动化测试框架总结(四)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 1、pytest之不只是…

B. Longest Divisors Interval(连续倍数)

题目&#xff1a;Problem - B - Codeforces 总结&#xff1a; 对于连续的倍数&#xff0c;要想连续的数量越大连续的数越小 对于该题遍历50就可以AC 代码献上&#xff08;连续倍数&#xff09;&#xff1a; #include<iostream> #include<cmath>using namespace…

Indo-1 AM,112926-02-0,INDO-1, AM,钙离子荧光探针

资料编辑|陕西新研博美生物科技有限公司小编MISSwu​ PART1----产品描述 Indo-1 AM钙离子荧光探针&#xff08;112926-02-0&#xff09;&#xff0c;一种荧光 Ca2 指示剂 (λex340 nm&#xff0c;λem405/485 nm)。Indo-1属紫外激发Ca2荧光指示剂&#xff0c;也是目前常用的钙…

1018 Public Bike Management (PAT甲级)

这道题一开始测试点7过不了&#xff0c;后来发现是需要“output the one that requires minimum number of bikes that we must take back to PBMC”&#xff0c;补上就可以了。 #include <cstdio> #include <vector> #include <algorithm> #include <se…

小红书运营推广方法分享

大家好&#xff0c;我是网媒智星&#xff0c;今天跟大家讨论一下小红书的运营推广方法&#xff0c;总结了七点经验分享给大家。 首先&#xff0c;让我们了解一下什么是热门文案。热门文案可从以下三个方面来定义&#xff1a; 1. 阅读量&#xff1a;如果一篇小红书的阅读量达到上…

汽车后视镜反射率测定仪

汽车后视镜位于汽车头部的左右两侧&#xff0c;顶部以及汽车内部的前方。汽车后视镜反映汽车正后方视野、两侧视野和汽车前端区域视野&#xff0c;以便驾驶员可以间接看清楚这些位置的情况&#xff0c;它起着“第二只眼睛”的作用&#xff0c;扩大了驾驶者的视野范围&#xff0…

手写自定义的spring-boot-start

需求&#xff1a;手写一个加密的spring-boot-start&#xff0c;按着用户定义的加密算法&#xff08;可选&#xff1a;MD5、SHA&#xff09;去加密内容 新建一个maven项目 新建好的项目结构和pom.xml如图 添加pom.xml 完整的pom.xml文件 <?xml version"1.0" …

高并发下判重难?架构必备技能 - 布隆过滤器

系列文章目录 当Dubbo遇到高并发&#xff1a;探究流量控制解决方案 主从选举机制&#xff0c;架构高可用性的不二选择 高并发下判重难&#xff1f;架构必备技能 - 布隆过滤器 系列文章目录前言一、布隆过滤器简介二、特性与应用场景三、参数定制四、java版本的Demo五、总结 前…

七个步骤, 编写一个 Servlet 的 HelloWorld 程序

目录 1.创建项目 2.引入依赖 ①直接粘贴仓库目标地址代码 ② 下载jar包, 然后导入jar包 3.创建目录 4.编写代码 5.打包代码 6. 部署程序 ①使用IDEA打成war包 ②更方便的部署方式 7.验证程序 1.创建项目 使用IDEA创建一个maven项目 2.引入依赖 引入依赖的方式两种…

selenium-web自动化测试

一、selenium环境部署 1.准备chrome浏览器&#xff08;其他浏览器也行&#xff09; 2.准备chrome驱动包 步骤一&#xff1a;查看自己的谷歌浏览器版本(浏览器版本和驱动版本一定要对应) 步骤二&#xff1a;下载对应的驱动包, 下载路径 : ChromeDriver - WebDriver for Chrom…

环境搭建的上手指南

前言 测试环境是QA开展测试工作的前置条件。稳定和可控的测试环境&#xff0c;可以使测试人员在执行测试用例时无需花费额外的时间去维护。 有些公司运维或者研发部门会帮忙准备好测试环境&#xff0c;但是QA如果一味依赖其他部门&#xff0c;会局限测试工作的开展。 一、什…

OSPF随记

邻居状态机&#xff1a;进度条 工作原理&#xff1a; 1.发送hello报文&#xff0c;建立邻居关系 down&#xff1a;没有发送报文之前 init:开始发送hello报文&#xff0c;自己收到的hello报文中没有自己的route-id 2way:收到的hello报文中有自己的route-id&#xff08;在2w…

selenium如何打开浏览器,等待用户输入完成后,再运行

selenium如何打开浏览器&#xff0c;等待用户输入完成后&#xff0c;再运行 一、在脚本中&#xff0c;等待用户输入 在使用 Selenium 打开浏览器后等待用户输入完成&#xff0c;可以使用 Python 编写一个简单的脚本来实现。首先&#xff0c;确保你已经安装了 Selenium 和对应的…

这 4 个系统可靠性评估指标,可能比 MTTR 更靠谱!

如果要评选研发效能管理中最重要的 10 个度量指标&#xff0c;相信 MTTR&#xff08;Mean Time to Recover&#xff0c;平均恢复时间&#xff09;一定榜上有名。 MTTR 代表一定周期内可修复系统不可用状态的平均持续时长&#xff0c;可以帮助企业更好地理解技术团队与研发工作…

GPU显卡驱动安装

查看GPU版本 lspci | grep -i nvidia从下面的网址ThePCI ID Repository中输入ID查看对应的GPU版本 官网NVIDIA下载对应的驱动 安装下载的文件 sudo sh ./NVIDIA-Linux-x86_64-535.86.05.run 检验是否安装成功 nvidia-smi

机器学习-Regression

机器学习(Regression:Case Study) 前言&#xff1a; 学习资料 videopptblog Example Application 建立一个model&#xff0c;将宝可梦的一些数据作为输入&#xff0c;然后输出宝可梦进化以后的战斗力CP值&#xff0c;这个model的建立尤为重要&#xff0c;但是这个模型的建立…

目标检测中 anchor base和anchor free

目标检测中两种不同anchor的生成 趋势&#xff1a;anchor free越来越受到实时性检测的青睐&#xff0c;&#xff0c;&#xff0c;

redis 高级篇 redis 源码的读取分析

一 redis源码分析 1.1 源码分析 1每一个kv键值对应有一个dictEntry。 2.底层数据结构

《QDebug 2023年7月》

一、Qt Widgets 问题交流 1.QPainter旋转角度绘制线条的一点问题 QPainter 旋转角度&#xff0c;等距绘制若干线条&#xff0c;会出现绘制不均匀的情况&#xff1a; 但是在测试 QML Canvas 绘制时&#xff0c;发现效果是正常的&#xff0c;原来是因为 Canvas 默认的 capStyle…