一篇博客详解朴素贝叶斯解分类问题

news2025/1/11 20:57:06

目录

  • 回归问题
    • 正则化Regularization
  • 分类问题—类别之间是独立的
    • 为什么不用回归解分类问题
    • 以概率的形式解分类问题
      • 抽盒机率→分类机率
      • 正态分布覆盖
        • 原理
        • 高斯分布函数
      • 极大似然估计求最优参数
    • 朴素贝叶斯法
      • 用同一个协方差
      • 三步骤
        • 模型的简化

回归问题

大概内容与之前的类似,步骤仍是三步:详见我的另一篇博客
深度学习

  1. 定义function或neural network
  2. 定义loss函数,一般采取值越低越好,有MAE、MSE、Cross Entry等
  3. 定义optimization,选择最优的参数

正则化Regularization

在这里插入图片描述
正则化是解决过拟合的一种方式

重新定义loss函数,loss函数既包括原来的损失,又包括weight参数的平方和(不加bias的原因是:function曲线的平滑与否与bias无关)

L o s s n e w = L o s s o l d + λ ∑ i = 1 n ( w i ) 2 , λ 是 超 参 数 Loss_{new}=Loss_{old}+\lambda \sum _{i=1} ^n (w_i)^2,\lambda 是超参数 Lossnew=Lossold+λi=1n(wi)2,λ

我们一般期待比较平滑的最终的神经网络function,目的是为了减少输入噪声的影响。而比较平衡的function就要求它的输出对输入不敏感,也就要求输入的系数要比较小。

分类问题—类别之间是独立的

分类网课视频
https://zhuanlan.zhihu.com/p/127993180

为什么不用回归解分类问题

回归问题的求最佳参数过程中,会利用gradient
descent根据loss值对参数进行更新,从而选择一个loss最小的参数对应的函数。而这个函数可能并不适用于分类问题(下图以二分类为例)的函数解。

在这里插入图片描述

以概率的形式解分类问题

在做回归Regression时,output为真实有意义的数字,而在做分类classification时,output为离散的数字discret ,并没有实际意义。

抽盒机率→分类机率

在这里插入图片描述

在这里插入图片描述

抽盒时,设选中Box 1的概率为2/3,选中Box 2的概率是1/3。而Box 2中选中蓝球的概率是4/5,Box
2中选中蓝球的概率是2/5,故根据 贝叶斯公式 选中蓝球而它是来自Box 1的概率是

P ( B o x 1 ∣ B l u e ) = P ( B o x 1 ) × P ( B l u e ∣ B o x 1 ) P ( B o x 1 ) × P ( B l u e ∣ B o x 1 ) + P ( B o x 2 ) × P ( B l u e ∣ B o x 2 ) P(Box_1|Blue)=\frac {P(Box_1) \times P(Blue|Box_1)} {P(Box_1) \times P(Blue|Box_1)+P(Box_2) \times P(Blue|Box_2)} P(Box1Blue)=P(Box1)×P(BlueBox1)+P(Box2)×P(BlueBox2)P(Box1)×P(BlueBox1)

而将其演变为分类问题。则选中一个物体它是来自Class 1的概率是

P ( C 1 ∣ o ) = P ( C 1 ) × P ( o ∣ C 1 ) ∑ i = 1 n P ( C i ) × P ( o ∣ C i ) , P ( C i ) = n u m C i n u m a l l P(C_1|o)=\frac {P(C_1) \times P(o|C_1)} {\sum _{i=1} ^n P(C_i) \times P(o|C_i)},P(C_i)=\frac {num_{C_i}} {num_{all}} P(C1o)=i=1nP(Ci)×P(oCi)P(C1)×P(oC1)P(Ci)=numallnumCi

式中的P(Ci)很好求,根据样本总数以及该类别的总数目即可算出,难点是P(o|Ci)的计算

正态分布覆盖

原理

计算P(o|Ci)我们采用正态分布(Gaussian
Distribution)
因为可以把Ci想象成从一个正态分布中选出的若干个对象,这些对象即组成了样本中的Ci。而仍有一些其他的对象(也是该分布中的),但是并不在样本中的Ci。我们构造的分类器即可以通过输入这些对象,得到它所属的类别(分类)

在这里插入图片描述

也就是说一个分布产生一个类别。我们要做的即是根据所给训练集的样本分类推导出每个类别对应的分布函数。从而即可根据这些分布函数判断出是或不是这个类别(函数输出值>0.5则是该类别)。

在这里插入图片描述

高斯分布函数

f μ , Σ ( x ) = 1 ( 2 π ) D 2 1 ∣ Σ ∣ 1 2 e x p ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f_{\mu,\Sigma}(x)=\frac 1 {(2\pi)^\frac D 2} \frac 1 {|\Sigma|^\frac 1 2} exp(- \frac 1 2(x-\mu)^T \Sigma ^{-1} (x-\mu)) fμ,Σ(x)=(2π)2D1Σ211exp(21(xμ)TΣ1(xμ))

其中μ是这一类别的对象特征值的均值

Σ是这一类别的对象特征值的协方差矩阵

在这里插入图片描述

极大似然估计求最优参数

至于求μ和Σ,我们采用极大似然估计法,有两种计算方法:

  • 分别求μ和Σ对f的导函数,当其导函数为0时,则可求出Σ和μ值
  • 利用数学公式
    μ = 1 n ∑ i = 1 n x i , Σ = 1 n ∑ i = 1 n ( x i − μ ) ( x i − μ ) T \mu=\frac 1 n\sum _{i=1}^n x^i,\Sigma=\frac 1 n \sum _{i=1} ^n (x^i-\mu)(x^i-\mu)^T μ=n1i=1nxi,Σ=n1i=1n(xiμ)(xiμ)T

朴素贝叶斯法

但是如果按照上面的方案,这样每一个类别,它都会有自己的Σ,而Σ的参数数量是输入特征量的平方,所以既会导致输入参数过多,也会导致准确度降低。因此我们通常采用所有的类别有自己的μ,但是共用一个Σ

用同一个协方差

所有类别的正态分布函数均用同一个协方差会使边界boundary为直线liner model, 下面介绍这个Σ的求法:

Σ a l l = ∑ i = 1 n n u m C i n u m a l l Σ i \Sigma_{all}=\sum _{i=1} ^n \frac {num_{C_i}}{num_{all}} \Sigma_i Σall=i=1nnumallnumCiΣi

在这里插入图片描述

三步骤

  • 定义模型
    P ( C 1 ∣ o ) = P ( C 1 ) × P ( o ∣ C 1 ) ∑ i = 1 n P ( C i ) × P ( o ∣ C i ) , P ( C i ) = n u m C i n u m a l l P(C_1|o)=\frac {P(C_1) \times P(o|C_1)} {\sum _{i=1} ^n P(C_i) \times P(o|C_i)},P(C_i)=\frac {num_{C_i}} {num_{all}} P(C1o)=i=1nP(Ci)×P(oCi)P(C1)×P(oC1)P(Ci)=numallnumCi

    模型的简化

    在这里插入图片描述
    化简过程

    这也可以解释,为什么共用Σ,边界是直线

    所有类别的正态分布函数均用同一个协方差会使边界boundary为直线liner model

    之后我们会讲解如何直接得到w和b

  • 通过什么来评价模型中函数的好坏

    例如采用高斯分布,是通过μ和Σ来确定模型中函数的好坏

  • 寻找分布函数的最优参数

    通过极大似然估计

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/75148.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

工业ESD防静电闸机系统帮助您实现静电监控自如!

如何有效检测、消除静电,对元器件品质进行有效管控?现在工厂常用的设备有腕带接地、电阻测试仪,ESD防静电系统,但是这些都是在我们生产的同时去监控处理掉静电,那么有没有一种能直接从人体根源消除掉静电的系统呢&…

Postman 的简单使用

什么是Postman 在程序开发中用于调试网络程序或者跟踪网页请求。可以对网页进行简单的基本信息调试。Postman最早是作用chrome浏览器插件存在的,但是2018年初Chrome停止对Chrome应用程序的支持。所以现在Postman提供了独立的安装包,不再依赖于Chrome浏览…

MySQL innodb引擎架构分析-Buffer Pool

文章目录系列文章目录前言一、Buffer Pool是什么?二、Buffer Pool是如何工作的?1. free链2. flush链根据脏页的情况(阈值)和相关配置刷新自适应刷脏3. Lru升级链总结参数:innodb_buffer_pool_size参数:innodb_buffer_pool_instanc…

避免重要数据泄露的8种方式

得益于国家的大力支持,我国数字化经济已开启高速发展模式,数据已经成为企业不可或缺的重要资产,相对应的数据安全风险问题也随之而来。 数据泄露不仅给企业带来了财产损失,也给企业带来了极大的声誉威胁。以下是日常生活中企业和…

W公司对接奥迪Audi EDI项目案例

项目背景 奥迪(Audi)是德国大众汽车集团子公司奥迪汽车公司旗下的豪华汽车品牌,作为高技术水平、质量标准、创新能力、以及经典车型款式的代表,奥迪是汽车品牌之一。公司总部设在德国的英戈尔施塔特,并在中国等许多国…

ASA防火墙高级配置——NAT控制欲NAT豁免

作者简介:一名在校云计算网络运维学生、每天分享网络运维的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.NAT控制欲NAT豁免 1.禁用NAT控制 1)出站(Outbou…

2021全国高校计算机能力挑战赛(初赛java)(部分)

数据1 input: 4 L G D U 7 L Y C N 2 T G E N 1 T R E P 4 output: 1 1 数据2 input: 6 L G D E 7 L Y C N 4 T G E N 4 T Y E P 3 L Y C N 2 T G D N 3 output: 1 1 package com.第四届校内模拟;import java.util.Scanner;/*** Author Lunau* Create 2022-12-09 18:02* Descri…

使用 ESP-DL 深度学习库基于 ESP32-S3 实现手势识别

人工智能改变了计算机与现实世界交互的方式。过去,人们通过微小的低功率设备和传感器获取数据,并传输至云端进行决策。这样的方式在设备连接性、成本和数据隐私方面带来了一定挑战。相对地,边缘人工智能是在物理设备上另一种处理数据的方式&a…

11.javase_面向对象1

一.面向对象介绍 1.1并不是一个技术,而是一种编程指导思想 1.2以什么形式组织代码;以什么思路解决问题 1.3为什么要用面向对象编程: 因为生活中,我们解决问题时,就是采用这种指导思想去解决的。 所以,我们写…

Codeforces Round #792 (Div. 1 + Div. 2)

比赛链接:Dashboard - Codeforces Round #792 (Div. 1 Div. 2) - Codeforces A: 思维 题意:Alice和Bob在玩游戏,每次等Alice交换两个不同位置的数后,Bob就会删除最后一个位置上的数,当最终只剩下一个数后&#xff0c…

基于对抗互信息学习特征解耦的零样本语音转换|INTERSPEECH 2022

零样本语音转换在转换时只需目标说话人的一段语音,更适合实际应用需求,具有广泛应用前景。 现有工作只考虑内容和音色表征的解耦,没有考虑与语音旋律相关的 韵律 和 音高 表征,导致与音高和韵律相关的信息泄露到音色中。 本文利用…

Flutter - Stack 与 Positioned 层叠布局

1 层叠布局和 Web 中的绝对定位、Android 中的 Frame 布局是相似的 2 子组件可以根据距父容器四个角的位置来确定自身的位置。 3 层叠布局允许子组件按照代码中声明的顺序堆叠起来。 4 Flutter中使用Stack和Positioned这两个组件来配合实现绝对定位。 5 Stack允许子组件堆叠&am…

什么是数据为先营销?为什么它对市场部如此重要?

数据为先营销希望能帮助各地的市场人员与高管们建立联系,实现这些商业目标,并真正学会如何适当地跟踪一切数据,这样他们就知道自己是否真的达到了收入目标,ROI,这些商业目标,而不是仅仅说我们是被数据驱动型…

先进的数字隔离技术提高了太阳能逆变器的可靠性

介绍 一个多世纪以来,化石燃料发电设施一直被证明是坚固可靠的能源,但这些久经考验的电力设施规模大、复杂,而且建造成本越来越高。以最小的碳足迹和环境影响清洁地操作它们也具有挑战性和成本高昂。相比之下,现代光伏&#xff0…

CSDN涨粉就这几招

目录说明涨粉不可不知的几件事几个常规的涨粉之道CSDN的数据运营之道粉丝列表关注列表关注某人取消关注获得某个用户的主要信息:昵称、排名、原创数、粉丝数等其它数据有了数据,怎么涨粉?说明 直到今年,我才开始重视涨粉&#xf…

_2LeetCode代码随想录算法训练营第二天C++

_2LeetCode代码随想录算法训练营第二天C LeetCode 题目列表: 977.有序数组的平方209.长度最小的子数组59.螺旋矩阵II 977.有序数组的平方 题目所述数组含有负数。 双指针的思路 双指针的思路: 最大元素一定是在两边,考虑用两个指针逐步…

PHY寄存器解读

以太网PHY寄存器分析 1 1、以太网PHY标准寄存器分析 2 1.1 Control Register 2 1.2 Status register 5 1.3 PHY Identifier Register 8 1.4 Auto-Negotiation Advertisement Register 8 1.5 Auto-Negotiation Link Partner Base Page Ability Register…

NY CREATE和Bleximo宣布达成新量子计算研发合作

(图片来源:网络) 12月7日,全栈量子计算系统集成公司Bleximo Corp.宣布:计划将其原型设计和营销业务扩展到纽约北部的奥尔巴尼纳米技术综合体(Albany NanoTech Complex)。该公司还将与纽约研究、经济发展、技术、工程和…

llvm编译、自带例子toy、llvm编译报错解决、.lib中搜索指定函数名

hunterzju/llvm-tutorial cs.cmu.edu/academic/class/15745-s14/public/lectures 编译llvm cd /d d:\llvm-home\ git clone gitgitcode.net:pubz/llvm-project.gitcd /d d:\llvm-home\llvm-project\ git status #HEAD detached at llvmorg-11.0.0set PATH%PATH%;D:\Python38\S…

ImmunoChemistry丨艾美捷NIR-FLIVO 690游离染料对照试验说明书

ImmunoChemistry艾美捷ICT近红外(NIR)-FLIVO示踪剂与无NIR-FLIVO染料对照分析结合使用。无NIR-FLIVO染料控制试验使用无NIR-FRIVO染料检测试剂(*Dylight690游离染料)。注射时,游离染料对照物和示踪物试剂都会产生荧光信…