机器学习模型5——贝叶斯分类器

news2024/12/25 9:30:04

前置知识

条件概率
贝叶斯公式
(贝叶斯模型还是很好理解的,主要基于高中就学到过的条件概率。)

贝叶斯定理

P(A),P(B)分别是事件A,B发生的概率,而P(A|B)是在事件A在事件B发生的前提下发生的概率,P(AB)是事件A,B同时发生的概率。那么我们的有公式:在这里插入图片描述

那么贝叶斯定理是:clip_image004[8]

注:P(AB)=P(A)P(B)的充分必要条件是事件A和事件B相互独立。用通俗的语言讲就是,事件A是否发生不会影响到事件B发生的概率。

朴素贝叶斯

设样本属性集合为x{x1,x2,x3…xn},n为数目,xi为取值;设c为类别集合,把样本划分为某一类,c={y1,y2,y3…ym}.
假设属性特征相互独立,贝叶斯公式可写为:在这里插入图片描述

拉普拉斯平滑系数

朴素贝叶斯API

这些是基于应用贝叶斯定理和强(朴素)特征独立性假设的监督学习方法。

naive_bayes.BernoulliNB(*[, alpha, ...])Naive Bayes classifier for multivariate Bernoulli models.

naive_bayes.CategoricalNB(*[, alpha, ...])Naive Bayes classifier for categorical features.

naive_bayes.ComplementNB(*[, alpha, ...])The Complement Naive Bayes classifier described in Rennie et al. (2003).

naive_bayes.GaussianNB(*[, priors, ...])Gaussian Naive Bayes (GaussianNB).

naive_bayes.MultinomialNB(*[, alpha, ...])Naive Bayes classifier for multinomial models.

MultinomialNB多项式模型的朴素贝叶斯分类器。

多项式Naive Bayes分类器适用于具有离散特征的分类(例如,文本分类的字数)。多项式分布通常需要整数特征计数。然而,在实践中,分数计数(如tf-idf)也可能有效。

class sklearn.naive_bayes.MultinomialNB(*, alpha=1.0, fit_prior=True, class_prior=None)

参数:

  • alpha: float, default=1.0
    添加剂(拉普拉斯/利德斯通)平滑参数(0表示无平滑)。
  • fit_prior: bool, default=True
    是否学习课堂先验概率。如果错误,将使用统一的优先权。
  • class_prior: array-like of shape (n_classes,), default=None
    类别的先验概率。如果指定,则不根据数据调整优先级。

BernoulliNB多元贝努利模型的朴素贝叶斯分类器

与MultinomialNB一样,该分类器适用于离散数据。不同之处在于,虽然MultinomalNB可以处理出现次数,但BernoulliNB是为二进制/布尔特征设计的。

class sklearn.naive_bayes.BernoulliNB(*, alpha=1.0, binarize=0.0, fit_prior=True, class_prior=None

参数:

  • binarize: float or None, default=0.0
    样本特征的二值化(映射到布尔值)阈值。如果无,则假定输入已经包含二进制矢量。

CategoricalNB分类特征的朴素贝叶斯分类器。

分类朴素贝叶斯分类器适用于具有分类分布的离散特征的分类。每个特征的类别都是从分类分布中得出的。

class sklearn.naive_bayes.CategoricalNB(*, alpha=1.0, fit_prior=True, class_prior=None, min_categories=None)

参数:

  • min_categories:int or array-like of shape (n_features,), default=None
    每个功能的最小类别数。
    integer:将每个要素的最小类别数设置为每个要素的n_categories。
    array-like:shape(n_features,)其中n_categories[i]包含输入的第i列的最小类别数。
    None(default):根据训练数据自动确定类别数。

ComplementNB互补朴素贝叶斯分类器。

互补朴素贝叶斯分类器旨在纠正标准多项式朴素贝叶斯分类器所做的“严重假设”。它特别适合不平衡的数据集。

class sklearn.naive_bayes.ComplementNB(*, alpha=1.0, fit_prior=True, class_prior=None, norm=False)

参数:

  • norm: bool, default=False
    是否执行权重的第二次规格化。默认行为反映了在Mahout和Weka中发现的实现,它们不遵循本文表9中描述的完整算法。

GaussianNB高斯朴素贝叶斯

可以通过partial_fit在线更新模型参数。

class sklearn.naive_bayes.GaussianNB(*, priors=None, var_smoothing=1e-09)[source]

参数:

  • priors:array-like of shape (n_classes,)
    类别的先验概率。如果指定,则不根据数据调整优先级。
  • var_smoothing:float, default=1e-9
    所有特征中最大方差的一部分,添加到方差中以保持计算稳定性。

朴素⻉叶斯优缺点

优点:

  • 朴素⻉叶斯模型发源于古典数学理论,有稳定的分类效率
  • 对缺失数据不太敏感,算法也⽐较简单,常⽤于⽂本分类
  • 分类准确度⾼,速度快

缺点:

  • 由于使⽤了样本属性独⽴性的假设,所以如果特征属性有关联时其效果不好
  • 需要计算先验概率,⽽先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设 的先验模型的原因导致预测效果不佳

参考

1.黑马学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/14386.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Burpsuite实验室之点击劫持

Burpsuite实验室之点击劫持 这是BurpSuit官方的实验室靶场,以下将记录个人点击劫持共5个Lab的通关过程 lab1: Basic clickjacking with CSRF token protection 带CSRF令牌保护的基本点击劫持 目标:官方给了一个账号密码wiener:peter&…

小型点阵屏后台监控系统研发

目 录 一、绪论 1 (一)课题的研究意义 1 (二)设计任务及要求 1 (三)单片机的发展史 2 (四)单片机的发展趋势 3 二、系统的整体结构 5 三、单片机介绍 6 1、单片机引脚介绍 9 2、复位…

感受野计算问题

我觉得以下两篇文章,在感受野的含义和计算上,说的是比较好的。 1、深度学习:VGG(Vision Geometrical Group)论文详细讲解_HanZee的博客-CSDN博客 2、关于感受野的总结 - 知乎 我们知道一个图片经过了一个7 * 7卷积…

【论文笔记】TINYCD: A (Not So) Deep Learning Model For Change Detection

论文 标题:TINYCD: A (Not So) Deep Learning Model For Change Detection paper: https://arxiv.org/abs/2207.13159 code: GitHub - AndreaCodegoni/Tiny_model_4_CD: Official implementation of TINYCD: A (NOT SO) DEEP LEARNING MO…

基于聚类算法:K-means、DBSCA算法完成航空客户价值分析任务 代码+数据

1.任务描述 信息时代的来临使得企业营销焦点从产品中心转变成客户中心。具体地,对不同的客户进行分类管理,给予不同类型的客户制定优化的个性化服务方案,采取不同的营销策略。将有限的营销资源集中于高价值的客户,实现企业利润最大化。因此,如何对客户进行合理的分类成为…

喵 ~ 小程序搭建记录

喵 ~ 小程序搭建记录前言一、搭建分析1. 项目里的页面相关2. 项目里的组件相关3. 项目里的 api 相关4. 项目里的没有用到的东西5. 项目中会用到的 iconfont二、 搭建参考参考博客三、 搭建实现1. 结构搭建2.全局样式导航栏配置tabBar配置四、uniapp项目搭建 请求配置前言 喵 ~…

1702967-37-0,PSMA-617 是prostate特异性膜抗原 (PSMA) 的强有效抑制剂

【产品描述】 Vipivotide tetraxetan (PSMA-617) 是prostate特异性膜抗原 (PSMA) 的强有效抑制剂,其 Ki 值为 0.37 nM。Vipivotide tetraxetan (PSMA-617)由三种成分组成:药效基团Glutamate-urea-Lysine,螯合剂DOTA(能够结合68Ga或177Lu&…

智慧住建工程项目监管数字化管理解决方案

在国家“放管服”大背景下,提高各级住房城乡建设主管部门的服务效能和依法治理水平的呼声越来越高。 住建部《“十四五”建筑业发展规划》提出,基于建筑产业互联网平台建设政府监管平台,把“新监管”提到重要位置,打造“工程项目监…

临时回忆啦啦啦啦

设置为private是为了防止其他类使用当前类的日志对象;如果当前类需要被子类继承,并且都使用同一个日志对象时,可设置为protected 。设置为static是为了让每个类中的日志对象只生成一份,日志对象是属于类的,不是属于具体…

MySQL8.0优化 - 索引的数据结构、B+树、常见索引概念、索引的代价

文章目录学习资料索引的数据结构B树常见索引概念聚簇索引特点优点缺点限制二级索引(辅助索引、非聚簇索引)回表联合索引Innodb的B树索引注意事项1、根页面位置万年不动2、内节点中目录项记录的唯一性3、一个页面最少存储2条记录索引的代价学习资料 【My…

计算机毕业设计ssm+vue基本微信小程序的小学生兴趣延时班预约小程序

项目介绍 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱小学生兴趣延时班预约小程序的设计与开发被用户普遍使用,为方便用户能够可以随时进行小学生兴趣延时班预约小程序的…

mMED影响组蛋白甲基化和表观遗传

2019 年 8 月 8 日,来自美国 NIH 的 Rafael Casellas 与科罗拉多大学 Francisco J. Asturias 在 Cell 杂志上发表文章 《A Pliable Mediator Acts as a Functional Rather Than an ArchitecturalBridge between Promoters and Enhancers》,综合运用 CRIS…

Landsat Collection 2 数据集详细介绍(T1/T2产品差异)

Landsat Collection 2 是对 Landsat 档案的第二次主要再处理工作,它带来了多项数据产品改进,这些改进应用了数据处理、算法开发以及数据访问和分发功能方面的进步。 Landsat Collection 2 包含来自 Landsat 1-9 的 Level-1 数据和来自 Landsat 4-9 的科…

Spring IOC源码:invokeBeanFactoryPostProcessors 后置处理器详解

前言 前面篇幅介绍了Bean配置的解析过程,包括注解、xml配置文件的解析。下面进入refresh方法中另一个重要的节点,即BeanFactoryPostProcessor的注册及其执行过程。 正文 进入refresh,前面篇幅已经介绍了obtainFreshBeanFactory()&#xff…

说出你常用的20个linux命令,你还是只会说ls、cat那20个命令吗?3分钟让你发现新大陆

服务器排障常用命令 🍊 博客主页:作者主页 🍊 简介:云计算领域优质创作者🏆、在校期间参与众多计算机ICT相关的省赛、国赛,斩获系列荣誉。考取华为资深工程师、红帽工程师、阿里云ACP云计算工程等系列认证。…

java图书推荐协同过滤算法网站

目 录 摘 要 2 Abstract 3 1绪论 6 1.1背景和意义 6 1.2国内外发展现状 6 2系统技术分析 7 2.1技术选型 7 2.2 MVC模式 7 3功能分析 8 3.1系统角色 8 3.2系统用例图 8 3.3系统功能 8 3.3.1网站前台功能 8 3.3.2网站后台功能 13 4系…

使用Android辅助功能AccessibilityService实现微信自动聊天【外挂插件】

本文是使用Android辅助功能AccessibilityService实现微信自动聊天demo; 只是为了跟深入的了解Android辅助功能, 提高自身的动手能力。 请勿用于商用,或非法用途。 动手前,基本的准备要求: 聊天机器人app demo,去操作…

供应PEG试剂Azide-PEG-Acrylamide,N3-PEG-ACA,叠氮-聚乙二醇-丙烯酰胺

1、名称 英文:Azide-PEG-Acrylamide,N3-PEG-ACA 中文:叠氮-聚乙二醇-丙烯酰胺 2、CAS编号:N/A 3、所属分类: Acrylate/Acrylamide PEG Azide PEG 4、分子量:可定制,5k、2k、10k、20k、3.4k…

DarkNet网络结构

一、darknet53网络结构图 文字版:卷积(下采样卷积1残差块)(下采样卷积2残差块)(下采样卷积8残差块)(下采样卷积8残差块)(下采样卷积4*残差块) 不难看出,darknet53就是重复堆叠下采样卷积n*残差块(n为残差块的个数)这个结构而组成的。而更基本的结构就是…

数据库视图的基本操作(sql语句)

表视图的增删改查(sql语句) 概念:视图是一张虚拟表,它是从数据库的一张或多张表中导出的表,其内容由查询语句定义。 作用: 简单性、安全性、逻辑数据独立性;如果应用建立在视图上&#xff0c…