生成模型之高斯判别分析(GDA)和贝叶斯

news2025/1/12 10:52:24

生成模型与判别模型的区别

判别模型的学习算法学习给定x下的条件分布p(y|x; θ),

例如,Logistic Regression(对数几率回归)将p(y|x; θ)建模为h_{\theta } = g(\theta ^{T}x),g是sigmoid函数。

考虑一个分类问题,基于动物的某些特征想要区分大象(y=1)和狗狗(y=0)。给定一个数据集,类似LR或者感知机的算法尝试找到一条直线(超平面),也就是决策边界,将大象和狗狗分开。然后,当新样本要将其分类为大象类和狗狗类时,只需要检查新样本落在决策边界的哪一边,然后再对新样本进行预测。

这篇博客要谈的是另外一类学习算法,与上面的方法不同,首先看大象,构建一个大象长什么样子的模型,然后看狗狗,构建一个狗狗长什么样的分离模型,最后当输入一个新动物时,将这个新动物与大象模型和狗狗模型分别进行匹配,看新动物是更像大象还是更像狗狗。

直接学习p(y|x)或者尝试学习到一个从输入空间到输出标签{0,1}的映射(例如感知机算法)的学习算法叫做判别学习算法,这样的模型叫做判别模型

生成式学习算法与判别式算法不同,它尝试对p(x|y)和p(y)进行建模,例如,如果y表示一个样本是狗狗(y=0)或者大象(y=1),则p(x|y=0)对狗狗的特征分布进行建模,p(x|y=1)对大象的特征进行建模。

当建模了p(y)(类先验)和p(x|y),可以使用贝叶斯公式导出给定x时y的后验分布:

p(y|x) = \frac{p(x|y)p(y))}{p(x)}

p(x) = p(x|y=1)p(y=1) + p(x|y=0)p(y=0)

预测的时候:

 高斯判别分析模型(GDA)

当输入特征x是连续值的随机变量,可以使用高斯判别分析(Gaussian Discriminant Analysis, GDA),GDA使用多维正态分布对p(x|y)进行建模,模型如下:

 写成分布的形式:

模型的参数是 \phi, \sum,  \mu _{0}\mu _{1},均值向量不同,协方差矩阵相同。

对数似然:

通过最大似然估计其参数如下:

算法的分类效果如下:

 使用两个高斯分布来拟合两个类的数据,这两个高斯的等高线有相同的形状和方向,因为它们的协方差相同。这两个高斯的均值不同。

 朴素贝叶斯

 在GDA中,特征向量x是连续的实数,当特征向量的值是离散时可以使用贝叶斯模型。例如,如果想使用机器学习做一个垃圾邮件过滤器,将邮件信息分类为垃圾广告邮件和非垃圾邮件。我们有一个训练集(带标签的数据),特征向量的长度等于词典的长度,如果一个邮件包含第j个单词,则这个特征设置为1;否则,设置为0。例如,一个样本邮件的特征向量如下:

有了特征向量,我们构建一个生成模型来对p(x|y)来建模。假定x_{i}在给定的y下条件独立,这个假设成为贝叶斯假设,对应的算法成为贝叶斯分类器

tips:

  • 第2087个特征x2087和第39831个特征条件独立可以写成:

        p(x2087|y) = p(x2087|y, x39831)

        表示当y给定的情况下,知道x39831与否对知道x2087的概率没有影响。

  • 第2087个特征和第39831个特征独立可以写成

        p(x2087) = p(x2087|x39831)

 后验分布p(x|y)可以写成:

 联合似然:

最大似然估计后的参数:

 

 对新样本进行预测:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608216.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电商数据监测:如何获取想要的电商平台数据?

随着电商行业的发展,越来越多的企业开始通过电商平台销售商品。为了更好地掌握市场信息和消费者需求,企业需要获取电商平台上的数据。这些数据可以帮助企业制定营销策略、优化产品设计和提高竞争力。本文将介绍如何使用电商API获取想要的电商平台数据。 …

数据库的增删改查(一)

1、CRUD *注释:在SQL中可以使用"--空格描述"来表示注释说明 *CRUD即增加(Create)、查询(Retrieve)、更新(Update)、删除(Delete)四个单词的首字母缩写 2、新增(Create) 语法: insert [into] table_name [(column[,column] ...)…

【红队靶场】暗月五月考核靶场sunday

红队靶场 🎉B站配套视频:【顺手挂个三连呗】 https://www.bilibili.com/video/BV1xu4y1Z71y/?share_sourcecopy_web&vd_source0e30e09a4adf6f81c3038fa266588eff🔥系列专栏:红队靶场 🎉欢迎关注🔎点赞…

【MySql】ProxySQL

文章目录 ProxySQL运行机制ProxySQL安装ProxySQL的Admin管理接口和admin管理接口相关的变量admin-admin_credentialsadmin-stats_credentialsadmin-mysql_ifaces 读写分离环境信息部署步骤 负载均衡连接池自动摘除宕机的DB动态加载配置访问控制查询缓存ProxySQL 集群来源 Proxy…

送礼物 dfs 双向dfs 剪枝 java

🍑 送礼物 达达帮翰翰给女生送礼物,翰翰一共准备了 N N N 个礼物,其中第 i i i 个礼物的重量是 KaTeX parse error: Undefined control sequence: \[ at position 2: G\̲[̲i\]。 达达的力气很大,他一次可以搬动重量之和不超…

有效的括号——力扣20

题目描述 思路 1.判断括号的有效性可以使用「栈」这一数据结构来解决 2.遍历给定的字符串 s。当遇到一个左括号时,我们会期望在后续的遍历中,有一个相同类型的右括号将其闭合。由于后遇到的左括号要先闭合,因此我们可以将这个左括号放入栈顶。…

2.项目中的文件

项目的路径是这样的 目录 1 pages 1.1 json 1.2 wxml 1.3 wxss 1.4 js 2 utils 3 .eslintrc.js 4 app.js 5 app.json 6 app.wxss 7 project.config.json 8 project.private.config.json 9 sitemap.json 1 pages pages 用来存放所有小程序的页面&am…

数据结构与算法基础(青岛大学-王卓)(4)

第四弹啊,栈和队列终于叮叮咚咚看完了,小龙虾呀鳝鱼汤啊倍儿香~~~~,配合本文食用更香 😃 文章目录 栈和队列栈队列案列的引入栈的表示和操作栈的抽象数据类型定义顺序栈顺序栈的表示顺序栈的初始化顺序栈基本操作顺序栈的入栈顺序…

基于Python的接口自动化-JSON模块的操作

目录 引言 一、JSON是啥? 二、JSON的有效数据类型 三、Python JSON库的使用 结语 引言 在使用Python进行接口自动化测试脚本时,一般都是脚本只写接口测试逻辑实现,而执行脚本时需要的测试用例数据都是写入excel、数据库或者指定的配置文…

入门编程指南:如何从零开始学习编程?

一、自学编程需要注意什么? 自学编程需要注意以下几点: 选择适合自己的编程语言,在学习初期建议选择易入手的编程语言。需要不断地练习,并建立自己的编程项目,以此提高编程技巧和应用能力。追求知识的全面性&#xf…

实验二十二、压控电压源二阶带通滤波器的参数选择

一、题目 如图1所示电路中,已知 R 51 k Ω R51\,\textrm kΩ R51kΩ, R 3 20 k Ω R_320\,\textrm kΩ R3​20kΩ; f 0 1 kHz f_01\,\textrm{kHz} f0​1kHz。利用 Multisim 分析下列问题: (1)选取合适…

[图表]pyecharts-K线图

[图表]pyecharts-K线图 先来看代码: import requests from typing import List, Unionfrom pyecharts import options as opts from pyecharts.charts import Kline, Line, Bar, Griddef get_data():response requests.get(url"https://echarts.apache.org/…

攻击者使用 Python 编译的字节码来逃避检测

以 PyPI(Python 包索引)等开源包存储库为目标的攻击者设计了一种新技术,可以将他们的恶意代码隐藏在安全扫描器、人工审查和其他形式的安全分析中。 在一次事件中,研究人员发现恶意软件代码隐藏在 Python 字节码 (PYC) 文件中&am…

Scala学习(十二)---模式匹配

文章目录 1.基本语法2.模式守卫3.匹配常量和类型4.匹配对象和样例类4.1 匹配对象4.2 匹配样例类 5.偏函数中的模式匹配 1.基本语法 在Scala中的模式匹配类似于Java中的switch语法 //模式匹配基本语法val a10val b20val c""c match {case "" >println(…

VScode远程连接虚拟机(ubuntu系统)

文章目录 1. Windows端安装VScode2. 安装远程登录插件3. 配置Remote-SSH插件关于关闭后如何打开该配置文件 4. 测试ubuntu与windows可否ping通5. 在Ubuntu中安装 SSH1.检查是否安装ssh-server2.安装openssh-server3.查看ssh服务是否启动4.Ubuntu中配置openssh-server开机自动启…

路径规划算法:基于蝠鲼觅食优化的路径规划算法- 附代码

路径规划算法:基于蝠鲼觅食优化的路径规划算法- 附代码 文章目录 路径规划算法:基于蝠鲼觅食优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要:本文主要介绍利用智能优化…

6.4下周黄金最新行情走势分析及开盘交易策略

近期有哪些消息面影响黄金走势?下周黄金多空该如何研判? ​黄金消息面解析:周五(6月2日),美市尾盘,现货黄金收报1947.82美元/盎司,大幅下跌29.70美元或1.50%,日内最高触及1983.43美元/盎司&…

chatgpt赋能python:Python升序排序

Python升序排序 Python是一种非常强大的编程语言,它在数学计算、数据处理等方面具备很强的优势。在实际应用中,我们经常需要对一系列数据进行排序。而在Python中,升序排序是非常常见的操作。本篇文章将介绍在Python中如何使用ifelse进行升序…

JavaWeb13(ajax01 AJAX介绍AJAX登陆AJAX加入购物车AJAX修改购物车商品数量)

目录 一. 什么是ajax 二.为什么需要AJAX? 三. 同步和异步的区别. 四.基于jQuery实现AJAX语法 4.1 语法1-$.ajax(url,[settings]). 4.1 语法2-$.get/post(url, [data], [callback], [type]). 五 .案例 5.1 ajax实现登录 ①html代码 用户登录 用户名: 密码…

【无功优化】基于改进教与学算法的配电网无功优化【IEEE33节点】(Matlab代码时候)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…