生成式模型与辨别式模型

news2025/1/13 9:25:08

分类模型可以分为两大类:生成式模型与辨别式模型。本文解释了这两种模型类型之间的区别,并讨论了每种方法的优缺点。

辨别式模型

辨别式模型是一种能够学习输入数据和输出标签之间关系的模型,它通过学习输入数据的特征来预测输出标签。在分类问题中,我们的目标是将每个输入向量x分配给标签y。判别模型试图直接学习将输入向量映射到标签的函数f(x)。这些模型可以进一步分为两个子类型:

分类器试图找到f(x)而不使用任何概率分布。这些分类器直接为每个样本输出一个标签,而不提供类的概率估计。这些分类器通常称为确定性分类器或无分布分类器。此类分类器的例子包括k近邻、决策树和SVM。

分类器首先从训练数据中学习后验类概率P(y = k|x),并根据这些概率将一个新样本x分配给其中一个类(通常是后验概率最高的类)。

这些分类器通常被称为概率分类器。这种分类器的例子包括逻辑回归和在输出层中使用sigmoid或softmax函数的神经网络。

在所有条件相同的情况下,我一般都使用概率分类器而不是确定性分类器,因为这个分类器提供了关于将样本分配给特定类的置信度的额外信息。

一般的判别式模型包括:

  • 逻辑回归(Logistic Regression,LR)
  • 支持向量机(Support Vector Machine,SVM)
  • 决策树(Decision Tree,DT)

生成式模型

生成式模型在估计类概率之前学习输入的分布。生成式模型是一种能够学习数据生成过程的模型,它可以学习输入数据的概率分布,并生成新的数据样本。

更具体地说生成模型首先从训练数据中估计类别的条件密度P(x|y = k)和先验类别概率P(y = k)。他们试图了解每个分类的数据是如何生成的。

然后利用贝叶斯定理估计后验类概率:

贝叶斯规则的分母可以用分子中出现的变量来表示:

生成式模型也可以先学习输入和标签P(x, y)的联合分布,然后将其归一化以得到后验概率P(y = k|x)。一旦我们有了后验概率,我们就可以用它们将一个新的样本x分配给其中一个类(通常是后验概率最高的类)。

例如,考虑一个图像分类任务中,我们需要区分图像狗(y = 1)和猫(y = 0)。生成模型首先会建立一个狗 P(x|y = 1) 的模型,以及猫 P(x|y = 0) 的模型。然后在对新图像进行分类时,它会将其与两个模型进行匹配,以查看新图像看起来更像狗还是更像猫。

为生成模型允许我们从学习的输入分布P(x|y)中生成新的样本。所以我们将其称之为生成式模型。最简单的例子是,对于上面的模型我们可以通过从P(x|y = 1)中采样来生成新的狗的图像。

一般的生成模型包括

  • 朴素贝叶斯(Naïve Bayes)
  • 高斯混合模型(GMMs)
  • 隐马尔可夫模型(hmm)
  • 线性判别分析 (LDA)

深度生成模型(DGMs)结合了生成模型和深度神经网络:

  • 自编码器(Autoencoder,AE)
  • 生成式对抗网络(Generative Adversarial Network,GAN)
  • 自回归模型,例如GPT(Generative Pre-trained Transformer)是一种包含数十亿参数的自回归语言模型。

区别和优缺点

生成式模型和辨别式模型的主要区别在于它们学习的目标不同。生成式模型学习输入数据的分布,可以生成新的数据样本。辨别式模型学习输入数据和输出标签之间的关系,可以预测新的标签。

生成式模型:

生成模型给了我们更多的信息,因为它们同时学习输入分布和类概率。可以从学习的输入分布中生成新的样本。并且可以处理缺失的数据,因为它们可以在不使用缺失值的情况下估计输入分布。但是大多数判别模型要求所有的特征都存在。

训练复杂度高,因为生成式模型要建立输入数据和输出数据之间的联合分布,需要大量的计算和存储资源。对数据分布的假设比较强,因为生成式模型要建立输入数据和输出数据之间的联合分布,需要对数据的分布进行假设和建模,因此对于复杂的数据分布,生成式模型在小规模的计算资源上并不适用。

生成模型可以处理多模态数据,因为生成式模型可以建立输入数据和输出数据之间的多元联合分布,从而能够处理多模态数据。

辨别式模型:

如果不对数据做一些假设,生成式模型学习输入分布P(x|y)在计算上是困难的,例如,如果x由m个二进制特征组成,为了对P(x|y)建模,我们需要从每个类的数据中估计2个ᵐ参数(这些参数表示m个特征的2个ᵐ组合中的每一个的条件概率)。而Naïve Bayes等模型对特征进行条件独立性假设,以减少需要学习的参数数量,因此训练复杂度低。但是这样的假设通常会导致生成模型比判别模型表现得更差。

对于复杂的数据分布和高维数据具有很好的表现,因为辨别式模型可以灵活地对输入数据和输出数据之间的映射关系进行建模。

辨别式模型对噪声数据和缺失数据敏感,因为模型只考虑输入数据和输出数据之间的映射关系,不利用输入数据中的信息填补缺失值和去除噪声。

总结

生成式模型和辨别式模型都是机器学习中重要的模型类型,它们各自具有优点和适用场景。在实际应用中,需要根据具体任务的需求选择合适的模型,并结合混合模型和其他技术手段来提高模型的性能和效果。

https://avoid.overfit.cn/post/9dc20966c4824be18ef7e9fd1acabe51

作者:Roi Yehoshua

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/444191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Revit相关问题:符号线,转转问题,生成三维视图

一、Revit符号线如何画粗一些?如何自定义符号线子类别? 1、Revit在族里面符号线的粗细、显示颜色、显示线型为符号线的子类别控制! 你可以通过,管理选项卡新建子类别,然后在画符号线的时候应用该子类别! 新建符号线对象样式 应用子类别 二、Revit三维模…

YOLOv7+单目跟踪

YOLOv7单目跟踪 1. 目标跟踪2. 测距模块2.1 设置测距模块2.2 添加测距 3. 实验效果 相关链接 1. YOLOv5单目测距(python) 2. YOLOv7单目测距(python) 3. 具体效果已在Bilibili发布,点击跳转 1. 目标跟踪 用yolov7实现…

Moviepy模块之视频添加图片水印

文章目录 前言视频添加图片水印1.引入库2.加载视频文件3.加载水印图片4.缩放水印图片大小5.设置水印的位置5.1 相对于视频的左上角5.2 相对于视频的左下角5.3 相对于视频的右上角5.4 相对于视频的右下角5.5 相对于视频的左中位置5.6 相对于视频的正中位置5.7 相对于视频的右中位…

【设计模式】23种设计模式之结构型模式

一、适配器设计模式 1、是什么? 1、适配器模式将某个类的接口转换成客户端期望的另一个接口表示,主要的目的是兼容性,让原本因接口不匹配不能一起工作的两个类可以协同工作 2、适配器模式属于结构型模式 3、主要分为三类:类适配…

【机器学习】EM原理和K-mean聚类

一、教程说明 EM算法就是expect maxmise算法,就是“期望最大化”的缩写。本篇首先提出:1 什么是期望? 2 期望最大化是个啥意思?k-mean聚类中如何用EM算法? 所涉及的概念: 期望 期望的加权平均理解 概率…

工业网关开发:IxCahriot测试吞吐量

吞吐量测试可以确定被测试设备或被测试系统在不丢弃包的情况下,设备或系统能够接受并转发的最大有效数据。在测试中以一定的速率发送一定数量的帧,并计算待测设备接收的帧,如果发送的帧与接受的帧数量相等,那么就将发送速率提高并…

ASEMI代理ADA4940-1ACPZ-R7原装ADI车规级ADA4940-1ACPZ-R7

编辑:ll ASEMI代理ADA4940-1ACPZ-R7原装ADI车规级ADA4940-1ACPZ-R7 型号:ADA4940-1ACPZ-R7 品牌:ADI/亚德诺 封装:LFCSP-16 批号:2023 引脚数量:16 安装类型:表面贴装型 ADA4940-1ACPZ-…

ChatGPT 和 Elasticsearch:OpenAI 遇见私有数据

作者:Jeff Vestal 结合 Elasticsearch 的搜索相关性和 OpenAI 的 ChatGPT 的问答功能来查询你的数据。 在此博客中,你将了解如何使用 Elasticsearch 将 ChatGPT 连接到专有数据存储,并为你的数据构建问答功能。 什么是聊天 GPT? …

Baumer工业相机堡盟工业相机如何联合BGAPISDK和OpenCVSharp实现图像的对数Log变换算法增强(C#)

Baumer工业相机堡盟工业相机如何联合BGAPISDK和OpenCVSharp实现图像的对数Log变换算法增强(C#) Baumer工业相机Baumer工业相机使用图像算法增加图像的技术背景Baumer工业相机通过BGAPI SDK联合OpenCV使用图像增强算法1.引用合适的类文件2.BGAPI SDK在图像…

ASEMI代理ADI亚德诺ADA4940-1ACPZ-R7车规级芯片

编辑-Z ADA4940-1ACPZ-R7芯片参数: 型号:ADA4940-1ACPZ-R7 −3 dB小信号带宽:260 MHz −3 dB大信号带宽:25 MHz 0.1dB平坦度的带宽:14.5 MHz 斜率:95 V/s 超速恢复时间:86 ns 输入电压噪…

【数据结构】堆的应用(堆排序的实现 + (向上/向下)建堆时间复杂度证明 + TopK问题(笔记总结))

👦个人主页:Weraphael ✍🏻作者简介:目前学习C和算法 ✈️专栏:数据结构 🐋 希望大家多多支持,咱一起进步!😁 如果文章对你有帮助的话 欢迎 评论💬 点赞&…

Redis高可用之3种集群方案对比

Redis集群方案使用建议: Redis cluster:除非是1000个节点以上的超大规模集群,优先考虑使用Redis clustercodis:旧项目如果仍在使用codis,可继续使用,但也推荐迁移到Redis clustertwemproxy:不建…

什么是数字化?企业为什么要数字化转型?

什么是数字化?企业为什么要数字化转型? 深度长文,4000字,融合了很多国内外专业期刊观点,一文讲清到底什么是企业数字化转型?心急的小伙伴可以先看目录: 关于定义——到底什么是“数字化转型”…

Ubuntu18.04通过一根网线与树莓派建立连接,远程操作树莓派,向树莓派传文件

文章目录 前言1 树莓派设置静态IP1.1 不能登录到树莓派的图形化界面1.2 可以登录到树莓派的图形化界面 2 PC端的ubuntu18.04设置静态ip地址2.1 不使用图形化界面操作2.2 使用图形化界面进行操作 3 Putty软件3 FileZilla软件 前言 本篇博客的应用场景,前提条件如下&a…

4.1.2串的存储结构

串的存储结构和线性表类似 串的顺序存储: 缺点就是长度不可变(也就是静态数组存储) 函数执行结束存储空间自动回收 需要使用free函数回收 串的顺序存储: 方案二的缺点: char[0]存储length,但是由于char的…

智能学习 | MATLAB实现FA-BP多输入单输出回归预测(萤火虫算法优化BP神经网络)

智能学习 | MATLAB实现FA-BP多输入单输出回归预测(萤火虫算法优化BP神经网络) 目录 智能学习 | MATLAB实现FA-BP多输入单输出回归预测(萤火虫算法优化BP神经网络)预测效果基本介绍程序设计参考资料预测效果 基本介绍 MATLAB实现FA-BP多输入单输出回归预测(萤火虫算法优化B…

基于铜锁构建Web在线加密工具库

基于铜锁构建Web在线加密工具库 搭建运行环境 实验⼿册中的实验都是以 docker 和 docker-compose 环境为主,基于 Ubuntu 20.04 容器镜像。 初始化项目 首先利用 IDE 创建一个 tongsuo_web 的空项目,接下来我们所有的文件都会创建在该项目中&#xff0…

学习系统编程No.19【进程间通信之控制进程】

引言: 北京时间:2023/4/13/8:00,早八人,早八魂,时间不怎么充足,磨磨引言刚好,学习Linux和Linux有关的系统级知识已经许久了,在不知不觉之中,发现自己已经更到了第19篇&a…

3D视觉之深度相机方案

随着机器视觉,自动驾驶等颠覆性的技术逐步发展,采用 3D 相机进行物体识别,行为识别,场景 建模的相关应用越来越多,可以说 3D 相机就是终端和机器人的眼睛。 3D 相机 3D 相机又称之为深度相机,顾名思义&…

openDriver开源插件main.js源码分析

、基础要求 阅读本文章需要对以下知识有相关的了解 Threejs 3D渲染引擎dat.gui界面控制插件webgl三维绘图协议、着色器相关知识UV坐标、XYZ惯性坐标XODR文件格式 拓展 自动驾驶场景仿真标准(一)- OpenDRIVE - 知乎 《OpenDRIVE1.6规格文档》3_open…