【机器学习300问】102、什么是混淆矩阵?

news2024/11/16 13:54:22

一、混淆矩阵的定义

        混淆矩阵是一种用于评估分类模型性能的评估指标。当模型对数据进行预测并将数据分配到预定义的类别时,混淆矩阵提供了一种直观的方式来总结这些预测与数据实际类别之间的对应关系。具体来说,它是一个表格

二、分类模型性能评估一级指标

分类模型的性能评估指标有三个等级,一级评估指标如下:

  1. 真正例(True Positives, TP):模型预测为正类,实际上也是正类的样本数。
  2. 假正例(False Positives, FP):模型预测为正类,但实际上为负类的样本数。
  3. 真负例(True Negatives, TN):模型预测为负类,实际上也是负类的样本数。
  4. 假负例(False Negatives, FN):模型预测为负类,但实际上为正类的样本数。

混淆矩阵就是根据一级分类指标得到的一张表。 

我自己的理解是三句话:

第一句:分类你可以理解成猜迷,猜的对不对用“T真,F假”来表示。

第二句:你猜的这个东西的时候,你猜测它类别是“P正”还是“N负”。

第三句:你猜的这个东西,它本身的分类用“标签label”表示。

所以按照上面的三句话理解,举几个例子:

情况一:这个东西,本来的“标签”是“正”的,我猜它是“正”,意味着我猜对了,故TP。

情况二:这个东西,本来的“标签”是“负”的,我猜它是“负”,意味着我猜对了,故TN。

情况三:这个东西,本来的“标签”是“正”的,我猜它是“负”,意味着我猜错了,故FN。

情况四:这个东西,本来的“标签”是“负”的,我猜它是“正”,意味着我猜错了,故FP。

二、分类模型性能评估二级指标

        分类模型的二级评估指标在之前的文章中提到过,但没有总结过。因此在本文章简单总结一下:

四个二级指标
二级指标公式意义
准确率(Accuracy)Accuracy=\frac{TP+TN}{TP+TN+FP+FN}分类模型所有判断正确的结果占总观测值的比重
精确率(Precision)Precision=\frac{TP}{TP+TN}在模型预测是Positive的所有结果中,模型预测对的比重

召回率(Recall)

(又叫灵敏度Sensitivity)

Recall=\frac{TP}{TP+FN}在真实值是Positive的所有结果中,模型预测对的比重
特异度(Specificity)Specificity=\frac{TN}{TN+FP}在真实值是Negative的所有结果中,模型预测对的比重

更多更详细的知识点,在往期文章中有提到,下面是跳转链接:

【机器学习300问】25、常见的模型评估指标有哪些?icon-default.png?t=N7T8https://blog.csdn.net/qq_39780701/article/details/136407056 

三、分类模型新能评估三级指标

        分类模型的三级评估指标就是F1分数,在之前的文章中提到过。这里就不赘述了。

【机器学习300问】32、F1分数是什么?icon-default.png?t=N7T8https://blog.csdn.net/qq_39780701/article/details/136607068

四、混淆矩阵举例说明 

        以一个图片多分类问题为例,想要判断一张图片是“猫”、“狗”和“猪”其中的哪一种。

 混淆矩阵中的数值是样本数量,如果我们要计算准确率accuracy,那么可以统计所有表中数字的总和做分母。对角线相加做分子(因为对角线上的元素代表模型预测结果是正确的)。可以算出accuracy=\frac{10+15+20}{10+1+2+3+15+4+5+6+20}=\frac{45}{66}=0.6818

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1711419.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Redhat9 LAMP安全配置方案及测试

目录 数据库主机 安装Mariadb数据库服务 设置mariadb开机自动启动 Php主机 部署Apache服务器 设置apache服务开机自启 安装php 安装 phpMyAdmin 打开测试机 更新软件包列表: 首先,确保你的软件包列表是最新的。打开终端并输入以下命令&#xf…

js使用链表实现音乐播放器(新增,下一首播放,置顶,删除)

什么是链表 链表是一种线性数据结构,与数组类似,它用于存储一系列元素。不过,与数组在内存中连续存储元素不同,链表中的元素(称为节点)在内存中可以是非连续存放的。每个节点包含两部分:一部分…

开源博客项目Blog .NET Core源码学习(29:App.Hosting项目结构分析-17)

本文学习并分析App.Hosting项目中后台管理页面的按钮管理页面。   按钮管理页面用于显示、新建、编辑、删除页面按钮数据,以便配置后台管理页面中每个页面的工具栏、操作栏、数据列中的按钮的事件及响应url。按钮管理页面附带一新建及编辑页面,以支撑新…

鸿蒙ArkTS声明式开发:跨平台支持列表【组件快捷键事件】

组件快捷键事件 开发者可以设置组件的自定义组合键,组合键的行为与click行为一致,组件在未获得焦点状态下也可以响应自定义组合键,每个组件可以设置多个组合键。 说明: 开发前请熟悉鸿蒙开发指导文档: gitee.com/li-s…

【做一道算一道】力扣332.重新安排行程

332.重新安排行程 给定一个机票的字符串二维数组 [from, to],子数组中的两个成员分别表示飞机出发和降落的机场地点,对该行程进行重新规划排序。所有这些机票都属于一个从 JFK(肯尼迪国际机场)出发的先生,所以该行程必…

【数据结构】-- 栈

栈 引入: 一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。 进行数据插入和删除操作的一端 称为栈顶,另一端称为栈底。栈中的元素遵循先进后出的原则,先入栈的元素总是先后出栈。 压栈:栈的插入操作叫…

新零售数据中台:打造智能商业运营的核心引擎_光点科技

随着数字化转型的浪潮席卷全球,新零售行业正在经历一场前所未有的革新。在这一过程中,“新零售数据中台”逐渐成为企业构建智能商业运营的核心引擎。本文将重点介绍新零售数据中台的概念、其在新零售中的作用,以及如何通过数据中台实现商业价…

阴影技术在AI去衣中的角色扮演

引言: 人工智能去衣技术,在最初期可能听起来有些令人不安,但它实际上包括了一系列进步的图像处理和机器学习技术,有助于各种领域的革新,例如虚拟试衣室、电影制作中的特效,乃至在线零售的个性化体验。在这些…

每天学点小知识:图床搭建 + CDN简介

前言: 本章内容帮你解决,本地图片不能分享到网上的问题。需要工具github JSDelivr 知识点 Q:什么是JSDelivr? JSDelivr是一个免费且公开的内容分发网络(CDN),专门用于加速开源项目和静态网站…

TiDB-从0到1-分布式事务

TiDB从0到1系列 TiDB-从0到1-体系结构TiDB-从0到1-分布式存储TiDB-从0到1-分布式事务TiDB-从0到1-MVCC 一、事务定义 这属于老生常谈了,无论不管是传统事务还是分布式事务都离不开ACID A:原子性C:一致性I:隔离性D:…

Dubbo传输层及交换层实现

原创 风度玉门 拍码场 前言 Apache Dubbo 是一款高性能的 Java RPC 框架,主要用于构建分布式服务。Dubbo 的架构设计包括多个层次,其中传输层和交换层是非常重要的两个组成部分。 其中传输层(Transport)只负责对二进制数据的收…

Thingsboard规则链:Switch节点详解

在物联网(IoT)领域,数据的高效处理与自动化决策是构建智能系统的核心。作为一款强大的物联网平台,Thingsboard通过其规则引擎为开发者提供了高度灵活的工具,其中Switch节点是实现消息条件路由的关键组件。本文将全方位…

IC617 虚拟机下载 RHEL6_ic617_hspice2015_spectre15

下载地址: 链接:https://pan.baidu.com/s/1kFEkq-SVkpSXcSS49THkiA?pwdtpm8 提取码:tpm8

Let‘s Encrypt 免费证书申请

填写邮箱,申请的域名 单域名:www.example.com 泛域名: *.example.com yum -y install certbot sudo certbot certonly --server https://acme-v02.api.letsencrypt.org/directory --manual --preferred-challenges dns --email xxexample…

第十二课,for循环

一,for循环对字符串(序列)的基础语法 语法:for i in “hello world”: *小练习:统计字符串中有一个字符?特定的字符有几个? 二,for循环的range语句 ①从a开始到b结束,每…

6岁开始学习打字,10岁学懂文字编程

​你们有没有想过打字速度会影响Coding 编程能力? 疫情期间,全国中小学均不定期停止面授课程,改为网上教学。顷刻之间,电脑、智能手机等即时通讯软件成为每日学习的「良师益友」,常伴左右。 同时,学生也由…

JVM学习-字节码指令集(一)

概述 Java字节码对于虚拟机,好像汇编语言对于计算机,属于基本执行指令Java虚拟机的指令由一个字节长度的,代表某种特定操作含义 的数字(称为操作码Opcode)以及跟随其后的零至多个代表此操作所需参数(操作数,Operands)而构成&…

Postman实现批量发送json请求

最近有一个场景,需要本地批量调用某个接口,从文件中读取每次请求的请求体,实现方法记录一下。 1.读取请求体 在 Postman 中,如果你想在 Pre-request Script 阶段读取文件内容,比如为了将文件内容作为请求的一部分发送…

电商api接口进行数据采集获取淘宝/天猫/京东/抖音多平台商品价格

在电商运营中,从品牌角度来看,品牌方通过电商数据采集API接口进行数据采集,获取多渠道商品价格信息的这一行为,能为品牌方带来诸多好处: 及时准确:API接口能为品牌提供实时数据,这意味着企业可…

北斗高精度定位终端的工作原理和精度范围

北斗高精度定位终端的工作原理主要基于北斗卫星导航系统,通过卫星信号的接收、处理和计算,实现了对目标位置的精确测量。以下是关于北斗高精度定位终端工作原理的引文: ​ 北斗高精度定位终端作为一款新型的高精定位设备,其核心…