机器学习--混淆矩阵(Confusion Matrix)

news2024/11/27 0:20:37

一、混淆矩阵

  • True Negative (TN): 真负类,样本的真实类别是负类,并且模型将其识别为负类,cm[0][0]。
  • False Positive (FP): 假正类,样本的真实类别是负类,但是模型将其识别为正类,cm[0][1]。
  • False Negative (FN):假负类,样本的真实类别是正类,但是模型将其识别为负类,cm[1][0]。
  • True Positive (TP): 真正类,样本的真实类别是正类,并且模型将其识别为正类,cm[1][1]。
from sklearn.metrics import confusion_matrix:

By definition a confusion matrix :math:`C` is such that :math:`C_{i, j}`
is equal to the number of observations known to be in group :math:`i` and
predicted to be in group :math:`j`.in binary classification, the count of 
true negatives is:math:`C_{0,0}`, 
false negatives is :math:`C_{1,0}`, 
true positives is:math:`C_{1,1}` and 
false positives is :math:`C_{0,1}`

二、根据混响矩阵计算分类指标

对于二分类问题,可以将样例根据其真实类别与机器学习器预测类别的组合划分为:TN、FP、FN、TP。
样例总数 = TN + FP + FN + TP。

2.1 精确率(Accuracy)

精确率是最常用的分类性能指标,可以用来表示模型的精度,即模型识别正确的个数/样本的总个数。一般情况下,模型的精度越高,说明模型的效果越好。
A c c u r a c y = T P + T N T N + F P + F N + T P \mathbf{Accuracy=\frac{TP+TN}{TN + FP + FN + TP}} Accuracy=TN+FP+FN+TPTP+TN

2.2 召回率(Recall)

召回率又称为查全率,表示的是,模型正确识别出为正类的样本的数量占总的正类样本数量的比值。一般情况下,Recall越高,说明有更多的正类样本被模型预测正确,模型的效果越好。
Recall(召回率) = Sensitivity(敏感指标,True Positive Rate,TPR)= 查全率
R e c a l l = T P T P + F N = 预测正确的正类样本数 正类正确预测为正类 + 正类误认为负类 = 预测正确的正类样本数 真实为正类的样本数 \mathbf{Recall=\frac{TP}{TP + FN}=\frac{预测正确的正类样本数}{正类正确预测为正类+正类误认为负类}=\frac{预测正确的正类样本数}{\color{blue} 真实为正类的样本数}} Recall=TP+FNTP=正类正确预测为正类+正类误认为负类预测正确的正类样本数=真实为正类的样本数预测正确的正类样本数

2.3 正确率/准确率(Precision)

又称为查准率,表示在模型识别为正类的样本中,真正为正类的样本所占的比例。
P r e c i s i o n = T P T P + F P = 预测正确的正类样本数 预测正确的正类 + 负类误认为正类 = 预测正确的正类样本数 预测为正类的样本数 \mathbf{Precision=\frac{TP}{TP + FP}=\frac{预测正确的正类样本数}{预测正确的正类+负类误认为正类}=\frac{预测正确的正类样本数}{\color{blue} 预测为正类的样本数}} Precision=TP+FPTP=预测正确的正类+负类误认为正类预测正确的正类样本数=预测为正类的样本数预测正确的正类样本数

参考链接:
https://blog.csdn.net/seagal890/article/details/105059498
https://www.cnblogs.com/wuliytTaotao/p/9285227.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2035313.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mutual_Voting_for_Ranking_3D_Correspondences

因为目前主要在看表示学习,所以配准了解较少,这篇文章就主要记录了一下相关工作和作者提出的非dl的模型,实验部分很简略,大家可以做参考。 Abstract 在摘要部分,作者介绍了一种新颖的相互投票方法,用于对…

孙宇晨所到之处,投资人闻风丧胆?WBTC被坑惨了?MakerDAO带头抗议!BitGo退场!

为实现WBTC跨多个司法管辖区的托管业务和冷储存业务多元化,加密货币托管公司BitGo于8月10日宣布,将与BiT Global创建合资企业对Wrapped Bitcoin(WBTC)业务进行多司法管辖区托管,且BitGo将成为新合资企业的少数股东。此…

满天飞的浮毛怎么去掉?最最高效解决浮毛的办法宠物空气净化器

作为一名呼吸科医生,我们的工作有着明显的“淡旺季”之分。旺季:一是秋冬季节雾霾加剧,引发呼吸道不适;二是宠物换毛期,导致家庭环境中浮毛增多,进而引发呼吸道过敏、炎症等问题。秋冬的雾霾是自然界的不可…

java基础进阶——log日志、类加载器、XML、单元测试、注解、枚举类

前言 这篇内容主要掌握的就是logback使用、理解类加载器、XML文件的编写,XML文档约束schema,用Dom4j解析XML文档,Xpath检索XML文档,完整使用Junit单元测试框架常用部分,注解的定义和使用,枚举类的定义和开发…

IDEA:Dangling Javadoc comment

JetBrains对JavaDocs的描述: Javadoc comments are usually placed above classes, methods, or fields in your source code. A Javadoc provides a description of the code element located under it and contains block tags marked with with specific metada…

0x6 风险评估

风险评估介绍 一、风险评估解决的问题 二、什么是风险评估 三、风险评估的目的 加强信息安全保障:信息安全风险评估是信息安全体系建设和管理的关键环节。通过评估,能够发现系统的主要问题和矛盾,并找到解决关键问题的办法。 认清安全环境与…

Linux的常用操作-02

一:Linux的系统目录结构 /bin bin是ary的缩写,这个目录存放着最经常用的命令 /boot:这里存放的是启动Linux时使用的一些核心文件,包括一些连接文件以及镜像文件。 /dev:dev是Device(设备)的缩写,该目录下存放的是Lin…

尚硅谷MYSQL高级篇(一)

存储引擎 support是看是否支持这些存储引擎 default是默认的 transactions是看一下是否支持事务 xa是看是否支持分布式事务 savepoint 保存点是支持部分事务的回滚

2024 年最受欢迎的数据库

数据库是我们与技术交互的支柱,以下是 2024 年最受开发人员喜爱的十大数据库引擎列表。 数据库很像管道。用户就像房主一样,不一定知道数据库的结构,最多只能看到一些片段,但他们的大部分活动都依赖于底层框架。系统的存亡取决于数…

你不知道的EPLAN 小窍门

1 图形拉伸 下面有五条直线,如果想同时改变直线的倾斜角度,这时候我们可以用到拉伸命令。 编辑>图形>拉伸 然后全选5根线的顶端,就可以自由的拖动变形了。 图形中还有一些修剪,倒角,圆角等CAD中常用命令,大家可以自己尝试下。 2 显示标示性的编号 打开EPLAN设置,…

# 利刃出鞘_Tomcat 核心原理解析(六)

利刃出鞘_Tomcat 核心原理解析(六) 一、Tomcat专题 - 内容 1、Web 应用配置 2、Tomcat 管理配置 3、JVM 配置 4、Tomcat 集群 5、Tomcat 安全 6、Tomcat 性能调优 7、Tomcat 附加功能。 二、Tomcat专题 - Web应用配置介绍 1、Web.xml 配置文件…

人工智能在病理组学领域的最新进展|文献速递·24-08-09

小罗碎碎念 本期推文主题:人工智能在病理组学领域的最新进展 这一期推文和往期不太一样——往期几乎都是顶刊,而这一期选了一些分数不那么高的文章。这样做有两个原因: 验证一下在IF较低的期刊中能否找到灵感对比一下,期刊之间的…

子进程与父进程运行不同程序

往文件里面写内容,fork在open之前,会接着父进程写的内容写,继承父进程的状态信息,文件描述符一直往下 往文件里面写内容,fork在open之后,分别打开文件,后运行的会覆盖先运行的内容 让低8位有效 进程的终止…

LVS-NAT + LVS-DR

LVS 现在lvs已经是linux内核标准的一部分,使用lvs可以达到的技术目标是:通过linux达到负载均衡技术和linux操作系统实现一个高性能高可用的linux服务器集群,他具有良好的可靠性,可延展性和可操作性,从而以低廉的成本实…

AQS的同步队列和条件队列原理

文章目录 二者区别实现原理同步队列原码-内部类Node源码-获取锁源码-释放锁条件队列原码-内部类Node源码-等待源码-唤醒Demo-比较典型的条件队列使用场景二者区别 首先,AQS中的 同步队列 和 条件队列 是两种不同队列: 目的不同:同步队列主要用于实现锁机制(也就是锁的获取…

4.3.2 C++ 平面拟合的实现

4.3.2 C 平面拟合的实现 参考教程: gaoxiang12/slam_in_autonomous_driving: 《自动驾驶中的SLAM技术》对应开源代码 (github.com) Eigen打印输出_打印eigen矩阵-CSDN博客 1. 编写 Plane fitting 1.1 创建文件夹 通过终端创建一个名为Plane_fitting的文件夹以保…

Cookie和Session的区别(详细讲解)

Session 和 Cookie 的区别 在网络通信过程中,使用的是HTTP协议,它是一种无状态协议,比如,在登录一个网站时,登录成功后,之后在访问这个网站的其他页面时,都需要重新登录,无法识别出…

[240812] X-CMD 发布 v0.4.5:更新 gtb、cd、chat、hashdir 模块功能

目录 📃Changelog✨ gtb✨ cd✨ chat✨ hashdir 📃Changelog ✨ gtb 调整了 fzf 预览窗口中书籍文本的显示效果,通过识别文本中的特殊字符、日期、章节标题等信息,为其赋予不同的颜色。 ✨ cd cd 模块新增功能:在找…

网络编程day03 20240813

一、相关练习 1、通过w(红色臂角度增大)s(红色臂角度减小)d(蓝色臂角度增大)a(蓝色臂角度减小)按键控制机械臂 机械臂需要发送16进制数,共5个字节,协议如下: 0xff 0x0…

数据库核心技术:存储与索引概览

文章目录 存储与索引技术概览存储结构索引技术 MySQL存储结构索引技术事务与锁优势 PostgreSQL存储结构索引技术事务与锁优势 Oracle存储结构索引技术事务与锁优势 SQL Server存储结构索引技术事务与锁优势 选型考量存储结构索引技术事务与锁的支持综合因素未来趋势 结语 数据库…