机器学习——分类评价指标

news2024/12/23 18:06:17

【说明】文章内容来自《机器学习——基于sklearn》,用于学习记录。若有争议联系删除。

1、评价指标

        对于模型的评价往往会使用损失函数和评价指标,两者的本质是一致的。一般情况下,损失函数应用于训练过程,而评价指标应用于测试过程。对于回归问题,往往使用均方误差等指标评价模型,也使用回归损失函数作为评价指标。而分类问题的评价指标一般会选择准确率、ROC曲线和AUC等,其评价指标如下:

术语sklearn函数
混淆矩阵confusion_matrix
准确率accuracy_score
召回率reacall_score
f1_scoref1_score
ROC曲线roc_curve
AUCroc_auc_score
分类评估报告classification_report

2、混淆矩阵

        在机器学习领域,混淆矩阵(confusion matrix)是衡量分类模型准确度的方法中最基本、最直观、计算最简单的方法。混淆矩阵又称为可能性表格或错误矩阵,用来呈现算法性能的可视化效果,通常应用于监督学习。混淆矩阵由n行n列组成,其每一列表预测值,每一行代表实际的类别。例如,一个人得病了,但检查结果说他没病,那么他“假没病”,也叫假阴性(FN);一个人得病了,医生判断他有病,那么他是“真有病”,也叫阳性(TP);一个人没得病,医生检查结果却说他有病,那么他是“假有病”,也叫假阳性(FP);一个人没得病,医生检查结果也说他没病,那么他是“真没病”,也叫真阴性(TN)4种结局就是2X2=4的混淆矩阵,如表所示。

        FN、TP、FP、TN共包含4个字母P、N、T、F,英文分别是 Positive、Negative、True、False。True和 False 代表预测本身的结果是正确还是不正确,Positive 和 Negative则是代表预测的方向是正向还是负向。
        每一行之和表示该类别的真实样本数量,每一列之和表示被预测为该类别的样本数量。预测性分类模型肯定是越准越好。因此混淆矩阵中TP与 TN的数值越大越好,而FP与FN的数值越小越好。
混淆矩阵具有如下特性:

  • 样本全集=TPUFPUFNUTN。
  • 任何一个样本属于且只属于4个集合中的一个,即它们没有交集。

2.1 混淆矩阵示例

        某系统用来对猫(cat)、狗(dog)、免子(rabbit)进行分类。现共有27只动物,包括8只猫、6条狗和13只兔子。混淆矩阵如表所示。

        在这个混淆矩阵中,实际有8只猫,但是系统将其中3只猫预测成了狗;实际有6条狗,其中有一条狗被预测成了免子,两条狗被预测成了猫;实际有13只兔子,其中有2只兔子被预测成了狗。
        sklearn,metrics模块提供了confusion_matrix函数,格式如下:

sklearn.metrics.confusion_matrix(y_true, y_pred,labels)

【参数说明】

  • y_true:真实目标值
  • y_pred:估计器预测目标值
  • labels:指定类别对应的数字

示例:

from sklearn.metrics import confusion_matrix
y_true = [2,0,2,2,0,1]
y_pred = [0,0,2,2,0,2]
print('confusion_matrix\n', confusion_matrix(y_true, y_pred))
y_true = ['cat', 'ant', 'cat', 'cat', 'ant', 'bird']
y_pred = ['ant', 'ant', 'cat', 'cat', 'ant', 'cat']
print('confusion_matrix\n', confusion_matrix(y_true, y_pred, labels = ['ant','bird', 'cat']))

【运行结果】

真实值中,共0,1,2三个特征。

2.2 准确率

准确率(accuracy)是最常用的分类性能指标。准确率是预测正确的样本数与总样本数的比值。其计算公式:

ACC= \frac{TP+TN}{P+N}

sklearn.metrics模块提供了accuracy_score函数,格式如下:

 sklearn.metrics.accuracy_score(y_true, y_pred, normalize)

【参数说明】

  • y_true:真实目标值
  • y_pred:估计器预测目标值
  • normalize:是否正则化。默认为True,返回正确分类的比例;False返回正确分类的样本数。

示例:

import numpy as np
from sklearn.metrics import accuracy_score
y_true = [0,1,2,3]
y_pred = [0,2,1,3]
print(accuracy_score(y_true, y_pred))
print(accuracy_score(y_true, y_pred, normalize = False))

2.3 精确率

        精确率(precision)又称为查准率。精确率只针对预测正确的正样本而不是所有预测正确的样本,是正确预测的正样本数与预测正样本总数的比值,其计算公式如下:

precision = \frac{TP}{TP+FP}

sklearn.metrics模块提供了precision_score函数,格式如下:

sklearn.metrics.precision_score(y_true, y_pred)

示例:

import numpy as np
from sklearn.metrics import precision_score
y_true = [1,0,1,1]
y_pred = [0,1,1,0]
p = precision_score(y_true, y_pred)
print(p)

2.4 召回率

        召回率(recall)是有关覆盖面的度量,它反映有多少正例被分为正例,又称查全率。查准率和召回率是一对矛盾的度量。查准率高时,召回率往往偏低;而召回率高时,查准率往往偏低。
召回率是正确预测的正例数与实际正例总数之比,计算公式如下

Recall = \frac{TP}{TP+FN}
sklearn.metrics模块提供了recall_score函数,格式如下:

sklearn.metrics.recall _score(y_true, y_pred, average)

        以信息检索为例,刚开始在页面上显示的信息是用户可能最感兴趣的信息,此时查准率高,但只显示了部分数据,所以召回率低;随着用户不断地下拉滚动条显示其余信息,信息与用户兴趣的匹配程度逐渐降低,查准率不断下降,召回率逐渐上升;当下拉到信息底部时,此时的信息是最不符合用户兴趣的,因此查准率最低,但所有的信息都已经展示,召回率最高。

3、F1分数

F1分数(F1 score)用于衡量二分类模型的精确度,是精确率和召回率的调和值,其变化范围为0~1。F1分数的计算公式如下:

F1=\frac{2*TP}{2*TP+FN+FP}=\frac{2*precision*Recall}{Precision+Recall}

sklearn.metrics 模块提供了f1_score函数。格式如下:

sklearn.metrics.f1_score(y_true, predictions, average = 'micro

【参数说明】

  • y_true:真实目标值
  • predictions:估计器预测目标值

示例:

from sklearn import metrics
y_test = [0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2]
y_pred = [0,0,1,1,0,0,0,2,2,0,1,1,1,1,2,1,1,2,2,1,2,2,2,2,2,2,1,1,2,2]
F1 = metrics.f1_score(y_test, y_pred, average = 'micro')
print("F1", F1)

4、ROC曲线

        ROC全称是“受试者工作特征”(Receiver Operating Characteristic)曲线,用于描述混淆矩阵中FPR-TPR两个量之间的相对变化情况。ROC曲线的横轴是FPR,纵轴是TPR。ROC曲线用于描述样本的真实类别和预测概率。

ROC曲线中的4个点如下:

  • 点(0,1):即 FPR=0,TPR=1,意味着FN=0且FP=0,所有的样本都正确分类
  • 点(1,0):即 FPR=1,TPR=0,最差分类器,避开了所有正确答案。
  • 点(0,0):即 FPR=TPR=0,FP=TP=0,分类器把每个样本都预测为负类。
  • 点(1,1):即 FPR=TPR=1,分类器把所有样本都预测为正类。

sklearn,metrics 模块提供了roc_curve函数,格式如下:

sklearn.metrics.roc_ curve(y_true, y_score)

【参数说明】

  • y_true:每个样本的真实类别,必须为0(反例)、1(正例)标记。
  • y_score:预测得分,可以是正类的估计概率

示例:

import numpy as np
from sklearn import metrics
y = np.array([1,1,2,2])
scores = np.array([0.1, 0.4, 0.35, 0.8])
fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label = 2)
print(fpr)
print(tpr)
print(thresholds)
from sklearn.metrics import auc
print(metrics.auc(fpr, tpr))

5、AUC

        AUC(Area Under Curve)是指 ROC曲线下的面积,由于ROC曲线一般都处于y=x这条直线的上方,所以AUC 的取值范围为0.5~1。AUC 只能用于评价二分类,直观地评价分类器的好坏,值越大越好。
AUC 对模型性能的判断标准如下:

  • AUC=1,是完美分类器。采用这个预测模型时,存在至少一个阈值能得出完美预测。在绝大多数预测的场合,不存在完美分类器。
  • 0.5<AUC<1,优于随机猜测。若对这个分类器(模型)设定合适的阈值,它就才预测价值。
  • AUC=0.5,跟随机猜测一样(例如抛硬币),模型没有预测价值。
  • AUC<0.5,比随机猜测还差。但是,只要总是反预测而行,就优于随机猜测。

sklearn.metrics模块提供了roc_auc_score函数,格式如下:

sklearn.metrics.roc_auc_score(y_true, y_score)

【参数说明】

  • y_true:每个样本的真实类别,必须为0(反例)、1(正例)标记。
  • y_score:预测得分,可以是正类的估计概率。

示例:

import numpy as np
from sklearn.metrics import roc_auc_score
y_true = np.array([0,0,1,1])
y_score = np.array([0.1,0.4,0.35,0.8])
print(roc_auc_score(y_true, y_score))

6、分类评估报告

        Sklearn 中的classification_report函数用于显示主要分类指标的文本报告,显示每个类的精确度、召回率、F1值等信息。classification_report函数格式如下:

sklearn.metrics.classification _report(y_true, y_pred, labels, target_names)

【参数说明】

  • y_true:真实目标值。
  • y_pred:估计器预测目标值。
  • labels:指定类别对应的数字。
  • target_names:目标类别名称。

示例:

from sklearn.metrics import classification_report
y_true = [0,1,2,2,2]
y_pred = [0,0,2,2,1]
target_names = ['class 0','class 1','class 2']
print(classification_report(y_true, y_pred, target_names = target_names))

【运行结果】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1326644.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Apache Superset如何实现无公网ip实时远程访问本地数据【内网穿透】

文章目录 前言1. 使用Docker部署Apache Superset1.1 第一步安装docker 、docker compose1.2 克隆superset代码到本地并使用docker compose启动 2. 安装cpolar内网穿透&#xff0c;实现公网访问3. 设置固定连接公网地址 前言 Superset是一款由中国知名科技公司开源的“现代化的…

CloudCanal x Debezium 打造实时数据流动新范式

简述 Debezium 是一个开源的数据订阅工具&#xff0c;主要功能为捕获数据库变更事件发送到 Kafka。 CloudCanal 近期实现了从 Kafka 消费 Debezium 格式数据&#xff0c;将其 同步到 StarRocks、Doris、Elasticsearch、MongoDB、ClickHouse 等 12 种数据库和数仓&#xff0c;…

[linux]进程间通信-管道pipe的实际用法(写入/读取)

一、需求 现有两个进程A和B&#xff0c;B进程含较为独立且复杂的业务逻辑&#xff0c;A进程为主控进程&#xff0c;现A进程需要控制B进程执行对应的功能&#xff0c;且要保持响应及时。 二、分析 典型进程间通信案例&#xff0c;因此使用linux下的管道方法&#xff08;pipe&…

大创项目推荐 深度学习 机器视觉 人脸识别系统 - opencv python

文章目录 0 前言1 机器学习-人脸识别过程人脸检测人脸对其人脸特征向量化人脸识别 2 深度学习-人脸识别过程人脸检测人脸识别Metric Larning 3 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 深度学习 机器视觉 人脸识别系统 该项目…

在RT-Thread中使用SystemView进行调试分析

一、SystemView SystemView is a toolkit for visual analysis of any embedded system. SystemView gives complete insight into an application, to gain a deep understanding of the runtime behavior, going far beyond what a debugger is offering. This is particula…

maven学习和maven聚合工程搭建

1.学习maven maven的概念 项目管理工具 &#xff0c;对jar进行依赖管理&#xff0c;编译&#xff0c;打包&#xff0c;单元测试&#xff0c;安装&#xff0c;部署&#xff0c;贯穿整个项目 为什么要学maven 要解决的问题&#xff1a; 不同的开发工具开发出来的项目目录结构…

元旦厦门游--ChatGPT/GPT4科研实践应用与AI绘图技术

2023年我们进入了AI2.0时代。微软创始人比尔盖茨称ChatGPT的出现有着重大历史意义&#xff0c;不亚于互联网和个人电脑的问世。360创始人周鸿祎认为未来各行各业如果不能搭上这班车&#xff0c;就有可能被淘汰在这个数字化时代&#xff0c;如何能高效地处理文本、文献查阅、PPT…

马蹄集第37周

1、最小子串覆盖 考点&#xff1a;双指针 代码&#xff1a; def judge(s,t,l,r):m [0] * (256)for i in t:m[ord(i)] 1for i in range(l,r1):if s[i] in t:m[ord(s[i])] - 1for i in m:if i > 0:return Falsereturn Truedef main():result "No"s input()t i…

EMNLP 2023 亮点回顾:大模型时代下的 NLP 研究

作为自然语言处理&#xff08;NLP&#xff09;领域的顶级盛会&#xff0c;EMNLP 每年都成为全球研究者的关注焦点。2023 年的会议在新加坡举行&#xff0c;聚集了数千名来自世界各地的专家学者&#xff0c;也是自疫情解禁以来&#xff0c;中国学者参会最多的一次。巧的是&#…

windows 快捷键 win+tab 图标显示工具栏设置

在Windows中&#xff0c;按下Win Tab组合键会打开任务视图&#xff0c;该视图显示当前打开的窗口以及工作区的虚拟桌面。如果你希望在任务视图中显示工具栏设置&#xff0c;可以按照以下步骤进行&#xff1a; 1. 打开设置&#xff1a; 使用快捷键Win I或在任务栏上右键单击开…

南京大学-软件分析-课程05-数据流分析基础理论2

7. 迭代算法与不动点定理关联 我们需要证明自己的Transfer Function是单调的 代码什么时候会停止 8. May/Must Analysis, A Lattice View May Analysis Unsafe result->Safe result 如果我是一个查错的定义&#xff0c; 没有no definition的错误&#xff0c;这是一个不安…

Java开发框架和中间件面试题(2)

8.说说自己对Spring MVC的了解&#xff1f; MVC是一种设计模式&#xff0c;Spring MVC是一款很优秀的MVC框架。Spring MVC可以帮助我们进行更简洁的Web层开发&#xff0c;并且它天生与Spring框架集成。SpringMVC下我们一般把后端项目分为Service&#xff08;处理业务&#xff0…

21、Web攻防——JavaWeb项目JWT身份攻击组件安全访问控制

文章目录 一、JavaWeb二、JWT攻击 一、JavaWeb webgoat 1.java web的配置文件&#xff0c;配置文件一般在META-INF目录下&#xff0c;文件名常为pom.xml或web.xml 2.如何通过请求&#xff0c;查看运行的java代码。 地址信息PathTraversal/profile-upload 直接找到以该字符P…

【网络技术设备安全】BGP 基础与概述-2-中转 AS 中的 IBGP 路由传递

0x01 中转 AS 中的 IBGP 路由传递 参考该图&#xff1a; 上图&#xff0c;我们模拟一个 1.0 的路由通过 AS 65101 来传递 1&#xff1a;通过图可知&#xff0c;A 与 B 之间的 Peer 为 EBGP&#xff0c;B 与 E 之间为 Peer IBGP&#xff0c;E 与 F 之间为 Peer EBGP 邻接 2&a…

python爬取网页图片并下载

python爬取网页图片并下载之GET类型 准备工作 【1】首先需要准备好pycharm&#xff0c;并且保证环境能够正常运行 【2】安装request模块 pip install requestsimport request导入request内置模块 【3】安装lxml模块 pip install lxmlfrom lxml import etree导入lxml.etre…

机器学习---随机森林

1、使用决策树来做回归或者预测值 如上图&#xff0c;使用学历、收入、身高、行业使用决策树来预测收到的邮件数。可以将邮件数分为几类&#xff08;也可以按照其他列&#xff0c;将邮件数分类&#xff09;&#xff0c;比如邮件数<23封属于A类&#xff0c;邮件数大于23<邮…

使用 Node.js 插件给指定目录下的所有图片添加上文字水印

说在前面 加水印是为了保护图片的版权和安全。在互联网上&#xff0c;很容易将图片下载或者截屏保存下来&#xff0c;然后进行二次使用&#xff0c;这就侵犯了原作者的版权。而加上水印可以使得图片更难被盗用&#xff0c;因为盗用者需要花费时间和精力去处理水印&#xff0c;而…

【稳定检索|投稿优惠】2024年交通运输与能源动力国际学术会议(IACTEP 2024)

2024年交通运输与能源动力国际学术会议(IACTEP 2024) 2024 International Academic Conference on Transportation and Energy Power(IACTEP) 一、【会议简介】 2024年交通运输与能源动力国际学术会议(IACTEP 2024)将在美丽的三亚盛大启幕。本次会议将聚焦交通运输与能源动力等…

【所有方法一览】大模型推理优化:在更小的设备运行、推理增速

大模型推理优化&#xff1a;在更小的设备运行、推理增速 知识蒸馏&#xff08;优先&#xff09;模型剪枝模型量化&#xff08;优先&#xff09;参数共享低秩分解参数搜索 知识蒸馏&#xff08;优先&#xff09; 知识蒸馏&#xff1a; 知识&#xff1a;模型参数、一堆矩阵蒸馏&…