classification_report

news2024/11/19 16:43:40

文章目录

  • classification_report
  • 混淆矩阵
  • 精确率(精准率),召回率,F1值
    • 精确率
    • 召回率
    • F1值
    • 精确率、召回率和F1值的应用
  • 参考文献

classification_report

假设使用sklearn.metrics.classification_report生成的分类图像如下图所示:
在这里插入图片描述
列名:“精确率(precision)”、“召回率(recall)”、“F1值(f1-score)”、“样本数(support)”
行名:“类别(0:错误;1:正确)”、“准确率(accuracy)”、“算术平均(macro avg)”、“加权平均(weighted avg)”
weighted avg:本身的比例乘以该样本占全部样本的比例
m a c r o   w e i g h t = ( 0.9305 + 0.9474 ) / 2 = 0.9389 w e i g h t e d   a v g = 0.9305 ∗ 7702 7702 + 10498 + 0.9474 ∗ 10498 10498 + 7702 macro\ weight=(0.9305+0.9474)/2=0.9389\\ weighted\ avg=0.9305*\frac{7702}{7702+10498}+0.9474*\frac{10498}{10498+7702} macro weight=(0.9305+0.9474)/2=0.9389weighted avg=0.93057702+104987702+0.947410498+770210498
想要理解什么是精确率、什么是召回率、什么是F1值,我们首先需要了解混淆矩阵

混淆矩阵

我们在这里定义行表示真实值,列表示预测值,如下图:
在这里插入图片描述

  • 先填写阳性P和隐性N:阳性和隐性由预测值决定凡是预测为1的都是阳性-P,凡是预测为0的都是隐性-N
    在这里插入图片描述
  • 接着填写真T假F:真假由预测值是否跟真实值一致来决定若一致,如副对角线上,则为T;若不一致,如主对角线上则为F
    在这里插入图片描述

精确率(精准率),召回率,F1值

精确率

精确率:你认为是对的中,有多少是对的
你认为对的中:即预测值为1的数量:TP+FP
有多少是对的:TP
P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP
精确率衡量了模型在预测正类别时的准确性

召回率

召回率:本来是对的中,你找回了多少对的
本来是对的,即真实值为1的数量:TP+TN
你找回了多少对的:TP
R e c a l l = T P T P + T N Recall=\frac{TP}{TP+TN} Recall=TP+TNTP
召回率衡量模型找出正类别样本的能力

F1值

F1值:精确率越高越好,召回率越高越好
F 1 = 2 1 P r e c i s i o n + 1 R e c a l l ( 方便理解 ) F1=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}}(方便理解) F1=Precision1+Recall12(方便理解)
F 1 = 2 P r e c i s i o n ∗ R e c a l l P r e c i s i o n + R e c a l l ( 标准公式 ) F1=\frac{2Precision*Recall}{Precision+Recall}(标准公式) F1=Precision+Recall2PrecisionRecall(标准公式)
F1值综合考虑了模型的准确性和查全率

精确率、召回率和F1值的应用

  • 医疗诊断:
    癌症检测:在医疗图像分析中,精确率和召回率可以用来评估模型对癌症病灶的检测性能。高精确率可以减少误报,高召回率可以确保不错过患者的真正癌症病变
  • 信息安全:
    垃圾邮件过滤:在垃圾邮件过滤中,精确率和召回率用于评估模型对垃圾邮件的识别性能。高精确率可降低误将正常邮件分类为垃圾邮件的情况,高召回率可确保垃圾邮件不被漏过
  • 搜索引擎:
    信息检索:在搜索引擎中,精确率和召回率用于评估检索结果的质量。高精确率确保搜索结果与用户查询高度相关,高召回率确保不错过潜在相关结果
  • 社交媒体分析:
    情感分析:在社交媒体情感分析中,精确率和召回率用于评估模型对情感类别的分类性能。高精确率可减少误分类,高召回率可确保捕捉到各种情感表达
  • 自然语言处理:
    实体识别:在实体识别任务中,精确率和召回率可用于评估模型对命名实体的识别性能。高精确率可确保标识的实体准确,高召回率可确保找到尽可能多的实体
  • 金融风险管理:
    信用评分:在信用评分模型中,精确率和召回率可用于评估模型对高风险客户的识别性能。高精确率可减少风险,高召回率可确保不错过潜在风险
  • 制造业质量控制:
    产品质量检验:在制造业中,精确率和召回率可用于评估产品质量检验模型的性能。高精确率可减少误报次品,高召回率可确保检测到尽可能多的次品

参考文献

1、classification_report分类报告
2、自己画混淆矩阵,防止懵逼
3、精确率(精准率),召回率,F1值的通俗解释

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1011307.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大模型对外提供应用的三种服务方式及示例

最近在研究Llama大模型的本地化部署和应用测试过程中,为了给大家提供更多的应用方式,研究了如何利用python快速搭建各种应用访问服务,一般来说,我们开发完成的软件模块为了体现价值,都需要对外提供服务,最原…

C++ PrimerPlus 复习 第一章 命令编译链接文件 make文件

第一章 命令编译链接文件 C 有什么呢?C 源代码文件后缀运行C过程可执行代码:编译语法:makeMakefile 基础语法编写完make只要和将要编译的文件放一起就行 然后在该目录使用make命令,就将自动运行;基础的Makefile版本 现…

GaussDB(DWS)云原生数仓技术解析:湖仓一体,体验与大数据互联互通

文章目录 前言一、关于数据仓库需求场景分类二、数据仓库线下部署场景2.1、线下部署场景介绍及优劣势说明2.2、线下部署场景对应的客户需求 三、数据仓库公有云部署场景3.1、公有云部署场景介绍及优劣势说明3.2、公有云部署场景对应的客户需求 四、为何重视数据共享&#xff08…

【洛谷 P1364】医院设置 题解(图论+深度优先搜索)

医院设置 题目描述 设有一棵二叉树,如图: 其中,圈中的数字表示结点中居民的人口。圈边上数字表示结点编号,现在要求在某个结点上建立一个医院,使所有居民所走的路程之和为最小,同时约定,相邻接…

windows彻底卸载unity

1.控制面板卸载 双击打开桌面的控制面板,选择卸载程序,选中Unity和UnityHub右击卸载。 2.清除unity的注册表 在运行中输入“regedit”双击打开注册表界面 删除 HKEY_CURRENT_USER\Software\Unity 下所有项 删除 HKEY_CURRENT_USER\Software\Unity Tec…

项目:TCP在线云词典

一.要求 1.搭建的框架环境中实现并发,实现多个用户同时查询的功能。 2.服务器分别保存每个用户的使用记录,客户端可以查询日志的功能。 3.基本的查询单词的功能。 4.密码验证的功能,实现登录验证账号和密码是否正确。 二.流程和框架 框架 …

【Spring容器的启动过程】

Spring容器的启动过程 Spring 在初始化过程中有二个非常重要的步骤,容器的初始化与刷新。 初始化流程 如果想生成 bean 对象,那么就需要一个 beanFactory 工厂(DefaultListableBeanFactory)如果想让加了特定注解(如 …

爬虫数据存储:技术、策略与实践(一)

文章目录 🍋引言🍋xlrd库和xlwt库🍋创建Excel文件🍋通过Python代码向Excel写入数据🍋案例实战 🍋引言 本节主要介绍一下在使用网络爬虫技术的时候,如何将数据存储到Excel中去 🍋xl…

云原生之使用Docker部署Teedy轻量级文档管理系统

云原生之使用Docker部署Teedy轻量级文档管理系统 一、Teedy介绍1.1 Teedy简介1.2 Teedy特点 二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍 三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker compose 版本 四、下载Teedy镜像五、部署Teedy轻量级文…

git 本地工作区和仓库区基本使用

(1)git 本地有三个区 工作区和暂存区和 git管理的仓库. (自行动手实践理解,然后就入门了)(2)本地初次使用git做的事情,需要做如下工作 git config --global user.name "xx" git config --global user.email xxxqq.com git config --globa…

山西电力市场日前价格预测【2023-09-15】

日前价格预测 预测说明: 如上图所示,预测明日(2023-09-15)山西电力市场全天平均日前电价为338.85元/MWh。其中,最高日前电价为415.06元/MWh,预计出现在19: 15。最低日前电价为270.06元/MWh,预计…

OPC是通讯协议吗安全性

目录 1 安全防护 1.1 防火墙 1.2 网闸 2 OPC是通讯协议吗 2.1 什么通讯协议 2.2 那么OPC又是什么? OPC官方说明文档 1 安全防护 本文阐述了控制网络以OPC接口接入信息网络应当采用的安全防护。 1.1 防火墙 防火墙是大家熟知的网络安全产品,并被用作控制网…

laravel8框架-语言包的安装和配置

1, 查找 laravel框架语言包地址: \根目录\resources\lang\ 默认有个 en 语言包 2,下载 和 安装 下载地址:https://packagist.org/ 搜索 laravel/lang 参考网址:https://packagist.org/packages/overtrue/laravel-lang 选择你…

ARM Linux DIY(十一)板子名称、开机 logo、LCD 控制台、console 免登录、命令提示符、文件系统大小

文章目录 前言板子名称uboot Modelkernel 欢迎词、主机名 开机 logoLCD 控制台console 免登录命令提示符文件系统大小 前言 经过前面十篇文章的介绍,硬件部分调试基本完毕,接下来的文章开始介绍软件的个性化开发。 板子名称 uboot Model 既然是自己的…

Games101作业0(vscode连接VB虚拟机)

作业0 配置环境: 基本配置在pa0中都有,下面介绍使用vscode连接VB虚拟机快捷开发 vscode连接VB虚拟机 1.用户名 可以看到Username为cs18并非为css180 2.密钥 在window主机生成密钥 ssh-keygen #一路回车3.VB虚拟机配置ssh sshd_config配置 cd /etc/ssh/ vim sshd_confi…

丰田工厂停产竟然因为磁盘...

丰田因磁盘空间不足关闭14家工厂 在如今的信息时代,无论是生活还是工作,我们都离不开计算机和网络。然而,令人惊讶的是,一家全球知名的汽车制造商——丰田,却因为磁盘空间不足的问题,被迫关闭了14家工厂。…

DP专题2 爬楼梯|

题目: 思路: 根据题意,我们先找到对应的 n 阶台阶的方案数是多少。 n 1 f(n) 1 n 2 f(n) 2 n 3 f(n) 3 n 4 f(n) 5 n 5 f(n) 8 ...... ...... n n f(n) f(n - 2) f(n - 1…

读高性能MySQL(第4版)笔记09_创建高性能索引(下)

1. 覆盖索引 1.1. 设计优秀的索引应该考虑到整个查询,而不单是WHERE条件部分 1.2. 如果一个索引包含(或者说覆盖)所有需要查询的字段的值,我们就称之为覆盖索引 1.3. 只有B-tree索引可以用于覆盖索引 1.4. 如果查询只需要扫描…

用Python实现链式调用

嗨喽,大家好呀~这里是爱看美女的茜茜呐 我们在使用Django的models查询数据库时,可以看到有这种写法: form app.models import XXX query XXX.objects.all() query query.filter(name123, age456).filter(salary999)在这种写法里面&#xf…

matlab根轨迹绘制

绘制根轨迹目的就是改变系统的闭环极点,使得系统由不稳定变为稳定或者使得稳定的系统变得更加稳定。 在使用PID控制器的时候,首先要确定的参数是Kp,画成框图的形式如下: 也就是想要知道Kp对系统性能有哪些影响,此时就…