机器学习/深度学习——关于分类任务的机器学习、深度学习模型的评估指标详解

news2025/1/8 5:22:40

机器学习/深度学习——模型的评估详解

搭配以下文章进行学习:

卷积神经网络:
深度学习——卷积神经网络(convolutional neural network)CNN详解(一)——概述. 步骤清晰0基础可看

深度学习——卷积神经网络(convolutional neural network)CNN详解(二)——前向传播与反向传播过程(特征提取+预测+反向传播更新参数). 步骤清晰0基础可看

简单的神经网络详解:
深度学习——神经网络(neural network)详解(一). 带手算步骤,步骤清晰0基础可看

深度学习——神经网络(neural network)详解(二). 带手算步骤,步骤清晰0基础可看

梯度下降法:
机器学习/深度学习——梯度下降法(Gradient descent)详解. 步骤清晰 0基础可看

模型的过拟合与欠拟合:
机器学习/深度学习——模型的欠拟合和过拟合,正则化方法详解

(1)混淆矩阵

我们需要先了解如下概念:

它是一个表格,用于描述分类模型的预测结果与实际标签之间的关系。混淆矩阵的基本元素包括:

True Positives (TP): 真正例,模型正确预测为正类的样本数量。
True Negatives (TN): 真负例,模型正确预测为负类的样本数量。
False Positives (FP): 假正例,模型错误预测为正类的样本数量(也称为第一类错误)。
False Negatives (FN): 假负例,模型错误预测为负类的样本数量(也称为第二类错误)。

如下图所示展示了4个指标以及TRP和FPR的概念

混淆矩阵
f1
总结

评估指标列表

1.Accuracy (准确率)

  • 来源:正确分类的样本占总样本的比例
  • 作用:衡量模型整体的准确性
  • 公式: Accuracy = T P + T N T P + T N + F P + F N \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} Accuracy=TP+TN+FP+FNTP+TN

2.Precision (精确度)

  • 来源:预测为正类中实际为正类的比例
  • 作用:衡量模型预测为正类的准确性
  • 公式: Precision = T P T P + F P \text{Precision} = \frac{TP}{TP + FP} Precision=TP+FPTP

3.Recall (召回率, 真正例率)

  • 来源:实际为正类中被正确预测的比例
  • 作用:衡量模型捕捉所有正类样本的能力
  • 公式: Recall = T P T P + F N \text{Recall} = \frac{TP}{TP + FN} Recall=TP+FNTP

4.F1 Score (F1分数)

  • 来源:精确度和召回率的调和平均数
  • 作用:平衡精确度和召回率,提供一个综合指标
  • 公式: F 1 = 2 × Precision × Recall Precision + Recall F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} F1=2×Precision+RecallPrecision×Recall

5.Specificity (特异性, 真负例率)
在计算公式上:Specificity =1-误诊率

  • 来源:实际为负类中被正确预测的比例
  • 作用:衡量模型对负类的分类能力
  • 公式: Specificity = T N T N + F P \text{Specificity} = \frac{TN}{TN + FP} Specificity=TN+FPTN

6.敏感度(Sensitivity, TPR)
在计算公式上:Sensitivity =1-漏诊率
敏感度是真正例(TP)占实际正类(TP + FN)的比例。
T P R = T P T P + F N TPR = \frac{TP}{TP + FN} TPR=TP+FNTP

7.Negative Predictive Value (NPV, 负预测值)

  • 来源:预测为负类的样本中实际为负类的比例
  • 作用:衡量模型预测为负类的准确性
  • 公式: N P V = T N T N + F N NPV = \frac{TN}{TN + FN} NPV=TN+FNTN

8.False Positive Rate (FPR, 假正例率,误诊率)
将得病称为正例(Positive)。
健康称为负例(Negative)。
误诊就是将没有病的人诊断为有病,也就是假正例率。

  • 来源:实际为负类中被错误预测为正类的比例
  • 作用:衡量模型将负类错误分类为正类的频率
  • 公式: F P R = F P T N + F P FPR = \frac{FP}{TN + FP} FPR=TN+FPFP

9.False Negative Rate (FNR, 假负例率,漏诊率)
漏诊就是将有病的人诊断为健康,也就是假负例率。

  • 来源:实际为正类中被错误预测为负类的比例
  • 作用:衡量模型将正类错误分类为负类的频率
  • 公式: F N R = F N T P + F N FNR = \frac{FN}{TP + FN} FNR=TP+FNFN
  1. AUC-ROC (接收者操作特征曲线下面积)
  • 来源:ROC曲线下面积
  • 作用:提供一个模型在不同阈值下性能的综合评估
  • 公式:通常不直接给出,而是通过计算不同阈值下的TPR和FPR
  1. AUC-PR (精确率-召回率曲线下面积)
    • 来源:PR曲线下面积
    • 作用:特别适用于不平衡数据集,提供一个模型性能的综合评估
    • 公式:同样不直接给出,通过计算不同阈值下的精确度和召回率

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2045932.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ciallo~(∠・ω・ )⌒☆第十七篇 Ubuntu基础使用 其一

Ubuntu是一种基于Linux的操作系统,它是开源的、免费的,并且具有广泛的用户群体。 基本文件操作:Ubuntu使用命令行工具来进行文件操作。以下是一些常用的命令: 切换到用户主目录: cd ~ 切换到上级目录: cd .…

QT 数据导出到Excel

原创:QT 数据导出到Excel 在Qt自带的axcontainer模块中,我们可以使用QAxObject类来将数据保存到Excel中。Qt中将数据保存到Excel通常有两种方式:一种是以Excel格式导出,需要电脑上安装Office软件;另一种是以CSV格式导出…

用户端是小程序,后台管理系统是PC端的CMS系统

1. 数据库表设计 1.1 课程轮播图表 CREATE TABLE course_banners (id int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT 轮播图主键,image_url varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL COMMENT 轮播图图片链接,title varchar(255) CHARAC…

高考志愿智能推荐系统-计算机毕设Java|springboot实战项目

🍊作者:计算机毕设残哥 🍊简介:毕业后就一直专业从事计算机软件程序开发,至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长:按照需求定制化开发项目、 源…

Lesson 64 Don‘t ... You mustn‘t ...

Lesson 64 Don’t … You mustn’t … 词汇 play n. 戏剧(真人演的,话剧)v. 玩耍 搭配:play with 物体 / 人    玩…… / 和……一起玩 例句:我正在和Leo玩。    I am playing with Leo.演奏(乐器…

代码随想录算法训练营第十六天

力扣题部分: 513.找树左下角的值 题目链接:. - 力扣(LeetCode) 题面: 给定一个二叉树的 根节点 root,请找出该二叉树的 最底层 最左边 节点的值。 假设二叉树中至少有一个节点。 思路(层序遍历): 应该是这道题最简单的方法了&#xff0…

数据结构与算法——DFS(深度优先搜索)

算法介绍: 深度优先搜索(Depth-First Search,简称DFS)是一种用于遍历或搜索树或图的算法。这种算法会尽可能深地搜索图的分支,直到找到目标节点或达到叶节点(没有子节点的节点),然后…

Vue3 reactive 响应式原理源码实现

学习小满的视频,更详细的讲解 Vue3响应式原理 视频 需要了解Proxy、Reflect函数 目录结构: 配置环境: package.json {"name": "vue-reactive","version": "1.0.0","description": &quo…

【Kubernetes】Service 类型

Service 类型 1.NodePort2.ClusterlP3.LoadBalance4.ExternalName 在《Service 概念与实战》一文中,Service 的发布使用的是 NodePort 类型。除此之外,Service 的发布还支持 ClusterlP、LoadBalancer 和 ExternalName 这 3 种类型。 1.NodePort 在把 Se…

基于STM32开发的智能门铃系统

目录 引言环境准备工作 硬件准备软件安装与配置系统设计 系统架构硬件连接代码实现 系统初始化按钮与蜂鸣器控制显示与远程通知Wi-Fi通信应用场景 家庭智能门铃办公室访客通知常见问题及解决方案 常见问题解决方案结论 1. 引言 智能门铃系统通过集成按钮、蜂鸣器、显示屏、W…

HTML补充——表格表单

一、表格 1、在现实生活中,我们经常需要使用表格来表示一些格式化数据:课程表、人名表、成绩单 同样在网页中我们也需要使用表格,我们通过table标签创建表格。 2、在table标签中使用tr表示表格中的一行,有几个tr就有几行&#xff…

prometheus数据如何清理

1. 停止prometheus服务 2. 进到prometheus数据目录 3. 删除数据 3.1 删除持久化的数据块 Prometheus 将数据分块存储,每个块对应一个时间段。你可以通过查看目录中的时间戳来找到需要删除的数据块。 每个块的目录名是一个时间戳范围,例如 16094592000…

单片机在线升级架构(bootloader+app)

1、架构(bootloaderapp) 在一定的时间内如果没有程序需要更新则自动跳转到app地址执行用户程序 内部flash 512K bootloader 跑裸机 48k 主要实现USB升级和eeprom标志位升级 app 跑freeRtos 464K 程序的基本功能,升级时软件复位开始执行bootloader升级…

互斥锁以及进程间通信

写线程 ---写资源 可以写数据 的条件 1.开始时 ,buf空的 2.读线程 读完了 读线程 //buf充当读资源 //1.一开始,buf中没有数据可读的 1.写线程结束 信号量的机制 1.信号量 ----来描述 可使用的资源的个数 2.p操作 表示 使用这个资源 资…

毕业生实习与就业管理系统的设计与实现

TOC springboot297毕业生实习与就业管理系统的设计与实现 绪论 1.1 研究背景 现在大家正处于互联网加的时代,这个时代它就是一个信息内容无比丰富,信息处理与管理变得越加高效的网络化的时代,这个时代让大家的生活不仅变得更加地便利化&a…

保存数据至后台表

保存数据至后台表-供大数据平台使用-JOB程序 *&---------------------------------------------------------------------* *&程序名称 :ZBD_JOB_001 *&程序描述 : 保存数据至后台表-供大数据平台使用-JOB程序 *…

[Linux] 什么是 Shell?

一、什么是 shell ? shell在英语中的意思就是外壳,所以我们习惯称shell程序为壳程序。那为什么又会被叫做壳程序呢?那是因为shell程序是在内核上面的,属于操作系统的外壳部分,因此我们就称之为壳程序(shell)。 在 Linux 中&#…

增材制造正在加速赋能模具产业转型升级

模具,作为制造业的基石,正随着经济的蓬勃发展与产业的深度转型而面临更高要求。特别是注塑模具的冷却系统,传统工艺在面对随形冷却水路时显得力不从心,导致冷却效率无法进一步提升。而3D打印技术的崛起,则为模具领域开…

财务会计与管理会计(七)

文章目录 电商快递费用计算IF、VLOOKUP函数的应用 交费分布统计表SUMPRODUCT函数的应用 考勤签到统计系统OFFSET、MATCH函数的应用 出入库余额自动核算系统SUMPRODUCT、LOOKUP函数的应用 分段收费的典型案例VLOOKUP函数、MIN函数、MAX函数的应用 全额累进与超额累进计算提成全额…

《走走停停》,观后感

他这辈子看起来,好像就不是很成功。但是我们都很怀念这个人。 我们的文化太过强调永远,并把“永远”和“成功”牢牢捆绑了起来。 比如你开了一家咖啡店,这家店给你带来了很多快乐。但后来成本变高了,经营压力也变大了&#xff0…