离散分类和非离散分类问题中的模型评价

news2025/1/15 20:38:21

离散分类问题中的模型评价

假设分类目标只有两类:正样本(positive)和负样本(negative)。
分类器的分类结果会出现以下四种情况:

  • TP: 若一个实例为正,且被预测为正,即为“真正类”(True Positive)。
  • TN:若一个实例为负,且被预测为负,即为“真负类”(True Negative)。
  • FP:若一个实例为负,但被预测为正,即为“假正类”(False Positive)。
  • FN:若一个实例为正,但被预测为负,即为“假负类”(False Negative)。
    说明:True或False表示预测正确与否。

混淆矩阵:也称误差矩阵,是分析分类器识别不同类元组的一种有用工具。

image.png
其中,每一列代表预测值,每一行代表实际的类别。

分类模型的评价指标—准确率

  • 准确率:被准确分类的样本数占总样本数的比例。
  • 准确率是评价分类模型的一个常见的评价指标。
  • 一般而言,准确率越高,分类器性能越好。

image.png

image.png

  • 如果模型预测每个实例为0类, 则准确率为多少?
  • 显然,此时模型并不能正确预测任何1类的实例,准确率也成为了误导。特别是疾病检测中,1类更需要被关注。
  • 在正负样本不平衡的情况下,准确率会有很大的缺陷。
    这个时候只用准确率去评估一个模型就显得不够准确,此时就需要精确率和召回率去一起评估模型.

分类模型的评价指标—精确率

精确率(精确性的度量,也称精度):

  • 针对预测结果而言,表示被预测为正的样本数中实际为正样本的比例。
  • 预测为正有两种情况:一种是TP,一种是FP。

image.png

分类模型的评价指标—召回率

召回率(覆盖面的度量):

  • 针对测试样本而言,表示样本集中的正样本被预测正确的比例。
  • 原样本集中有两种情况:一种是TP,一种是FN

image.png

分类模型的评价指标—F1分数

对于地震的预测,我们往往希望召回率非常高,而牺牲准确率。
宁可发1000次警报,把10次地震都预测正确
也不希望发100次警报,只有8次预测正确,而漏掉2次

而对于买西瓜而言,我们往往希望买到甜的西瓜,但也存在一些不甜的西瓜。由于不可能把所有西瓜都尝一遍,所以根据常识选择一个西瓜时,
可能买到甜西瓜,此时精确率是高的;
而同时也可能把甜的误判为了不甜的,而导致了低的召回率;
这种情况要了高精确率而牺牲了召回率,因为买到了甜的西瓜,也是值得的。

  • 如果一些场景下要兼顾精确率和召回率,可以使用F1分数。
  • F1值是精确率和召回率的调和均值。

image.png

分类模型的评价指标—其它度量

image.png

非离散分类问题中的模型评价

分类模型的评价指标— ROC曲线

  • 前面讨论的分类器预测结果为离散的正类、负类,

  • 如果是针对连续型数据分类,可能会得到一个数值作为分类的阈值,此时该如何进行评价呢?

  • 如表所示,给出10条样本数据,对应按
    朴素贝叶斯分类器得到的后验概率。如何
    选定阈值以及把≥阈值的归为正类,<阈值
    归为负类呢?
    image.png

  • 解决方法:连续的值离散化

  • 导致的问题:离散阈值难以确定
    这个时候就引出了roc曲线即受试者工作特征曲线,它是一种坐标图式的分析工具,用于:

  • 选择最佳的分类模型、舍弃次佳的模型。

  • 在同一模型中设定最佳阈值。

  • 给定一个二元分类模型和它的阈值,就能从所有样本的(阳性/阴性)真实值和预测值计算出一个 (X=FPR, Y=TPR) 坐标点。

image.png

如何构建ROC曲线

  • 首先利用分类器计算每个数据记录的后验概率P(+|A)
  • 将这些数据记录对应的P(+|A)从高到低排列(如下表):
  • 由低到高, 将每个P(+|A)值分别作为阈值,把对应的记录以及那些值高于或等于阈值指派为阳性类positive, 把那些值低于阈值指派为阴性类negative。
  • 统计 TP, FP, TN, FN;
  • 计算TPR 和FPR 。
  • 绘出诸点(FPR, TPR)并连接它们。

image.png

image.png

将折线图按照连接凸点忽略凹点的方式去画出弧线图.
23536fb9142ed71c05e74066e4a94ed.jpg

  • ROC曲线越靠近左上角,模型的准确性越高。
    ROC曲线的缺点:
  • 如果根据ROC曲线对分类器模型进行比较时,两个分类器模型的ROC曲线发生交叉,则难以断言两者孰优孰劣。
    解决办法——AUC:
  • AUC即ROC曲线下与坐标轴围成的面积。用于衡量二分类模型的优劣,表示预测的正例排在负例前面的概率。
  • AUC取值一般在【0.5,1】之间,等于1表示准确性最高,等于0.5则没有应用价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/607618.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能python:Python去空格输出:优化您的代码和网站速度

Python去空格输出:优化您的代码和网站速度 Python是一种简单易用的编程语言,广泛用于各种应用和网站开发。然而,Python的代码输出(如HTML和CSS)中不可避免地包含了空格、制表符和换行符。这些额外的字符可能会影响网站…

模式识别算法的常见评价指标TP/FP/FN/TN,ROC,DET,EER

文章目录 TP/FP/FN/TN(TA/FA/FR/TR)误报率(FAR)漏报率(FRR) ROC曲线(Receiver Operating Characteristic Curve,受试者特征曲线)DET曲线(Detection Error Tra…

Maven高级——继承与聚合——版本锁定

在前面的文章已经实现了Maven的继承,初次之外,还可以在父工程当中统一管理依赖的版本。 场景介绍 有一些依赖不是各个模块共有的,则需要到那些子模块当中单独配置了,这时需要到各个模块单独配置了,比如下图有一个模块…

【小沐学Python】Python实现Web服务器(CentOS+Docker下部署Flask)

🍺基于Python的Web服务器系列相关文章编写如下🍺: 🎈【Web开发】Python实现Web服务器(Flask快速入门)🎈🎈【Web开发】Python实现Web服务器(Flask案例测试)&a…

Pyside6-第五篇-单选按钮QRadioButton

今天是Pyside6的第五篇内容。一起来看单选按钮。 QRadioButton。 class QRadioButton(QAbstractButton):"""QRadioButton(self, parent: Optional[PySide6.QtWidgets.QWidget] None) -> NoneQRadioButton(self, text: str, parent: Optional[PySide6.QtWidg…

9.wxss

wxss基本满足所有css,并在css的基础上增加了 rpx 尺寸单位import 导入样式 目录 1 rpx 2 import 3 全局样式与局部样式 4 样式权重 1 rpx rpx(responsive pixel),中文名叫响应像素,它是用来解决屏幕适配的尺寸单位,它…

Flink第九章:Flink CEP

系列文章目录 Flink第一章:环境搭建 Flink第二章:基本操作. Flink第三章:基本操作(二) Flink第四章:水位线和窗口 Flink第五章:处理函数 Flink第六章:多流操作 Flink第七章:状态编程 Flink第八章:FlinkSQL Flink第九章:Flink CEP 文章目录 系列文章目录前言一、简单案例1.Logi…

Linux高性能服务器编程|阅读笔记:第11章 - 定时器

目录 简介系列笔记11.1 socket选项SO_RCVTIMEO和SO_SNDTIMEO11.2 SIGALRM信号11.2.1 基于升序链表的定时器11.2.2 处理非活动连接11.3 I/O复用系统调用的超时参数11.4 高性能定时器11.4.1 时间轮11.4.2 时间堆结语简介 Hello! 非常感谢您阅读海轰的文章,倘若文中有错误的地方…

光储存技术及原理

描述 信息资料迅速增长是当今社会的一大特点。有人统计,科技文献数量大约每7年增加1倍,而一般的情报资料则以每2年~3年翻一番的速度增加。大量资料的存储、分析、检索和传播,迫切需要高密度、大容量的存储介质和管理系统。 1898年荷兰的Vald…

Jenkins+Docker 实现一键自动化部署项目!步骤齐全,少走坑路

本文章实现最简单全面的Jenkinsdockerspringboot 一键自动部署项目,步骤齐全,少走坑路。 环境:centos7git(gitee) 简述实现步骤:在docker安装jenkins,配置jenkins基本信息,利用Dockerfile和shell脚本实现…

javaScript蓝桥杯-----芝麻开门

目录 一、介绍二、准备三、目标四、代码五、完成 一、介绍 在阿里巴巴和四十大盗的故事中,阿里巴巴因为无意中知道了开门的咒语人生发生了翻天覆地的变化,四十大盗也因为咒语的泄露最终丧命。芝麻开门的咒语作为重要的信息推动着故事的发展。下面由你来…

初识网络之TCP网络套接字

目录 一、TCP常用网络接口 1. 监听服务器 2. 接收链接 3. 发起连接 二、实现一个简单的tcp程序 1. 日志函数 2. 服务端文件 2.1 .hpp文件 2.2 .cpp文件 3. 客户端文件 3.1 .hpp文件 3.2 .cpp文件 4. 程序测试 三、实现支持多个用户并发访问的tcp程序 1. 当前程序…

解决Dockerfile错误: ERROR [3/3] RUN yum install -y wget vim net-tools

RUN yum install -y wget vim net-tools该命令是在使用容器编排工具(如Docker)的Dockerfile文件中执行的。它尝试安装一些常用的软件包,如wget、vim、net-tools。根据错误消息,执行此命令时发生了3个错误。 可能的原因包括&#…

chatgpt赋能python:Python去除非法字符:让你的数据更干净、更有效

Python去除非法字符:让你的数据更干净、更有效 在处理数据时,非法字符是常见的问题。它们可能是一些无意义的符号、特殊字符或非常规字符等等。如果不被正确处理,这些非法字符可能会给你带来麻烦,如导致脚本失败、破坏数据完整性…

LeetCode中等题合集 python

目录 3. 无重复字符的最长子串53. 最大子数组和80. 删除有序数组中的重复项 II442. 数组中重复的数据209. 长度最小的子数组59. 螺旋矩阵 II24. 两两交换链表中的节点19. 删除链表的倒数第 N 个结点142. 环形链表 II 3. 无重复字符的最长子串 滑动窗口,类似的题目还…

Biological Psychiatry:利用TMS-EEG识别难治性抑郁症间歇性θ脉冲刺激的神经生理标志物

前言 难治性抑郁症(TRD)是指在经过足够疗程的药物治疗或心理治疗后,症状没有得到改善的重度抑郁。大约有30%的重度抑郁症(MDD)属于难治性抑郁症。重复经颅磁刺激(rTMS)可引起大脑皮层兴奋或抑制性的改变,是TRD的有效干预措施。间歇性θ脉冲刺激(iTBS)一…

ClickHouse 基础

ClickHouse是2016年开源的列式存储数据库(DBMS),使用C语言编写,主要用于在线分析处理查询OLAP,能够使用SQL查询实时生成分析数据报告。 一、列式存储 以下面的Tabel为例 IDNameGender1吴彦祖男2刘亦菲女3陈冠希男 …

INT8 中的稀疏性:加速的训练工作流程和NVIDIA TensorRT 最佳实践

INT8 中的稀疏性:加速的训练工作流程和NVIDIA TensorRT 最佳实践 文章目录 INT8 中的稀疏性:加速的训练工作流程和NVIDIA TensorRT 最佳实践结构稀疏量化在 TensorRT 中部署稀疏量化模型的工作流程案例研究:ResNet-34要求第 1 步:…

JDK17新特性 即将成为主流的JDK 深入了解

文章目录 Switch 语句增强优化字符串拼接代码instanceof增强密封类(限制继承类)ZGC垃圾收集器 对于JDK17比较明显的特性 总结 Switch 语句增强 首先就是简化了Switch语句: 去掉了break及可以直接给返回值赋值。并且再匹配多个值的时候也做了…

AI 导致留学中介文书老师痛失万元月收入?是真的吗?

近日,总部位于伦敦,但在国内多个城市设有分公司的留学服务机构老板张冶告诉在接受记者采访时,他们对留学英国的人士提供的本硕博申请、论文润色、挂科申诉等业务都受到了ChatGPT的影响,甚至有业务线直接萎缩60%以上,有…