从另外一个角度解释AUC

news2025/1/20 5:51:41

AUC到底代表什么呢,我们从另外一个角度解释AUC,我们先看看一个auc曲线

蓝色曲线下的面积(我的模型的AUC)比红线下的面积(理论随机模型的AUC)大得多,所以我的模型一定更好。

我的模型比随机模型好多少呢?理论随机模型只是对角线,这条对角线下的面积是0.5,我们的模型的AUC是0.75 那么这个0.75的AUC值究竟代表什么?

首先,我们要了解AUC是为一个可以给出概率分数的模型定义的。另外一点是,它是为二元分类任务定义的。但是也可以推广到多类分类问题。

我们要牢记以上这两点,这样才可以继续解释这个问题。

二元分类模型是什么样子的?

简单地说,给定一个数据点,比如x,它可以有许多特征,任何这样的数据点的类只能有两种可能性,要么是1,要么是0。而模型一般都会预测样本为1的概率(0-1之间的一个数值)。

也就是说,它不是直接断言类,而是预测一个类的概率。

我们得到了这个分数,可以把它看做是一个信心的衡量标准。如果你把钱押在两匹马上,x1和x2。你记录下它们的特征,然后通过分类器。第一个赢的概率是0.90第二个赢的概率是0.85。这两匹马都有相当不错的胜率,虽然这两个马的分类都是“win”(因为概率都超过了50%)。但是如果只有在一匹马上下注的钱,那么根据概率你会选择哪匹马呢?

在上面的讨论中,我们忽略了一个假设,这正是直观理解AUC的最基本方面。我如何判断这两匹马都属于这个类别呢?因为他们获胜的概率都很高(>0.5)。但是有多高呢?

为什么把这两匹马都归为类别获胜似乎是一件显而易见的事情?

因为在0到1的范围内(这是任何概率的范围),大于0.5或0.55的值应该被视为高值。但是,如果你真的要下注,而一匹马的概率是0.60,你会下注吗?我不这么认为!也就是说,你不关心0.5的门槛,你有一个更高的门槛因为你是在用真的钱在冒险,所以你可能会想拒绝0.6的那匹马是明智的。

如果把阈值提高到0.95上面提到的马x1和x2都会被拒绝。但是如果你的门槛是0.88,哪你会选择x2而拒绝x1。

也就是说,当涉及概率评分时分类结果将取决于0-1范围内阈值的选择。

这里我们首先假设有一个上帝模型,它会知道哪匹马会赢,所以它会输出获胜的概率分数,赢的马的概率分数为0.999,其他所有马的概率分数为0.0001。另外一个假设你是一个“傻瓜”,你会相信即使是一匹赢的概率等于0.1的马也会赢。

当我们的模型给出胜出的概率为0.25时,你肯定直接去柜台把钱押在那匹马身上(0.25>0.1)。但是如果你有上帝模型,它会直接输出0.0001,而你的阈值是0.1,因此你也不会在那匹马上下注,所以即使你是“傻瓜”,但上帝模型很好也可能给你正确的答案。也就是说无论你的阈值是多少,如果这个模型都很好,你就不会有损失。

因此,无论你的阈值是0.9还是0.95,上帝模型都会输出获胜马的概率分数为0.999,这将高于做出决定而设置的任何阈值。因此你将永远赢钱,永远不会赔钱。

对于上帝模型来说,True-Positive 率总是1,False-Positive率总是0。上帝模型的ROC曲线可以说是不存在的,因为在绘制它时,你会发现只有一个点,FP等于0,TP等于1。

TPR和FPR

让我们继续说说TPR和FPR。

TPR:在所有正例中,有多少被预测为正例的。

对于我们说的赛马来说,TPR是假设钱被押注的情况下的赢钱的概率。而FPR是在赌钱的情况下赔钱的比率。所以,我们希望TPR大于FPR。

FPR:在所有真正的负例中,有多少被预测为正例的

假设你的阈值太低,比如0.05。模型给出的任何概率值都可能高于阈值,因此每个实例都被预测为正例。在这种情况下,TPR和FPR都是1。类似的当阈值过高(如0.99)时,你的模型给出的任何概率分数都可能低于阈值,因此每个实例都被预测为负例。在这种情况下,TPR和FPR都等于0。

所以如果绘制这两个点,其中FPR =TPR =1和FPR =TPR =0,你会发现这两个点在对角线上。注意对角线的方程是FPR = TPR。他的含义是,如果模型对不同的截止点表现出这样的行为,我们可以保证不会因为损失而抵消你所赚的钱。

为了得到一个比随机模型更好、更接近上帝模型的模型,我们希望TPR在大多数截断点上大于FPR。

为什么呢?因为TPR是可能获胜的总数中的胜率,而 FPR 给出了下注的输钱率。对角线上方的区域是TPR大于FPR的区域。曲线越向上移动越好。

最后就是要量化这个概念,曲线下的面积是有意义的。曲线下的面积越大,曲线向上移动的幅度就越大。所以当看到TPR和FPR之间的曲线时,

你会注意到曲线位于TPR > FPR的区域。通过AUC,你就知道它有多好。

为什么要在TPR和FPR之间画一条曲线呢?

我们继续用赛马的例子中给出TPR和FPR的含义来解释这一点

橙色的ROC曲线说明了什么?这条曲线通过绘制TPR与FPR在不同截点处的曲线而存在。这条曲线表明无论截点是多少,TPR总是等于1。

从这一点出发,截点用于检查模型的判别质量有多健壮。也就是说即使有不同的截点,模型给出的TPR值总会高于FPR值。具体高出多少呢?

AUC就给出的是给出“多高”的概念。因为我们感兴趣的是知道模型有多好?它能更好地区分两个类别(赢/输),我们赌赢钱越多,赌输钱越少的可能性就越大。

https://avoid.overfit.cn/post/0c5dffb7414141a98c4b1ffb5b5f6c82

作者:Number Theory

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/93032.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

加密与认证技术

加密与认证技术密码技术概述密码算法与密码体制的基本概念加密算法与解密算法秘钥的作用什么是密码密钥长度对称密码体系对称加密的基本概念典型的对称加密算法DES加密算法3DES加密算法非对称密码体系非对称加密基本概念密码技术概述 密码技术是保证网络安全的核心技术之一&am…

【windows Server 2019系列】 构建IIS服务器

个人名片: 对人间的热爱与歌颂,可抵岁月冗长🌞 Github👨🏻‍💻:念舒_C.ying CSDN主页✏️:念舒_C.ying 个人博客🌏 :念舒_C.ying Web服务器也称为WWW(World W…

电子厂测试题——难倒众多主播——大司马也才90分

一、选择题 1、1-2 ( ) A.1 B.3 C.-1 D.-3 2、|1-2|( ) A.1 B.3 C. -1 D.-3 3、1x2x3( ) A.5 B.6 C.7 D.8 4、3643( ) A.29 B.16 C.8 D.3 5、55x5( ) A.15 B.30 C.50 D.125 二、填空题(请填写阿拉伯数字) 6、110100 1000_______ 7、一个三角形砍去1个角&#…

Feign的两种最佳实践方式介绍

何谓最佳实践呢?就是企业中各种踩坑,最后总结出来的相对比较好的使用方式; 下面给大家介绍两种比较好的实践方案: 方式一(继承):给消费者的FeignClient和提供着的Controller定义一个统一的父接…

在逆变器中驱动和保护IGBT

在逆变器中驱动和保护IGBT 介绍 ACPL-339J是一款先进的1.0 A双输出,易于使用,智能的手机IGBT门驱动光耦合器接口。专为支持而设计MOSFET制造商的各种电流评级,ACPL-339J使它更容易为系统工程师支持不同的系统额定功率使用一个硬件平台通过…

全面解析若依框架(springboot-vue前后分离--后端部分)

1、 若依框架分解 - 启动配置 前端启动 # 进入项目目录 cd ruoyi-ui# 安装依赖 npm install# 强烈建议不要用直接使用 cnpm 安装,会有各种诡异的 bug,可以通过重新指定 registry 来解决 npm 安装速度慢的问题。 npm install --registryhttps://regist…

算法刷题打卡第47天:排序数组---归并排序

排序数组 难度:中等 给你一个整数数组 nums,请你将该数组升序排列。 示例 1: 输入:nums [5,2,3,1] 输出:[1,2,3,5]示例 2: 输入:nums [5,1,1,2,0,0] 输出:[0,0,1,1,2,5]归并排…

用CSS给健身的侣朋友做一个喝水记录本

前言 事情是这样的,由于七八月份的晚上时不时就坐在地摊上开始了喝酒撸串的一系列放肆的长肉肉项目。 这不,前段时间女朋友痛下决心(心血来潮)地就去报了一个健身的私教班,按照教练给的饮食计划中,其中有一…

卵巢早衰与微生物群,营养治疗新进展

卵巢早衰 卵巢早衰(premature ovarian insufficiency,简称POI)在生殖系统疾病中位居首位,这些疾病可能会损害多个功能系统,降低生活质量,最终剥夺女性患者的生育能力。 目前的激素替代疗法不能改善受孕或降…

NR PDSCH(七) DL SPS

非动态调度,除了PUSCH configured grant type 1和2的传输,还有PDSCH SPS 传输,两者的流程基本类似,也有些小区别。在实网并没有见过配置DL SPS PDSCH传输的log,但还是按顺序理一遍相关内容。 RRC/MAC 先看下MAC 38.32…

文件上传,还存储在应用服务器?

一般项目开发中都会有文件、图片、视频等文件上传并能够访问的场景。要实现这样的场景,要么把文件存储在应用服务器上,要么搭建文件服务来存储。但是这两种方式也有不少的缺点,增加运维的成本。 因此,追求用户体验的项目可能会考…

Tomcat安装配置全解

👌 棒棒有言:也许我一直照着别人的方向飞,可是这次,我想要用我的方式飞翔一次!人生,既要淡,又要有味。凡事不必太在意,一切随缘,缘深多聚聚,缘浅随它去。凡事…

数据库分库分表

文章目录为什么要分库分表?数据切分垂直切分水平切分(每个表的结构相同)范围拆分取模拆分(一般为业务主键)分库分表带来的问题数据倾斜问题热点问题事务问题聚合查询问题分页问题非分区业务查询分库分表实现或工具hash…

DSP篇--C6701功能调试系列之 UART串口测试

目录 1、原理 2、测试 调试的前期准备可以参考前面的博文:DSP篇--C6701功能调试系列之前期准备_nanke_yh的博客-CSDN博客 UART串口收发数据存在两种模式:通常的串口模式(McBSP in Serial Port Mode)和GPIO模式(McBS…

哈希表及其与Java类集的关系

目录 1.哈希表的概念 2.哈希冲突 3.如何避免哈希冲突? 3.1哈希函数设计 3.2 负载因子的调节 4.解决哈希冲突 4.1闭散列 4.1.1线性探测 4.1.2二次探测 4.2开散列(哈希桶) 5.HashMap 6.HashSet 1.哈希表的概念 假设有一组数据,要让你去搜索其中的一个关键码,这种场…

JWT快速入门及所需依赖

目录 1.JWT 1.1什么是JWT 1.2JWT的构成 jwt的头部 payload signature 1.3JWT快速入门案例 2Jwt认证(微服务) 2.1微服务下统一权限认证 2.2应用认证 3.无状态的JWT令牌如何实现续签功能? 3.1不允许改变Token令牌实现续签 3.2允许改…

计算机毕业设计django基于python大学生多媒体学习系统

项目介绍 随着计算机多媒体技术的发展和网络的普及。采用当前流行的B/S模式以及3层架构的设计思想通过Python技术来开发此系统的目的是建立一个配合网络环境的大学生多媒体学习系统的平台,这样可以有效地解决数据学习系统混乱的局面。 本文首先介绍了大学生多媒体学习系统的发…

eslint Parsing error: The keyword ‘export‘ is reserved

报错 原因 ECMAScript modules(import/export) 是 es6 的语法。 根据 eslint 官方文档 Configure language options ,eslint 默认使用 es5 语法: 解决 要让 eslint 知道我在使用 es6 的 modules 语法。有下面几种方法: 设置 env 为 es6&am…

喜讯 | 第三届国际科创节,企企通喜提两项大奖

近日,第三届国际科创节暨数服会STIF奖评选活动重磅揭晓,旨在向科技创新与数字化转型引领者致敬。企企通作为作为数字化采购平台领军者,凭借业内领先的技术实力与优秀的服务口碑,经过层层筛选和专业评审,企企通最终荣膺…

【LeetCode每日一题:1785. 构成特定和需要添加的最少元素~~~数组公式推导+防止整型溢出+向上取整+贪心】

题目描述 给你一个整数数组 nums &#xff0c;和两个整数 limit 与 goal 。数组 nums 有一条重要属性&#xff1a;abs(nums[i]) < limit 。 返回使数组元素总和等于 goal 所需要向数组中添加的 最少元素数量 &#xff0c;添加元素 不应改变 数组中 abs(nums[i]) < limi…