ROC与AUC与主动学习评价指标ALC

news2024/11/18 21:48:35

首先需要关注一下什么是混淆矩阵,此处认为1为正类,0为负类

预测为0预测为1
真实为0TN真负例(预测为0,真实也为0)FP假正例(预测为1,但真实为0)
真实为1FN假负例(预测为0,但真实为1)TP真正例(预测为1,真实也为1)

那么接下来推导出各个常见指标的定义:

  • Accuracy:准确率: a c c = T T + F = T P + T N T P + T N + F P + F N acc = \frac{T}{T+F}=\frac{TP+TN}{TP+TN+FP+FN} acc=T+FT=TP+TN+FP+FNTP+TN
  • Precision:查准率: P r e c i s i o n = T P T P + F P Precision=\frac{TP}{TP+FP} Precision=TP+FPTP,这里需要解释一下为何只有预测为1类的例子,因此在实际例子中常见是不平衡的类别比率,例如在病情诊断例子中,1类通常代表生病类,那么这个类别通常是少数的,因此用查准率来代表模型预测为生病的所有例子中生病的比率为多少
  • Recall:召回率(真正类率): R e c a l l = T R T P + F N Recall = \frac{TR}{TP+FN} Recall=TP+FNTR,同理按照上述例子,这里表达的是在所有生病的例子中,模型能够识别出来的比率是多少
  • FPR:负正类率: F P R = F P F P + T N FPR=\frac{FP}{FP+TN} FPR=FP+TNFP
  • TPR:真正类率: T P R = T P T P + F N TPR=\frac{TP}{TP+FN} TPR=TP+FNTP
  • 截断点:机器学习算法对test样本进行预测后,可以输出各test样本对某个类别的相似度概率。比如t1是P类别的概率为0.3,一般我们认为概率低于0.5,t1就属于类别N。这里的0.5,就是”截断点”。

而ROC曲线是以FPR为横轴,TPR为纵轴所绘制的线

那么接下来将测试集中所有的n个样本预测为正类的置信度进行排序,从高到低,并且接下来进行n次计算,每次需要将排序的第n个样本的置信度作为分类置信度阈值划分类别。例如排序后的序列为[0.9,0.8,0.5,0.4]。

那么第一次迭代,第一个样本的置信度为0.9,那么此时大于0.9的认为是正类(数目为0),小于等于0.9的认为负类(数目为n,即4),可计算得到 F P R = T P R = 0 FPR=TPR=0 FPR=TPR=0,即第一个点为ROC曲线上的 ( 0 , 0 ) (0,0) (0,0)点;第二次选择0.8作为阈值,那么正类样本划分为1,负类样本划分为3,那么再根据样本的真实标签计算 F P R , T P R FPR,TPR FPR,TPR就可以得到下一个点,以此类推。

而AUC就是ROC曲线下的面积,介于0.1到1之间的数值,越接近于1越好

例如下图:

在这里插入图片描述

那么关于ALC,在论文《Results of the Active Learning Challenge》中是这么描述的:

The prediction performance was evaluated according to the Area under the Learning Curve (ALC). A learning curve plots the Area Under the ROC curve (AUC) computed on all the samples with unknown labels, as a function of the number of labels queried. To obtain our ranking score, we normalized the ALC as follows:
g l o b a l s c o r e = A L C − A r a n d A m a x − A r a n d globalscore = \frac{ALC-Arand}{Amax-Arand} globalscore=AmaxArandALCArand
where Amax is the area under the best achievable learning curve and Arand is the area under the average learning curve obtained by making random predictions.

解释:根据学习曲线下的面积(ALC)评估预测性能。学习曲线绘制在具有未知标签的所有样本上计算的ROC曲线下面积(AUC),作为查询的标签数量的函数。为了获得我们的排名分数,我们将ALC标准化如下。

其中Amax是最佳可实现学习曲线下的面积,Arand是通过随机预测获得的平均学习曲线下的面积。

那么首先理解ALC的定义:ALC是学习曲线下的面积,而学习曲线则是绘制了AUC的变化曲线,而AUC是曲线ROC曲线的面积,然后根据论文提供的参考资料(http://www.causality.inf.ethz.ch/activelearning.php?page=evaluation#cont)可以更好理解:学习曲线的横坐标是请求实例的数目的对数,纵坐标为请求该数目的实例时,所请求标签的实例集合计算出来的AUC分数,因此总体绘制出来就是一个AUC的变化曲线。而其中 A m a x Amax Amax代表最理想的情况,即AUC始终为1的情况,而 A r a n d Arand Arand则代表随机策略,那么此时可以认为其数值为0.5。以下为例子:

在这里插入图片描述

上面是简单的例子,以下为论文的实验中的例子:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1105920.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

VUE 快速上手与基础指令(内附详细案例)

文章目录 前言一、vue快速上手1. vue是什么2. 创建一个vue实例3. 插值表达式4. vue的响应式特性5. 开发者工具安装 二、vue指令1. v-html2. v-if 和 v-show3. v-else 和 v-else-if4. v-on5. v-bind6. 案例-波仔的学习之旅7. v-for8. 案例-小黑的书架9. v-for 中的key10. v-mode…

Python 框架学习 Django篇 (三) 链接数据库

只要你是做后端开发的,那么就离不开各种数据库,Django框架对各种数据库都非常友好,比如常见的PostgreSQL、MySQL、SQLite、Oracle,django都对他们提供了统一调用api,我们这里主要使用mysql数据库作为演示 一、ORM机制 …

报考阿里云acp认证,你得到的是什么?

放眼全球能够和亚马逊AWS、微软Azure竞争的,国内也就只有阿里云了。 阿里云目前稳居国内云计算市场第一,比排后面5名同行市场占有率的总和还要多,全球云计算市场,阿里云目前排名第3位。 阿里云的市场占有率说明市场对于阿里云产…

许战海战略文库|我们的建议:华彬集团改名战马饮料集团

摘要:战马未能有效借势红牛,市场份额不及东鹏特饮。战马要走出当下面临的窘境,需要将华彬集团改名为战马饮料集团,借势红牛加强战马主品牌的认知建设构建战马饮料的产品矩阵;组建战马独立销售网络。 许战海咨询认为:过度差异化造成华彬集团快…

肿瘤科常用评估量表汇总,建议收藏!

根据肿瘤科医生的量表使用情况,笔者整理了10个肿瘤科常用量表,可在线评测直接出结果,可转发使用,可生成二维码使用,可创建项目进行数据管理,有需要的小伙伴赶紧收藏! 肿瘤患者的ECOG评分标准 肿…

手机流量卡经营商城小程序的作用是什么

流量卡成为很多用户的选择,同时市场中也出现了不少流量卡卖家,基于多种形式开展生意。然而虽然市场需求度高,但流量卡经营难题也不少。 流量卡客户具有高忠诚度,然而入驻线上第三方平台,客户属于平台,无法…

檀香香料经营商城小程序的作用是什么

檀香香料有安神、驱蚊、清香等作用,办公室或家庭打坐等场景,都有较高的使用频率,不同香料也有不同效果,高品质香料檀香也一直受不少消费者欢迎。 线下流量匮乏,又难以实现全消费路径完善,线上是商家增长必…

grafana v10.1版本设置告警

1. 相关概念概述 如图所示,点击切换菜单标志,可以看到警报相关子选项。 警报规则:通过PromQL语句定义告警规则,即达到怎样的状态触发告警。 联络点: 设置当警报规则实例触发时,如何通知联系人,…

索引优化与查询优化(补充篇)

其他优化策略 exist和in的区别 选择的标准:小表驱动大表 SELECT *FROM A WHERE cc IN (SELECT cc FROM B)SELECT *FROM A WHERE EXISTS (SELECT cc FROM B WHERE B.ccA.cc)当A小于B时,用EXISTS。因为EXISTS的实现,相当于外表循环&#xff0…

猜数字游戏(Rust实现)

文章目录 游戏说明游戏效果展示游戏代码游戏代码详解生成神秘数字读取用户输入解析用户输入进行猜测比较 游戏说明 游戏说明 游戏运行逻辑如下: 随机生成一个1-100的数字作为神秘数字,并提示玩家进行猜测。如果玩家猜测的数字小于神秘数字,则…

智慧河湖方案:AI赋能水利水务,构建河湖智能可视化监管大数据平台

一、方案背景 我国江河湖泊众多,水系发达。伴随着经济社会快速发展,水生态水环境问题成为群众最关注的民生议题之一。一些河流开发利用已接近甚至超出水环境承载能力,一些地区废污水排放量居高不下,一些地方侵占河道、围垦湖泊等…

Apache SeaTunnel Web 功能正式发布!

Apache SeaTunnel Web 功能正式发布! 在大数据技术的不断进步之下,Apache SeaTunnel 成为了众多开发者和企业关注的焦点。今天,我们很高兴地宣布:Apache SeaTunnel Web功能已正式发布,带来了前所未有的易用性和效率。…

手把手带你使用VSCode 搭建 STM32开发环境!

首先附上一张VS Code图一直都喜欢这种,黑色主题感觉高大上。 一、需要的软件和工具。 下载最新版VS Code: 安装好插件,具有良好的代码补全与调试功能。 “ VS Code下载地址:https://code.visualstudio.com/ ” 下载 LLVM:用于代码…

DeFi世界 MXT脱颖而出 利好不断

​​MixTrust希望成为用户在Web3世界的专用金融平台,注重为用户提供个性化的金融服务。而WorldCoin的愿景则是建设一个全球最大的、公平的数字身份和货币体系,强调构建一个涵盖全球范围的身份认证和货币交易系统。 扩展性 在扩展性方面,双方…

操作系统体系结构和OS

1.冯诺依曼计算机体系 关于冯诺伊曼系统,在这里我只是简单讲一讲,更加详细的内容可以看我的计算机组成系列。 常见的笔记本、台式机,不常见的服务器、工作站,大部分都遵守“冯诺依曼体系”,因此该计算机体系就是现代…

易点易动设备管理系统帮助生产企业提升设备巡检效率

在现代制造业中,设备的正常运行对于生产企业的成功至关重要。然而,设备巡检是确保设备安全性和可靠性的关键环节,但却常常耗费大量时间和资源。为了解决这个问题,许多企业采用了现代化的设备管理系统,其中易点易动设备…

简单谈谈我参加数据分析省赛的感受与体会

数据分析省赛的感受与体会 概要考试前的感受与体会考试注意事项小结 概要 大数据分析省赛指的是在省级范围内举办的大数据分析竞赛活动。该竞赛旨在鼓励和推动大数据分析领域的技术创新和人才培养,促进大数据技术与应用的深度融合,切实解决实际问题。参…

通讯协议学习之路:有线通讯协议总览

通讯协议之路主要分为两部分,第一部分从理论上面讲解各类协议的通讯原理以及通讯格式,第二部分从具体运用上讲解各类通讯协议的具体应用方法。 后续文章会同时发表在个人博客(jason1016.club)、CSDN;视频会发布在bilibili(UID:399951374) 一、…

【ELK使用指南 2】常用的 Logstash filter 插件详解(附应用实例)

Logstash filter 一、logstash filter过滤插件的常用模块简介二、grok 正则捕获插件2.1 grok插件的作用2.2 内置正则表达式2.3 自定义正则表达式 三、mutate 数据修改插件3.1 mutate插件的作用3.2 常用的配置选项3.3 mutate插件应用实例 四、multiline 多行合并插件4.1 multili…

哈希表(拉链法)代码模板

这里也是用数组模拟链表 //拉链法 //模拟散列表 在算法题中一般只有添加和查询不会有删除 //如果真的要删除也不是真正的删除而是打上一个标记 //mod的这个数最好取大于数据范围的第一个质数 #include<iostream> #include<cstring> using namespace std; const in…