评估在线不平衡学习的PAUC

news2024/11/18 3:33:58

评估在线不平衡学习的PAUC

原始论文《Prequential AUC: properties of the area under the ROC curve for data streams with concept drift》
由于正常的AUC需要计算整体数据集上,每个数据的预测置信度的排名。那么我们首先要求我们的在线学习算法在进行预测时也返回预测为某个类别的概率数值,并将其限制为二分类。

然后再在每个例子后使用一个特殊的排序结构结合滑动窗口遗忘机制来增量计算AUC。因为我们无法记得所有的例子,无法按照AUC的原始计算方式来对所有实例排序。为了使AUC在计算上可行并适用于不断发展的概念,必须使用滑动窗口进行计算。分数的滑动窗口将分析限制在最新的数据上,但要计算AUC,必须对分数进行排序。为了有效地维护一组排序的分数,我们建议使用红黑树数据结构。

伪代码为:

在这里插入图片描述

具体的文字描述为:

  • 对于每个传入的标记示例,分类器分配给该示例的分数被插入到窗口(第15行)以及红黑树(第10行)中,如果已经超过示例窗口,则删除最旧的分数(第5行和第15行)
  • 红黑树根据分数以降序排序,如果分数在负数之前是正数,则根据到达时间以升序排序。通过这种方式,我们保持了一个便于计算AUC的结构,并确保滑动窗口中最旧的分数将在红黑树中被及时找到。
  • 在滑动窗口和树已经被更新之后,通过对在每个阴性示例之前出现的阳性示例的数量求和(第18-28行)并通过所有可能的对pn(第29行)将该值归一化来计算AUC,其中p是窗口中阳性的数量,并且n是阴性的数量。
  • 在第26行中,我们通过减少AUC的增量来考虑阳性和阴性示例之间的分数关系。

例子如下图所示:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

窗口W包含六个例子,所有这些例子都已经插入到红黑树中。如前所述,树中的示例根据得分s降序排序(深度优先搜索),肯定在否定之前,并且根据到达时间t升序排序。当一个新的实例被分类器评分时(t:7,l:+,s:0.80),最旧的实例(t:1)将从窗口和树中删除。在插入新的评分示例之后,通过以深度优先搜索方式遍历树并对算法1的第17-29行中呈现的标签进行计数来计算AUC。

并且经过实验证明,随时间平均的序贯AUC与在整个流上计算的AUC高度一致且具有显著判别性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1150533.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue的动画与过度

一、Vue的动画效果 (一)编写CSS关键帧动画 keyframes show{from{transform: translateX(-100%);}to{transform: translateX(0px);} } (二)定义动画效果 .v-enter-active { animation: 配置项 } // 显示动画 .v-leave-active…

2.预备知识-2简化版

#pic_center R 1 R_1 R1​ R 2 R^2 R2 目录 知识框架No.1 数据操作数据预处理一、N维数组样例二、创建数组三、访问元素四、数据操作五、数据预处理六、D2L注意点 No.2 线性代数一、标量二、向量1、基本操作2、空间表示3、乘法 三、矩阵1、基本操作2、乘法3、空间表示4、乘法5、…

在销售区域 销售范围 <‘5100‘,‘20‘,‘00‘> 中, 订单类型 ZO05 没有定义

创建销售订单时报错,如上图,查询后台配置 SPRO-销售和分销-销售-销售凭证-销售凭证抬头-分配销售区域到销售凭证类型 对比发现ZO05没有配置这个销售范围,可以在此处进行配置。 通过STMS查看修改的传输请求 查看,传输时修改的内容…

Java架构师项目管理

目录 1 导学2 进度管理2.1 关键路径法3 软件配置管理3.1 配置项版本号4 质量管理5 风险管理想学习架构师构建流程请跳转:Java架构师系统架构设计 1 导学 2 进度管理 进度管理就是采用科学的方法,确定进度目标,编制进度计划和资源供应计划,进行进度控制,在与质量、成本目…

集简云x slack(自建)无需API开发轻松连接OA、电商、营销、CRM、用户运营、推广、客服等近千款系统

slack是一个工作效率管理平台,让每个人都能够使用无代码自动化和 AI 功能,还可以无缝连接搜索和知识共享,并确保团队保持联系和参与。在世界各地,Slack 不仅受到公司的信任,同时也是人们偏好使用的平台。 官网&#x…

【C/C++】关于指针变量的误区

程序运行前 ​ 在程序编译后,生成了exe可执行程序,未执行该程序前分为两个区域 ​ 代码区: ​ 存放 CPU 执行的机器指令 ​ 代码区是共享的,共享的目的是对于频繁被执行的程序,只需要在内存中有一份代码即可 ​ 代…

[C++入门系列]——类和对象下篇

​作者主页 📚lovewold少个r博客主页 ⚠️本文重点:C类和对象下篇知识点讲解 👉【C-C入门系列专栏】:博客文章专栏传送门 😄每日一言:宁静是一片强大而治愈的神奇海洋! 目录 前言 再谈构造函数…

Compose 如何配置布局?

Compose 是一个界面工具包,可让您轻松实现应用的设计。您只需描述自己想要的界面外观,Compose 会负责在屏幕上进行绘制。 Compose布局的优势 使用Compose布局还有许多其他优势: 灵活性:Compose布局支持组合任何数量的UI元素和自…

代码随想录算法训练营第三十八天丨 动态规划part01

动态规划理论基础 动态规划刷题大纲 什么是动态规划 动态规划,英文:Dynamic Programming,简称DP,如果某一问题有很多重叠子问题,使用动态规划是最有效的。 所以动态规划中每一个状态一定是由上一个状态推导出来的&a…

TypeScript之接口

一、是什么 接口是一系列抽象方法的声明,是一些方法特征的集合,这些方法都应该是抽象的,需要由具体的类去实现,然后第三方就可以通过这组抽象方法调用,让具体的类执行具体的方法 简单来讲,一个接口所描述…

python采集电商jd app搜索商品数据(2023-10-30)

一、技术要点: 1、cookie可以从手机app端用charles抓包获取; 2、无需安装nodejs,纯python源码; 3、搜索接口为:functionIdsearch; 4、clientVersion "10.1.4"同时也支持更高的版本; …

[UDS] --- CommunicationControl 0x28

1 0x28功能描述 根据ISO14119-1标准中所述,诊断服务28服务主要用于网络中的报文发送与接受,比如控制应用报文的发送与接收,又或是控制网络管理报文的发送与接收,以便满足一定场景下的应用需求。 2 0x28应用场景 一般而言&#…

刷穿力扣(31~60)

更好的阅读体验 \huge{\color{red}{更好的阅读体验}} 更好的阅读体验 31. 下一个排列 排列原理就是 C 中的 next_permutation 函数&#xff0c;生成指定序列的下一个全排列从给定序列的最右端开始&#xff0c;找到第一个满足 nums[i] < nums[i 1] 的元素 nums[i]若找不到这…

pytorch 入门 (五)案例三:乳腺癌识别-VGG16实现

本文为&#x1f517;小白入门Pytorch内部限免文章 &#x1f368; 本文为&#x1f517;小白入门Pytorch中的学习记录博客&#x1f366; 参考文章&#xff1a;【小白入门Pytorch】乳腺癌识别&#x1f356; 原作者&#xff1a;K同学啊 在本案例中&#xff0c;我将带大家探索一下深…

高压放大器在工作中的应用实例有哪些

高压放大器是一种电子设备&#xff0c;主要用于将输入的低电压信号放大为输出的高电压信号。它在工业、医疗、科研等领域具有广泛的应用。下面将列举一些高压放大器在工作中的应用实例&#xff1a; 1.高压发生器&#xff1a;高压放大器在高压发生器中被广泛使用。这些发生器通常…

Android渲染流程

目录 缓冲区的不同生命周期代表当前缓冲区的状态&#xff1a; 多个源 ViewRootImpl&#xff1a; Android4.0&#xff1a; Android5.0&#xff1a; Android应用程序调用SurfaceFliger将测量&#xff0c;布局&#xff0c;绘制好的Surface借助GPU渲染显示到屏幕上。 一个Acti…

Cannot find namespace ‘NodeJS‘.

最近在使用自定义指令做防抖节流的时候&#xff0c;使用ts定义定时器类型的时候报的错误&#xff0c;记录一下&#xff1a; 解决方法&#xff1a; 在根目录下找到env.d.ts&#xff0c;或者在根目录中新建一个文件&#xff08;global..d.ts&#xff09;在文件中导出NodeJS命名空…

OpenLayers入门,OpenLayers从vue的assets资源路径加载TopoJson文件并解析数据叠加到地图上,以加载世界各国边界为例

专栏目录: OpenLayers入门教程汇总目录 前言 本章以加载世界各国边界的TopoJson格式数据为例,讲解如何使用OpenLayers从vue的assets资源路径加载TopoJson文件并解析数据叠加到地图上。 GeoJson介绍 GEOJSON是gis地图中常用的数据格式,制作地图时用于存储各种地理数据,使…

使用 node.js 简单搭建Web服务 使用node简单搭建后端服务 使用node搭建服务

使用 node.js 简单搭建Web服务 使用node简单搭建后端服务 使用node搭建服务 1、初始化项目2、安装 Express.js Web 服务框架3、创建 app.js 主入口文件, 并且实现 GET、POST请求4、启动服务5、请求测试 1、初始化项目 例如项目名为 node-server-demo mkdir node-server-demo进…

sd 模型笔记之 SDXL

C站有个创作者Copax&#xff0c;他创作了许多模型和LoRA&#xff0c;其中有一个SDXL1.0的模型非常受欢迎&#xff0c;叫Copax TimeLessXL。 TimeLess的字面意思是永恒&#xff0c;不过有一首英文歌也是TimeLess&#xff0c;歌词大意是唯爱永恒。 这个SDXL1.0的模型更新到了8…