读文章笔记-OSSFS-DD

news2025/2/26 22:48:07

读文章笔记-OSSFS-DD

  • 文章
  • 代码
  • 文章主要贡献
  • 内容
    • 公式(5)(6)的详细推倒
    • 对比其他7种算法
  • 算法
  • 思考

文章

Online Scalable Streaming Feature Selection via Dynamic Decision

代码

  • https://github.com/doodzhou/OSFS

文章主要贡献

  • 将特征分成选择,丢弃和延迟。提出基于动态决策的在线可扩展流特征选择算法。
  • 通过算法降低总体决策风险。并且动态调整阈值,筛选出最富有信息的特征:1如果两个特征都>β,但是两个特征的联合信息<2β,那么就将候选特征子集的特征作为冗余信息抛弃;2如果两个特征都<β,但是两个特征的联合信息>2β,那么就将未决策的信息放入候选特征子集.
  • 用11组数据集比较现有的7种流特征选择算法。

内容

  • 预备的知识,总体方差计算公式:
    在这里插入图片描述
  • 预备的知识,正态分布:
    在这里插入图片描述
  • 关于Sc和Su的时间复杂度计算。
    在这里插入图片描述

公式(5)(6)的详细推倒

在这里插入图片描述

对比其他7种算法

  • 对比Alpha-investing[33]:只能为某些数据集选择前一两项特征,没有像本文算法那样有可扩展性。
  • 对比 Fast-OSFS[21]:本文算法在跑GISETTE运行时间打败了它,因为Fast-OSFS导致关键信息丢失。所以本文算法是更稳定的算法。
  • 对比SAOLA[29]:本文算法可以选择出比SAOLA算法更富有信息的特征。
  • 对比OSFSMI[17]: 本文算法在DEXTER and GISETTE花费的运行时间优于OSFSMI。
  • 对比GFSSF[7]:GFSSF对于相关性和冗余分析太苛刻,导致错过很多重要的信息。
  • 对比OFS-A3M[36]:基于邻域粗糙集的OFS-A3M算法运行时间更大。OFS-A3M使用邻域信息进行特征选择,该特征选择可能受到样本分布的显著影响。但是OFS-A3M在一些数据集就用到了较少的样本。
  • 对比OFS-Density[35]:基于邻域粗糙集的OFS-Density。不能处理分布不均匀的数据集。

算法

  • 算法总体就是:1将t时刻获得的ft特征;2计算它的成员度,更新α和β的值;3如果ft的成员度<α就丢弃ft特征;4如果ft的成员度>β,就放入Sc强相关的候选特征子集;并且将fi和fj的的互信息<2β的冗余信息剔除;5如果α<ft的成员度<β,就放入Su弱相关的未确定特征子集,如果Su溢出,那么将fi和fj的的互信息>=2β的信息放入Sc中,清空Su。

思考

  • 使用邻域粗糙集处理流特征。
  • 一般基于邻域粗糙处理流特征,有很高的时间复杂度。文章就是提出的新的方法来应对,邻域粗糙集处理的流特征的高时间复杂度。文章中使用全局统计信息来选择信息量最大的特征的可扩展比例。
  • 本文仅检查冗余和不确定性分析中两个特征之间的冗余和联合信息。在未来的工作中,我们将考虑三元组或更多变量的关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/24656.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《第一行代码》核心知识点:Android的脸面之UI控件

《第一行代码》核心知识点&#xff1a;Android的脸面之UI控件前言三、Android的脸面之UI控件3.1 常用控件介绍3.1.1 TextView3.1.2 Button3.1.3 EditText3.1.4 ImageView3.1.5 ProgressBar3.1.6 AlertDialog3.1.7 ProgressDialog3.2 四种基本布局介绍3.2.1 线性布局3.2.2 相对布…

更强悍 更智能!飞凌嵌入式FET3588-C核心板震撼发布!

为提升AIoT领域终端设备的处理能力以及智能化程度&#xff0c;飞凌嵌入式与瑞芯微强强联手&#xff0c;正式推出FET3588-C核心板&#xff01; 1、国芯之光 品质之选 FET3588-C核心板基于Rockchip新一代旗舰RK3588处理器开发设计&#xff0c;采用先进的8nm制程工艺&#xff0c; …

【软考软件评测师】第三十一章 操作系统综合知识

【软考软件评测师】第三十一章 操作系统综合知识 第三十一章 操作系统综合知识【软考软件评测师】第三十一章 操作系统综合知识第一部分 知识点集锦1.嵌入式操作系统1&#xff09;可裁剪性2&#xff09;实时性3&#xff09;统一的接口4&#xff09;弱交互性5&#xff09;更好的…

EasyExcel使用详解与源码解读

EasyExcel使用详解1、EasyExcel简单介绍64M内存20秒读取75M(46W行25列)的Excel&#xff08;3.0.2版本&#xff09;2、EasyExcel和POI数据处理能力对比3、使用EasyExcel读写Excel、web上传/下载3.1、写EXCEL3.2、读EXCEL3.3、web上传、下载4、EasyExcel源码解读5、总结1、EasyEx…

AdsPower VS Dolphin,哪款指纹浏览器性价比更高?

现在指纹浏览器已经成为了跨境人必备的账号安全工具&#xff0c;市面上的指纹浏览器也非常多&#xff0c;但其实真正专业的寥寥无几。现在市场上比较出名的浏览器有AdsPower、Dolphin、multilogin。为了比较出AdsPower和Dolphin功能上的差异&#xff0c;龙哥特地去下载使用了这…

三、nginx设置浏览器缓存[expires]

一、浏览器缓存 解释&#xff1a;浏览器缓存极大缓解了带宽压力&#xff0c;提高了用户体验。 访问页面-查看是否有缓存&#xff0c;如果没有过期&#xff0c;直接击中缓存&#xff0c;不向服务器发送请求访问页面-查看是否有缓存&#xff0c;如果过期&#xff0c;向服务器发送…

如何给async await批量添加try…catch?

如何给async await批量添加try…catch&#xff1f;async和await是什么&#xff1f;如何给async await批量添加try…catchbabel插件的实现思路插件的基本格式示例寻找await节点向上查找 async 函数添加用户选项babel插件的安装使用其他参考资料async和await是什么&#xff1f; …

深紫色粉末BHQ-1 NHS,916753-61-2,NHS修饰是合成后与一个伯氨基的共轭

英文名称&#xff1a;BHQ-1 NHS CAS&#xff1a;916753-61-2 外观&#xff1a;深紫色粉末 分子式&#xff1a;C30H31N7O7 分子量&#xff1a;601.62 储存条件&#xff1a;-20C&#xff0c;避光避湿 结构式&#xff1a; 凯新生物产品简介&#xff1a; NHS修饰是合成后与一…

程序员必知必会网络传输之TCP/IP协议族,共864页的详解文档让你原地起飞!

我们现实网络无处不在&#xff0c;我们被庞大的虚拟网络包围&#xff0c;但我们却对它是怎样把我们的信息传递并实现通信的&#xff0c;我们并没有了解过&#xff0c;那么当我们在浏览器中出入一段地址&#xff0c;按下回车这背后都会发生什么&#xff1f; 比如说一般场景下&a…

ubuntu18.04安装QT5

ubuntu18.04安装QT5 1、说明 QT界面本不应该做为一个很高的知识点&#xff0c;问题是&#xff0c;越来越多的程序实验&#xff0c;需要界面支持&#xff0c;或用界面显得更加方便&#xff0c;因而专门启动该栏目专门介绍QT方法。因为体系比较庞大&#xff0c;因此&#xff0c;需…

在腾讯云 TKE 上部署 EMQX MQTT 服务器集群

云进入以「应用为中心」的云原生阶段&#xff0c;Operator 模式的出现&#xff0c;为 Kubernetes 中的自动化任务创建配置与管理提供了一套行之有效的标准规范。针对大规模分布式物联网 MQTT 消息服务器 EMQX 全生命期管理的自动化管理工具 EMQX Kubernetes Operator&#xff0…

11.数组的分类和定义

1.数组的概念 数组是若干个相同类型 的变量在内存中有序存储的集合。 int a[10];//定义了一个整型的数组a&#xff0c;a是数组的名字&#xff0c;数组中有10个元素&#xff0c;每个元素的类型都是int类型&#xff0c;而且在内存中连续存储。 这十个元素分别是a[0] , a[1] , … …

[附源码]java毕业设计鲜花销售管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

同花顺_代码解析_技术指标_Z_2

本文通过对同花顺中现成代码进行解析&#xff0c;用以了解同花顺相关策略设计的思想 目录 ZNZ_CYC ZNZ_CYD ZNZ_CYDD ZNZ_CYDK ZNZ_CYE1 ZNZ_CYF1 ZNZ_CYMR ZNZ_CYOBV ZNZ_CYQKL ZNZ_CYQKR ZNZ_CYR ZNZ_CYS ZNZ_DKBL ZNZ_CYC 指南针成本均线 技术分析非常重视成…

【PinkCAx】可视化工具开发记录与总结

-----------PinkCAx----------- 仅以此篇&#xff0c;记录我的一次可视化软件开发尝试点滴。 简介 PinkCAx是一款采用Python语言编写的&#xff0c;基于QT5VTK架构的三维可视化工具。 该工具目前的功能如下&#xff1a; 基本操作 网格文件的打开与保存&#xff08;支持STL、P…

Packet Tracer - 确定 DR 和 BDR

地址分配表 设备 接口 IP 地址 子网掩码 RA G0/0 192.168.1.1 255.255.255.0 Lo0 192.168.31.11 255.255.255.255 RB G0/0 192.168.1.2 255.255.255.0 Lo0 192.168.31.22 255.255.255.255 RC G0/0 192.168.1.3 255.255.255.0 Lo0 192.168.31.33 255.25…

sqli-labs/Less-38

这一关有变成了get请求的题目了 我们先判断一下是否属于数字型注入 输入如下 id1 and 12 回显如下 属于字符型 然后判断一下是单引还是双引 输入1 报错了 从报错信息可知 这是一个单引号注入型 我们去佐证一下呗 输入1-- 回显如下 可以 确实是单引号注入型 然后我选择使用…

SeriLog日志框架的应用

C#中当前流行的日志框架有NLog、Log4Net、及SeriLog&#xff0c;在这里我们简单介绍SeriLog日志框架的应用 1、日志基础 &#xff08;1&#xff09;、日志等级 &#xff08;2&#xff09;、日志接收器 序号 接收器 说明 1 Console 输出到控制台 2 Debug 输出到VS的Debug窗口 3…

TCP沾包问题

TCP流式协议&#xff1a;所谓流式协议&#xff0c;即协议的内容是像流水一样的字节流&#xff0c;内容与内容之间没有明确的分界标志&#xff0c;需要我们人为地去给这些协议划分边界。 我们说 TCP 是流式协议究竟意味着什么&#xff1f; - 云社区 - 腾讯云 (tencent.com) 网…

DJ12-1 8086系列指令系统-1

指令&#xff1a;能够被计算机识别并执行的二进制代码。 指令系统&#xff1a;所有指令的集合。 指令按功能分类&#xff1a;数据传送类、算术运算类、逻辑运算和移位、串操作、控制转移类、处理器控制。 一、8086 指令格式 1. 指令的一般格式 在《计组》里面&#xff0c;我…