读文章笔记-OSSFS-DD

news2026/2/9 2:49:37

读文章笔记-OSSFS-DD

文章
代码
文章主要贡献
内容
- 公式(5)(6)的详细推倒
- 对比其他7种算法
算法
思考

文章

Online Scalable Streaming Feature Selection via Dynamic Decision

代码

https://github.com/doodzhou/OSFS

文章主要贡献

将特征分成选择，丢弃和延迟。提出基于动态决策的在线可扩展流特征选择算法。
通过算法降低总体决策风险。并且动态调整阈值，筛选出最富有信息的特征：1如果两个特征都>β,但是两个特征的联合信息<2β，那么就将候选特征子集的特征作为冗余信息抛弃；2如果两个特征都<β,但是两个特征的联合信息>2β，那么就将未决策的信息放入候选特征子集.
用11组数据集比较现有的7种流特征选择算法。

内容

预备的知识，总体方差计算公式：
预备的知识，正态分布：
关于Sc和Su的时间复杂度计算。

公式(5)(6)的详细推倒

在这里插入图片描述

对比其他7种算法

对比Alpha-investing[33]：只能为某些数据集选择前一两项特征，没有像本文算法那样有可扩展性。
对比 Fast-OSFS[21]：本文算法在跑GISETTE运行时间打败了它，因为Fast-OSFS导致关键信息丢失。所以本文算法是更稳定的算法。
对比SAOLA[29]：本文算法可以选择出比SAOLA算法更富有信息的特征。
对比OSFSMI[17]：本文算法在DEXTER and GISETTE花费的运行时间优于OSFSMI。
对比GFSSF[7]：GFSSF对于相关性和冗余分析太苛刻，导致错过很多重要的信息。
对比OFS-A3M[36]：基于邻域粗糙集的OFS-A3M算法运行时间更大。OFS-A3M使用邻域信息进行特征选择，该特征选择可能受到样本分布的显著影响。但是OFS-A3M在一些数据集就用到了较少的样本。
对比OFS-Density[35]：基于邻域粗糙集的OFS-Density。不能处理分布不均匀的数据集。

算法

算法总体就是：1将t时刻获得的ft特征；2计算它的成员度，更新α和β的值；3如果ft的成员度<α就丢弃ft特征；4如果ft的成员度>β，就放入Sc强相关的候选特征子集；并且将fi和fj的的互信息<2β的冗余信息剔除；5如果α<ft的成员度<β，就放入Su弱相关的未确定特征子集，如果Su溢出，那么将fi和fj的的互信息>=2β的信息放入Sc中，清空Su。

思考

使用邻域粗糙集处理流特征。
一般基于邻域粗糙处理流特征，有很高的时间复杂度。文章就是提出的新的方法来应对，邻域粗糙集处理的流特征的高时间复杂度。文章中使用全局统计信息来选择信息量最大的特征的可扩展比例。
本文仅检查冗余和不确定性分析中两个特征之间的冗余和联合信息。在未来的工作中，我们将考虑三元组或更多变量的关系。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/24656.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

《第一行代码》核心知识点：Android的脸面之UI控件

《第一行代码》核心知识点：Android的脸面之UI控件

《第一行代码》核心知识点：Android的脸面之UI控件前言三、Android的脸面之UI控件3.1 常用控件介绍3.1.1 TextView3.1.2 Button3.1.3 EditText3.1.4 ImageView3.1.5 ProgressBar3.1.6 AlertDialog3.1.7 ProgressDialog3.2 四种基本布局介绍3.2.1 线性布局3.2.2 相对布…

阅读更多...

更强悍更智能！飞凌嵌入式FET3588-C核心板震撼发布！

更强悍更智能！飞凌嵌入式FET3588-C核心板震撼发布！

为提升AIoT领域终端设备的处理能力以及智能化程度，飞凌嵌入式与瑞芯微强强联手，正式推出FET3588-C核心板！ 1、国芯之光品质之选 FET3588-C核心板基于Rockchip新一代旗舰RK3588处理器开发设计，采用先进的8nm制程工艺， …

阅读更多...

【软考软件评测师】第三十一章操作系统综合知识

【软考软件评测师】第三十一章操作系统综合知识

【软考软件评测师】第三十一章操作系统综合知识第三十一章操作系统综合知识【软考软件评测师】第三十一章操作系统综合知识第一部分知识点集锦1.嵌入式操作系统1）可裁剪性2）实时性3）统一的接口4）弱交互性5）更好的…

阅读更多...

EasyExcel使用详解与源码解读

EasyExcel使用详解与源码解读

EasyExcel使用详解1、EasyExcel简单介绍64M内存20秒读取75M(46W行25列)的Excel（3.0.2版本）2、EasyExcel和POI数据处理能力对比3、使用EasyExcel读写Excel、web上传/下载3.1、写EXCEL3.2、读EXCEL3.3、web上传、下载4、EasyExcel源码解读5、总结1、EasyEx…

阅读更多...

AdsPower VS Dolphin，哪款指纹浏览器性价比更高？

AdsPower VS Dolphin，哪款指纹浏览器性价比更高？

现在指纹浏览器已经成为了跨境人必备的账号安全工具，市面上的指纹浏览器也非常多，但其实真正专业的寥寥无几。现在市场上比较出名的浏览器有AdsPower、Dolphin、multilogin。为了比较出AdsPower和Dolphin功能上的差异，龙哥特地去下载使用了这…

阅读更多...

三、nginx设置浏览器缓存[expires]

三、nginx设置浏览器缓存[expires]

一、浏览器缓存解释：浏览器缓存极大缓解了带宽压力，提高了用户体验。访问页面-查看是否有缓存，如果没有过期，直接击中缓存，不向服务器发送请求访问页面-查看是否有缓存，如果过期，向服务器发送…

阅读更多...

如何给async await批量添加try…catch？

如何给async await批量添加try…catch？

如何给async await批量添加try…catch？async和await是什么？如何给async await批量添加try…catchbabel插件的实现思路插件的基本格式示例寻找await节点向上查找 async 函数添加用户选项babel插件的安装使用其他参考资料async和await是什么？ …

阅读更多...

深紫色粉末BHQ-1 NHS，916753-61-2，NHS修饰是合成后与一个伯氨基的共轭

深紫色粉末BHQ-1 NHS，916753-61-2，NHS修饰是合成后与一个伯氨基的共轭

英文名称：BHQ-1 NHS CAS：916753-61-2 外观：深紫色粉末分子式：C30H31N7O7 分子量：601.62 储存条件：-20C，避光避湿结构式： 凯新生物产品简介： NHS修饰是合成后与一…

阅读更多...

程序员必知必会网络传输之TCP/IP协议族，共864页的详解文档让你原地起飞！

程序员必知必会网络传输之TCP/IP协议族，共864页的详解文档让你原地起飞！

我们现实网络无处不在，我们被庞大的虚拟网络包围，但我们却对它是怎样把我们的信息传递并实现通信的，我们并没有了解过，那么当我们在浏览器中出入一段地址，按下回车这背后都会发生什么？ 比如说一般场景下&a…

阅读更多...

ubuntu18.04安装QT5

ubuntu18.04安装QT5

ubuntu18.04安装QT5 1、说明 QT界面本不应该做为一个很高的知识点，问题是，越来越多的程序实验，需要界面支持，或用界面显得更加方便，因而专门启动该栏目专门介绍QT方法。因为体系比较庞大，因此，需…

阅读更多...

在腾讯云 TKE 上部署 EMQX MQTT 服务器集群

在腾讯云 TKE 上部署 EMQX MQTT 服务器集群

云进入以「应用为中心」的云原生阶段，Operator 模式的出现，为 Kubernetes 中的自动化任务创建配置与管理提供了一套行之有效的标准规范。针对大规模分布式物联网 MQTT 消息服务器 EMQX 全生命期管理的自动化管理工具 EMQX Kubernetes Operator&#xff0…

阅读更多...

11.数组的分类和定义

11.数组的分类和定义

1.数组的概念数组是若干个相同类型的变量在内存中有序存储的集合。 int a[10];//定义了一个整型的数组a，a是数组的名字，数组中有10个元素，每个元素的类型都是int类型，而且在内存中连续存储。这十个元素分别是a[0] , a[1] , … …

阅读更多...

[附源码]java毕业设计鲜花销售管理系统

[附源码]java毕业设计鲜花销售管理系统

项目运行环境配置： Jdk1.8 Tomcat7.0 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术： SSM mybatis Maven Vue 等等组成，B/S模式 M…

阅读更多...

同花顺_代码解析_技术指标_Z_2

同花顺_代码解析_技术指标_Z_2

本文通过对同花顺中现成代码进行解析，用以了解同花顺相关策略设计的思想目录 ZNZ_CYC ZNZ_CYD ZNZ_CYDD ZNZ_CYDK ZNZ_CYE1 ZNZ_CYF1 ZNZ_CYMR ZNZ_CYOBV ZNZ_CYQKL ZNZ_CYQKR ZNZ_CYR ZNZ_CYS ZNZ_DKBL ZNZ_CYC 指南针成本均线技术分析非常重视成…

阅读更多...

【PinkCAx】可视化工具开发记录与总结

【PinkCAx】可视化工具开发记录与总结

-----------PinkCAx----------- 仅以此篇，记录我的一次可视化软件开发尝试点滴。简介 PinkCAx是一款采用Python语言编写的，基于QT5VTK架构的三维可视化工具。该工具目前的功能如下： 基本操作网格文件的打开与保存（支持STL、P…

阅读更多...

Packet Tracer - 确定 DR 和 BDR

Packet Tracer - 确定 DR 和 BDR

地址分配表设备接口 IP 地址子网掩码 RA G0/0 192.168.1.1 255.255.255.0 Lo0 192.168.31.11 255.255.255.255 RB G0/0 192.168.1.2 255.255.255.0 Lo0 192.168.31.22 255.255.255.255 RC G0/0 192.168.1.3 255.255.255.0 Lo0 192.168.31.33 255.25…

阅读更多...

sqli-labs/Less-38

sqli-labs/Less-38

这一关有变成了get请求的题目了我们先判断一下是否属于数字型注入输入如下 id1 and 12 回显如下属于字符型然后判断一下是单引还是双引输入1 报错了从报错信息可知这是一个单引号注入型我们去佐证一下呗输入1-- 回显如下可以确实是单引号注入型然后我选择使用…

阅读更多...

SeriLog日志框架的应用

SeriLog日志框架的应用

C#中当前流行的日志框架有NLog、Log4Net、及SeriLog，在这里我们简单介绍SeriLog日志框架的应用 1、日志基础 （1）、日志等级 （2）、日志接收器序号接收器说明 1 Console 输出到控制台 2 Debug 输出到VS的Debug窗口 3…

阅读更多...

TCP沾包问题

TCP沾包问题

TCP流式协议：所谓流式协议，即协议的内容是像流水一样的字节流，内容与内容之间没有明确的分界标志，需要我们人为地去给这些协议划分边界。我们说 TCP 是流式协议究竟意味着什么？ - 云社区 - 腾讯云 (tencent.com) 网…

阅读更多...

DJ12-1 8086系列指令系统-1

DJ12-1 8086系列指令系统-1

指令：能够被计算机识别并执行的二进制代码。指令系统：所有指令的集合。指令按功能分类：数据传送类、算术运算类、逻辑运算和移位、串操作、控制转移类、处理器控制。一、8086 指令格式 1. 指令的一般格式在《计组》里面，我…

阅读更多...

推荐文章

最新文章