【MATLAB第76期】基于MATLAB的代表性样本筛选方法合集(针对多输入单输出数据)

news2024/11/18 0:28:32

【MATLAB第76期】基于MATLAB的代表性样本筛选方法合集(针对多输入单输出数据)

前有筛选变量方法,如局部敏感性分析和全局敏感性分析方法介绍 。
今天提出另外一种思路,去对样本进行筛选。
使用场景:
场景1:对抽样方法生成的数据合理性进行对比分析。
场景2:对多样本数据进行筛选精简,且精度影响幅度不大。
场景3:对多输入单输出数据异常/较差样本检测。

本文使用Kennard-Stone、cluster聚类算法、局部线性重构(LLR)算法选择代表性样本

数据设置:
案例数据选用12输入,1输出,357个样本的分类预测数据,评价指标为正确率。正确率越大代表效果越好。
为了提高结果稳定性,使用libsvm算法进行分类。

训练样本编号: 1:240
测试样本编号: 300:357
筛选样本编号:1:299 (除去测试样本剩余的样本)
筛选的样本数: 210

trainIdx = 1:240; % 训练样本  1:240
testIdx = 300:357; %测试样本  300:357
testIdx2= setdiff(1:size(X,1),testIdx); % 筛选样本,除去测试样本剩余的样本  1:299
nSel = 210;%筛选的样本数 210

libsvm参数设置:

c = 10.0;      % 惩罚因子
g = 0.01;      % 径向基函数参数
cmd = ['-t 2', '-c', num2str(c), '-g', num2str(g)];

一、Kennard-Stone算法

参考文献:
R. W. Kennard, and L. A. Stone, “Computer aided design of experiments,” Technometrics, vol. 11, no. 1, pp. 137-148, Feb. 1969.
在这里插入图片描述
筛选前正确率: 75.86%
筛选后正确率:81.03% (效果提升)

筛选后的编号:2,3,5,6,8,9,10,14,15,17,19,20,22,24,25,26,27,28,29,33,37,39,41,42,43,44,45,47,48,50,51,52,53,55,56,57,58,61,63,64,65,66,67,68,69,70,73,74,77,78,79,80,81,83,84,86,89,90,91,92,93,94,95,97,98,99,100,101,103,106,107,109,110,111,113,114,115,116,117,118,119,120,121,122,124,125,126,128,129,130,132,133,134,135,136,138,139,140,141,142,143,145,146,147,148,151,153,154,156,157,158,160,161,165,166,167,168,169,170,171,172,173,174,175,176,179,181,182,183,184,185,187,188,190,191,193,195,196,197,198,201,202,203,204,207,209,210,211,212,213,214,219,220,221,223,225,226,227,229,230,231,232,233,235,236,237,239,240,241,242,243,245,246,248,249,250,251,253,254,257,259,260,261,262,263,264,265,266,267,270,275,276,278,281,282,283,284,285,286,287,288,289,290,291,292,293,295,296,297,299

二、cluster聚类算法

IDX = clusterdata(X,'maxclust',nSel,'linkage','average');%聚集性集群

在这里插入图片描述
筛选前正确率: 75.86%
筛选后正确率:70.68% (效果减弱)

筛选后的编号:
2 3 5 6 9 10 11 14 15 17 20 21 22 24 25 28 29 31 33 37 38 39 41 42 43 44 45 47 48 51 52 53 54 55 56 58 61 62 63 64 65 66 67 68 70 73 75 77 78 79 80 81 83 84 85 88 89 90 91 93 94 95 96 97 98 99 100 101 103 109 110 112 114 116 117 119 120 121 122 123 124 125 128 129 130 131 132 133 134 135 136 137 138 139 141 142 143 144 146 147 148 149 151 153 154 156 157 158 160 161 162 164 165 166 167 169 170 171 172 173 174 175 176 179 181 182 183 184 185 186 187 188 190 191 193 195 196 198 201 202 203 204 207 208 209 210 212 213 214 216 218 219 220 221 222 224 225 226 227 229 230 233 234 235 236 237 238 239 240 242 243 245 246 248 249 250 251 253 254 256 257 258 259 260 263 264 265 266 267 268 270 275 276 278 280 281 282 283 284 285 286 287 288 289 290 291 293 295 297 299

三、局部线性重构(LLR)

参考文献:
L. Zhang, C. Chen, J. Bu, D. Cai, X. He, and T. S. Huang, “Active Learning Based on Locally Linear Reconstruction,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 33, no. 10, pp. 2026-2038, Oct. 2011.

Nonlinear Dimensionality Reduction by Locally Linear Embedding, Science, 2000
在这里插入图片描述
筛选前正确率: 75.86%
筛选后正确率:84.48% (效果提升)

筛选后的编号:
3 5 6 7 9 10 14 15 16 17 18 20 21 22 23 25 26 27 29 30 31 32 33 34 35 36 38 39 41 42 43 46 47 48 49 51 52 53 54 55 56 57 59 60 62 64 65 66 67 68 70 72 75 78 79 81 82 83 85 87 88 89 92 93 94 95 96 98 99 100 101 102 104 105 107 108 109 110 111 112 113 116 117 118 124 125 126 128 130 131 132 134 135 136 137 140 141 144 145 148 149 150 152 154 155 157 158 159 160 162 163 164 166 167 170 172 174 177 178 179 181 182 183 184 186 187 188 189 190 192 193 194 195 196 197 198 199 200 201 202 203 204 205 207 208 210 212 213 214 215 216 220 221 222 223 225 226 229 230 231 232 233 234 235 236 237 238 240 242 244 245 246 247 248 249 251 253 254 256 257 258 259 261 262 263 264 265 267 269 271 272 273 276 277 278 279 280 281 282 283 284 285 286 288 291 292 294 295 296 297

四、代码获取

CSDN私信回复“76期”即可获取下载方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1032693.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

期刊目录解析 | 慎投!又2本“On Hold”SCI期刊被踢!

科睿唯安官方目前对SCI期刊的管理可以说是相当严格的,每个月都会出评估报告,如果任何一本期刊有问题,就会先被“On Hold”,这代表需要重新评估是否符合SCI标准,有可能直接被剔除。 此前,小编也为大家统计了…

rabbitMQ (1)

文章目录 1. RabbitMQ 介绍1.1 几个重要概念1.2 RabbitMq 的工作原理 2 RabbitMQ 安装3. RabbitMQ 入门操作3.1 添加依赖3.2 生产者代码3.3 消费者代码 4. Work Queues5. 管理端页面创建队列 1. RabbitMQ 介绍 引用 : RabbitMQ 是一个消息中间件:它接受…

Axure设计之引入ECharts图表

ECharts是一款基于JavaScript的可视化图表库,它提供了丰富的图表类型和交互功能,可以轻松地创建各种类型的图表,如折线图、柱状图、饼图、散点图等。 想要通过Axure实现ECharts示例中的某些图表效果,单纯靠Axure自带的功能是很难实…

C# 实现数独游戏

1.数独单元 public struct SudokuCell{public SudokuCell() : this(0, 0, 0){}public SudokuCell(int x, int y, int number){X x; Y y; Number number;}public int X { get; set; }public int Y { get; set; }public int Number { get; set; }} 2.数独创建 public class …

JVM 参数详解

GC有两种类型:Scavenge GC 和Full GC 1、Scavenge GC 一般情况下,当新对象生成,并且在Eden申请空间失败时,就会触发Scavenge GC,堆的Eden区域进行GC,清除非存活对象,并且把尚且存活的对象移动到…

mysql 命令

1.以root身份登录MySQL服务器 mysql -u root -p 2.输入root用户密码 显示命令 1. 显示数据库列表 show databases; 刚开始时才两个数据库:mysql和test。mysql库很重要它里面有MYSQL的系统信息,我们改密码和新增用户,实际上就是用这个库进…

AUTOSAR词典:CAN驱动Mailbox配置技术要点全解析

AUTOSAR词典:CAN驱动Mailbox配置技术要点全解析 前言 首先,请问大家几个小小问题,你清楚: AUTOSAR框架下的CAN驱动关键词定义吗?是不是有些总是傻傻分不清楚呢?CAN驱动Mailbox配置过程中有哪些关键配置参…

操作系统--------调度算法篇

目录 一.先来先服务调度算法(FCFS) 二.短作业优先调度算法(SJF) 2.1.SJF调度算法缺点 三.优先级调度算法 3.1优先级调度算法的类型 1.非抢占优先级调度算法 2.抢占优先级调度算法 3.2优先级的类型 3.1静态优先级 3.2动态…

2101. 引爆最多的炸弹;752. 打开转盘锁;1234. 替换子串得到平衡字符串

2101. 引爆最多的炸弹 核心思想:枚举BFS。枚举每个炸弹最多引爆多少个炸弹,对每个炸弹进行dfs,一个炸弹能否引爆另一个炸弹是两个炸弹的圆心距离在第一个炸弹的半径之内。 752. 打开转盘锁 核心思想:典型BFS,就像水源扩散一样&a…

MySQL数据库 -- 入门篇

1. MySQL概述 1.1 数据库相关概念 三个概念:数据库、数据库管理系统、SQL。 目前主流的关系型数据库管理系统的市场占有率排名如下: Oracle:大型的收费数据库,Oracle公司产品,价格昂贵。MySQL:开源免费…

力扣刷题-数组-螺旋矩阵

模拟过程,但却十分考察对代码的掌控能力。 重点:循环不变量原则! 第一条原则: 模拟顺时针画矩阵的过程: 填充上行从左到右填充右列从上到下填充下行从右到左填充左列从下到上 由外向内一圈一圈这么画下去。 第二条原…

【探索Linux世界|中秋特辑】--- 倒计时和进度条的实现与演示

个人主页:兜里有颗棉花糖 欢迎 点赞👍 收藏✨ 留言✉ 加关注💓本文由 兜里有颗棉花糖 原创 收录于专栏【Linux专栏】🎈 本专栏旨在分享学习Linux的一点学习心得,欢迎大家在评论区讨论💌 演示环境&#xff1…

PageHelp插件在复杂sql下引起的Having无法识别错误及其解决方案

1: 问题出现的场景 系统中有一个复杂SQL内嵌套了多个子查询.在改动时需要将SQL的最后一行加上having来做额外的过滤处理. 添加完having语句后发现SQL能够正常执行就直接将代码提交到了测试环境.结果在测试环境报错Unknown column ‘xxx‘ in ‘having clause. 2: 分析问题 1…

公众号留言功能怎么打开?有什么条件?

为什么公众号没有留言功能?2018年2月12日,TX新规出台:根据相关规定和平台规则要求,我们暂时调整留言功能开放规则,后续新注册帐号无留言功能。这就意味着2018年2月12日号之后注册的公众号不论个人主体还是组织主体&…

十四、MySql的用户管理

文章目录 一、用户管理二、用户(一)用户信息(二)创建用户1.语法:2.案例: (三) 删除用户1.语法:2.示例: (四)修改用户密码1.语法&#…

ps丢失d3dcompiler_47.dll怎么办,这四个方法都能解决

在当今的信息化社会,电脑已经成为我们生活和工作中不可或缺的一部分。然而,随着软件技术的不断发展,电脑在使用过程中也难免会遇到各种问题。其中,缺失d3dcompiler_47.dll文件是一个常见的问题。本文将为大家介绍如何修复电脑出现…

Python JS逆向之Ku狗,实现搜索下载功能(附源码)

今天用Python来实现一下酷狗JS逆向,实现搜索下载功能 1、环境使用 Python 3.8Pycharm 2、模块使用 import hashlib --> pip install hashlib import prettytable as pt --> pip install prettytable import requests --> pip install requests import…

深度学习从入门到入土

1. 数据操作 N维数组样例 N维数组是机器学习和神经网络的主要数据结构 0-d 一个类别: 1.0 1-d 一个特征向量(一维矩阵):[1.0, 2.7, 3.4] 2-d 一个样本-特征矩阵-(二维矩阵) 3-d RGB图片 (宽x高x通道)- 三维数组 4-d 一个RGB…

selenium自动化测试入门,一篇足矣

Selenium是一个基于浏览器的自动化测试工具,它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。 Selenium是用于自动化控制浏览器做各种操作,打开网页,点击按钮,输入表单等等,可以模拟各种人工操作浏览器的功…

共享WiFi贴项目怎么实施与运营,微火为你提供高效解答!

共享WiFi贴是一项有前景的商业项目,不仅可以满足用户对网络的需求,还可以为创业者带来盈利的机会。那么,我们来看看如何有效地开展共享WiFi贴项目。 最重要的是选择合适的位置。共享WiFi贴项目的成功与否很大程度上取决于位置选择。优先选择人…