weka3.8.6的安装与使用

news2024/11/20 4:50:00

目录

背景

一、安装

二、使用explorer

1. 介绍

2.打开自带的数据集(Preprocess)

1.打开步骤

2.查看属性和数据编辑

3.classify

4.Cluster

5.Associate

6.Select attributes

7.Visualize

待补充


背景

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费
的,非商业化软件,与之对应的是SPSS公司商业数据挖掘产品--Clementine ;weka是基于JAVA环境下开源的
机器学习(machine learning)以及数据挖掘(data mining)软件。Weka的主要开发者来自新西兰的怀卡托大学(The University of Waikato)。WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

一、安装

安装简单,一路next。

1.打开weka3.8.6的安装包

01a951b74d564fc6a163646f64f61793.png

2.点击 next

fc075071a2ca4ce781b3893ec5e31aa2.png

 3.点击I Agree

1a1770dee2484f2a89fb0a87121f1440.png

4.点击next

f413b17809164c7eb582fc20fc46a10a.png

5.选择安装路径如:D:\weka-3-8-6

0eb3e6ea3ebc4e5189bba8655f82f0ac.png

6.点击install

9aa430e8e47045eea074f1b943fd0740.png

等待后,finish。下面是安装成功后打开的初始界面d257cfe5582f4121bb138ff161730403.png

二、使用explorer

bb3bb2f14f8a4b479f02ad2b4844fbe9.png

1. 介绍

5832686aa24c45e99253b48d03ed201b.png

Preprocess:预处理
Classify:分类
Cluster:聚类
Associate:关联
Select attributes:选择属性
Visualize:可视化

e3c730d43d4245a0887bcac5a08e5a73.png

  • open file:从文件中打开一组实例
  • open URL:从URL中打开一组实例
  • open DB:从数据库中打开一组实例
  • generate:生成人工数据
  • undo:撤销对数据集最后更改
  • edit:在查看器中打开当前数据集进行编辑
  • save:将工作关系保存到文件中

 2fa52ca9246f4acba8585f27e8750598.png

属性

  • ALL:全选
  • None:全不选
  • invert:取反
  • pattern:输入perl正则表达式

2b52ccf01a1544df95502cc4755df3b3.png

该位置展示具体属性都有什么

  • remove:选择属性后,点击删除,可用undo撤回。

aae1d5c2df6247b9ba9e5fa181f8cc67.png

当前的关系

  • 关系:投票  属性:17
  • 实例:435   权重和:435

2.打开自带的数据集(Preprocess)

1.打开步骤

选择openfile

80a83d63817b43eeb63dff1fa8b61e50.png

选择data文件

 1f006d3c282f43fca20a650fc4bcadb0.png

这里我们可以看到一些weka自带的数据集

468d19189e1c4a7b8ecbe141894ecaac.png 

选择其中一个数据集打开,我选择的是vote.arff

05d29e668a5746d68c33cd51023b290d.png

2.查看属性和数据编辑

2.1查看属性

选择属性,可以下拉查看并选择

b326139b40dd4401b96c9db33f3dfb95.png 

 411d7e5d8a154f05a4c7b4edc4be3ee5.png

Visualize All:查看所有属性直方图

b467e84288424be5946c50301e209527.png

2.2数据编辑

001043e1292641cb88faec51ded3d323.png

 点击Edit,弹出viewer,在这里面可以查看并编辑数据。

3dafa6212b744971944cc9d04d1e8f58.png

3.classify

d5237fb1bdaa45ceb563ce22bfe3484f.png

e66e72f21e6244c3b6b5ddd827b5331b.png

测试选项 

  • Use training set:使用训练集
  • Supplied test set:提供测试集
  • Cross-validation:交叉验证
  • Percentage split:按比例分配
  • start:点击即用

4.Cluster

b837b1cfd4b74607901c8a87081670fa.png

集群模式【Cluster mode】

  • Use training set:使用训练集
  • Supplied test set:提供测试集
  • Percentage split:比例分割
  • Classes to clusters evalation:类到聚类的评估

5.Associate

6faacb8663174c688e803a37c5b12138.png

6.Select attributes

8246a87ad7fd40f8a2ed8018931cb38b.png

属性选择模式

  • Use full training set:使用完整的训练集

  • Cross-validation:交叉验证

7.Visualize

fb79175aea5c4f5fb3cf9a61ae0cd6b2.png

  • update:更新
  • select attribute:选择属性
  • subsample:子样品

待补充

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/502336.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

进程调度/页面置换/磁盘调度算法

进程调度算法 进程调度算法也称 CPU 调度算法,毕竟进程是由 CPU 调度的。 当 CPU 空闲时,操作系统就选择内存中的某个「就绪状态」的进程,并给其分配 CPU。 什么时候会发生 CPU 调度呢?通常有以下情况: 当进程从运…

AIGC:【LLM(二)】——LangChain:由LLMs驱动的应用开发框架

文章目录 一.背景介绍二.LangChain简介2.1 常见应用场景 三.LangChain特点3.1 优点3.2 不足 四.LangChain功能4.1 基础功能4.2 功能模块4.2.1 LLM和Prompts4.2.2 Chain4.2.3 Agent4.2.4 Memory4.2.5 Embedding4.2.6 Models4.2.7 Indexes 五.实战案例5.1 背景需求5.2 数据准备5.…

抖音seo矩阵系统源码是什么?

抖音SEO矩阵系统源码是一款功能强大的营销工具,能够帮助用户进行抖音视频的SEO优化,使其在抖音平台上获得更高的曝光度和流量。该系统结合了SEO的相关算法和技巧,提供了完整的优化方案,可帮助用户提高视频的曝光率、获得更多的点赞…

阻塞队列原理及Java实现

目录 1.阻塞队列 1.举例:包饺子 1.通过多线程来实现 2.通过阻塞队列来实现 2.消息队列 1.解耦 2.削峰填谷 用消息队列来解决 3.异步操作 3.实现一个阻塞队列 使用循环数组 4.实现生产者和消费者模型 完整代码 5.虚假唤醒 1.概念及原因 2.解决方法 1…

关于GD32替换STM32(pin to pin)搭载rt-thread操作系统,需要注意的问题总结

1、SystemInit()函数 该函数位于启动文件中的Reset_Handler中(具体实现在GD32位于system_gd32f4xx.c,STM32位于system_stm32f4xx.c中,几乎所有的文件,你只要把gd换成st就能找到对应的文件),gd的叫startup_gd32Fxxx.s,…

4.HIVE函数

1.hive函数 1.1 空值替换 两个输入:nvl(col,default_num) : 如果colum不为null,返回col.否则返回default_num 多个输入:coalesce(col1, col2, col3, ....) :从左到右找第一个不为null的值 例如:求所有员工的平均薪…

【操作系统】总结

依旧是小林coding 的内容 存储架构 现代 CPU 都是多核心的,线程可能在不同 CPU 核心来回切换执行,这对 CPU Cache 不是有利的,虽然 L3 Cache 是多核心之间共享的,但是 L1 和 L2 Cache 都是每个核心独有的,如果一个线…

VMWare安装windows7虚拟机提示Operating System not found

前提:下载windows7 Gost并创建虚拟机,启动报错:Operating System not found 解决办法 用微PE工具制作iso系统,对虚拟机进行分区 下载地址:https://www.wepe.com.cn/ 制作方法,双击安装程序,选…

最困难的也是最简单的,做好这两点不盈利天理难容

投资者应该时刻记住,在外汇交易中复杂的方法并不总是最好的。Forexclub发现交易中最困难的是正确识别进场点和出场点。 从技术上来说,进入交易是非常容易的,你只需要点击一个按钮,你就在那里交易。但是你会从中获利吗?没人能回答…

【Linux Network】网络编程套接字(代码练习)—UDP

目录 1. 常用接口 2. C/S 回声模拟 3. C/S myshell 的制作 Linux网络编程✨ 1. 常用接口 socket:创建套接字: // 创建 socket 文件描述符 int socket(int domain, int type, int protocol); 返回值: 套接字创建成功返回一个文件描述符 &…

GAMMA电源维修直流高压电源模块RR300-1P

美国GAMMA高压电源维修参数(RR分离式): 输入:220VAC 或 380VAC(视型号而定) 输出电压:550KV,功率:0-10KW或定制 纹波率0.01 ;稳定度0.01/1H 控制部分19英…

(只需两步)让ChatGPT帮你制作出漂亮的PPT

目录 第一步:生成 PPT 代码 第二步:将代码转化为 PPT 还在为制作PPT而烦恼吗? 让ChatGPT来帮您! 本篇文章介绍如何利用ChatGPT一键生成PPT文字和样式,省时省力又专业! (真的只需两步&#xf…

案例实践|云智慧ITSM产品在利星行汽车的运维实践

ITSM(信息技术服务管理)是一种以客户为中心的方法,旨在提高信息技术的效率和效果。在传统零售行业,ITSM可以帮助连锁零售企业提升客户服务水平,通过IT服务台提供快速响应和解决客户的问题和需求。同时, ITS…

PSP - 配置 AlphaFold2 的高效运行环境

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/130560538 AlphaFold2 是由 DeepMind 开发,可以根据蛋白质的氨基酸序列预测其三维结构,准确度经常可以与实验相媲美。DeepMind 和 EMBL 的欧洲生物信息学研…

最新的Ubuntu20安装配置Nagios教程

首先声明,盗帖可耻,我发现有人把我文章复制到百度文库,并设置vip下载,直接照搬别人的还牟利,恶心!!! 目录 一、简介 二、安装配置 1、安装Nagios以及相关插件 a、安装Nagios核心…

Blender渲染动画太慢怎么办?用云渲染啊!

1995 年,荷兰开发者 Ton Roosendaal 开发了三维制作软件 Blender ,这是一款功能强大的 3D 创建工具,用于创建 3D 图形、交互式 3D 应用程序、视频游戏、虚拟现实视频和动画。它自 2002 年以来一直作为开源软件提供,可在 macOS、Li…

嵌入式基础测试手册——基于NXP iMX6ULL开发板(3)

前 言 本文档适用开发环境: Windows开发环境:Windows 7 64bit、Windows 10 64bit 虚拟机:VMware15.1.0 Linux开发环境:Ubuntu18.04.4 64bit U-Boot:U-Boot-2020.04 Kernel:Linux-5.4.70 Linux SDK:5.4.70_2.3.0 基于测试板卡:创龙科技TLIMX6U-EVM是一款基于NXP…

Gradio的web界面演示与交互机器学习模型,主要特征《2》

上一篇文章是介绍了安装与使用,Gradio的web界面演示与交互机器学习模型,安装和使用《1》 了解到这个gradio,真是个贴心的产品,接下来更多的关注一些重要的细节特征,让我们去更完善和熟练的使用它。 1、简单计算器的示…

Netty基础(三)

1.Netty模型 1.1.工作原理示意图1-简单版 Netty主要基于主从Reactors多线程模型(如图)做了一定的改进,其中主从Reactor多线程模型有多个Reactor; 说明: ①.BossGroup线程池中的线程维护了Selector,只关注Accecpt事件; ②.当接收到Accept事件,获取到连接对应的SocketChannel…

数据结构入门--栈和队列

栈 栈的概念及结构 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除的一段为栈顶,另一端为栈底。栈中元素遵循后进先出LIFO(Last In First Out)原则。 压栈:栈的插…