大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。喜欢通过博客创作的方式对所学的知识进行总结与归纳,不仅形成深入且独到的理解,而且能够帮助新手快速入门。
本文主要介绍了西瓜数据集读取的详细解决方案,希望能对新手有所帮助。
文章目录
- 1. 数据集介绍
- 2. 读取详细代码
-
- 2.1 西瓜数据集1.0
- 2.2 西瓜数据集2.0
- 2.3 西瓜数据集3.0
- 2.4 西瓜数据集4.0
1. 数据集介绍
今天实习生在验证特征生成工具openfe的有效性,挑选了西瓜数据集作为benchmark。其中西瓜数据集总共包括了1.0、2.0、3.0、4.0这四个版本,每个版本的标签均为二分类标签,下面对每个数据集进行简要的介绍。
西瓜数据集1.0总共包括了17个样本,其中特征列分别为色泽、根蒂 、敲声、纹理、脐部、触感,并且每个特征列均为离散值,而在标签值中总共包含9个
好瓜、8个坏果。