机器学习 100 天,今天讲的是:数据预处理之导入数据集。
首先,我们打开 spyder。新建一个 load_data.py 脚本。
第一步,导入标准库
机器学习常用的标准库有 3 个:
第一个:numpy,用于数据处理。
第二个:matplotlib.pyplot,用于画图。
第三个:pandas,用于数值分析。
# 导入标准库
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
我们选中这三行,按 F9 运行,发现没有报错,说明标准库导入成功。
第二步:导入数据集
首先来看一下我们想要导入的数据集,他是一个 data.csv 文件。
可以看到,