首先我们找到对应的数据,天池蒸汽项目的数据.
import pandas as pd 导入文件读取库
import numpy as np 导入数学计算库
df=pd.readcsv('./zhenggi_train.txt',sep='\t') 读取csv文件,这个就是天池的用tab分割的数据
X_train = df . iloc[:,: - 1],我们我们切片,从0列,切片到-1列,不包含最后一列,其实就是x数据
y_train=df['target'] 然后我们获取最后一列,最后一列列名是target
X_test=pd.readcsv('./zhenggL_test.txt'sep='\t')然后再去读取测试数据,这个文档
display(X_train.head(),y_train.head(),X_test.head()) 然后我们可以显示,这几个数据的前5个数据
可以看到结果,这里没有做归一化的时候,数据可以看到有的是-2.11有