文章目录
- 第1关:认识数据
- 第2关:数据预处理
- 第3关:数学成绩预测
第1关:认识数据
编程要求
根据提示,在右侧Begin-End区域补充代码,查看数据属性名称。
测试说明
程序会调用你实现的方法,查看数据属性名称,若与正确结果一致,则视为通关。
开始你的任务吧,祝你成功!
示例代码如下:
# -*- coding: utf-8 -*-
def get_feature_names(df):
'''
input:df(DataFrame):输入数据
output:feature_names
'''
#*********Begin*********#
feature_names=df.keys()
#********** End **********#
return feature_names
第2关:数据预处理
编程要求
根据提示,在右侧编辑器补充代码,填补数据缺失值,且对数据进行MinMaxScaler标准化。
测试说明
程序会调用你的方法对数据进行处理,若处理后与正确数据一致,则视为通关。
示例代码如下:
# -*- coding: utf-8 -*-
from sklearn.preprocessing import Imputer,MinMaxScaler
def data_preprocessing(data):
'''
input:data(ndarray):待处理数据
output:preprocessing_data(ndarray):预处理后数据
'''
#*********Begin*********#
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
data = imp.fit_transform(data)
min_max_scaler = MinMaxScaler()
preprocessing_data = min_max_scaler.fit_transform(data)
#********** End **********#
return preprocessing_data
第3关:数学成绩预测
编程要求
根据提示,在右侧编辑器补充代码,实现数学成绩分数预测方法。
测试说明
程序会调用你实现的方法对数据进行预测,若模型评估指标值大于0.95则视为通关。
开始你的任务吧,祝你成功!
示例代码如下:
# -*- coding: utf-8 -*-
from sklearn.linear_model import LinearRegression
def lr(train_data,train_label,test_data):
'''
input:train_data(ndarray):训练数据
train_label(ndarray):训练标签
test_data(ndarray):测试数据
output:predict(ndarray):测试数据预测标签
'''
#********* Begin *********#
lr = LinearRegression()
lr.fit(train_data,train_label)
predict = lr.predict(test_data)
#********** End **********#
return predict