1.册除每列都为NAN的数据,以下操作正确的是单法题
选B:
2.?离散化就是将连续值进行分区间
选C
3.以下方法中可以修改索引名称的是多选
选ABCD。
df.index.map({0:‘A1’,1:‘B1’,2:‘C1’})
4.?求4个人的平均分数
选BCD .为啥选CD呢。
5.对于缺失值的处理方法有?
选ABCD。D有争议。
6. df.duplicated()方法默认检测的是每一行是否与之前出现过的行在某列上是重复的
B:不是某列,而是所有列相同才算重复的值。
7.Python内建的None估也被当作NaN判断题
选A。
8.(必做题1)读取lianjia.csv文件里的数据,完成以下需求
8.必做题1)读取lianjia.csv文件里的数据,完成以下需求
- 观察结构,调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)
- 增加一个列关于目前状况(state),是否卖出状态随机设定
- 处理重复数据
- 查找楼层低的房子(这里提取低楼层)
- 电梯这列存在缺失值,想办法处理下缺失值
问答题 0.0分
1. 观察结构,调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)
2. 增加一个列关于目前状况(state),是否卖出状态随机设定
3. 处理重复数据
没重复值:
4. 查找楼层低的房子(这里提取低楼层)
5. 电梯这列存在缺失值,想办法处理下缺失值
subset是把该列有缺失值的“行”删掉。