一般这两个东西相互配合使用
pd.Series
若没有给定行和列的话,就会自动给0,1,2,3,4
describe= 只能描述数字,不可以描述字符串
ascending=false:倒序
一般的截取方式
特定的选取方式
有这三种挑选方式
一些改变某些值的方法
df.dropna=丢掉有nan的东西
axis = 指定是丢掉行还是丢掉列
若how = ‘any’,就说明只要这一行/列有nan,就丢掉
若how = ‘all’,就说明只有这一行/列都有nan,才丢掉
df.fillna = 填充nan值,把nan改为value的值,这里的意思就是把值为nan变成值为0
df.isnull = 看是否有nan,若有nan,则那个位置是True,若没有缺失数据,则不为nan,则返回False
np.any(df.isnull()) == true :若有一个及以上的True,则返回True,就说明起码有一个nan在表格当中,用于大规模数据的排查。
ignore_index = True = 忽略原来的序号排列,重新排列
outer:补齐,如果a有,b没有,合并的时候,补齐,用nan补齐 ,如果b有,a没有,合并的时候,补齐,用nan补齐
inner:最后只保留两者共有的部分,其他的都不要
join_axes = 只考虑df1.index 的序号排列,以df1为准
若df1有的,df2没有,则合并的时候,用nan补充,
若df1没有的,df2有,则合并的时候,舍去
听说这个方法新版本已经舍弃了?