【Python_Pandas】reset_index函数解析

文章目录

【Python_Pandas】reset_index函数解析
- 1. 介绍
- 2. 示例
- - 2.1 参数drop
  - 2.2 参数inplace
  - 2.3 参数level
  - 2.4 参数col_level
  - 2.5 参数col_fill
- 参考

1. 介绍

pandas.DataFrame.reset_index

reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')

1）函数作用：

重置索引或其level。
- 重置数据帧的索引，并使用默认索引。如果数据帧具有多重索引，则此方法可以删除一个或多个level。

2）参数：

drop: 重新设置索引后是否将原索引作为新的一列并入DataFrame，默认为False
inplace: 是否在原DataFrame上改动，默认为False
level: 如果索引(index)有多个列，仅从索引中删除level指定的列，默认删除所有列
col_level: 如果列名(columns)有多个级别，决定被删除的索引将插入哪个级别，默认插入第一级
col_fill: 如果列名(columns)有多个级别，决定其他级别如何命名

3）返回

DataFrame or None。具有新索引的数据帧，如果inplace=True，则无索引。

2. 示例

2.1 参数drop

False：表示重新设置索引后，将原索引作为新的一列并入DataFrame，
True：表示删除原索引

import pandas as pd
import numpy as np

df = pd.DataFrame([('bird', 389.0), ('bird', 24.0), ('mammal', 80.5), ('mammal', np.nan)],
                  index=['falcon', 'parrot', 'lion', 'monkey'], columns=('class', 'max_speed'))
print(df)
print('\n')

df1 = df.reset_index()
print(df1)
print('\n')

df2 = df.reset_index(drop=True)
print(df2)

输出：

2.2 参数inplace

True表示：在原DataFrame上修改，返回为None
False：将修改后的DataFrame作为新的对象返回

import pandas as pd
import numpy as np

df = pd.DataFrame([('bird', 389.0), ('bird', 24.0), ('mammal', 80.5), ('mammal', np.nan)],
                  index=['falcon', 'parrot', 'lion', 'monkey'], columns=('class', 'max_speed'))
print(df)
print('\n')

df1 = df.reset_index()
print(df1)
print('\n')

df2 = df.reset_index(inplace=True)
print(df2)
print('\n')
print(df)

输出：

2.3 参数level

如果索引有多个列，仅从索引中删除由level指定的列，默认删除所有列。

输入整数时表示将index的names中下标为level的索引删除；
输入为字符串时表示将名字为level的索引删除

import pandas as pd
import numpy as np

index = pd.MultiIndex.from_tuples([('bird', 'falcon'), ('bird', 'parrot'), ('mammal', 'lion'), ('mammal', 'monkey')], names=['class', 'name'])
columns = pd.MultiIndex.from_tuples([('speed', 'max'), ('species', 'type')])
df = pd.DataFrame([(389.0, 'fly'), ( 24.0, 'fly'), ( 80.5, 'run'), (np.nan, 'jump')], index=index, columns=columns)

print(df)
print('\n')

df0 = df.reset_index()
print(df0)
print('\n')

df1 = df.reset_index(level=1)
print(df1)
print('\n')

df2 = df.reset_index(level='name')
print(df2)

输出：

2.4 参数col_level

如果列名(columns)有多个级别，决定被删除的索引将插入哪个级别，默认插入第一级(col_level=0)

import pandas as pd
import numpy as np

index = pd.MultiIndex.from_tuples([('bird', 'falcon'), ('bird', 'parrot'), ('mammal', 'lion'), ('mammal', 'monkey')], names=['class', 'name'])
columns = pd.MultiIndex.from_tuples([('speed', 'max'), ('species', 'type')])
df = pd.DataFrame([(389.0, 'fly'), ( 24.0, 'fly'), ( 80.5, 'run'), (np.nan, 'jump')], index=index, columns=columns)

print(df)
print('\n')

df1 = df.reset_index(level=0, col_level=0)
print(df1)
print('\n')

df2 = df.reset_index(level=0, col_level=1)
print(df2)
print('\n')

输出：

2.5 参数col_fill

重置索引时被删除的索引只能插入一个级别，

如果列名(columns)有多个级别，那么这个列的列名的其他级别如何命名就由col_fill决定，默认不做填充，
如果传入None则用被删除的索引的名字填充

import pandas as pd
import numpy as np

index = pd.MultiIndex.from_tuples([('bird', 'falcon'), ('bird', 'parrot'), ('mammal', 'lion'), ('mammal', 'monkey')], names=['class', 'name'])
columns = pd.MultiIndex.from_tuples([('speed', 'max'), ('species', 'type')])
df = pd.DataFrame([(389.0, 'fly'), ( 24.0, 'fly'), ( 80.5, 'run'), (np.nan, 'jump')], index=index, columns=columns)

print(df)
print('\n')

df0 = df.reset_index(level=0, col_level=0)
print(df0)
print('\n')

df1 = df.reset_index(level=0, col_level=0, col_fill=None)
print(df1)
print('\n')

df2 = df.reset_index(level=0, col_level=1, col_fill='species')
print(df2)
print('\n')

df3 = df.reset_index(level=0, col_level=0, col_fill='genus')
print(df3)
print('\n')