行索引、列索引、loc和iloc
import pandas as pd
import numpy as np
# 准备数据
df = pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("WXYZ"))
-
行索引(index):对应最左边那一竖列
-
列索引(columns):对应最上面那一横行
-
.loc[]官方释义: Access a group of rows and columns by label(s) or a boolean array.(通过标签或布尔数组访问一组行和列) 官方链接
- loc使用索引来取值,基础用法 df.loc[[行索引],[列索引]]
-
.iloc[]官方释义: Purely integer-location based indexing for selection by position.(按位置进行索引选择) 官方链接
- iloc使用位置(从0开始)来取值,基础用法 df.iloc[[行位置],[列位置]]
一、根据列索引取某一列/多列(常用)
df['W'] # 取‘W’列,返回类型是Series
df[['W']] # 取‘W’列,返回类型是DataFrame
df[['W','Y']] # 取‘W’列和‘Y’列
df.loc[:,'W':'Y'] # 取‘W’列到‘Y’列
二、根据行索引取某一行/多行
df.loc['a'] # 取‘a’行,返回类型是Series
df.loc[['a']] # 取‘a’行,返回类型是DataFrame
df.loc[['a','c']] # 取‘a’行和‘c’行,也可以写成 df.loc[['a','c'],:]
df.loc['a':'c',:] # 取‘a’行到‘c’行
三、根据行位置取某一行/多行(常用)
df[:2] #取前2行,行号为0和1
df[1:2] #取第2行,行号为1