目录
1 series和dataframe的关系
2 创建一个df
3 用index过滤不同行
4 用row 过滤
5 用series构建dataframe
1 series和dataframe的关系
- 类似集合与元素的关系
- DataFrame中的一行or一列的取值,返回的结果都是series
- 通过几个series,可以创建一个dataframe
默认引入
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
2 创建一个df
直接传入一个参数
data = { 'A' : [ ' ' , ' ' , ' ' , ...]
... } 就是一个字典
- df = DataFrame ( data )
没指定index,就默认序列0,1,2... 指定的话如下
- df = DataFrame ( data , index = [ 'A' , 'B' , 'C' ] )
3 用index过滤不同行
① 位置的、非实际的index过滤
第1到2行;更具体的位置 第1到2行且第2列
- df = [ 0:2 ]
- df. iloc [0:2 , 1:2 ]
② 用实际的index过滤
单行的;多行的
- df = [ 'A' ]
- df. iloc [ 'A' , 'B' ]
4 用row 过滤
① 用row过滤所有行
- for row in df.iterrows ():
- print(row)
② 用row过滤个别行
- for row in df.iterrows ():
- print( row[0], row[1] )
- →只有一个元组里面的内容,一个index和它对应的值
5 用series构建dataframe
- 创建一个data
- 用series创建三个,待组成dataframe
- df_new = DataFrame ( [s1,s2,s3] )
用T可反转(矩阵同理)
- df_new.T
用上index
- df_new = DataFrame ( [s1,s2,s3] , index = '吃', '用', '做' ] )
- dfn = df_new.T
再用index 修改索引
- dfn . index = [ 'A' , 'B' , 'C' ]