1. DataFrame
DateFrame对象是Pandas最常用的数据结构,是由不同类型的列组成的二维数据表结构,类似于EXCEL表,语法格式如下:
pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None)
1.1 函数参数:data
参数 | 含义 |
---|---|
data | 创建DataFrame的数据 |
DataFrame的data参数接收多种类型的输入:
1.1.1 Series 的字典
1.1.2 Dicts 的字典
1.1.3 ndarray 的字典
ndarrays的长度必须相同,否则会报错
1.1.4 lists 的字典
1.1.5 Series
1.2 函数参数:index
参数 | 含义 |
---|---|
data | 创建DataFrame的数据 |
index | 产生的DataFrame的索引,当数据中不包含index且创建时没有输入Index参数内容,默认为range(n) |
1.2.1 不指定index
1.2.2 指定index
1.2.3 当data为Series
当输入数据为Series时,产生DataFrame的结果会与Series的索引一致,当创建DataFrame时如果指定的index与Series的索引不一致,DataFrame将去掉指定索引中不存在的数据
1.3 函数参数:columns
参数 | 含义 |
---|---|
data | 创建DataFrame的数据 |
index | 产生的DataFrame的索引,当数据中不包含index且创建时没有输入Index参数内容,默认为range(n) |
columns | 创建DataFrame的列标签,当data中没有传入列标签时,默认为range(n);当data中传入了列标签,此时的columns参数作用是筛选 |
1.3.1 data中未指定列标签
1.3.2 data中指定了列标签
此时的column参数作用为筛选
1.4 函数参数:dtype
参数 | 含义 |
---|---|
data | 创建DataFrame的数据 |
index | 产生的DataFrame的索引,当数据中不包含index且创建时没有输入Index参数内容,默认为range(n) |
columns | 创建DataFrame的列标签,当data中没有传入列标签时,默认为range(n);当data中传入了列标签,此时的columns参数作用是筛选 |
dtype | DataFrame中的数据类型 |
1.5 函数参数:copy
参数 | 含义 |
---|---|
data | 创建DataFrame的数据 |
index | 产生的DataFrame的索引,当数据中不包含index且创建时没有输入Index参数内容,默认为range(n) |
columns | 创建DataFrame的列标签,当data中没有传入列标签时,默认为range(n);当data中传入了列标签,此时的columns参数作用是筛选 |
dtype | DataFrame中的数据类型 |
copy | 产生的DataFrame是复制data中的数据,当data是列表或字典构成的数据时,默认copy=True;当data为Series,ndarray数组或者DataFrame时 ,默认copy=False |