文章目录
- Series
- 创建series对象
- Series对象的属性
- DataFrame
- 创建DataFrame对象
Python 在数据处理上独步天下:代码灵活、开发快速;尤其是 Python 的 Pandas 包,无论是在数据分析领域、还是大数据开发场景,都具有显著的优势。
Series
Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。
Series 由索引(index)和列组成,函数如下:
pandas.Series(data, index, dtype, name, copy)
参数说明:
-
data:一组数据(ndarray 类型)。
-
index:数据索引标签,如果不指定,默认从 0 开始。
-
dtype:数据类型,默认会自己判断。
-
name:设置名称。
-
copy:拷贝数据,默认为 False。
创建series对象
# 创建series对象
import pandas as pd
ser_obj = pd.Series([1,2,3,4,5])
print(ser_obj)
'''
0 1
1 2
2 3
3 4
4 5
dtype: int64'''
# 创建series对象指定索引
ser_obj = pd.Series([1,2,3,4,5],index=(['a','b','c','d','e']))
print(ser_obj)
'''
a 1
b 2
c 3
d 4
e 5
dtype: int64
'''
# 通过字典创建series对象
year_data = {2001:17,2002:14,2003:12}
ser_obj2 = pd.Series(year_data)
print(ser_obj2)
'''
2001 17
2002 14
2003 12
dtype: int64
'''
Series对象的属性
print(ser_obj2.index)
'''
Int64Index([2001, 2002, 2003], dtype='int64')
'''
print(ser_obj2.values)
'''
[17 14 12]
'''
print(ser_obj2[2001])
'''
17
'''
DataFrame
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
参数说明:
-
data:一组数据(ndarray、series, map, lists, dict 等类型)。
-
index:索引值,或者可以称为行标签。
-
columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
-
dtype:数据类型。
-
copy:拷贝数据,默认为 False。
-
Pandas DataFrame 是一个二维的数组结构,类似二维数组。
创建DataFrame对象
Pandas的DataFrame类对象可以使用以下构造方法创建:
pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)
import numpy as np
import pandas as pd
demo_arr = np.array([['a','b','c'],['d','e','f']]) # 创建数组
df_obj = pd.DataFrame(demo_arr) # 基于数组创建DataFrame对象
print(df_obj)
'''
0 1 2
0 a b c
1 d e f
'''
df_obj = pd.DataFrame(demo_arr,index=['小明','小红'],columns=['No1','No2','No3'])