【数据分析 - 基础入门之pandas篇②】- pandas数据结构——Series

news2026/2/11 12:57:44

文章目录

前言
一、Series的创建
- 1.1 列表创建
- 1.2 NumPy数组创建
- 1.3 字典创建
二、Series索引
- 2.1 显式索引
- 2.2 隐式索引
三、Series切片
- 2.1 显式切片
- 2.2 隐式切片
四、Series基本属性和方法
- 4.1 属性
- 4.2 方法
- 4.3 案例——使用 bool 值去除空值
五、Series运算
六、Series多层行索引
- 6.1 Series多层索引的构建
- 6.2 Series多层索引的索引和切片操作
结语
相关导读

前言

大家好！我是一朵向阳花（花花花），本期跟大家分享的知识是 pandas 数据结构——Series。

作者的【 Python 数据分析】专栏正在火热更新中，如果本文对您有帮助，欢迎大家点赞 + 评论 + 收藏！

每日金句分享：愿你有一天，能和你最重要的人重逢。』—— 艾拉「可塑性记忆」。

一、Series的创建

Series 是一种类似于一维数组的对象，由下面两部分组成：

values：一组数据，ndarray 类型
index：数据索引

顾名思义，我们在创建 Series 对象时，需要传递一组数据，该数据大多数时候是可迭代对象。因此，下面三种创建方式都是将数据传入到 Series 方法中。

1.1 列表创建

list1 = list('ABCD') # 创建列表
s =pd.Series(list1) # 传递列表数据到 Series 方法中
print(s)
print(type(s.values))
print(type(s.index))

1.2 NumPy数组创建

n = np.array(range(5,10))
s2 = pd.Series(n)
s2

1.3 字典创建

前两种方式，都是只传递了数据，那么索引是默认索引（0 ~ N-1）；下面的字典创建方式，则是以字典的键为索引，字典的值为数据。

d = {
'a':11,'b':22,'c':33,'d':44
}
s = pd.Series(d)
s

二、Series索引

从以上 Series 的创建中我们可以看出，Series 的索引是可以修改的 。我们先来探讨以下索引的作用。

获取元素

有多种获取方式，s.索引名，s[‘索引名’]，s.loc[‘索引名’]

允许修改

（为 s.index 重新赋值即可，注意前后数量一致）

显式即表示使用索引名称的方式，隐式即表示使用序号的方式。后面的显式切片和隐式切片也是同理。

2.1 显式索引

取单个值时，三种方式：（假设 Series 对象名为 s）

s.索引名（数字索引不能用这种方式）
s[‘索引名’]
s.loc[‘索引名’]

取多个值时，返回一个新的 Series 对象，两种方式（也就是加中括号）：

s.[[‘索引名1’,‘索引名2’]]
s.loc[[‘索引名1’,‘索引名2’]]

s = pd.Series(np.array(range(5,10)),index=list('abcde'),name='number')
print(s)
display(s.a,s['a'],s.loc['a'])

2.2 隐式索引

隐式索引和显示索引的区别就是它通过数字来获取值。因为是数字，因此 s.number 这种方式肯定 不能用了 ，其他都相同。

取单值，两种方式：

s[number]
s.iloc[number]

取多值，两种方式：

s[[number1,number2]]
s.iloc[[number1,number2]]

s = pd.Series(np.array(range(5,10)),index=list('abcde'),name='number')
print(s)
print('取单值')
print(s[1])
print(s.iloc[1])
print('取多值')
print(s[[1,2]])
print(s.iloc[[1,2]])

三、Series切片

切片操作是获取一个新的 Series 对象的操作，显式切片是为左闭右臂，隐式切片时为左闭右开。

2.1 显式切片

两种方式：

s[索引名1：索引名2]
s.loc[索引名1：索引名2]

2.2 隐式切片

两种方式：

s[number1：number2]
s.iloc[number1：number2]

s = pd.Series({
'yw':100,
'math':150,
'eng':110,
'Python':130
})
print('数据：',end='')
print('-'*10)
print(s)
print('-'*10)
print('显式切片')
print(s['yw':'math'])
print('-'*10)
print(s.loc['yw':'math'])
print('-'*10)
print('隐式切片')
print(s[0:1])
print('-'*10)
print(s.iloc[0:1])

四、Series基本属性和方法

Series基本属性和方法是让我们更好了解数据组成的手段。

4.1 属性

属性	作用
s.shape	查看数据行列
s.ndim	查看维度，Series 就是一维，ndim 恒等于1
s.size	查看数据总数
s.index	查看索引
s.values	查看数据
s.name	查看 Series 对象的 name，若未设定则为空

4.2 方法

方法	功能
s.head()	查看前5条数据，若传入数字 n ，则查看前 n 条
s.tail()	查看后5条数据，若传入数字 n ，则查看后 n 条
s.isnull()	判断数据是否为空，空的为 True ，不空的为 False
s.notnull()	判断数据是否不空，空的为 False ，不空的为 True

4.3 案例——使用 bool 值去除空值

原理：Series 切片可以再传入一个 Series 对象，该 Series 对象索引要和原来相同，那么值为 False 的将不会被取出。

请看示例：

s = pd.Series(['a','e','f','b'])
s[pd.Series([True,True,False,True])]

如果改为：

s = pd.Series(['a','e','f','b'])
s[pd.Series([True,True,False,True],index=list('abcd'))]

那么将会报错：

下面是 Series 去除空值的案例。

s = pd.Series(['zhangsan','lisi','a',np.NAN,None])
print('数据：'+'-'*10)
print(s)
conditon = s.isnull()
print('判空情况：'+'-'*10)
print(conditon)
# 使用 bool 值索引过滤数据
s = s[~conditon]
print('过滤结果：'+'-'*10)
print(s)

五、Series运算

Series 运算包括算术运算和 Series 对象之间运算。算术运算是针对每一个元素的，有 +、-、*、/、 //、 %、 ** 等，这里不再赘述。Series 对象间的运算，只要记住，索引一个有一个没有时，计算值为 NaN，其他按照算术运算计算即可。

算术运算

s = pd.Series(np.array(range(5,10)))
print(s)
s * 10

Series对象间的运算

s1 = pd.Series(np.array(range(5,10)))
s2 = pd.Series([3,6,10,12])
print(s1)
print(s2)
s1 + s2 # 索引一个有一个没有时，计算值为 NaN

六、Series多层行索引

6.1 Series多层索引的构建

Series 不仅支持单层索引，还支持多层索引。最简单的实现方式就是将 index 设置成多维。

下面以二级行索引为例：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
print(s)

在这里插入图片描述

6.2 Series多层索引的索引和切片操作

对于 Series 多层索引的索引和切片操作，只要记住以下两点：

要先取第一层，再取第二层，不能直接取第二层索引
获取到第一层之后，就是一个普通的单层索引 Series
隐式索引，直接得到数

具体的方式，还是索引和切片都分为显式和隐式，下面通过一个案例来演示。

索引：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
print(s)
# 索引
print('显式索引：'+'-'*10)
print(s['语文']) # 获取到单层 Series
print(s.loc['语文']) 
print(s['语文']['小明'],s.loc['语文']['小明']) # 获取到单个值
print('隐式索引：'+'-'*10)
print(s.iloc[0])
print(s[0]) # 获取到单个值

切片：

s = pd.Series(np.random.randint(60,100,6),index=[['语文','语文','语文','数学','数学','数学'],['小明','小红','小丽','小明','小红','小丽']])
s = s.sort_index()
print(s)
print('显式切片'+'-'*10)
print(s['数学':'语文'])
print(s.loc['数学':'语文'])
print('隐式切片'+'-'*10)
print(s[0:2])
print(s.iloc[0:2])

结语

💕 本期跟大家分享的 “芝士” 就到此结束了，关于 Series 数据结构，你学会了吗？✨

🍻 我是向阳花花花花，在学习的路上一直前行，期待与你一起进步。~ 🍻

🔥如果文中有些地方不清楚的话，欢迎联系我，我会给大家提供思路及解答。🔥

文章直达	链接
上期回顾	【数据分析 - 基础入门之pandas篇①】- pandas介绍
下期预告	【数据分析 - 基础入门之pandas篇③】- pandas数据结构——DataFrame