目录
- 列表和元组基础
- 概念
- 区别
- 列表和元组的基础操作和注意事项
- 列表和元组存储方式的差异
- 列表和元组的性能
- 列表和元组的使用场景
- 总结
- 思考题
列表和元组基础
概念
列表和元组,都是一个可以放置任意数据类型的有序集合。
在绝大多数编程语言中,集合的数据类型必须一致。不过,对于 Python 的列表和元组来 说,并无此要求:
l = [1, 2, 'hello', 'world'] # 列表中同时含有 int 和 string 类型的元素
l
[1, 2, 'hello', 'world']
tup = ('jason', 22) # 元组中同时含有 int 和 string 类型的元素
tup
('jason', 22)
区别
列表是动态的,长度大小不固定,可以随意地增加、删减或者改变元素(mutable)。
而元组是静态的,长度大小固定,无法增加删减或者改变(immutable)。
如何改变元组?
重新开辟一块内存,创建新的元组
tup = (1, 2, 3, 4)
new_tup = tup + (5, ) # 创建新的元组 new_tup,并依次填充原元组的值
new _tup
(1, 2, 3, 4, 5)
列表和元组的基础操作和注意事项
- 都支持负数索引,1 表示最后一个元 素,-2 表示倒数第二个元素,以此类推。
l = [1, 2, 3, 4]
l[-1]
4
tup = (1, 2, 3, 4)
tup[-1]
4
- 都支持切片(遵循顾前不顾后原则)
l = [1, 2, 3, 4]
l[1:3] # 返回列表中索引从 1 到 2 的子列表
[2, 3]
tup = (1, 2, 3, 4)
tup[1:3] # 返回元组中索引从 1 到 2 的子元组
(2, 3)
- 都可以嵌套
l = [[1, 2, 3], [4, 5],(4,7),{"a":1}] # 列表的每一个元素也是一个列表,也可以嵌套dict、tuple
tup = ((1, 2, 3), (4, 5, 6)) # 元组的每一个元素也是一元组
- 转换类型
list((1, 2, 3))
[1, 2, 3]
tuple([1, 2, 3])
(1, 2, 3)
- 内置函数
列表和元组存储方式的差异
列表和元组最重要的区别就是,列表是动态的、可变的,而元组是静态的、不可 变的。这样的差异,势必会影响两者存储方式。我们可以来看下面的例子:
l = [1, 2, 3]
l.__sizeof__()
64
tup = (1, 2, 3)
tup.__sizeof__()
48
为什么列表要比元组的存储空间多16字节?
由于列表是动态的,所以它需要存储指针,来指向对应的元素(上述例子中,对于 int 型,8 字节)。另外,由于列表可变,所以需要额外存储已经分配的长度大小(8 字 节),这样才可以实时追踪列表空间的使用情况,当空间不足时,及时分配额外空间。
上面的例子,大概描述了列表空间分配的过程。我们可以看到,为了减小每次增加 / 删减 操作时空间分配的开销,Python 每次分配空间时都会额外多分配一些,这样的机制 (over-allocating)保证了其操作的高效性:增加 / 删除的时间复杂度均为 O(1)。
但是对于元组,情况就不同了。元组长度大小固定,元素不可变,所以存储空间固定。
列表和元组的性能
通过学习列表和元组存储方式的差异,我们可以得出结论:元组要比列表更加轻量级一些, 所以总体上来说,元组的性能速度要略优于列表。
另外,Python 会在后台,对静态数据做一些资源缓存(resource caching)。通常来说, 因为垃圾回收机制的存在,如果一些变量不被使用了,Python 就会回收它们所占用的内存,返还给操作系统,以便其他变量或其他应用使用。
但是对于一些静态变量,比如元组,如果它不被使用并且占用空间不大时,Python 会暂时 缓存这部分内存。这样,下次我们再创建同样大小的元组时,Python 就可以不用再向操作 系统发出请求,去寻找内存,而是可以直接分配之前缓存的内存空间,这样就能大大加快程 序的运行速度。
下面的例子,是计算初始化一个相同元素的列表和元组分别所需的时间。我们可以看到,元 组的初始化速度,要比列表快 5 倍。
python3 -m timeit 'x=(1,2,3,4,5,6)'
20000000 loops, best of 5: 9.97 nsec per loop
python3 -m timeit 'x=[1,2,3,4,5,6]'
5000000 loops, best of 5: 50.1 nsec per loo
但如果是索引操作的话,两者的速度差别非常小,几乎可以忽略不计。
python3 -m timeit -s 'x=[1,2,3,4,5,6]' 'y=x[3]'
10000000 loops, best of 5: 22.2 nsec per loop
python3 -m timeit -s 'x=(1,2,3,4,5,6)' 'y=x[3]'
10000000 loops, best of 5: 21.9 nsec per loo
当然,如果你想要增加、删减或者改变元素,那么列表显然更优。原因你现在肯定知道了, 那就是对于元组,你必须得通过新建一个元组来完成。
列表和元组的使用场景
- 如果存储的数据和数量不变,比如你有一个函数,需要返回的是一个地点的经纬度,然 后直接传给前端渲染,那么肯定选用元组更合适。
- 如果存储的数据或数量是可变的,比如社交平台上的一个日志功能,是统计一个用户在 一周之内看了哪些用户的帖子,那么则用列表更合适。
总结
关于列表和元组,我们今天聊了很多,最后一起总结一下你必须掌握的内容。
总的来说,列表和元组都是有序的,可以存储任意数据类型的集合,区别主要在于下面这两点。
- 列表是动态的,长度可变,可以随意的增加、删减或改变元素。列表的存储空间略大于元组,性能略逊于元组。
- 元组是静态的,长度大小固定,不可以对元素进行增加、删减或者改变操作。元组相对于 列表更加轻量级,性能稍优。
思考题
想创建一个空的列表,我们可以用下面的 A、B 两种方式,请问它们在效率上有什么区 别吗?我们应该优先考虑使用哪种呢?可以说说你的理由。
# 创建空列表
# option A
empty_list = list()
# option B
empty_list = []
区别主要在于list()是一个function call,Python的function call会创建stack,并且进行一系列参 数检查的操作,比较expensive,反观[]是一个内置的C函数,可以直接被调用,因此效率高。
另外, list和tuple的内部实现都是array的形式,list因为可变,所以是一个over-allocate的 array,tuple因为不可变,所以长度大小固定