python从入门到精通：数据容器

数据容器介绍

一种可以容纳多份数据的数据类型，容纳的每一份数据称之为一个元素，可以是任意类型的数据，如字符串、数字、布尔等。

数据容器根据特点的不同，如：

· 是否支持重复元素

· 是否可以修改

· 是否有序，等

分为五类，分别是：

列表（list）、元组（tuple）、字符串（str）、集合（set）、字典（dict）

数据容器：list（列表）

列表（list）的介绍：

列表（list）类型，是数据容器的一类，可以一次存储多个数据。

基本语法：

# 字面量

[元素1,元素2,元素3,...]

# 定义变量

变量名称=[元素1,元素2,元素3,...]

# 定义空列表

变量名称=[ ]

变量名称=list( )

列表内的每一个数据，称之为元素

· 以 [ ] 作为标识

· 列表内的每一个元素，逗号隔开

# 列表（list）
name = ['python','c','c++','java']
print(name)
print(type(name))
# 列表嵌套
name_list = [[1,2,"haha"],[4,5,True]]
print(name_list)
print(type(name_list))

注意：列表可以一次存储多个数据，且可以为不同的数据类型，支持嵌套

列表（list）的下标索引：

我们可以通过下标索引的方式找到列表中特定位置的元素。

比如：

# 列表索引
my_list = ["tom","jack","lihua"]
print(my_list[0]) # 结果为tom
print(my_list[1]) # 结果为jack
print(my_list[2]) #结果为lihua

或者可以反向索引，也就是从后向前：从-1开始，依次递减（-1、-2、-3....）

比如：

my_list = ["tom","jack","lihua"]
print(my_list[-3]) # 结果为tom
print(my_list[-2]) # 结果为jack
print(my_list[-1]) #结果为lihua

嵌套索引的下标索引：

比如：

# 嵌套列表的下标索引
name_list = [[1,2,"haha"],[4,5,True]]
print(name_list[1][2]) # 结果为True
print(name_list[0][2]) # 结果为haha

需要注意的是不要超出下标索引的范围，超出范围无法取出元素，会造成越界。

列表的常用操作：

列表除了可以定义和使用下标索引获取值，此外还有一系列功能：

1、插入元素

2、删除元素

3、清空元素

4、修改元素

5、统计元素个数

等等，这些功能统称为列表的方法

1、列表的查询功能

查询指定元素在列表中的下标，如果找不到，报错ValueError

语法：

列表.index(元素)

index就是列表对象（变量）内置的方法（函数）

# 查询下标索引
name = ['python','c','c++','java']
index = name.index("python")
print(f"python在列表中的下标索引为{index}")
# 如果被查找元素不存在，则会报错
index = name.index("javascript")
print(f"python在列表中的下标索引为{index}")

2、列表的修改功能

修改特定位置（索引）的元素值：

语法：列表[下标]=值

可以使用如上语法，直接对指定下标（正向、或反向均可）的值进行重新赋值

# 修改特定位置元素值
my_list = [1,2,3,4]
my_list[0] = 8
print(my_list)
my_list[-1] = 6
print(my_list)

插入元素：

语法：列表.insert(下标，元素)，在指定的下标位置，插入指定的元素

# 插入元素
my_list = [1,2,3,4]
my_list.insert(2,'haha')
print(my_list)

追加元素：

语法：列表.append(元素)，将指定元素，追加到列表的尾部

# 追加元素
my_list = [1,2,3,4]
my_list.append(4) # 结果：[1,2,3,4,4]
print(my_list)
my_list.append([5,5,6])
print(my_list) #结果：[1, 2, 3, 4, 4, [5, 5, 6]]

追加方式2：

语法2：列表.extend(其他数据容器)，将其他数据容器内容取出，以此追加到列表尾部

# 追加一批元素
my_list = [1,2,3,4]
my_list.extend([4,5,6])
print(my_list) #结果为：[1, 2, 3, 4, 4, 5, 6]

删除元素：

语法1：del列表[下标]

语法2：列表.pop(下标)

# 删除元素
my_list = [1,2,3,4]
# 方式1：
del my_list[0]
print(my_list) #结果为：[2, 3, 4]
# 方式2：
my_list.pop(0)
print(my_list) #结果为：[3, 4]

删除某元素在列表中的第一个匹配项：

语法：列表.remove(元素)

my_list = [1,2,3,2]
my_list.remove(2)
print(my_list) # 结果为：[1, 3, 2]

清空列表内容：

语法：列表.clear()

# 清空列表内容
my_list = [1,2,3,2]
my_list.clear()
print(my_list)

统计某元素在列表中的数量：

语法：列表.count(元素)

# 统计2在列表中的次数
my_list = [1,2,3,2]
num = my_list.count(2)
print(num)

统计列表内，有多少元素：

语法：len(列表)

# 统计列表内，有多少元素
my_list = [1,2,3,2]
count = len(my_list)
print(count)

列表的特点：

1、可以容纳多个元素（上限为2**63-1个）

2、可以容纳不同类型的元素

3、数据是有序存储的

4、允许重复数据存在

5、可以修改

list（列表）的遍历

既然数据容器可以存储多个元素，那么，就会有需求从容器内依次取出元素进行操作。将容器内的元素依次取出进行处理的行为，称之为：遍历、迭代。

列表的遍历-while循环

通过定义一个从0开始的下标变量，循环条件为下标值<列表中元素数量来实现遍历。

index = 0
while index < len(列表):
元素 = 列表[index]
对元素进行处理
index +=

def list_while_func():
    """
    使用while循环遍历列表的演示函数
    :return:
    """
    my_list = ["python","java","c++","javascript","go"]
    index = 0;
    while index < len(my_list):
        element = my_list[index]
        print(f"列表的元素：{element}")
        index += 1
list_while_func()

列表的遍历-for循环

除了while循环，python中还有另一种循环的形式：for循环。对比while，for循环更加适合对列表等数据容器进行遍历

语法：

for 临时变量 in数据容器:

对临时变量进行处理

表示从容器内，依次取出元素并赋值到临时变量上。在每一次的循环中，我们可以对临时变量进行处理。

def list_for_func():
    """
    使用for循环遍历列表的演示函数
    :return:
    """
    my_list = ["python","java","c++","javascript","go"]
    for element in my_list:
        print(f"列表的元素：{element}")
list_for_func()

while循环与for循环的对比：

1、在循环控制上：while循环可以自定循环条件，并自行控制；for循环不可以自定循环条件，只可以一个个从容器内取出数据

2、在无限循环上：while循环可以通过条件控制做到无限循环；for循环理论上不可以，因为被遍历的容器容量不是无限的

3、在使用场景上：while循环适用于任何想要循环的场景；for循环适用于，遍历数据容器的场景或简单的固定次数循环场景

数据容器：tuple（元组）

因为列表是可以被修改的，如果想要传递的信息，不被篡改，列表是不合适的。而元组与列表最大的不同就在于：元组一旦定义完成，就不可修改。

元组定义：定义使用小括号，且使用逗号隔开各个数据，数据可以是不同的数据类型。

# 定义元组字面量

(元素,元素,......,元素)

# 定义元组变量

变量名称=(元素,元素,......,元素)

# 定义空元组

变量名称=( )

变量名称=tuple( )

t1 = (1,"hehe",True)
t2=()
print(f"t1的类型:{type(t1)}")
print(f"t1的类型:{type(t2)}")
t3 = ("haha",) #元组中只有一个数据，这个数据后面添加逗号,否则类型变为str
# 元组嵌套
t = ((1,2,3),(4,5,6))
print(f"t的类型:{type(t)},内容是：{t}")

元组（tuple）的下标索引：

t = ((1,2,3),(4,5,6))
print(f"t的类型:{type(t)},内容是：{t}")
# 元组索引
print(t[1][2])

元组的相关操作：

编号	方法	作用
1	index()	查找某个数据，如果数据存在返回对应下标，否则报错
2	count()	统计某个数据在当前元组出现的次数
3	len()	统计元组内的元素个数

# 根据index()，，查找第一个特定元素的匹配项
t1 = (1,2,"hehe",3,4,"hehe")
index = t1.index("hehe")
print(index) #结果为2
# 统计某个元素在元组中的个数
count = t1.count("hehe")
print(count) #结果为2
# 统计元组中元素个数
print(len(t1)) #结果为6

元组（tuple）的遍历

元组的遍历-while循环：

# 元组的遍历-while循环
t1 = (1,2,"hehe",3,4,"hehe")
index = 0
while index < len(t1):
    print(f"元组的元素有:{t1[index]}")
    index += 1

元组的遍历-for循环：

# 元组的遍历-for循环
t2 = (1,2,"hehe",3,4)
index = 0
for element in t2:
    print(f"元组的元素有：{element}")

注意事项：不可以修改元组内容，否则会直接报错；但是如果在元组中嵌套了一个列表，那么列表中的元素是可以修改的。

数据容器：str（字符串）

字符串是字符的容器，一个字符串可以存放任意数量的字符。

字符串的下标索引：

和其他容器如：列表、元组一样，字符串也可以通过下标进行访问。

· 从前往后，下标从0开始

· 从后向前，下标从-1开始

# 字符串索引
str1 = "hello"
print(str1[0]) #结果为h

同元组一样，字符串是一个无法修改的数据容器。所以：

修改指定下标的字符、移除特定下标的字符、追加字符等均无法完成。如果必须要做，只能得到一个新字符串，旧的字符串无法修改。

字符串的常用操作：

1、查找特定字符串的相关索引值。

语法：字符串.index(字符串)

# 字符串查找特定元素的下标
str1 = "hello word"
index = str1.index("hello")
print(index) # 结果是字符串第一个元素的位置

2、字符串的替换

语法：字符串.replace(字符串1，字符串2)

功能：将字符串的全部：字符串1，替换为字符串2

注意：不是修改字符串本身，而是得到了一个新的字符串

# 字符串的替换
str1 = "hello word"
new_str1 = str1.replace("h","H")
print(new_str1) #结果为：Hello word

3、字符串的分割

语法：字符串.split(分隔符字符串)

功能：将按照指定的分隔符字符串，将字符串划分为多个字符串，并存入列表对象中。

注意：字符串本身不变，而是得到了一个列表对象

# 字符串分割
str1 = "hehe haha xixi"
list1 = str1.split(" ")
print(f"将字符串{str1}进行分割后得到{list1}，它的类型为：{type(list1)}")
# 运行结果：将字符串hehe haha xixi进行分割后得到['hehe', 'haha', 'xixi']，它的类型为：<class 'list'>

4、字符串的规整操作（去前后空格）

语法：字符串.strip()

# 字符串规整操作，去前后空格
str1 = " hello word "
print(str1.strip())

5、字符串的规整操作（去前后指定字符串）

语法：字符串.strip(字符串)

# 字符串的规整操作（去前后指定字符串）
str1 = "12@hello word@21"
print(str1.strip("12@"))

6、统计字符串中某个元素的个数

语法：字符串.count(字符)

str1 = "hello word"
count = str1.count("o")
print(count) # 结果为2

7、统计字符串长度

语法：len(字符串)

# 统计字符串长度
str1 = "hello word"
count = len(str1)
print(count) #结果为10

作为数据容器，字符串有如下特点：

1、只可以存储字符串

2、长度任意

3、支持下标索引

4、允许重复字符串存在

5、不可以修改

6、支持while、for循环

数据容器（序列）的切片

序列是指内容连续、有序，可以使用下标索引的一类数据容器。元组、列表、字符串均可以视为序列。

序列至此切片，即：列表、元组、字符串，均支持进行切片操作。

切片：从一个序列中，取出一个子序列

语法：序列[起始下标：结束下标：步长]

表示从序列中，从指定位置开始，依次取出元素，到指定位置结束，得到一个新序列：

· 起始下标表示从何处开始，可以留空，留空视作从头开始

· 结束下标（不含）表示何处结束，可以留空，留空是做截取到结尾

· 步长表示，依次取元素的间隔

· 步长1表示一个个取元素

· 步长2表示每次跳过一个元素

· 步长n表示每次跳过n-1个元素

· 步长为负数表示，反向取（起始下标与结束下标也要反向标记）

注意：此操作不会影响序列本身，而是会得到一个新序列（元组和字符串不可修改）

# 对list切片，从一到四，步长为1
my_list = [0,1,2,3,4,5,7]
result1 = my_list[1:5]
print(result1)
# 对元组进行切片，从头开始到位结束，步长为-2
my_tuple = [0,1,2,3,4,5,6]
result2 = my_tuple[::-2]
print(result2)

# 案例：万过薪月，员序程马黑来，nohtyp学
# 1、倒序字符串，切片取出或切片取出，然后倒序
str1 = "万过薪月，员序程马黑来，nohtyp学"
str2= str1[::-1][9:14]
print(str2)
str3 = "万过薪月，员序程马黑来，nohtyp学"
str4 = str1[5:10][::-1]
print(str4)
# 2、split分割“，”replace替换来为空，倒序字符串
str5 = "万过薪月，员序程马黑来，nohtyp学"
str6 = str5.split("，")[1].replace("来","")[::-1]
print(str6)

数据容器：set（集合）

集合是不支持重复元素的，会对重复元素进行去重操作、并且内容无序。

基本语法：

# 定义集合字面量

{元素,元素,......,元素}

# 定义集合变量

变量名称={元素,元素,......,元素}

# 定义空集合

变量名称=set( )

set1 = {"haha","hehe","xixi","haha"}
print(f"set1的内容为：{set1},类型：{type(set1)}") #set1的内容为：{'haha', 'hehe', 'xixi'},类型：<class 'set'>
set2 = set() # 空集合

集合的常用操作：

首先，因为集合是无序的，所以不支持下标索引访问。但是集合和列表一样，是允许修改的，因此我们来看集合的修改方法。

1、添加新元素

语法：集合.add(元素)。将指定元素添加到集合内

结果：集合本身被修改，添加了新元素

# 给集合添加元素
my_set = {"haha","hehe","xixi"}
my_set.add("python")
print(my_set)# 结果为：{'hehe', 'haha', 'python', 'xixi'}是无序的

2、移除元素

语法：集合.remove(元素)。将指定元素从集合中删除

结果：集合本身被修改，删除了指定元素

my_set = {"haha","hehe","xixi"}
my_set.remove("haha")
print(my_set) #结果为：{'hehe', 'xixi'}

3、随机取出一个元素

语法：集合.pop( )。将元素从集合中随机删除

结果：会得到一个元素的结果。同时集合本身被修改

# 随机取出一个元素
my_set = {"haha","hehe","xixi"}
pop_set = my_set.pop()
print(f"随机取出的元素为{pop_set},集合中的元素为{my_set}") #随机取出的元素为haha,集合中的元素为{'hehe', 'xixi'}

4、清空集合

语法：集合.clear( )

#清空集合
my_set = {"haha","hehe","xixi"}
my_set.clear()
print(my_set)

5、取出两个集合的差集

语法：集合1.difference(集合2)，功能：取出集合1与集合2的差集（集合1有而集合2没有的）

结果：得到一个新集合，集合1与集合2不变

# 两个集合的差集
my_set1 = {1,3,5}
my_set2 = {1,4,6}
new_set = my_set1.difference(my_set2)
print(new_set) # 结果：{3, 5}
print(my_set1) # 结果：{1, 3, 5}
print(my_set2) # 结果：{1, 4, 6}

6、消除两个集合的差集

语法：集合1.difference_update(集合2)

功能：对比集合1和集合2，在集合1内，删除和集合2相同的元素

结果：集合1被修改，集合2不变

# 消除两个集合的差集
my_set1 = {1,3,5}
my_set2 = {1,4,6}
my_set1.difference_update(my_set2)
print(my_set1) # 结果：{3, 5}
print(my_set2) # 结果：{1, 4, 6}

7、两个集合合并为一个

语法：集合1.union(集合2)

功能：将集合1和集合2组成新集合

结果：得到新集合，集合1和集合2不变

# 两个集合合并为一个
my_set1 = {1,3,5}
my_set2 = {1,4,6}
new_set = my_set1.union(my_set2)
print(new_set) #结果为：{1, 3, 4, 5, 6}
print(my_set1) #结果为：{1, 3, 5}
print(my_set2) #结果为：{1, 4, 6}

8、统计集合数量

语法：len(集合)

my_set = {1,2,3,4,5,6}
num = len(my_set)
print(num)

集合（set）的遍历

因为集合不支持下标索引，所以不能用while循环，但可以使用for循环

# for循环
my_set = {1,2,3,4,5,6}
for element in my_set:
    print(f"集合中的元素有：{element}")

数据容器：dict（字典、映射）

通过字典，我们可以通过用key取value的操作。

字典的定义，同样使用{}，不过存储的元素是一个个的：键值对，如下语法：

# 定义字典字面量

{key:value,key:value,......,key:value}

# 定义字典变量

变量名={key:value,key:value,......,key:value}

# 定义空字典

变量名={}

变量名=dict( )

字典同样不支持key的重复，如果重复，第一个key会被覆盖掉。

字典同集合一样，不可以使用下标索引。但是字典可以通过key值来取得对应的value

语法：字典[key]可以取到对应的value

my_dict = {"张三":99,"李四":88,"王二":77}
print(f"字典的内容为：{my_dict},类型：{type(my_dict)}")
score = my_dict["张三"]
print(score) # 99

字典的嵌套

字典的key和value可以是任意类型（key不可以为字典）

那么，就表明，字典是可以嵌套的

score_dict = {
    "张三":{
        "语文":77,
        "数学":66,
        "英语":33
    },"李四":{
        "语文":88,
        "数学":86,
        "英语":55
    },"王二":{
        "语文":99,
        "数学":96,
        "英语":66
    }
}
print(f"学生的考试信息:{score_dict}")

字典（dict）的常用操作：

1、新增元素

语法：字典[key]=value,字典被修改，新增了元素

my_dict = {"张三":99,"李四":88,"王二":77}
my_dict["麻子"] = 67
print(my_dict) #{'张三': 99, '李四': 88, '王二': 77, '麻子': 67

语法：字典[key]=value,字典被修改，元素被更新

注意：字典key不可以重复，所以对已经存在的key执行上述操作，就是更新value值

# 更新元素
my_dict = {'张三': 99, '李四': 88, '王二': 77, '麻子': 67}
my_dict["麻子"] = 68
print(my_dict) #{'张三': 99, '李四': 88, '王二': 77, '麻子': 68}

3、删除元素

语法：字典.pop(key)，结果：获得指定key的value，同时字典被修改，指定key的数据被删除

# 删除元素
my_dict = {'张三': 99, '李四': 88, '王二': 77, '麻子': 67}
score = my_dict.pop("麻子")
print(f"字典被移除一个元素，结果{my_dict},麻子的分数：“{score}")

4、清空元素

语法：字典.clear( )

5、获取全部的key

语法：字典.keys( )

结果：得到字典中的全部key

# 取出全部key
my_dict = {'张三': 99, '李四': 88, '王二': 77, '麻子': 67}
keys = my_dict.keys()
print(keys) #dict_keys(['张三', '李四', '王二', '麻子'])

6、字典内元素数量

语法：len(字典变量名)

# 字典中元素数量
my_dict = {'张三': 99, '李四': 88, '王二': 77, '麻子': 67}
num = len(my_dict)
print(num)

字典（dict）的遍历：

my_dict = {'张三': 99, '李四': 88, '王二': 77, '麻子': 67}
num = len(my_dict)
print(num)
# 取出全部key
my_dict = {'张三': 99, '李四': 88, '王二': 77, '麻子': 67}
keys = my_dict.keys()
for key in keys:
    print(f"字典的key是:{key}")
    print(f"字典的value是:{my_dict[key]}")

emp_dict = {
    "马云":{
        "部门":"科技部",
        "薪资":3000,
        "级别":1
    },"李彦宏":{
        "部门":"市场部",
        "薪资":5000,
        "级别":2
    },"刘强东":{
        "部门":"市场部",
        "薪资":7000,
        "级别":4
    },"张一鸣":{
        "部门":"科技部",
        "薪资":4000,
        "级别":1
    }
}
for name in emp_dict:
    if emp_dict[name]["级别"] == 1:
        info_emp_dict = emp_dict[name]
        info_emp_dict["级别"] = 2
        info_emp_dict["薪资"] += 1000
        emp_dict[name]=info_emp_dict
print(f"升职加薪后的结果为：{emp_dict}")

数据容器的通用操作

首先在遍历上，5类数据容器都支持for循环遍历；列表、元组、字符串支持while循环，集合、字典不支持while循环。

除了下标索引这个共性以外，还可以同哟个类型转换。比如list（容器）-将给定容器转换为列表、set（容器）-将给定容器转换为集合等等。

通用排序功能：

sorted(容器，[reverse=True])

将给定容器进行排序

my_list = [1,4,6,8,2,3]
print(f"列表的排序结果:{sorted(my_list,reverse=True)}") # 反向排序
print(f"列表的排序结果:{sorted(my_list)}")