【Python】从Python列表中获取唯一值

news2026/2/12 23:41:41

基本原理

在Python中，列表是一种非常灵活的数据结构，它允许存储不同类型的元素。然而，有时我们可能需要从列表中提取唯一的值，即去除重复的元素。这在处理数据集或进行数据分析时尤其有用。Python提供了几种方法来实现这一目标。

代码示例

示例1：使用集合（Set）

集合是一个无序的、不包含重复元素的容器。我们可以利用集合的这一特性来快速获取列表中的唯一值。

# 定义一个包含重复元素的列表
my_list = [1, 2, 2, 3, 4, 4, 4, 5]

# 使用集合去除重复元素
unique_values = set(my_list)

# 将集合转换回列表（如果需要）
unique_list = list(unique_values)

print(unique_list)

示例2：使用列表推导式

列表推导式是Python中一种简洁的构建列表的方法，我们可以用它来过滤出不重复的元素。

# 定义一个包含重复元素的列表
my_list = ['apple', 'banana', 'apple', 'orange', 'banana', 'grape']

# 使用列表推导式和集合来获取唯一值
unique_values = []
[unique_values.append(x) for x in my_list if x not in unique_values]

print(unique_values)

示例3：使用`dict.fromkeys()`

这个方法利用了字典的键必须是唯一的这一特性。

# 定义一个包含重复元素的列表
my_list = [10, 20, 20, 30, 40, 40, 50]

# 使用dict.fromkeys()来去除重复元素
unique_values = list(dict.fromkeys(my_list))

print(unique_values)

注意事项

顺序问题：使用集合（Set）去除重复元素时，原始列表的顺序可能会丢失，因为集合是无序的。如果顺序重要，可以考虑使用OrderedDict（在Python 3.7+中，普通的字典已经是有序的）。
数据类型：集合只能包含不可变的数据类型，如整数、浮点数、字符串和元组。如果列表中包含可变数据类型，如列表或字典，则不能直接使用集合。
性能考虑：对于非常大的列表，集合方法通常更快，因为它的平均时间复杂度为O(1)，而列表推导式的时间复杂度为O(n^2)。

结论

从列表中获取唯一值是一个常见的编程任务，Python提供了多种方法来实现这一目标。选择哪种方法取决于具体的需求，比如是否需要保持原始顺序、列表的大小以及列表中元素的数据类型。通过上述示例，我们可以看到，即使是初学者也能轻松地掌握这些技巧，并将其应用到实际问题中。

>
> 【痕迹】QQ+微信朋友圈和聊天记录分析工具1.0.4 （1）纯Python语言实现，使用Flask后端，本地分析，不上传个人数据。
>
> （2）内含QQ、微信聊天记录保存到本地的方法，真正实现自己数据自己管理。
>
> （3）数据可视化分析QQ、微信聊天记录，提取某一天的聊天记录与大模型对话。
>
> 下载地址：https://www.alipan.com/s/x6fqXe1jVg1
>