Python集合的基本概念和使用方法

news2024/10/5 15:25:31

目录

集合(Set)

基本概念

基本特性

基本操作

集合运算

成员测试

高级操作

集合推导式

总结


集合(Set)

Python集合(Set)是Python语言中一个非常实用且强大的数据结构,它用于存储多个不重复的元素。集合中的元素可以是任何不可变类型的数据,如整数、浮点数、字符串等,但不能是可变数据类型,如列表或字典。集合提供了一种高效执行集合操作(如并集、交集、差集)的方式,这对于数据处理和分析任务尤为有用。

基本概念

在Python中,集合用set关键字来创建,可以通过花括号{}直接定义,或者使用内置函数set()将其他可迭代对象转换为集合。集合中的元素自动去重,这意味着每个元素在集合中只会出现一次。

# 直接定义集合
>>> my_set = {1, 2, 3, 4}
>>> print(my_set)
{1, 2, 3, 4}

# 使用set()函数转换列表为集合
>>> my_list = [1, 2, 2, 3, 4]
>>> my_set_from_list = set(my_list)
>>> print(my_set_from_list)
{1, 2, 3, 4}

注意:空集合只能用set()创建,因为{}代表的是空字典。

>>> type({})
<class 'dict'>
>>> type(set())
<class 'set'>

基本特性

在数学中,集合是由不同元素组成的一个整体,这些元素是无序的,且不重复。Python 的集合类型(set)正是基于这一概念实现的。与列表(list)、元组(tuple)等其他数据结构相比,集合有以下几个显著特性:

  1. 无序性:集合中的元素没有固定的顺序。
  2. 元素唯一性:集合中的所有元素都是唯一的,不会有重复的元素。
  3. 可变:集合是可变的,可以添加或删除元素。
  4. 动态性:集合的大小可以根据需要动态变化。

基本操作

  1. add(element):向集合中添加一个元素。
  2. remove(element):从集合中移除指定元素,如果元素不存在则抛出KeyError异常。
  3. discard(element):与remove相似,但当元素不存在时不会抛出错误。
  4. pop():随机移除并返回集合中的一个元素,集合为空时会抛出KeyError。
  5. clear():移除集合中所有元素,使其成为空集。
  6. copy():集合的复制拷贝。
>>> a = {1,2,3}
>>> a.add(4)
>>> a
{1, 2, 3, 4}
>>> a.remove(4)
>>> a
{1, 2, 3}
>>> a.remove(4)
Traceback (most recent call last):
  File "<pyshell#11>", line 1, in <module>
    a.remove(4)
KeyError: 4
>>> a.discard(4)
>>> a.discard(3)
>>> a
{1, 2}
>>> a.pop()
1
>>> a
{2}
>>> a.clear()
>>> a
set()
>>> t = {2,3,4}
>>> t
{2, 3, 4}
>>> s = t.copy()
>>> s
{2, 3, 4}

集合运算

  1. union(other_set) :返回两个集合的并集
  2. intersection(other_set) :返回两个集合的交集
  3. difference(other_set) :返回两个集合的差集
  4. symmetric_difference(other_set) :返回两个集合中不重复的元素集合,也称对称差集

集合运算也能使用运算符操作,以上四种运算分别对应重载运算符: | 、 &、 -、 ^

>>> s = {1,2,3}
>>> t = {2,3,4}
>>> s.union(t)
{1, 2, 3, 4}
>>> s | t
{1, 2, 3, 4}
>>> s.intersection(t)
{2, 3}
>>> s & t
{2, 3}
>>> s.difference(t)
{1}
>>> s - t
{1}
>>> s.symmetric_difference(t)
{1, 4}
>>> s ^ t
{1, 4}

另外对应四个update函数,功能对应相同,但改变当前集合。

  1. update(other_set) :返回两个集合的并集
  2. intersection_update(other_set) :返回两个集合的交集
  3. difference_update(other_set) :返回两个集合的差集
  4. symmetric_difference_update(other_set) :返回两个集合中不重复的元素集合,也称对称差集
>>> s = {1,2,3}
>>> t = {2,3,4}
>>> s.update(t)
>>> s
{1, 2, 3, 4}
>>> t
{2, 3, 4}
>>> s = {1,2,3}
>>> s.intersection_update(t)
>>> s
{2, 3}
>>> s = {1,2,3}
>>> s.difference_update(t)
>>> s
{1}
>>> s = {1,2,3}
>>> s.symmetric_difference_update(t)
>>> s
{1, 4}

注:改变的是原集合的值,四个函数的返回值都是None。

成员测试

  • in 和 not in:检查元素是否属于集合。
>>> s = {1,2,3}
>>> 1 in s
True
>>> 4 in s
False
>>> 1 not in s
False
>>> 4 not in s
True

高级操作

  1. 子集与超集:可以使用 issubset() 和 issuperset() 方法来判断一个集合是否是另一个集合的子集或超集(父集)。
  2. isdisjoint():判断当前集合与另一个集合,是否交集为空。
  3. 幂集:幂集是指一个集合所有可能子集的集合,可以通过递归或迭代的方式生成。
  4. 笛卡尔积:两个集合的笛卡尔积可以通过 itertools.product() 函数实现。

注:比较运算符==、  >、 >=、 < 、<= 也被重载用于父集、子集的比较。

注:笛卡尔积的概念

假设有两个集合 A = {a1, a2, ..., an} 和 B = {b1, b2, ..., bm},它们的笛卡尔积是所有可能的有序对 (ai, bj) 的集合,记作 A×B。

>>> import itertools
>>> s = {1,2,3}
>>> t = {2,3,4}
>>> list(itertools.product(s,t))
[(1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4), (3, 2), (3, 3), (3, 4)]

集合推导式

类似于列表推导式,集合也可以通过集合推导式快速生成。集合推导式语法简洁,适用于根据已有集合或其他可迭代对象生成新集合。

>>> squares = {x**2 for x in range(10)}
>>> print(squares)
{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

总结

Python集合是一种无序、不重复元素的集合数据类型,它提供了丰富的操作方法,包括元素的添加、删除、集合运算等。集合在数据处理、算法设计等方面具有广泛的应用,特别是对于需要去重、集合运算的场景,集合的效率和简洁性使其成为首选工具。通过掌握集合的基本操作和高级特性,开发者可以更加灵活高效地处理数据,提升代码的性能和可读性。随着Python在数据分析、机器学习、Web开发等领域的广泛应用,深入理解并有效利用集合功能,已成为Python程序员的一项重要技能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1810025.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

day27回溯算法part03| 39. 组合总和 40.组合总和II 131.分割回文串

39. 组合总和 题目链接/文章讲解 | 视频讲解 本题是 集合里元素可以用无数次&#xff0c;那么和组合问题的差别 其实仅在于 startIndex上的控制 class Solution { public:int sum;vector<int> path;vector<vector<int>> result;void backtracking(vector<…

爬虫工具yt-dlp

yt-dlp是youtube-dlp的一个fork&#xff0c;youtube-dlp曾经也较为活跃&#xff0c;但后来被众多网站屏蔽&#xff0c;于是大家转而在其基础上开发yt-dlp。yt-dlp的github项目地址为&#xff1a;GitHub - yt-dlp/yt-dlp: A feature-rich command-line audio/video downloaderA …

Java学习【深入探索包装类和泛型】

Java学习【深入探索包装类和泛型】 &#x1f680;包装类获取包装类对象的方式使用valueOf()创建直接赋值 Integer成员方法 &#x1f680;泛型引出泛型泛型类泛型方法泛型接口泛型的继承和通配符泛型的上界 在Java的学习中&#xff0c;包装类和泛型是两个重要的概念&#xff0c;…

分布式事务AP控制方案(上)

分布式事务控制方案 本篇文章给出一种要求高可用性&#xff08;AP思想&#xff09;的分布式事务控制方案 下篇新鲜出炉&#xff1a;点我查看 分布式事务控制方案1、业务背景2、本地消息表的设计3、对消息表的操作4、任务调度5、任务流程控制的抽象类6、课程发布的实现类7、总…

我的创作纪念日--我和CSDN一起走过的1825天

机缘 第一次在CSDN写文章&#xff0c;是自己在记录学习Java8新特性中Lambda表达式的内容过程中收获的学习心得。之前也有记录工作和生活中的心得体会、难点的解决办法、bug的排查处理过程等等。一直都用的有道笔记&#xff0c;没有去和大家区分享的想法&#xff0c;是一起的朋…

《Brave New Words 》2.4 与历史对话

Part II: Giving Voice to the Social Sciences 第二部分&#xff1a;为社会科学发声 Conversing with History 与历史对话 Good history and civics teachers make the past interesting. Great history and civics teachers make the past come alive. When history and civi…

作业07 递推算法2

作业&#xff1a; #include <iostream> using namespace std; int main(){int a[110][110]{0},b[110][110]{0},n;cin>>n;for(int i1;i<n;i){for(int j1;j<i;j){cin>>a[i][j];}}for(int in-1;i>1;i--){for(int j1;j<i;j){a[i][j]a[i][j]max(a[i1]…

离散数学--连通性和矩阵

目录 0.关系的运算和性质 1.通路和回路 2.连通关系 3.割点&#xff08;边&#xff09;和点&#xff08;边&#xff09;割集 4.强&#xff08;弱&#xff09;连通&单向连通 0.关系的运算和性质 &#xff08;1&#xff09;这个运算包括了矩阵的运算&#xff0c;包括这个…

汽车数据应用构想(三)

上期说的&#xff0c;用数据去拟合停车信息的应用&#xff0c;那么类似的POI信息相关的场景其实都可以实现。今天讲讲用户使用频率也很高的加油/充电场景。 实际应用中&#xff0c;在加油场景中用户关心的通常还是价格。无论是导航还是各种加油APP/小程序&#xff0c;都已经很…

了解常用智能指针

智能指针 1、概念 C中引入智能指针的主要目的是为了解决内存管理的问题&#xff0c;传统的指针&#xff08;裸指针&#xff09;在使用时需要手动分配和释放内存&#xff0c;容易出现内存泄漏和悬挂指针等问题。智能指针通过封装裸指针&#xff0c;并提供自动内存管理功能&…

端午安康,最真挚的祝福送最“粽”要的人

端午节&#xff0c;又称端阳节、龙舟节、重五节、天中节等&#xff0c;是集拜神祭祖、祈福辟邪、欢庆娱乐及饮食为一体的民俗大节&#xff0c;与春节、清明节、中秋节并称为中国四大传统节日&#xff0c;2008年被列为国家法定节假日&#xff0c;2009年9月端午节成为中国首个入选…

笔记 | 软件工程04:软件项目管理

1 软件项目及其特点 1.1 什么是项目 1.2 项目特点 1.3 影响项目成功的因素 1.4 什么是软件项目 针对软件这一特定产品和服务的项目努力开展“软件开发活动",&#xff08;理解&#xff1a;软件项目是一种活动&#xff09; 1.5 软件项目的特点 1.6 军用软件项目的特点 2 …

有点好玩的python运维脚本

python运维脚本 1. 常用端口扫描2. 文件整理 1. 常用端口扫描 在计算机网络中&#xff0c;端口是一个通信端点&#xff0c;允许不同的进程或服务通过网络连接和交换数据。端口通过数值来标识&#xff0c;并与特定的协议相关联。未采取适当安全措施而保持端口开放&#xff0c;可…

ICRA 2024:北京工业大学马楠教授联合中科原动力公司推出番茄采摘自主机器人AHPPEBot,实现32.46秒快速准确采摘

当前&#xff0c;农业生产正深受劳动力短缺困扰&#xff0c;这一现状对生产规模的进一步拓展构成了严重制约。为了突破这一瓶颈&#xff0c;实施自动化已成为提升农业生产力的关键途径&#xff0c;这也使得机器人采收技术备受关注。 现今的机器人采收系统普遍采用先进感知方法&…

linux 网桥学习

前言&#xff1a; 本文来学习一下linux网桥概念和网桥配置 1. linux网桥概念 网桥&#xff0c;类似于中继器&#xff0c;连接局域网中两个或者多个网段。它与中继器的不同之处就在于它能够解析它收发的数据&#xff0c;读取目标地址信息&#xff08;MAC&#xff09;&#xff…

技术玩家实现在不支持的CPU上运行 Windows 10 22H2

最近&#xff0c;AMD 悄然确认&#xff0c;其新款 Ryzen AI 300 系列 APU 将不再为 Windows 10 制作芯片组驱动程序&#xff0c;因为它将终止对Windows 10操作系统的支持&#xff0c;尽管它完全有能力这样做。这意味着想要获得官方驱动程序支持的用户必须在其上运行 Windows 11…

darts 时序预测入门

darts是一个强大而易用的Python时间序列建模工具包。在github上目前拥有超过7k颗stars。 它主要支持以下任务: 时间序列预测 (包含 ARIMA, LightGBM模型, TCN, N-BEATS, TFT, DLinear, TiDE等等) 时序异常检测 (包括 分位数检测 等等) 时间序列滤波 (包括 卡尔曼滤波&#xff0…

【Rd-03E】使用CH340给Rd03_E雷达模块烧录固件

Rd03_E 指导手册 安信可新品雷达模组Rd-03搭配STM32制作简易人体感应雷达灯教程 http://t.csdnimg.cn/mqhkE 测距指导手册网址&#xff1a; https://docs.ai-thinker.com/_media/rd-03e%E7%B2%BE%E5%87%86%E6%B5%8B%E8%B7%9D%E7%94%A8%E6%88%B7%E6%89%8B%E5%86%8C%E4%B8%AD%…

【Android面试八股文】一图展示 Android生命周期:从Activity到Fragment,以及完整的Android Fragment生命周期

图片来源于&#xff1a;https://github.com/xxv/android-lifecycle Android生命周期&#xff1a;从Activity到Fragment 图&#xff1a;android-lifecycle-activity-to-fragments.png 完整的Android Fragment生命周期 图&#xff1a;complete_android_fragment_lifecycle.png…

cve_2022_0543-redis沙盒漏洞复现 vulfocus

1. 原理 该漏洞的存在是因为Debian/Ubuntu中的Lua库是作为动态库提供的。自动填充了一个package变量&#xff0c;该变量又允许访问任意 Lua 功能。 2.复现 我们可以尝试payload&#xff1a; eval local io_l package.loadlib("/usr/lib/x86_64-linux-gnu/liblua5.1.so…