学Python的漫画漫步进阶 -- 第十六步
- 十六、多线程
- 16.1 线程相关的知识
- 16.1.1 进程
- 16.1.2 线程
- 16.1.3 主线程
- 16.2 线程模块——threading
- 16.3 创建子线程
- 16.3.1 自定义函数实现线程体
- 16.3.2 自定义线程类实现线程体
- 16.4 线程管理
- 16.4.1 等待线程结束
- 16.4.2 线程停止
- 16.5 动动手——下载图片示例
- 16.6 练一练
- 16.7 多线程总结
- 全部16步学习完成 ,后续就是介绍项目实战,请大家给予点赞、关注,绝对超值!
十六、多线程
如果想让我们的程序同时执行多个任务,就需要使用多线程技术了。到目前为止,我们编写的程序都是单线程的,在运行时一次只能执行一个任务。
Python多线程是指从软件或者硬件上实现多个线程并发执行的技术。在多线程中,一个程序可以划分为多个独立运行的线程(也称为轻量级进程),这些线程可以并行执行,从而提高程序的执行效率。
多线程的优点在于可以充分利用多核CPU资源,同时执行多个任务,特别是在等待I/O操作(如用户输入、文件读写和网络收发数据等)时,线程可以释放一些珍贵的资源如内存占用等。此外,多线程还可以用于实现并发执行的任务,如网络爬虫、文件批量处理等。
在Python中,多线程相关的模块主要有Thread
、Threading
和Queue
等。其中,Thread
是底层支持模块,不建议使用。Threading
模块对Thread
模块进行了封装,实现了线程的一些操作对象化。而Queue
模块则实现了多生产者、多消费者的队列模式,可以方便地在多线程中使用。
需要注意的是,多线程编程也存在着一些问题。首先是线程安全问题,如果多个线程同时访问共享数据,可能会导致数据竞争或冲突的问题。其次是线程同步问题,如果多个线程之间存在依赖关系,需要按照一定的顺序执行,就需要使用线程同步机制来确保正确地执行顺序。此外,多线程的开销也比较大,因为每个线程都需要分配和管理自己的栈空间等资源,所以在实际应用中需要注意控制线程的数量和开销。
总之,Python的多线程编程是一种有效的技术,可以有效地提高程序的执行效率和响应速度。但是在实际应用中需要注意线程安全和线程同步等问题,并合理控制线程的数量和开销。
16.1 线程相关的知识
本节先介绍线程相关的知识。
16.1.1 进程
一个进程就是一个正在执行的程序,每一个进程都有自己独立的一块内存空间、一组系统资源。在进程的概念中,每一个进程的内部数据和状态都是完全独立的。
在Windows操作系统中,一个进程就是一个exe或者dll程序,它们相互独立,相互也可以通信。
16.1.2 线程
在一个进程中可以包含多个线程,多个线程共享一块内存空间和一组系统资源。所以,系统在各个线程之间切换时,开销要比进程小得多,正因如此,线程被称为轻量级进程。
16.1.3 主线程
Python程序至少有一个线程,这就是主线程,程序在启动后由Python解释器负责创建主线程,在程序结束后由Python解释器负责停止主线程。
在多线程中,主线程负责其他线程的启动、挂起、停止等操作。其他线程被称为子线程。
16.2 线程模块——threading
Python官方提供的threading模块可以进行多线程编程。threading模块提供了多线程编程的高级API,使用起来比较简单。
在threading模块中提供了线程类Thread,还提供了很多线程相关的函数,这些函数中常用的如下。
active_count():返回当前处于活动状态的线程个数。
current_thread():返回当前的Thread对象。
main_thread():返回主线程对象。主线程是Python解释器启动的线程。示例代码如下:
通过Python指令运行文件:
16.3 创建子线程
创建一个可执行的子线程,需要如下两个要素。
1 线程对象:线程对象是threading模块的线程类Thread或Thread子类所创建的对象。
2 线程体:线程体是子线程要执行的代码,这些代码会被封装到一个函数中。子线程在启动后会执行线程体。实现线程体主要有以下两种方式。
1)自定义函数实现线程体。
2)自定义线程类实现线程体。
16.3.1 自定义函数实现线程体
创建线程Thread对象的构造方法如下:
target参数指向线程体函数,我们可以自定义该线程体函数;通过name参数可以设置线程名,如果省略这个参数,则系统会为其分配一个名称;args是为线程体函数提供的参数,是一个元组类型。
示例代码如下:
通过Python指令运行文件:
16.3.2 自定义线程类实现线程体
另外一种实现线程体的方式是,创建一个Thread子类并重写run()方法,run()方法就是线程体函数。
采用自定义线程类重新实现16.3.1节的示例,示例代码如下:
16.4 线程管理
线程管理包括线程创建、线程启动、线程休眠、等待线程结束和线程停止,其中,线程创建、线程启动和线程休眠在16.3节已经用到了,这些不再赘述。本节重点介绍等待线程结束和线程停止的内容。
16.4.1 等待线程结束
有时,一个线程(假设是主线程)需要等待另外一个线程(假设是t1子线程)执行结束才能继续执行。
join()方法的语法如下:
参数timeout用于设置超时时间,单位是秒。如果没有设置timeout,则可以一直等待,直到结束。
使用join()方法的示例代码如下:
通过Python指令运行文件:
从运行结果来看,在子线程t1结束后,主线程才输出变量value的内容,这说明主线程被阻塞了。
如果尝试将t1.join()语句注释掉,则输出结果如下:
从运行结果可见,子线程t1还没有结束,主线程就输出变量value的内容了。
16.4.2 线程停止
在线程体结束时,线程就停止了。但在某些业务比较复杂时,会在线程体中执行一个“死循环”。线程体是否持续执行“死循环”是通过判断停止变量实现的,“死循环”结束则线程体结束,线程也就结束了。
另外,在一般情况下,死循环会执行线程任务,然后休眠,再执行,再休眠,直到结束循环。
示例代码如下:
通过Python指令运行文件:
16.5 动动手——下载图片示例
这个网络爬虫程序每隔一段时间都会执行一次下载图片任务,在下载任务完成后,休眠一段时间再执行。这样反复执行,直到爬虫程序停止。
示例参考代码如下:
本示例从服务器下载图片,因此需要参考14.2节启动Web服务器,
然后通过Python指令运行文件:
16.6 练一练
1 请简述如何创建线程体。
2 请简述线程中join()方法的作用。
3 下列哪些情况可以停止当前线程的运行?()
A.引发一个异常时。
B.当该线程调用sleep()方法时。
C.当创建一个新线程时。
D.当该线程调用stop()方法时。
4 判断对错(请在括号内打√或×,√表示正确,×表示错误)。
1)线程对象是threading模块线程类Thread或Thread子类所创建的对象。()
2)实现线程体主要有以下两种方式:自定义函数实现线程体和自定义线程类实现线程体。()
3)在线程体结束时,可通过调用stop()方法停止。()
4)在线程体结束时,可通过调用join()方法停止。()
16.7 多线程总结
Python多线程是一种在程序中实现并发执行的技术,它允许同时执行多个线程,从而提高程序的运行效率。在Python中,多线程编程可以使用threading
模块或concurrent.futures
模块来实现。下面是关于Python多线程的总结:
- 多线程的概念和原理
多线程是指在一个程序中同时执行多个线程,以充分利用多核CPU资源,提高程序的运行效率。多线程的原理是将程序划分为多个子任务或线程,每个线程并行执行,从而加快程序的执行速度。在Python中,多线程编程可以使用threading
模块或concurrent.futures
模块来实现。
- 线程的创建和管理
在Python中,可以使用threading.Thread()
方法来创建一个新线程。创建线程时,需要传入一个可调用对象(即线程要执行的任务)作为参数。当线程被创建后,可以调用start()
方法来启动线程,调用join()
方法等待线程执行完毕,以及调用is_alive()
方法来判断线程是否仍在运行。
- 线程安全和线程同步
在多线程编程中,需要注意线程安全和线程同步的问题。线程安全是指在多线程环境下,数据访问不会出现冲突或竞争的情况。如果多个线程同时访问同一个数据,就可能会出现数据竞争或冲突的问题。为了解决这个问题,可以使用同步机制(如互斥锁)来确保在同一时间只有一个线程可以访问共享数据。
threading
模块和concurrent.futures
模块的比较
Python的threading
模块是标准库中的多线程库,使用起来比较简单,但是它不支持异步执行和线程池的概念。相比之下,concurrent.futures
模块则提供了更强大的功能,它支持异步执行和线程池的概念,可以更好地管理多线程的执行。
- 多线程编程的适用场景
多线程编程适用于需要并发执行多个子任务的场景,特别是当这些子任务之间没有依赖关系,可以并行执行时。例如,在一个网络爬虫程序中,可以使用多线程同时爬取多个网页;在一个文件下载程序中,可以使用多线程同时下载多个文件。需要注意的是,在某些情况下,多线程并不一定能提高程序的性能,因为线程的创建和管理也需要一定的时间和资源开销。因此,在使用多线程编程时,需要根据实际情况进行评估和优化。
- 注意事项
在多线程编程中,需要注意以下几点:
- 避免共享数据:在使用多线程编程时,应该尽量避免共享数据,以避免出现数据竞争或冲突的问题。如果必须要共享数据,应该使用同步机制来确保同一时间只有一个线程可以访问共享数据。
- 注意线程的生命周期:每个线程都有自己的生命周期,包括创建、启动、运行和结束等阶段。在程序中管理好线程的生命周期,避免出现死锁或其他问题。
- 慎用全局变量:在多线程编程中,全局变量可能会导致线程不安全。如果必须要使用全局变量,应该使用同步机制来保护全局变量的访问。
- 选择合适的同步机制:在多线程编程中,选择合适的同步机制非常重要。例如,可以使用互斥锁(mutex)或条件变量(condition variable)等同步机制来确保数据的正确性和一致性。
总之,Python的多线程编程可以让程序实现并发执行多个子任务的目标,从而提高程序的性能和响应速度。但是在使用多线程编程时,需要注意线程安全和线程同步的问题,以及选择合适的同步机制来保护共享数据的访问。
全部16步学习完成 ,后续就是介绍项目实战,请大家给予点赞、关注,绝对超值!
附录
“练一练”参考答案
第1步
答案:(略)
第2步
1 答案:BCDF
2 答案:BC
3 答案:√
4 答案:(略)
第3步
1 答案:ABCD
2 答案:1)×2)√
3 答案:(略)
第4步
1 答案:BD
2 答案:BC
3 答案:CD
4 答案:B
第5步
1 答案:(略)
2 答案:B
3 答案:D
第6步
答案:1)×2)√ 3)√ 4)×
第7步
1 答案:B
2 答案:D
3 答案:AD
4 答案:1)√ 2)×3)√ 4)√
第8步
1 答案:AB
2 答案:ABC
3 答案:global
4 答案:1)√ 2)√
第9步
1 答案:ABCD
2答案:1)√2)√3)√4)√5)×6)√7)×8)×
3 答案:(略)
第10步
1 参考答案:AttributeError、OSError、IndexError、KeyError、NameError、TypeError和ValueError等。
2 答案:B
3 答案:1)√ 2)√ 3)√ 4)×5)×
第11步
1 答案:1)-2 2)-1
2答案:1)√2)√3)×4)√5)×
第12步
1 答案:(略)
2答案:1)×2)√3)√4)√5)×6)×7)√8)√
第13步
1 答案:(略)
2 答案:1)√ 2)×
第14步
1 答案:(略)
2 答案:(略)
3答案:1)√2)√3)√4)√5)×6)√7)√8)√
第15步
1 答案:(略)
2 答案:BCD
3答案:1)√2)√3)√4)√5)×6)×7)√8)√
第16步
1 答案:(略)
2 答案:(略)
3 答案:AB
4答案:1)√2)√3)×4)×