进程(Process)、线程(Thread)和协程(Coroutine)构成了计算机科学中实现任务并发执行的三种核心抽象机制。通常,为了提高程序的执行效率,开发者会根据应用场景和性能需求,选择相应的并发策略:
-
多进程(Multiprocessing):通过创建多个独立的进程,实现任务的并行处理。在这种策略中,每个进程拥有独立的内存空间,其适用于需要隔离性和独立资源分配的应用程序。
-
多线程(Multithreading):在单个进程的上下文中,启动多个线程来同时处理多个任务。在这种策略中,线程间共享内存空间,其适合于提高应用程序的并发性和响应性。
-
多协程(Coroutine multitasking):在单个线程的执行流中,通过协程来实现多个任务的协作式调度。
进程(Process)
进程是操作系统进行资源分配和调度的基本单位,每个进程都有独立的内存空间。由于进程的重量级特性,它们在内存中占据独立的位置,因此进程间上下文切换涉及的开销较大,包括栈、寄存器状态、虚拟内存以及文件句柄等的保存与加载,但是进程具有较好的隔离性和稳定性。
- 优点:进程能够利用多核CPU进行真正的并行运算,增强计算能力
- 缺点:相比线程与协程,进程占用较多系统资源,创建和销毁成本高,可同时运行的进程数量少
- 适用场景:
CPU-bound
任务
线程(Thread)
线程,作为轻量级进程,是构成进程的基本执行单元,同时也是操作系统进行CPU调度的最小单位。每个线程都拥有独立的程序计数器、一组寄存器和自己的调用栈,确保了执行的独立性。与此同时,线程能够与同一进程中的其他线程共享进程资源,如内存空间、文件句柄和其他同步机制。
- 优点:相比进程,创建和切换开销较小,占用资源相对较少
- 缺点:
- 相比进程:在Python等语言中,全局解释器锁(GIL)限制了多线程的多核并行能力
- 相比协程:线程带来资源消耗和上下文切换成本,高并发时管理更复杂
- 适用场景:并发数目少的
I/O-bound
任务
协程(Coroutine)
协程,也称为用户态线程,是一种在用户空间实现的轻量级执行单元。与线程相比,协程拥有更低的资源消耗和上下文切换开销。协程拥有自己的寄存器上下文和栈,其调度完全由用户控制,而非操作系统。在协程切换时,上下文和栈的保存与恢复操作在用户空间完成,避免了昂贵的内核态切换开销。
- 优点:协程因其避免线程切换开销而提高了效率,简化了共享资源控制,且无需锁机制
- 缺点:协程虽性能优越,但应用可能受限于库支持和实现复杂性
- 适用场景:并发数目多的
I/O-bound
任务
联系 & 区别
- 层级关系:
1
个进程中可以启动N
个线程,1
个线程中可以启动N
个协程 - 执行特性:线程可以并行执行,但线程内的协程是串行执行的,不能同时在多核上运行
- 调度控制:操作系统自动调度进程和线程,用户显式控制协程调度,实现更灵活的管理
- 同步&异步:线程和进程倾向于同步执行,而协程则更常用于异步操作
- 抢占&非抢占:线程面临操作系统抢占,协程则由编程者控制,实现非抢占式执行
- 资源承载:线程是CPU资源的分片,协程则在这些线程上实现细粒度的任务调度和执行
选择策略
在考虑优化策略时,首先根据任务特点进行选择,若任务为CPU-bound
,则选择多进程;否则,根据任务量、协程支持情况以及实现复杂度选择,选择使用多线程或多协程。