什么是线程,为什么要引入线程?
有的进程可能需要 “同时” 做很多事情,而传统的进程只能串行的执行一系列的程序,为此,引入了 “线程” ,来增加并发度。
可以把线程理解为 轻量级进程
,线程是可以基本的 CPU 执行单位,也是程序执行流的最小单位,引入线程之后,不仅是进程之间可以并发,进程内的各个线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务。
引入线程后,进程只作为除 CPU 之外的系统资源的分配单元。
引入线程机制后,有什么变化?
资源分配、调度
传统进程机制中,进程是资源分配、调度的基本单位,而引入线程后,进程是资源分配的基本单位,线程是调用的基本单位。
并发性
传统进程机制中,只能进程间并发,引入线程之后,各个线程之间,也能并发,提升并发度。
系统开销
传统的进程间并发,需要切换进程的运行环境,系统开销很大,线程间的并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小,引入线程之后,并发所带来的系统开销减小。
线程的实现方式
用户级线程
在早期,操作系统还不支持线程的时候,当时的 “线程” 是由线程库实现的。
用户线程指不需要内核支持而在用户
程序中实现的线程,不依赖操作系统核心,程序利用线程库提供创建、同步、调用和管理线程的函数来控制用户线程。
用户级线程有以下特点:
1、用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)。
2、用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
3、在用户看来,是有多个线程,但是在操作系统内核来看,是意识不到线程的存在。用户级线程
就是从用户视角能看到的线程
4、优缺点:
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
缺点:当一个用户线程被阻塞后,整个进程都会被阻塞,并发度不高,多个线程不可在多个处理机上并行运行。
内核级线程
内核线程是指需要内核的参与,由内核完成线程的调度,依赖于操作系统核心,由内核的内部进行线程的创建和撤销。内核线程的线程表位于内核中,包括了线程控制块(TCB) ,一旦线程阻塞,内核会从当前或者其他进程中重新选择一个线程保证程序的执行。
内核级线程有以下特点:
1、内核级线程的管理工作都是由操作系统内核完成的,
2、线程调度、切换等工作,都是由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
3、操作系统会为每个内核级线程建立相应的 TCB,通过 TCB 对线程进行管理,内核级线程
就是从 操作系统内核视角能看到的线程
4、优缺点:
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。 多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程的管理成本较高,开销大。
多线程模型
一对一模型
一对一模型:一个用户级线程映射到一个内核级线程,每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换需要操作系统内核完成,需要切换到核心态,因此线程管理成本高,开销大。
多对一模型
多对一模型:多个用户线程映射到一个内核级线程,且一个进程只能被分配一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高,多个线程不可再多核处理机上并行执行。
多对多模型
多对多模型: n 个用户级线程映射到 m 个内核级线程 (n >= m),每个用户进程对应 m 个内核级线程。
克服了多对一模型的并发度不高的缺点,同时又解决了一对一模型中,用户进程占用太多内核级线程开销太大的缺点。
线程的组织
进程在操作系统的管理中,有 PCB 数据结构,而线程也有对应的数据结构存储线程相关信息,来方便操作系统进行管理,也就是对应的 TCB。