进程、线程、协程与虚拟线程
这一次我们从头,从最大的先开始说,我们从进程开始,因为内容比较多,所以我们分为几个不同的文章来介绍。先从进程,再从线程,最后介绍协程与虚拟线程。
简介
我们以一张操作系统的发展历程开始,引入对进程与线程等内容的切入。看完这张图之后,我们也会阐述一下其中与操作系统资源的关系。同时也是为后续的介绍做一些基本元素的介绍
操作系统的演进历程不仅是计算机科技进步的缩影,更是进程和线程概念演化的舞台。
在早期的简单批处理系统中,作业一次性装入内存运行,那时的作业可以看作是一个单一的进程。
随着技术的发展,多道程序系统出现了,它允许将多个作业装入内存,它们可以轮流使用 CPU 资源,这里面的每一个作业也可以理解为是一个独立的进程。
继续发展,操作系统引入了分时机制,让多个用户可以同时使用计算机,每个用户所运行的程序都是一个进程,它们共享CPU时间。这大大提高了系统的响应时间和资源利用效率。
但是,进程作为资源分配和调度的基本单位,在执行效率和资源消耗上有其局限性,这促使了线程的诞生。线程是进程中的实际运算单位,一个进程可以包含多个线程,它们共享进程的资源,但拥有各自的执行序列。这就意味着,在一个文本编辑器进程中,一个线程可以负责文字的输入,另一个线程可以同时进行拼写检查。
如今的现代操作系统中,进程与线程的关系更加微妙和紧密。进程为线程提供了一个虚拟的、独立的运行环境,而线程则使得进程内部的并行成为可能。在这种模型下,我们能够实现更高效的并发执行,让资源的管理和调度更加灵活。
正是基于这样的发展背景,我们可以深入探讨进程资源管理、线程同步与通信机制等诸多话题,它们构成了操作系统这门学科的核心内容,也是现代计算机高效运转的基石。在接下来的内容中,将详细解析进程资源的概念、线程的特性以及它们如何在现代操作系统中协同工作,来完成日益复杂的计算任务。
题外
什么是系统调用
所谓系统调用,是指用户在程序中调用操作系统所提供的一些自功能,系统调用可是为特殊的公公子程序。系统中的各种共享资源都由操作系统统一掌握,因此在用户程序中国呢,凡是与资源有关的操作(如存储分配、进行 I/O 传输及管理文件等),都必须通过系统调用方式向操作系统提出服务请求,并由操作系统代为完成。通常,一个操作系统提供的系统调用命令有十几条甚至上百条。大致分为一下几类:
- 设别管理。完成设备的请求或释放,以及设备启动等功能。
- 文件管理。完成文件的读、写、创建及删除等功能。
- 进程控制。完成进程的创建、撤销、阻塞及唤醒等功能。
- 进程通信。完成进程之间的消息传递或信号传递扽功能。
- 内存管理。完成内存的分配、回收以及获取作业占用内存去大小及始址等功能。
下图是关于系统调用以及内核态与用户态相关的图
进程是什么
进程的概念
在多道程序环境下,允许多个程序并发执行,此时他们将失去封闭性,并具有间断性及不可再现性的特征。为此引入进程的概念,以便更好的描述和控制程序的并发执行,实现操作系统的并发性和共享性(最基本的两个特性。)
为了使参与并发执行的每个程序(含数据)都能独立地运行,必须为之配置一个专门的结构,称为进程控制块(Process Control Block,PCB)。
系统利用 PCB 来描述进程的基本情况和运行状态,进而控制和管理进程。相应地,由程序段、相关数据段和 PCB 三部分构成了进程
(又称进程映像)。
所谓创建进程,实质上是创建进程实体中的PCB。而撤销进程,实质上进程的 PCB。值得注意的是,进程映像是静态的,进程则是动态的。
注意:PCB是进程存在的唯一标志!
从不同的角度,进程可以有不同的定义,比较典型的定义有:
1)进程是程序的一次执行过程。
2)进程是一个程序及其数据在处理机上顺序执行时所发生的活活动
3)进程是具有独立功能的程序在一个数据集合上运行的过程它是系统进行资源分配度的一个独立单位。
进程的特征
进程是由多道程序的并发执行而引出的,它和程序是两个截然不同的概念。进程的基本特征是对比单个程序的顺序执行提出的,也是对进程管理提出的基本要求。
1)动态性。进程是程序的一次执行,它有着创建、活动、暂停、终止等过程,具有一定生命周期,是动态地产生、变化和消亡的。动态性是进程最基本的特征。
2)并发性。指多个进程实体同存于内存中,能在一段时间内同时过运行。引入进程的目是使进程能和其他进程并发执行。并发性是进程的重要特征,也是操作系统的重要特征。
3)独立性。指进程实体是一个能独立运行、独立获得资源和独立接受调度的基本单位。未建立PCB的程序,都不能作为一个独立的单位参与运行。
4)异步性。由于进程的相互制约,使得进程按各自独立的、不可预知的速度向前推进步性会导致执行结果的不可再现性,为此在操作系统中必须配置相应的进程同步机制。
进程的状态与转换
我们的语言不断遇父生变化。通常进程有以下5种状态,前3种是进程的基本状态
1)运行态。进程正在处理机上运行。在单处理机中,每个时刻只有一个进程处于运行状态。
2)就绪态。进程获得了除处理机以外的所有资源,一旦得到处理机,便可立即运行。系统中处于就绪状态的进程可能有多个,通常称之为就绪队列。
3)阻塞态,又称等待态。进程正在等待某一事件而暂停运行,如等待某资源为可用(不包括处理机)或等待输入/输出完成。即使处理机空闲,该进程也不能运行,系统通常将处于阻塞态的进程也排成一个队列,甚至根据阻塞原因的不同,设置多个阻塞队列。
4)创建态,进程正在被创建,尚未转到就绪态。创建进程需要多个步骤:首先申请一个空白PCB,并向PCB中填写用于控制和管理进程的信息;然后为该进程分配运行时所必须的资源:最后把该进程转入就绪态并插入就绪队列。但是,如果进程所需的资源尚不能得到满足,如内存不足,则创建工作尚未完成,进程此时所处的状态称为创建态。
5)终止态: 进程正从系统中消失,可能是进程正常结束或其他原因退出运行。进程需要结束运行时。系统首先将该进程置为终止态,然后进一步等待资源释放和回收等工作。
需要注意的是,一个进程从运行态变为阻塞态是主动的行为,从阻塞态变成就绪态是被动行为,需要其他相关进程的协助。
进程控制
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撒销已有进程、实现进程状态转换等功能。在操作系统中,一般把进程控制用的程序段称为原语,原语的特点是执行期间不允许中断,它是一个不可分割的基本单位。
进程的创建
允许一个进程创建另一个进程,此时创建者称为父进程,被创建的进程称为子进程。子进程可以继承父进程所拥有的资源,当子进程被撒销时,应将其从父进程那里获得的资源归还给父进程。此外,在撤销父进程时,通常也会同时撒销其所有的子进程。
在操作系统中,终端用户登录系统、作业调度、系统提供服务、用户程序的应用请求等都会引起进程的创建。操作系统创建一个新进程的过程如下(创建原语):
1) 为新进程分配一个唯一的进程标识号,并申请一个空白 PCB(PCB 是有限的)。若PCB申请失败,则创建失败。
2) 为进程分配其运行所需的资源,如内存、文件、I/0 设备和CPU时间等(在PCB中体现),这些资源或从操作系统获得,或仅从其父进程获得。如果资源不足(如内存),则并不是创建失败,而是处于创建态,等待内存资源。
3) 初始化PCB,主要包括初始化标志信息、初始化处理机状态信息和初始化处理机控制信息,以及设置进程的优先级等。
4) 若进程就绪队列能够接纳新进程,则将新进程插入就绪队列,等待被调度运行。
进程的终止
引起进程终止的事件主要有:
1、正常结束。表示进程的任务已完成并准备退出运行
2、异常结束。表示进程在运行时,发生了某种异常事件,使程序无法继续运行,如存储区越界、保护错、非法指令、特权指令错、运行超时、算术运算错、I0故障等。
3、外界干预。指进程应外界的请求而终止运行,如操作员或操作系统干预、父进程请求和父进程终止。操作系统终止进程的过程如下(终止原语):
- 1)根据被终止进程的标识符,检索出该进程的PCB,从中读出该进程的状态
- 2)若被终止进程处于运行状态,立即终止该进程的执行,将处理机资源分配给其他进程
- 3)若该进程还有子孙进程,则应将其所有子孙进程终止。
- 4)将该进程所拥有的全部资源,或归还给其父进程,或归还给操作系统
- 5)将该PCB从所在队列(链表)中删除。
进程的阻塞与唤醒
正在执行的进程,由于期待的某些事件未发生,如请求系统资源失败、等待某种操作的完成、新数据尚未到达或无新任务可做等,进程便通过调用阻塞原语(Block),使自己由运行态变为阻塞态。可见,阻塞是进程自身的一种主动行为,也因此只有处于运行态的进程可能将其转为阻塞态。阻塞原语的执行过程如下:
1)找到将要被阻塞进程的标识号对应的PCB。
2)若谈进程为运行志,则保护其现场,将其软态转为阻塞态,停止运行。
当被阻塞进程所期待的事件出现时,如它所期待的10操作已完成或其所期待的数据已到达
3)把该PCB插入相应事件的等待队列,将处理机资源调度给其他就绪进程。
当被阻塞的进程所期待的事件出现时,如期待的 I/O 操作已完成或者期待的数据已到达时。会由有关进程(比如,释放该 I/O 设备的进程,或提供数据的进程)调用唤醒原语,将等待该事件的进程唤醒。唤醒原语的执行过程如下:
1)在该事件的等待队列中找到相应进程的PCB。
2)将其从等待队列中移出,并置其状态为就绪态。
3)把该PCB插入就绪队列,等待调度程序调度。
应当注意,阻塞原语和唤醒原语是一对作用刚好相反的原语,必须成对使用。如果某进程中调用了阻塞原语,则必须在与之合作的或其他相关的进程中安排一条相应的唤醒原语,以便唤醒阻塞进程:否则,阻塞进程将会因不能被唤醒而永久地处于阻塞状态。
进程间通信
1)共享存储。通过可以直接访问的共享空间进行写/读操作来实现进程之间的信息交换。操作时需要使用同步互斥工具(P 操作、V 操作)
2)消息传递。若通信的进程之间不存在可直接访问的共享空间,则使用操作系统提供的消息传递方式实现了进程通信。其中又有直接通信和间接通信两种方式。
3)管道通信。管道通信允许两个进程按照生产者-消费和的方式进行通信。生产者向管道的一段写,消费者从管道的另一端读。注意数据在管道中是先进先出的,若管道空课,则会有阻塞。
这一小节就不过多的做介绍了,相关的内容网上也有很多,如果想看到详细的具体介绍的话,大家可以自己多查查资料。
下一章再跟大家从结合线程的角度进行分析~