目录
一、操作系统
二、进程
2.1 进程的概念
2.2 进程的管理
2.3 PCB
2.3.1 PCB里面的一些属性
2.3.2 进程的调度
2.3.3 进程的虚拟地址空间
2.3.4 进程间通信
一、操作系统
CPU、存储器、输入设备、输出设备,这些实物看得着摸得到的,都属于 "硬件" 设备。
这些硬件是怎么为我们服务的呢?发明了 操作系统
操作系统的核心功能:
- 对下,要管理各种硬件设备
- 对上,要给各种软件提供稳定的运行环境
如:Windows、Mac、Android、IOS 都是常见的操作系统,虽然厂商不同,细节上有所差别,但是核心操作都是这两条
操作系统本身就是一个非常复杂的软件,包含了如:内存管理、文件管理、设备管理、进程管理等等操作。其中,"进程管理" 是一个非常重要的概念。
二、进程
2.1 进程的概念
"进程(process)", 有些地方也叫做 "任务(task)"都是同一个意思,是操作系统里面的一个非常重要的概念。
一个正在运行的程序,都是以 "进程" 的方式来体现出来的
通过双击可执行文件(.exe文件),操作系统就会把可执行文件的核心信息加载到内存上,并且开始运行里面的代码,从而形成了一个进程,这个进程就是可执行程序跑起来的模样
现在的电脑,可以有多个进程一起执行起来的,可以打开任务管理器,看看此时电脑的进程:
注意区分"进程" 和 "程序(可执行文件)" 之间的区别:
如:
这是一个 进程,是QQ所跑起来的模样(是动态的,被加载到内存中的)
这是一个 可执行文件,是静态的,躺在硬盘上的~~
一个计算机的硬盘上,躺着很多的可执行文件,但只有一小部分在运行(变成了进程)
点击可执行文件,那么这个文件在内存上跑起来了,就成了进程
2.2 进程的管理
一个操作系统上,同时跑着许多个进程,有的进程是自己开的,还有的是电脑操作系统自动开的。
既然有这么多的进程,操作系统是怎么进行管理的?
管理的思路就是:先描述再组织
- 先描述:使用一个类/结构体,把这个东西有啥特征都表示出来~~
- 再组织:使用一个数据结构,把很多个这样的对象/结构体给整理到一起~~
比如说,现在有一个需求场景:需要给同学发奖品
那么,首先需要把这些同学的信息给描述出来,虽然信息有很多,但是我们只需要知道这些同学的学号、姓名就可以了(至于说同学的性别、身高、体重啥的都不关心);然后可以用数据结构把这些同学组织在一起,然后就可以发奖品啦~~
类似的,操作系统在进行管理进程的时候,首先用一个结构体把很多进程相关的特征都去进行了一些描述;再用数据结构把这些结构体变量组织在一起。
2.3 PCB
PCB,叫做 "进程控制块" 。它就是一个结构体,这个结构体里就包含了一些表示进程的核心信息。在操作系统内核中,把若干个 PCB 串成了一个双向链表,这就是进程管理的核心模块。
在任务管理器中,看到了许多的进程,本质上每一个进程都是一个PCB,进程与进程之间是通过双向链表串起来的,当我们运行一个进程,就是在链表里面新增一个节点,当我们销毁一个进程,就是在链表里面删除一个节点。
2.3.1 PCB里面的一些属性
pid:进程的身份标识,唯一,类似于 "学号"
一些基本概念:
内存指针:操作系统要把一些必要的数据加载到内存中.
必要的数据:有些是运行的指令(代码),有些是运行时依赖的数据(全局变量)
内存指针就描述了该进程中哪些部分是指令,哪些部分是数据
文件描述符表:表示了当前进程都打开了哪些文件,进程每打开一次文件,就会在文件描述表上记录一些重要的信息。
在代码中打开一个文件,就会在进程的 文件描述符表 里给这个文件分配一个表项。
可以看作 数组,每个元素代表了一个打开的文件,它对应的数组下标就是 "文件描述符"。
所以说,内存指针 和 文件描述符表 就描述了进程有哪些系统的资源,也认为 进程是操作系统中 "资源分配" 的具体单位!!!
2.3.2 进程的调度
进程里面还有一组比较关键的属性,用来实现进程的调度。
- 进程的优先级
- 进程的状态
- 进程的记账信息
- 进程的上下文
什么是调度:
本质问题:当前计算机 CPU 能力是有限的,但是进程的数量却比较多,每个进程都需要消耗一定的 CPU资源, 操作系统要做到尽可能的公平,这时候就需要进行 "调度"。
类似于高铁站的 "调度"工作,铁轨就只有几根,但是每天在上面跑的高铁 确实有许多的,那么 "调度" 就是要规划好 高铁什么时候开,从哪条铁轨上开,从哪里开到哪里......"调度"工作就是需要保证 这些高铁之间需要有条不紊的开,相互之间不可以打架~~
这里的解决方法,就是 "轮流来",虽然进程的运行速度会受到一定的影响,但是 受到的影响相对来说是比较小的,毕竟,CPU的主频是 XX GHz,1秒钟有上几十亿个时钟周期,人是感受不到这么快的切换的。
比如说,此时 我正在打开 CSDN,但是 QQ也照样是开着的,表面上看,这些进程在同时执行,其实不然,而是以 "轮流" 的方式占用 CPU 执行。这种方式,我们称之为 "并发式的执行"。
由于 CPU 上有多个核心,每个核心上都可以跑一个进程,某一时刻两个进程在两个 CPU 核心上同时执行,这时宏观上和微观上都是同时执行的。这种方式,称之为 "并行式的执行"。
那么,现在就可以来解释 进程里的那些关键属性了~
进程的优先级:cpu资源分配的优先顺序,就是指进程的优先权(priority)。
进程的状态:对于 进程 来说,有很多的状态,其中最典型的,就是 就绪状态 和 堵塞状态:
- 就绪状态:进程是准备就绪的,随时都可以让 CPU 执行~
- 阻塞状态:进程在等待某个任务结束之后,才可以让 CPU 执行;在完成之前,就没法继续执行~
进程的记账信息:记录以往每个进程在 CPU 上执行的时间,当然,也不一定是以执行的时间为单位,也可能是以执行的指令数为单位。
进程的上下文:具体指的就是 CPU 里的一堆寄存器里面的值,上下文 就会在进程被切出 CPU 的时候,把寄存器的状态保存到内存里;下次进程回到 CPU 上,就把 PCB 里的上下文读取出来,恢复到 CPU 寄存器中,做到无缝连接
2.3.3 进程的虚拟地址空间
进程,需要调用一些系统的资源,其中的内存资源,就是一个很关键的资源。
每个进程都只能访问到自己的地址空间,相互之间都不会有影响了,哪怕指针指错,操作系统也能及时发现,不会影响到其他的进程。这是一个非常重要的特性:隔离性!!!
现在又引出一个问题:
每个进程都有一个 "虚拟地址空间",那么 一个系统里面的进程有那么多,这些虚拟地址空间加到一起,比物理内存大了,那怎么办呢?
虽然系统里面的进程有很多,但实际上同一时刻进行的进程没有几个!!!
即使同一时刻,有好几个进程在跑,这些进程也不是同时把所有的虚拟内存地址空间的内存都用上了(假设 同时有6个进程在跑,很可能每个进程只用了 1M 的内存空间,虽然每个进程的虚拟空间很大,但实际使用的内存只有一小部分,物理内存只需要把真实使用的这部分内存数据给表示出来即可)!!!
极端情况下,同时跑的几个进程同时吃了很多的真实内存,会导致物理内存不够,此时 出现这种情况,算 bug,程序员需要想出办法来优化一下内存占用,或者扩容换一个内存更大的机器。
2.3.4 进程间通信
进程引入了隔离性,确实使得系统更稳定了,但是也带来了其他的问题:
如果多个进程之间想要配合工作,就麻烦了,
操作系统又引入了 "进程间通信",在隔离行的前提下 开了个口子,让多个进程之间能相互通信。
操作系统提供的进程通信方式有很多种,但是本质上都是一样的:搞一个多个进程之间都能访问到的公共资源,借助公共资源来进行通信!!!
就类似于之前疫情比较严重的时候,点外卖的时候要求 "无接触配送",外卖小哥直接把外卖放到一个专门的 集中放置的地点,点外卖的人直接去那个地点去取外卖~~