文章目录
前言
一、操作系统
二、进程
2.1 进程的概念
2.2 进程的管理
2.3 PCB
2.3.1 PCB里面的一些属性
2.3.2 进程的调度
2.3.3 进程的虚拟地址空间
2.3.4 进程间通信
总结
前言
本节内容我们继续对JavaEE的有关内容进行学习,本节内容我们主要学习有关操作系统和进程的相关概念的理解和学习;接下来,就让我们进入到这个课程的学习吧!!!!
一、操作系统
像之前所说的,CPU、存储器、输入设备、输出设备,
总体上来说,都属于 "硬件" 设备!!!
而对于咱们普通用户,和硬件打交道,并不是一件方便的事情
为了可以更好的和这些 "硬件" 设备打交道,聪明的程序员发明了一个 "软件" —— 操作系统
操作系统的核心功能:
- 对下,要管理各种硬件设备
- 对上,要给各种软件提供稳定的运行环境
举例说明:
如:Windows、Mac、Android、IOS 都是操作系统,虽然厂商不同,细节上有所差别,但是核心操作都是这两条;
如:张三在QQ中写一段话,点击发送,这个过程 就是操作系统在进行工作;
操作系统本身就是一个非常复杂的软件;
如:内存管理、文件管理、设备管理、进程管理、......其中,"进程管理" 是一个非常重要的概念,作为程序员,就必须要去深入了解它;
二、进程
2.1 进程的概念
"进程(process)" 是操作系统里面的一个非常重要的概念,虽然 可能在不同的操作系统里面的叫法也许会有所差别,叫做 "任务(task)" ,但是其实它们都是一个意思;一个正在运行的程序,都是以 "进程" 的方式来体现出来的
通过双击 可执行文件(.exe文件),操作系统就会把 可执行文件的核心信息 加载到内存上,并且开始运行里面的代码,从而形成了一个进程,这个进程 就是可执行程序跑起来的模样
现在的电脑,可以有多个进程一起执行起来的,可以打开任务管理器,看看此时电脑的进程:
大家需要注意区分,"进程" 和 "程序(可执行文件)" 之间的区别:
如:
这是一个 进程,是QQ所跑起来的模样(是动态的,被加载到内存中的) ;
这是一个 可执行文件,是静态的,躺在硬盘上的;
换句话说,
一个计算机的硬盘上,可能会躺着很多的可执行文件;
同一时刻,可能只有一小部分在运行(变成了进程);
2.2 进程的管理
一个操作系统上,同时跑着许多个进程;
有的是自己双击过后打开的进程(如:QQ),还有的是电脑一开机 操作系统自动打开的进程;
既然有这么多的进程,操作系统就需要对它们进行管理,把它们安排的明明白白;
管理 的思路就是:先描述再组织;
- 先描述:使用一个类/结构体,把这个东西有啥特征 都表示出来;
- 再组织:使用一个数据结构,把很多个这样的 对象/结构体 给整理到一起;
比如说,现在有一个需求场景:需要给正在好好学习的同学发奖品:
那么,首先需要把这些同学的信息给描述出来,虽然信息有很多,但是 此时我们只需要知道 这些同学的学号、姓名就可以了(至于说同学的性别、身高、体重啥的都不关心);
然后就可以用一些数据结构 把这些同学整理到一起,然后就可以发奖品啦;
类似的,操作系统在进行管理进程的时候,首先用一个 结构体 把很多进程相关的特征 都去进行了一些表示;再用数据结构把这些结构体变量组织在一起;
2.3 PCB
PCB,叫做 "进程控制块"
它就是一个结构体,这个结构体里就包含了一些表示进程的核心信息;
在操作系统内核中,就把若干 PCB 串成了一个双向链表;这就是进程管理的核心模块
在任务管理器中,看到了许多的进程,本质上 每一个进程都是一个 PCB;
进程与进程之间 是通过双向链表串起来的,
当我们运行一个进程,就是在链表里面 新增一个节点,
当我们销毁一个进程,就是在链表里面 删除一个节点
2.3.1 PCB里面的一些属性
pid:进程的身份标识,唯一,类似于 "学号"
内存指针:操作系统要把一些必要的数据加载到内存中
必要的数据:有些是运行的指令(代码),有些是运行时依赖的数据(全局变量)
内存指针就描述了 该进程中哪些部分是指令,哪些部分是数据;
文件描述符表:表示了当前进程都打开了哪些文件,进程每打开一次文件,就会在文件描述表上记录一些重要的信息;
在代码中打开一个文件,就会在进程的 文件描述符表 里给这个文件分配一个表项;
可以看作 数组,每个元素代表了一个打开的文件,它对应的数组下标就是 "文件描述符";
所以说,内存指针 和 文件描述符表 就描述了进程有哪些系统的资源,也认为 进程是操作系统中 "资源分配" 的具体单位!!!
2.3.2 进程的调度
进程里面还有一组比较关键的属性,用来实现进程的调度:
- 进程的优先级
- 进程的状态
- 进程的记账信息
- 进程的上下文
什么是调度:
本质问题,当前计算机 CPU 是有限的,但是进程的数量却比较多,都需要消耗一定的资源,但是 每个进程都需要消耗一定的 CPU~
操作系统要做到尽可能的公平,这时候就需要进行 "调度"~
需要让这些有限的资源 贡献出更多的力量~
类似于高铁站的 "调度"工作,铁轨就只有几根,但是每天在上面跑的高铁 确实有许多的,那么 "调度" 就是要规划好 高铁什么时候开,从哪条铁轨上开,从哪里开到哪里......"调度"工作就是需要保证 这些高铁之间需要有条不紊的开,相互之间不可以打架~~
这里的解决方法,就是 "轮流来",虽然进程的运行速度会受到一定的影响,但是 受到的影响是比较小的~
毕竟,CPU的主频是 XX GHz,1秒钟有上几十亿个时钟周期~~
人是感受不到这样的轮转的~
比如说,此时 我正在打开 CSDN,但是 QQ也照样是开着的,
从宏观上面来说,就好像这些进程是同时执行一样,
但是 从微观上来说,并不是同时,而是 "轮流" 的方式占用 CPU 执行~~
类似于这种方式,我们称之为 "并发式的执行"~~
由于 CPU 上有多个核心,每个核心上都可以跑一个进程,某一时刻 两个进程就是在两个 CPU 核心上同时执行的~~
宏观上和微观上都是同时执行的~~
我们把这种方式,称之为 "并形式的执行"~~
那么,现在就可以来解释 进程里的那些关键属性了~
为了方便理解,我们首先需要引进一个场景(大家不要模仿哦):
假设 小欣是一位漂亮小姐姐,追求者有很多,她的选男友的标准是 有钱+长得帅~~
但是,没有哪个追求者具备这两个条件~
于是 她就决定同时交往多个男朋友(A,B,C)~
其中,A 有钱,B 长得帅,C 虽然没有这两个条件,但是他会舔~
所以,小欣 不能让 A、B、C 之间有交集~
于是,小欣 就需要化身为一个 "时间管理大师",即 规划一个时间表,规划哪段时间给和谁干什么~
好啦,场景已经设立
如果此时,把 小欣 当成一个 CPU,把 A,B,C 当成是三个进程的话,
上述的时间表的安排的情况下,就是 三个进程 在 CPU 上并发的执行
进程的优先级:
那么,什么是 进程的优先级 呢?
简单的来说,就是 小欣在安排时间表的时候,先安排哪一个,再安排哪一个......
假设,小欣比较喜欢 money,然后再考虑其他的,
那么 她就可以优先给 A 安排时间,把一周的大部分时间都陪伴在 A 的身边;
其次,在分出一点时间 陪伴 B;
至于 C,就看剩下的时间了
进程的状态:
指的是,安排时间表的时候,需要考虑到每个人的当前的特定情况~~
比如说,A 说他这周需要出差两个礼拜,不能够陪她了,
于是 接下来的时间就只给 B 和 C 了~~
对于 进程 来说,有很多的状态,其中最典型的,就是 就绪状态 和 堵塞状态:
就绪状态:进程是准备就绪的,随时都可以让 CPU 执行~
阻塞状态:进程在等待某个任务结束之后,才可以让 CPU 执行;在完成之前,就没法继续执行~
比如说,正常情况下,A、B、C 都是就绪状态(小欣随便安排时间,他们都是随叫随到);
但是,如果 A 出差了,就相当于进入阻塞状态,此时就没法给 A 安排时间了~~
进程的记账信息:
在安排时间的时候,就需要考虑到一些历史记录(以往的安排)~~
比如说,连续有好几个礼拜,给 C 安排的时间都太少了,小欣一看历史记录,发现了这个问题,再不进行一些调整的话,就要失去 C 这个小可爱啦~
于是,就在下一周安排时间的时候,就给 C 多安排一些时间~
操作系统 在安排进程的时候,也会记录以往每个进程在 CPU 上执行的时间,如果发现某个进程被安排得太少,就会适当的调整策略~~
而 记录以往每个进程在 CPU 上执行的时间,就叫做 进程的记账信息
当然,也不一定是一执行的时间为单位,也可能是以执行的指令数为单位
进程的上下文:
比如说,某一次 小欣和 A 在一起的时候,和 A 说好了,两周之后 一起去夏威夷旅游~
有一次 小欣和 B 在一起的时候,和 B 说好了,下次见面的时候 他会带来一个小礼物~
于是,当小欣下次遇到 A 的时候,就可以问他说:夏威夷那边准备的咋样了~
下次遇到 B 的时候,就可以问他说:礼物准备的怎么样了~
当然,在这个过程中 可千万不要把 A 和 B 两个对象给搞反了,不然就 "穿帮" 了~
为了避免出现 "穿帮" 的情况,小欣就需要记录好 每次约会后的一些关键信息,尤其是 这次约会还没有处理完的一些事情 需要在下次处理,就需要明确的记录好当前处理的进度/中间结果,这样下次约会的时候,就可以继续从上次的结果中继续往下进行了~
进程在调度的时候也是一样,进程很可能执行了某一个操作,执行到一半,就被调度走了~
过一段时间,进程还是要回来的~
回来就需要从上次执行的位置继续执行下去了~
这就很类似于 玩游戏的时候的 存档和读档,存档保存的信息,就是上次退出之前 的游戏的状态,这个就是 "上下文"~~
对于进程来说,"上下文",具体指的就是 CPU 里的一堆寄存器里面的值,上下文 就会在进程被切出 CPU 的时候,把寄存器的状态保存到 PCB里(内存 里);下次进程回到 CPU 上,就把 PCB 里的上下文读取出来,恢复到 CPU 寄存器中,做到从上次执行的结果 继续往下执行了~~
2.3.3 进程的虚拟地址空间
这是一个和进程非常相关的概念;
进程,需要调用一些系统的资源,其中的内存资源,就是一个很关键的资源;
我们期望每个进程,都用自己的内存,不要相互干扰!!!
但是,在 C语言 中有一个操作,叫做 指针解引用
解引用的时候,我们需要保证 这个指针里包含的地址,指向的是自己搞得合法的内存地址
此处必须有程序员来保证,当前指针指向的内存是否合法
如果指向的内存地址不合法,甚至会伴随着这个操作,把别的进程就直接搞挂了
但是,但凡是由人来操作的,都会有出错的可能性,甚至使得整个操作系统都不稳定
为了让各个进程之间不要相互干扰,操作系统就引入了 "虚拟地址空间" 这样的概念
每个进程都只能访问到自己的地址空间,相互之间都不会有影响了,哪怕指针指错,操作系统也能及时发现,不会影响到其他的进程
就算出问题,问题也会被限制到进程的内部,不会把其他的进程搞挂了
正因为有了 虚拟地址空间,进程有了一个非常重要的特性:隔离性!!!
一个进程的运行一般不会影响到另一个进程,尤其是一个进程崩溃也不会影响到另一个进程崩溃;
现在又引出一个问题:
每个进程都有一个 "虚拟地址空间",那么 一个系统里面的进程又那么多,这些虚拟地址空间加到一起,比物理内存大了,那怎么办呢?
1.虽然系统里面的进程有这么多,但是 实际上同一时刻进行的进程没有几个!!!
2.即使同一时刻,有好几个进程在跑,这些进程也不是同时把所有的虚拟内存地址空间的内存都用上了(假设 同时有6个进程在跑,很可能每个进程只用了 1M 的内存空间,虽然每个进程的虚拟空间很大,但实际使用的内存只有一小部分,物理内存只需要把真实使用的这部分内存数据给表示出来即可)!!!
3.极端情况下,同时跑的几个进程同时吃了很多的真实内存,会导致物理内存不够,此时 出现这种情况,算 bug,程序员需要想出办法来优化一下内存占用,或者扩容换一个内存更大的机器!!!
2.3.4 进程间通信
进程引入了隔离性,确实使得系统更稳定了,但是也带来了其他的问题:
如果多个进程之间想要配合工作,就麻烦了
操作系统又引入了 "进程间通信",在隔离行的前提下 开了个口子,让多个进程之间能相互通信
操作系统提供的进程通信方式有很多种,但是本质上都是一样的:搞一个多个进程之间都能访问到的公共资源,借助公共资源来进行通信!!!
举例说明:
就类似于之前疫情比较严重的时候,点外卖的时候要求 "无接触配送",外卖小哥直接把外卖放到一个专门的 集中放置的地点,点外卖的人直接去那个地点去取外卖
总结
今天的内容我们学习了有关进程的基本概念以及认识了操作系统;对PCB也有了一定的认识,下面的课程我们将进入到更加困难的线程的学习,让我们打起12分的精神继续学习吧!!!!!