Linux之进程(一)

news2024/11/25 2:40:17

目录

一、概念

1、基本概念

2、描述进程的PCB

3、task_struct

二、查看进程

三、获取进程的PID和PPID

通过系统调用获取进程的PID和PPID

四、通过系统调用创建进程

1、fork函数创建子进程

2、用if进行分流

五、进程状态

1、操作系统进程状态

1、新建

2、运行

3、阻塞

4、挂起

2、Linux进程状态

六、僵尸进程

1、僵尸状态

2、僵尸进程的危害

七、孤儿进程


一、概念

1、基本概念

课本概念:程序的一个执行实例,正在执行的程序等。
内核观点:担当分配系统资源(CPU时间,内存)的实体。

我们知道,代码被编译链接后会形成一个可执行程序。当我们在电脑上双击软件的图标或者在手机上打开App,实际上就是在运行它们的可执行程序。

而这个可执行程序本质上是一个文件,是放在磁盘上的。当我们双击这个可执行程序将其运行起来时,本质上是将这个程序加载到内存当中了,因为只有加载到内存后,CPU才能对其进行内容的读取执行。而一旦将这个程序加载到内存后,我们就不应该将这个程序再叫做程序了,而是应该将其称之为进程

下图就是我电脑上的一些进程:

简单来说:我们自己启动一个软件,本质上就是启动了一个进程。

 在Linux下,运行一条命令,./xxx运行可执行程序时,其实就是在系统层面上创建了一个进程。

2、描述进程的PCB

进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
PCB(process control block),Linux操作系统下的PCB是: task_struct

系统当中可以同时存在大量进程,而当你开机的时候启动的第一个程序就是我们的操作系统(即操作系统是第一个加载到内存的),我们都知道操作系统是做管理工作的,而其中就包括了进程管理。那么操作系统是怎么对进程进行管理的呢?

其实就是我们在操作系统中所讲到的:先描述,再组织。当一个进程出现时,操作系统就立马通过创建一个 struct/class 来对其进行描述,之后对该进程的管理实际上就是对其描述信息的管理。

操作系统将每一个进程都会对其进行描述,所以会形成多个PCB,并将这些PCB以双向链表的形式组织起来,之后对进程的管理就是对这个双向链表的增删查改。例如:退出一个进程实际上就是先将该进程的PCB从该双链表当中删除,然后操作系统再将内存当中属于该进程的代码和数据进行释放或是置为无效。

所以,严格来说,进程 = 对应的代码和数据 + 进程对应的PCB结构体。

3、task_struct

1、在Linux中描述进程的结构体叫做task_struct。
2、task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息。

注:PCB和task_struct的关系:PCB是task_struct这一类描述进程的结构体的统称。只是在Linux中PCB是task_struct。

task_struct中的内容:

标示符:描述本进程的唯一标示符,用来区别其他进程。
状态:任务状态,退出代码,退出信号等。
优先级:相对于其他进程的优先级。
程序计数器:程序中即将被执行的下一条指令的地址。
内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。

上下文数据:进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
其他信息

二、查看进程

在根目录下有一个名为proc的系统文件夹。文件夹当中包含大量进程信息,这些数字其实是某一进程的PID,对应文件夹当中记录着对应进程的各种信息。我们若想查看PID为1的进程的进程信息,则查看名字为1的文件夹即可。

我们还可以通过ps命令来查看进程:

~ 单独使用ps 会显示所有进程的信息。ps axj

~  ps命令与grep命令搭配使用,即可只显示某一进程的信息。

ps axj | head -1 && ps axj | grep proc

三、获取进程的PID和PPID

通过系统调用获取进程的PID和PPID

通过使用系统调用函数,getpid和getppid(获取当前进程的父进程ID)即可分别获取进程的PID和PPID。如下图:

下面我们通过ps来查看一下进程的id是否与打印得到的id相同。是相同的。

四、通过系统调用创建进程

1、fork函数创建子进程

fork是一个系统调用函数,其功能就是创建一个子进程。返回值:失败时,-1;成功时,a. 给父进程返回子进程的pid,b. 给子进程返回0(fork可以有两个返回值)。

比如我们先编写一个下面的代码:

运行结果:

这个结果就和我们以前所学的知识相冲突了,为什么会有两个ret值呢?一个变量不是应该只有一个值的吗?而出现这种现象就和进程有关系了。

紧接着,我们就来看一看它们的进程:

fork之后,代码是父子共享的,数据各自开辟空间,私有一份。所以子进程和父进程都可以执行printf,进而打印出不同的ret。 

但是,我把一个子进程创建出来是为了让它去执行和父进程一样的代码吗?肯定不是的,这样做没有任何意义。我们新创建一个进程肯定是要让它去执行不同的代码,将任务拆解成小任务,让不同的进程去执行不同的任务,这样才能够提高效率。

2、用if进行分流

所以为了让不同的进程去执行不同的任务,在 fork 之后通常要用 if 进行分流。根据父进程和子进程获取到fork函数的返回值不同,我们就可以来让父子进程执行不同的代码,从而做不同的事。如下面的代码:

fork创建出子进程后,子进程会进入到 else if 语句的循环打印当中,而父进程会进入到 else 语句的循环打印当中。 如下图:

五、进程状态

1、操作系统进程状态

1、新建

字面意思,就是新建立的进程。

2、运行

运行队列:CPU在内核上维护了一个运行队列,进行进程的管理。让进程入队列,本质就是将该进程的task_struct 结构体对象放入运行队列之中。

运行状态:进程PCB在运行队列里排队就是运行状态(在等待CPU资源)。注:不是说这个进程正在运行,才是运行状态。即进程可能正在运行,也可能在运行队列中。

3、阻塞

系统中存在各种资源,如磁盘、网卡显卡等,在使用这些资源时,它们也有自己的队列。故系统中不止存在一种队列。CPU的队列就叫运行队列。

等待非CPU资源就绪时,就是阻塞状态。(即不在运行队列中,在其他资源的队列中)。

4、挂起

如果系统中存在许多进程,而有部分进程在短期内不会被调度,代码和数据在短期内不会被执行,此时如果内存空间不足,操作系统就可以把代码和数据暂时保存到磁盘上,节省一部分空间,该进程暂时被挂起了,这就是挂起状态。

2、Linux进程状态

下面是进程状态在Linux内核中的定义:

static const char * const task_state_array[] = 
{
    "R (running)", /* 0 */
    "S (sleeping)", /* 1 */
    "D (disk sleep)", /* 2 */
    "T (stopped)", /* 4 */
    "t (tracing stop)", /* 8 */
    "X (dead)", /* 16 */
    "Z (zombie)", /* 32 */
};

R运行状态(running)

 注:状态后面带+,意味着这个任务是前台进程。前台进程:一旦进程运行起来,你的命令行解释器就不能使用,只有通过 CTRL C 使进程停下来才能使用。

后台进程:在运行时,加上&,即让这个进程在后台运行。会返回进程的PID。且 CTRL C也不能使它停下来。

使它停下来的方法:kill -9 PID

S睡眠状态(sleeping)  

意味着进程在等待非CPU资源就绪(这里的睡眠也叫做可中断睡眠(interruptible sleep))。相当于阻塞状态。

S是浅度睡眠,可以被终止。能够被os杀掉。我们也可以使用kill命令将该进程杀掉。

D磁盘休眠状态(Disk sleep)

也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束。D是深度睡眠,无法被OS杀掉,只能通过断电、自动唤醒才可以恢复。

例如,某一进程要求对磁盘进行写入操作,那么在磁盘进行写入期间,该进程就处于深度睡眠状态,是不会被杀掉的,因为该进程需要等待磁盘的回复(是否写入成功)以做出相应的应答。(磁盘休眠状态)。

T停止状态(stopped)

X死亡状态(dead)

死亡状态只是一个返回状态,当一个进程的退出信息被读取后,该进程所申请的资源就会立即被释放,该进程也就不存在了,所以你不会在任务列表当中看到死亡状态(dead)。

六、僵尸进程

1、僵尸状态

是一个比较特殊的状态。当进程退出并且父进程没有读取到子进程退出的返回代码时就会产生僵死(尸)进程。

僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态。 

简单来说,就是:一个进程已经退出,但是还不允许被os释放,处于一个被检测的状态——僵尸状态。

例如,对于以下代码,fork函数创建的子进程在打印7次信息后会退出,而父进程会一直打印信息。也就是说,子进程退出了,父进程还在运行,但父进程没有读取子进程的退出信息,那么此时子进程就进入了僵尸状态。

维持该状态,为了让父进程和操作系统来回收。然后由z状态变为x状态。

2、僵尸进程的危害

1、进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z状态。
2、维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存task_struct(PCB)中,换句话说,Z状态一直不退出,PCB一直都要维护。
3、那一个父进程创建了很多子进程,就是不回收,就会造成内存资源的浪费。因为数据结构对象本身就要占用内存,一个结构体变量(对象),是要在内存的某个位置进行开辟空间的。
4、僵尸进程会造成内存泄漏。

七、孤儿进程

父进程如果提前退出,子进程后退出,这种情况下子进程就称之为“孤儿进程”。

孤儿进程必须被1号init进程(系统本身)领养。

为什么子进程要被领养呢?因为之后在子进程要退出时,它的父进程已经不在了,需要领养进程来进行回收。

我们以下面的代码为例:

最开始,父进程和子进程都在。

然后,父进程会退出,子进程成为孤儿进程

它的父进程的pid也变成了1,即该孤儿进程被1号进程领养了。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1288858.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java利用UDP实现简单的双人聊天

一、创建新项目 首先创建一个新的项目,并命名。 二、实现代码 import java.awt.*; import java.awt.event.*; import javax.swing.*; import java.net.*; import java.io.IOException; import java.lang.String;public class liaotian extends JFrame{private stat…

expdp单独导出导入dblink

文章目录 前言一、实现步骤获取ddl方式(不可行)expdp单独导出dblink 二、impdp单独导入dblink 前言 在实际工作中可能会遇到测试或者迁移工作,对于数据库建立较多的dblink应用重新建立dblink工作量较大,此时可以通过逻辑导出导入…

邮件协议讲解(SMTP、POP3、IMAP)

邮件收发基本概念 常见邮件协议 发邮件:SMTP(加密版本SMTPS) 收邮件:IMAP(加密版本IMAPS)、POP3(加密版本POP3S) 邮件协议端口号 SMTP: TCP 25 IMAP:…

西门子SMART精彩触摸屏如何在进入某个画面时置位某个BOOL变量?

西门子SMART精彩触摸屏如何在进入某个画面时置位某个BOOL变量? 以下举例进行说明具体的操作: 如下图所示,新建一个项目后,在变量表中添加好自己需要的变量; 添加一个画面,这里以“画面_1”进行举例说明&…

在 Node-RED 中引入 ECharts 实现数据可视化

Node-RED 提供了强大的可视化工具,而通过引入 ECharts 图表库,您可以更直观地呈现和分析数据。在这篇博客中,我们将介绍两种在 Node-RED 中实现数据可视化的方法:一种是引入本地 ECharts 库,另一种是直接使用 CDN&…

美图发布自研视觉大模型4.0,主打AI设计与AI视频【无际Ai分享资讯】

12月5-6日,主题为“未来AI设计”的美图创造力大会在厦门举行。美图公司发布自研AI视觉大模型MiracleVision(奇想智能)4.0版本,主打AI设计与AI视频。 AI设计方面,新增了矢量图形、文字特效、智能分层、智能排版四大能力…

机器学习实验五:集成学习

系列文章目录 机器学习实验一:线性回归机器学习实验二:决策树模型机器学习实验三:支持向量机模型机器学习实验四:贝叶斯分类器机器学习实验五:集成学习机器学习实验六:聚类 文章目录 系列文章目录一、实验…

windows install git

refer: https://developers.weixin.qq.com/miniprogram/dev/devtools/wechatvcs.html https://blog.csdn.net/weixin_40228200/article/details/128451324 在使用小程序的时候,需要初始化项目,需要注册Git账号 1.在本地确认cmd没有安装Git,进入Git官网…

开放式耳机什么品牌好?南卡、韶音、cleer开放式耳机哪个好?

全球TWS耳机出货量从2016年的918万台增长至2023年第二季度的6816万台。开放式耳机的新赛道在2023年持续发酵,成为市场中的新关注点,各大品牌也在今年争先推出新款开放式耳机,韶音、南卡、Cleer的新产品都在上半年纷纷亮相,开放式耳…

阻碍“元宇宙”游戏行业发展的最大瓶颈是什么?

很显然,我们现在还没看到真正的“元宇宙”产品,在3-5年内也不太可能看到这样的产品。按照米哈游CEO蔡浩宇的说法,2030年希望建成一个“上亿人愿意生活在其中的虚拟世界”,那也是八年以后的事情了。 原因很简单:技术不成…

Java 输入输出流01

1. 什么是 IO Java 中 I/O 操作主要是指使用 Java 进行输入,输出操作. Java 所有的 I/O 机制都是基于数据流进行输入输出,这些数据流表示了字符或者字节数据的流动序列。Java 的 I/O 流提供了读写数据的标准方法。任何 Java 中表示数据源的对象都会提供…

2024年终工作总结汇报,这样来写更科学

时光荏苒,2024年已经悄然而至,伴随而来的是一年一度的终年工作总结,以回首过去的一年的成果与不足。然而,怎样写一份既真实又有说服力的总结汇报成了摆在很多人面前的一道难题。 在为年终总结苦恼时,我突然想到了平时…

CompletableFuture异步执行

CompletableFuture异步执行 概念 Java 8引入了一个强大的类:CompletableFuture,它在java.util.concurrent包中。CompletableFuture是Future的增强版本,主要用于实现异步编程。 首先,我们要理解什么是Future。Future是Java5引入的一个接口,代表一个异步计算的结果。你可…

虹科干货 | 关于JSON数据库

来源:艾特保IT 虹科干货 | 关于JSON数据库 原文链接:https://mp.weixin.qq.com/s/NutCGWa32rOcEHrk3UDGcQ 欢迎关注虹科,为您提供最新资讯! 如何理解JSON数据库?作为NoSQL数据库的一种类型,JSON数据库有哪…

cocos creator [Window] Cannot read property ‘dump‘ of null

写脚本的时候,出现了如下的问题, [Window] Cannot read property dump of null 原因:在下图中,方式一是正常的,而方式二则会爆出此错误,所以需要初始化,给它赋值

人工智能|网络爬虫——用Python爬取电影数据并可视化分析

一、获取数据 1.技术工具 IDE编辑器:vscode 发送请求:requests 解析工具:xpath def Get_Detail(Details_Url):Detail_Url Base_Url Details_UrlOne_Detail requests.get(urlDetail_Url, headersHeaders)One_Detail_Html One_Detail.cont…

AI助力智慧农业,基于YOLOv6最新版本模型开发构建不同参数量级农田场景下庄稼作物、杂草智能检测识别系统

智慧农业随着数字化信息化浪潮的演变有了新的定义,在前面的系列博文中,我们从一些现实世界里面的所见所想所感进行了很多对应的实践,感兴趣的话可以自行移步阅读即可: 《自建数据集,基于YOLOv7开发构建农田场景下杂草…

java8 常用code

文章目录 前言一、lambda1. 排序1.1 按照对象属性排序:1.2 字符串List排序:1.3 数据库排序jpa 2. 聚合2.1 基本聚合(返回对象list)2.2 多字段组合聚合(直接返回对象list数量) 二、基础语法2.1 List2.1.1 数…

Linux之进程(二)

目录 一、进程优先级 1、基本概念 2、Linux中的优先级 1、PRI和NI 2、通过top命令更改进程NI值 3、四个特性 二、进程切换 一、进程优先级 1、基本概念 什么是优先级?优先级:进程获取cpu资源分配的先后顺序,就是指进程的优先权。优先…

Python 日志(略讲)

日志操作 日志输出: # 输出日志信息 logging.debug("调试级别日志") logging.info("信息级别日志") logging.warning("警告级别日志") logging.error("错误级别日志") logging.critical("严重级别日志")级别设置…