基于Linux中的 进程相关知识 综合讲解

news2024/11/23 19:56:13

目录

一、进程的基本概念

二、pid,ppid,fork函数

三、进程的状态讲解

四、进程的优先级

五、完结撒❀


一、进程的基本概念

概念:

● 课本概念:程序的一个执行实例,正在执行的程序等
● 内核观点:担当分配系统资源( CPU 时间,内存)的实体

描述进程 —— PCB

● 进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
● 课本上称之为 PCB process control block 内核数据结构 ), Linux 操作系统下的 PCB :task_struct
task_struct —— PCB 的一种
● 在 Linux 中描述进程的结构体叫做 task_struct
● task_struct Linux 内核的一种数据结构,它会被装载到 RAM( 内存 ) 里并且包含着进程的信息

下面我们讲解一下要完成一个进程的运行,计算机设备以及操作系统所运作的整体逻辑,能使大家对进程有更深刻的理解:

首先比如我们所敲的一些代码,或者是Linux中的命令(pwd,ls等),运行起来其实就都是一个进程,而我们没有运行的时候,这些代码文件是存放在磁盘上的,当我们将一个程序运行起来之后需要将这些代码文件加载到内存里面

加载到内存里面的就是对应运行程序的代码和数据,但这还并不是一个进程

在Linux中存在许多的命令,如果运行一个程序只是将其代码和数据加载到内存中的话,那么在Linux中有那么多的指令,并且同一时间可能有许多进程同时在运行,我们又该如何进行管理?

这就变成了一个面向对象操作的问题,面向对象操作的精髓就是:先描述,再组织

所以我们就有了PCB,在Linux中PCB叫做task_struct

通过结构体task_struct对对象先进行描述,下面是task_struck里面的部分信息

task_ struct 内容分类
● 标示符 : 描述本进程的唯一标示符,用来区别其他进程。
● 状态 : 任务状态,退出代码,退出信号等。
● 优先级 : 相对于其他进程的优先级。
● 程序计数器 : 程序中即将被执行的下一条指令的地址。
● 内存指针 : 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
● 上下文数据 : 进程执行时处理器的寄存器中的数据 [ 休学例子,要加图 CPU ,寄存器 ]
● I O 状态信息 : 包括显示的 I/O 请求 , 分配给进程的 I O 设备和被进程使用的文件列表。
● 记账信息 : 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
● 其他信息

现在我们只需要知道task_struct里面有一个task_struct* next指针(用来连接各个task_struct结构体)和内存指针(用来指向对应进程在内存中的数据代码)即可

这样就可以同时运行多个进程并且对每个进程进行管理操作

那么进程到底是什么?

进程 = PCB + 自己的代码和数据

而PCB内核数据结构又是从哪里来的呢?
各位不要把操作系统给忘了,操作系统的功能之一是为用户提供良好(高效,稳定,安全)的运行环境,所以这里按理来说一定有操作系统的参与。

在我们的电脑或是手机关机开机的时候就是在加载操作系统,开机之前操作系统是以一堆二进制文件存放在磁盘中,开机过程中将二进制文件加载到内存中,而PCB就是在操作系统内部存储的

所以当我要运行一个程序的时候首先将在存在磁盘中的数据拷贝到内存中,再在操作系统中开辟出一块对应空间用于存储PBC

组织进程

可以在内核源代码里找到它。所有运行在系统里的进程都以 task_struct 链表的形式存在内核里。

二、pid,ppid,fork函数

上面我们讲解了进程的基本概念,对进程也已经有所了解

在同一时间内操作系统可能会同时运行多个进程,这我们在上面也讲过,那么问题来了

我们是如何区分在同一时段内每一个不同的进程的呢?

在Linux中是以pid进程标识符进行区分的

每一个进程都要有自己的唯一标识符,叫做进程pid

查看进程

进程的信息可以通过 /proc 系统文件夹查看
● 如:要获取 PID 1 的进程信息,你需要查看 /proc/1 这个文件夹。
● 大多数进程信息同样可以使用 top ps 这些用户级工具来获取

我们以运行下面代码为例:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
    while(1)
    {
        printf("this a process\n");
        sleep(1);
    }
    
    return 0;
}

命令ps ajx就是显示当前所有进程,head -1表示获取进程头一行的内容,&&是将两个命令进行连接一起执行,后面grep就不进行解释了

那么我们运行上面代码查看所对进程显示信息如下:

可以看到出现有两个进程,第一个就是我们所运行的进程,在第一行上面所显示的就是每个进程所对应的数据信息,可以看到第一列表示ppid,即每个进程所对应的ppid,第二列表示pid

那么我们在程序中如何访问其进程的pid值呢?
ppid,pid等都是存储在操作系统内部的数据,而作为用户我们不能直接对操作系统进行访问,但是我们可以通过调用其对应所连接系统调用接口的库函数进行对pid的访问

通过系统调用获取进程标示符
● 进程id(pid)getpid()
● 父进程id(ppid)getppid()
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main()
{
    printf("pid: %d\n", getpid());
    printf("ppid: %d\n", getppid());
    
    return 0;
}

这里再提一下:Ctrl + c可以在用户层面终止进程,kill -9 pid可以直接杀掉进程

下面我们再来认识一下fork函数

● 运行 man fork 认识 fork
● fork 有两个返回值
● 父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
    int ret = fork();
    printf("hello proc : %d!, ret: %d\n", getpid(), ret);
    sleep(1);
    return 0;
}
● fork 之后通常要用 if 进行分流
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main()
{
    int ret = fork();
    if(ret < 0)
    {
        perror("fork");
        return 1;
    }
    else if(ret == 0)
    { 
        //child
        printf("I am child : %d!, ret: %d\n", getpid(), ret);
    }
    else
    { 
        //father
        printf("I am father : %d!, ret: %d\n", getpid(), ret);
    }
    sleep(1);
    return 0;
}

在一个进程A运行中在创建一个进程B,那么进程A就是进程B的父进程,进程B的ppid为进程A的pid,并且进程B是可以看到并调用进程A的代码,但进程A和进程B的储存和运行又是相互独立存在的。

三、进程的状态讲解

为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在Linux内核里,进程有时候也叫做任务)。

下面是Linux的内核源代码:

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};

讲解:

R 运行状态( running ): 并不意味着进程一定在运行中,它表明进程要么是在运行中要在运行队列里。
S 睡眠状态( sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠
interruptible sleep ))。
D 磁盘休眠状态( Disk sleep )有时候也叫不可中断睡眠状态( uninterruptible sleep ),在这个状态的 进程通常会等待 IO 的结束。
T 停止状态( stopped ): 可以通过发送 SIGSTOP (kill) 信号给进程来停止( T )进程。这个被暂停的进程可 以通过发送 SIGCONT 信号让进程继续运行。
X 死亡状态( dead ):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。

进程状态查看

ps aux / ps axj 命令

在上面所提到的ps ajx | head -1中的STAT表示的就是当前进程状态

Z(zombie)- 僵尸进程
● 僵死状态( Zombies )是一个比较特殊的状态。当进程退出并且父进程(使用 wait() 系统调用 , 后面讲) 没有读取到子进程退出的返回代码时就会产生僵死 ( ) 进程
● 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
● 所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入 Z 状态

下面是维持30s的僵尸进程例子,大家可以手动实验一下

#include <stdio.h>
#include <stdlib.h>

int main()
{
    pid_t id = fork();
    if(id < 0)
    {
       perror("fork");
       return 1;
    }
    else if(id > 0)
    { 
       //parent
       printf("parent[%d] is sleeping...\n", getpid());
       sleep(30);
    }
    else
    {
       printf("child[%d] is begin Z...\n", getpid());
       sleep(5);
       exit(EXIT_SUCCESS);
    }
    return 0;
}
僵尸进程危害
● 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎 么样了。可父进程如果一直不读取,那子进程就一直处于 Z 状态
● 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在 task_struct(PCB) 中,换句话 说, Z 状态一直不退出, PCB 一直都要维护
● 那一个父进程创建了很多子进程,就是不回收,就会造成内存资源的浪费!因为数据结构 对象本身就要占用内存,想想 C 中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空 间!
● 引发内存泄漏
孤儿进程
● 父进程如果提前退出,那么子进程后退出,进入 Z 之后,那该如何处理呢?
● 父进程先退出,子进程就称之为 孤儿进程
● 孤儿进程被 1 init 进程(bash)领养,当然要有 init 进程回收喽。

四、进程的优先级

基本概念
● cpu 资源分配的先后顺序,就是指进程的优先权( priority )。
● 优先权高的进程有优先执行权利。配置进程优先权对多任务环境的 linux 很有用,可以改善系统性能。
● 还可以把进程运行到指定的 CPU 上,这样一来,把不重要的进程安排到某个 CPU ,可以大大改善系统整体性能。
查看系统进程
linux 中,用 ps –l 命令则会类似输出以下几个内容:

我们很容易注意到其中的几个重要信息,有下:
● UID : 代表执行者的身份
● PID : 代表这个进程的代号
● PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号
● PRI :代表这个进程可被执行的优先级,其值越小越早被执行
● NI :代表这个进程的 nice
PRI and NI
● PRI 也还是比较好理解的,即进程的优先级,或者通俗点说就是程序被 CPU 执行的先后顺序,此值越小 进程的优先级别越高(开始一般默认数值为80)
● 那 NI ? 就是我们所要说的 nice 值了,其表示进程可被执行的优先级的修正数值
● PRI 值越小越快被执行,那么加入 nice 值后,将会使得 PRI 变为: PRI(new)=PRI(old)+nice
● 这样,当 nice 值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行
● 所以,调整进程优先级,在 Linux 下,就是调整进程 nice
● nice 其取值范围是 -20 19 ,一共 40 个级别。
PRI vs NI
● 需要强调一点的是,进程的 nice 值不是进程的优先级,他们不是一个概念,但是进程 nice 值会影响到进 程的优先级变化。
● 可以理解 nice 值是进程优先级的修正数据
查看进程优先级的命令
top 命令更改已存在进程的 nice
● top
● 进入 top 后按 “r”–> 输入进程 PID–> 输入 nice
其他概念
● 竞争性 : 系统进程数目众多,而 CPU 资源只有少量,甚至 1 个,所以进程之间是具有竞争属性的。为了高 效完成任务,更合理竞争相关资源,便具有了优先级
● 独立性 : 多进程运行,需要独享各种资源,多进程运行期间互不干扰
● 并行 : 多个进程在多个 CPU 下分别,同时进行运行,这称之为并行
● 并发 : 多个进程在一个 CPU 下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为 并发

五、完结撒❀

如果以上内容对你有帮助不妨点赞支持一下,以后还会分享更多编程知识,我们一起进步。
最后我想讲的是,据说点赞的都能找到漂亮女朋友❤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1653084.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SSM【Spring SpringMVC Mybatis】——Mybatis

目录 1、初识Mybatis 1.1Mybatis简介 1.2 官网地址 2、搭建Mybatis框架 2.1 准备 2.2 搭建Mybatis框架步骤 1. 导入jar包 2. 编写核心配置文件【mybatis-config.xml】 3. 书写相关接口及映射文件 4. 测试【SqlSession】 2.3 添加Log4j日志框架 导入jar包 编写配置文…

CTF关于反序列化练习随笔记录

反序列化 php魔术方法 1、get、set 这两个方法是为在类和他们的父类中没有声明的属性而设计的 get&#xff08; $property &#xff09; 当调用一个未定义的属性时访问此方法 set&#xff08; $property&#xff0c; $value &#xff09; 给一个未定义的属性赋值时调用 这里的…

华为eNSP中型企业局域网网络规划设计(上)

敲半天一个闪退全™给我干没了呜呜呜&#xff0c;eNSP&#xff0c;wcnm&#xff01;wcnm&#xff01;wcnm&#xff01; →b站传送门&#xff0c;感谢大佬← →华为eNSP中型企业局域网网络规划设计&#xff08;下&#xff09;← →拓扑图传送门&#xff0c;可以自己配置着玩←…

带EXCEL附件邮件发送相关代码

1.查看生成的邮件 2.1 非面向对象的方式&#xff08;demo直接copy即可&#xff09; ​ REPORT Z12. DATA: IT_DOCUMENT_DATA TYPE SODOCCHGI1,IT_CONTENT_TEXT TYPE STANDARD TABLE OF SOLISTI1 WITH HEADER LINE,IT_PACKING_LIST TYPE TABLE OF SOPCKLSTI1 WITH HEADER LIN…

ansible------inventory 主机清单

目录 inventory 中的变量 2&#xff09;组变量[webservers:vars] #表示为 webservers 组内所有主机定义变量&#xff0c;所有组内成 员都有效 ansible_userrootansible_passwordabc1234 3&#xff09; [all:vars…

数据湖与数据网格:引领组织数据策略的未来

十多年来&#xff0c;组织已经采用数据湖来克服数据仓库的技术限制&#xff0c;并发展成为更加以数据为中心的实体。虽然许多组织已经使用数据湖来探索新的数据用例并改进其数据驱动的方法&#xff0c;但其他组织发现所承诺的好处很难实现。因此&#xff0c;许多数据湖计划的有…

文件下载出现 IOExpcetion: closed

异常原因截图 : 异常代码位置 : 出现的原因是 使用 try-with-resources, downloadFile 方法执行完毕, 文件流被关闭了...导致前面读取文件字节, 异常提示已经关闭... try (Response response OkHttpUtils.getInstance().client.newCall(new Request.Builder().url(fileUrl)…

Etcd集群选举细节

日志级别 在 etcd 集群中&#xff0c;领导者选举是 Raft 协议的一部分&#xff0c;用于在当前领导者失败或无法与集群中的其他节点通信时选出新的领导者。以下是您提供的日志中与领导者选举相关的一些关键条目&#xff0c;以及对它们的详细说明&#xff1a; 节点失去领导者&am…

python分析预测退休后养老金金额

欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一.前言 二.代码 三.总结 一.前言 养老金,也称为退休金或退休费,是一种主要的社会养老保险待遇。它旨在保障职工退休后的基本生活需要,根据劳动者对社会所作的贡献和所具备的享受养老保险资格或退休条件,按月或一次…

电脑屏幕监控软件有哪些?8款受欢迎的电脑屏幕监控软件

电脑屏幕监控软件有哪些&#xff1f;8款受欢迎的电脑屏幕监控软件 市场上有很多监控软件&#xff0c;因为太多&#xff0c;很多老板不知道怎么选&#xff0c;今天小编从它们各自的特点、优势、未来发展趋势几方面&#xff0c;介绍8款受欢迎的电脑屏幕监控软件。 第一是&#x…

【优选算法】——Leetcode——611. 有效三角形的个数

目录 ​编辑 1.题目 2 .补充知识 3.解法⼀&#xff08;暴⼒求解&#xff09;&#xff08;可能会超时&#xff09;&#xff1a; 算法思路&#xff1a; 算法代码&#xff1a; 4.解法⼆&#xff08;排序双指针&#xff09;&#xff1a; 算法思路&#xff1a; 以输入: nums …

还有谁不想薅云渲染的羊毛?五种云渲染优惠知道就是省到

不管你是效果图设计师还是动画设计师&#xff0c;在面对紧急或大量的渲染任务时&#xff0c;总会有云渲染的需要。然而&#xff0c;现在的云渲染越来越贵&#xff0c;我们该如何尽可能地节约成本完成渲染任务呢&#xff1f;本文将为你介绍云渲染的五种优惠形式&#xff0c;看完…

Compose 生命周期和副作用

文章目录 Compose 生命周期和副作用生命周期副作用APIDisposableEffectSIdeEffectLaunchedEffectrememberCoroutineScoperememberUpdatedStatesnapshotFlowproduceStatederivedStateOf Compose 生命周期和副作用 生命周期 OnActive&#xff1a;添加到视图树。即Composable被首…

传闻不断!TCL紧急澄清 | 百能云芯

TCL科技5月7日晚间发布澄清公告称&#xff0c;近日关注到有媒体发布《TCL华星年内投630亿元加入8代oled线竞逐&#xff01;》《TCL华星计划年内投资第八代OLED》等相关报道。公司目前无新建8代或8.6代OLED产线的投资计划&#xff0c;公司不存在通过定增募集资金新建显示产线的计…

期权和期货有什么区别?

今天期权懂带你了解期权和期货有什么区别&#xff1f;期权和期货是两种常见的衍生金融工具&#xff0c;它们在结构和盈利方式上存在一些关键的区别&#xff1a; 期权 期权是一种给予持有者在未来某个时间以特定价格买入或卖出基础资产的权利&#xff0c;但不是义务。期权的主要…

直播报名 | 珈和科技携手潍柴雷沃共探“现代农场”未来式

数据赋农季系列直播第四期&#xff0c;我们将以“未来农业发展趋势之农场智慧化、管理数据化”为主题展开&#xff0c;此次系列直播由珈和科技及湖北珞珈实验室共同主办&#xff0c;第四期直播很荣幸邀请到潍柴雷沃参与其中&#xff0c;双方将就智慧农服平台和数据交易SaaS平台…

C#里如何设置输出路径,不要net7.0-windows

官网介绍&#xff1a; 更改生成输出目录 - Visual Studio (Windows) | Microsoft Learn <PropertyGroup> <AppendTargetFrameworkToOutputPath>false</AppendTargetFrameworkToOutputPath> <AppendRuntimeIdentifierToOutputPath>false</Appen…

RabbitMQ基础入门

初识MQ 微服务间通讯有同步和异步两种方式&#xff1a; 同步通讯&#xff1a;就像打电话&#xff0c;需要实时响应。 异步通讯&#xff1a;就像发邮件&#xff0c;不需要马上回复。 两种方式各有优劣&#xff0c;打电话可以立即得到响应&#xff0c;但是你却不能跟多个人同…

Python自动化下载指定公开页面文件

示例代码如下&#xff0c;但你拿到本地之需要做两件事才能运行 from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time# 设置Se…

【电路笔记】-Twin-T振荡器

Twin-T振荡器 文章目录 Twin-T振荡器1、概述2、Twin-T振荡器3、Twin-T放大4、Twin-T 振荡器示例5、总结Twin-T 振荡器是另一种 RC 振荡器电路,它使用两个并联的 RC 网络来产生单一频率的正弦输出波形。 1、概述 Twin-T 振荡器是另一种类型的 RC 振荡器,它产生正弦波输出,用…