linux进程——父子进程层面的PID,fork的原理与理解

news2025/1/13 6:05:04

        前言:本篇内容主要讲解进程中系统调用fork和父子进程的概念与原理, 想要系统学习linux进程的友友们只管看本篇文章是不行的。 还要学习一些linux进程的周边知识以及linux进程其他方面的知识,博主的linux专栏中已经加入了这些文章方便友友们进行学习。 感兴趣或者想要学习的深入的友友可以一篇文章一篇文章地进行观看与理解。

        ps:本节内容非常不好理解, 需要了解linux进程的PCB, 以及操作系统如何对进程做管理

为了后面实验的方便, 我么先来学习一下如何杀进程——也就是使用指令终止掉进程

首先还是运行一个程序——其实运行程序, 本质上就是./程序变成了进程, 如图是一个程序(注意, 后续都将以process-7-11为程序名进程实验)

然后我们运行后, 再使用ps 和管道查看进程的PID。 也就是进程的标识符。

然后, 我们利用kill -9 PID就能杀掉对应的PID进程

如下图:

知道了如何杀程序后, 我们既然已经知道了每一个进程创建时, 里面都有一个自己的PID,而使用ps是查看所有的PID,但是如何在一个程序运行时,获取这个程序的PID呢?

        现在先来看下面这张图:

        假如说上面一个操作系统, 这个操作系统里面上层是系统调用, 下层是内存缓冲区, 这个时候内存中已经缓存了两个进程。 

        我们通过上面的学习已经知道, PCB对象里面含有PID,而我们可以使用ps axj和管道来获取进程的PID。 但是通过上面的学习我们已经知道, 操作系统不相信我们用户, 所以我们就不能直接访问PCB也就是task_struct里面的PID, 状态等字段。 而想要获取这些字段就必须使用系统调用接口。 

        那么获取当前进程的PID的系统调用接口是什么呢? 这里有一个系统调用接口, 叫做getpid(), 这个函数在哪个进程里被调用, 就会返回哪个进程的PID。

        这里需要注意的是pid是一个整形, 下面是我们自己定义的一个获取系统调用接口的程序。

        我们打开这个程序, 当前进程的PID是如下:

然后使用ps axj 加管道取头如下:

        上面的这个就是一遍运行程序, 一遍ps axj 加管道    

        可以发现,我们的进程里面系统调用和ps打印出来的PID是一样的。 这就是PID, 也就是进程的标识符, 程序每次运行, 都会生成不同的进程, 为什么说是不同的进程, 因为生成的代码虽然没有改变, 但是进程里面的PCB还有数据已经发生了变化。 而PCB不同, 用来标识一个进程的PID就不同。 

        对上面的概念进行试验之后, 我们再来看一下父进程, 也就是PPID。        

        那么, 这个父进程是谁呢? 我们使用ps 加管道过滤操作就可以查看:

从这里面, 我们就可以看懂, 这个8881是bash命令行的PID。

        那么这里的第一个问题就是——为什么额bash命令行也有PCB? 

        其实这也就证明了bash命令行也是一个进程, 不过吃这个进程偏向于管理与交互。 bash命令行在终端启动的时候就已经被cpu计算并执行。 并且一直执行。 这个就是bash命令行, 其特点有点像单例模式里面的懒汉。 

        第二个问题就是——为什么我们写的process-7-11程序的父进程会是bash呢? 

        我们知道, bash命令行是一个解释器, 而命令行解释器的核心工作就是获取用户的输入。 帮助用户进行命令行解释。 

        对于一个进程来说, 就按照process-7-11这个程序来说, 我们在命令行解释器上面输入./process-7-11.exe, 然后回车。 然后命令行就会解释这个程序,命令行解释这个程序就会生成一个子进程, 然后这个子进程被cpu计算, 计算结果再返回, 这个过程, 就是process-7-11.exe进程的产生过程。 

        其实, bash下面的运行的程序, 他们的父进程, 都是bash。 

        bash命令行的PID不变, 我们不管运行多少次程序, 他们的父进程都是bash命令行的PID, 如图:

如上图红框框是第一次启动process-7-11程序, 绿框框是第二次, 蓝框框是第三次。 

而当我们重启一下xshell, 并且重新登陆的时候, 就连bash都会改变PID。 

上图是两次登录普通用户时启动点bash的PID。

父进程的PID也可以被获取。 系统调用接口是getppid, 如下图:

        上图是定义的一个简单应用getppid的代码, 然后运行时,就会这样:

        由上面我们可以发现, 系统调用接口和我们平时使用的c语言接口区别不大。 并没有太大的学习使用方法上学习成本。 

        以上, 就是关于父子进程PID的知识点内容。

现在, 我们来学习如何创建父子进程——这个需要使用fork函数, 这个函数会让函数后面的语句被执行两次, 一个是父进程执行, 一个是子进程执行。 

        首先我们先来看一下没有fork的情况, 如下图:
 

下图是我们使用fork函数的情况:

        我们可以看到, 这里的第二行内容被执行了两次, 这个上面我们已经提到过了, fork相当于创建一个子进程, 这个子进程的代码和数据就是fork后面的内容。 也就是说, 原本只有一个执行流,现在加了fork之后, fork之前的代码相当于只属于父进程一个人, 只有一个执行流, 但是fork之后的代码就会属于子进程和父进程共同所有。

        这里为了验证上面的说法, 我们可以使用man手册查看fork的用法。        

上面这句话的意思就是以父进程为模板, 再创建一个子进程。 

        现在我们在man手册的第行输入return value, 可以查找我们想要看的返回值的相关信息。如下图:

        并且, 如果fork函数成功了, 那么给父进程返回子进程的pid, 0返回给子进程。 如果失败了, 就返回 -1 给父进程。 并且没有子进程被创建。

        那么, 也就是说, fork有两个返回值, 并且这两个返回值的类型都是pid_t, 也就是有符号整形。 那么有两个返回值是什么意思呢, 我们可以试验一下。

下面是运行结果:

        上面的运行结果,就是每一秒打印一条父进程, 打印一条子进程。 这说明父进程和子进程是同时进行的。 并且id > 0,   和 id == 0同时成立。 如果在以前的代码中, 不可能有两个id > 0, id == 0同时存在, 更不可能有两个死循环一起跑。 但是今天调用的fork下就可以。

        由上面打印的pid我们就可以发现, bash的pid就是父进程的ppid也就是27451, process-7-11.exe的pid是10920, 所以子进程的ppid就是如图的10920。 而且子进程pid是10921. 也就是说, 这个程序的执行顺序是命令行bash调用了process-7-11.exe进程, process-7-11.exe又以自身为模板调用了一个子进程。 

        现在又有另外一个问题, 对于上面的程序来说,为什么打印出来的会是一个父进程, 一个子进程, 一个父进程一个子进程的呢?

        这里我们可以这么理解, 正常情况下, 执行流是从上往下的:

        但是对于现在使用了fork来说, 它会返回两个值, 一个返回给父进程。 一个返回给子进程。 也就是说, 我们fork执行之后,它就变成了两个执行流, 只是我们肉眼看不到,但是它真实存在。所以只能通过感知感觉出来。其中一个执行流就是父进程, id接受了父进程的返回值, 符合else if 执行里面的循环。 另一个执行流是子进程。 id接收了子进程的返回值, 符合if里面的循环。

        如图:

        

知道了这些执行逻辑后, 现在就又有了三个问题:

第一个问题——为什么fork函数要返回两个返回值? / 为什么fork要给子进程返回0, 给父进程返回子进程的pid?

第二个问题——一个函数是怎么做到返回两次的? / 如何理解呢?

第三个问题——一个变量怎么会有不同的内容呢? 

第四个问题——fork函数, 究竟在干什么? 干了什么?

        首先来看一下第一个问题, 为什么要给子进程返回0, 给父进程返回子进程pid?

首先这样这要我们知道就可以通过返回不同的值, 然后让子进程和父进程分别进入不同的if else if判断之中, 执行不同的逻辑或者代码块。 

        但是,这里我们要明白, 是因为有if else if的存在, 不同的执行流才会执行不同的代码块, 但是一般而言, fork之后的代码, 父子共享。 

        但是为什么偏偏子进程返回0, 父进程返回的是子进程的pid呢? 

        这里我们可以想一下, 如果父进程里面不是fork一次, 而是fork多次。 或者直接来个循环, 循环fork, 那么是不是就有多个子进程, 而对于每一个子进程, 当父进程要进行控制的时候, 如果没有标识符, 就会变得很麻烦很麻烦。 而有了子进程的pid, 就可以直接找到某个子进程进程管理。 而对于子进程来说, 他们只有一个父进程, 只需要直接找到自己的父进程就可以, 不再需要记住父进程的标识符。

在进行理解第二个问题之前,我们先来理解一下第四个问题——fork函数, 究竟在干什么? 干了什么?

回忆一下我们以前学到的进程的概念——进程 = 内核数据结构(也就是PCB) + 你自己的代码和数据。 如下图为简单的进程图:

现在, 但我们创建一个子进程后, 就是如下图:

这个时候, 子进程的代码就是父进程的代码, 但是子进程的数据却是自己的数据。

        那么, 为什么会这样呢? 从上面的讲解我们知道, 子进程和父进程的代码是共享的, 他们两个公用同一块数据块, 两者指向同一块空间没有问题。 但是里面的数据是不一样的, 就像我们子进程性质的是if里面的数据模块, 而父进程执行的的是else if里面的数据模块。两个模块产生的进程的数据是不一样的, 当一个进程进行修改时, 那么势必会影响到另一个进程。 所以也就不能指向同一块空间, 也就不是一块代码块。

         知道了这些, 就可以拿过来上面的问题——fork函数是如何做到返回两次的——也就是第二个问题。

        首先要知道fork函数是一个系统调用, 它的本质也是一个函数!

        然后, 假设我们的fork实现如下:

        那么, 这里思考一下, 当这个函数走到return的时候, 有没有执行完呢? 这里要知道的是,当函数走到这里, 就已经把要做的工作做完了。 

        这里我们还记不记得上面说过, fork函数创建子进程后, 函数后面的代码就会被子进程和父进程所共享。 其实, 这里的本质就是fork函数里面创建好子进程后, 也就是上图红框框的部分完成后。 子进程也就被创建出来了。 然后执行流就变成了两个, 一个子进程的执行流, 一个父进程的执行流。 也就是说, 这个时候的return语句, 其实就是由两个执行流会执行它。 一个是父进程的执行流。 这两个执行流都会返回一个值。 这就是为什么fork会有两个返回值, 并且返回值给一个给子进程, 一个给父进程的原因。 

解析来理解第三个问题, 那么我们要知道首先在任何一个平台。 进程运行的时候都具有独立性。 

        就比如我们打开一个qq, 一个微信, 然而当我们的qq崩溃的时候, 我们的微信会受到影响吗?或者说我们的微信崩溃的时候, 我们的qq会受到影响吗?

        答案是不会, 那么如果子进程和父进程公用一个数据块, 当子进程改变数据的时候, 父进程也会改变数据。因为数据可能被修改, 不能让父进程和子进程共享一份数据!

        所以, 对于子进程, 数据是独立的。 那么就势必当创建子进程的时候要拷贝一份父进程的数据独立出来。 也就是我们上面画的那张图:

        这个时候, 父进程和子进程的数据就割裂起来了, 父进程崩溃或者子进程崩溃不影响对方。

那么这个时候就有了另外一个小问题, 我们知道, 父进程和子进程的数据不是同一个, 两者互不影响。 当我们的父进程访问某一数据, 是在父进程的数据块访问数据,当我们的子进程访问某个数据, 是在子进程的数据块访问数据。 

        但是, 这里的小问题是, 我们的子进程可能对于父进程拷贝的数据不会全部访问。 只会访问某一小部分的数据。 这里就有了多拷贝的问题。 存在了空间的浪费。 那么,操作系统呢, 对于这个问题, 就不去将父进程的数据全部拷贝过一份了。 而是等子进程访问父进程的数据的时候, 想要修改时, 那么操作系统就将这部分要被修改的数据拷贝一份, 然后管理子进程,让它不去改父进程中的数据了, 而是去修改拷贝出来的数据。 

那么就是说, 凡是对于父子进程中子进程被创建的时候, 父子进程的代码和数据都是共享的。 只有当子进程要修改父进程的数据的时候, 才会拷贝这一部分要修改的数据出来交给子进程进程处理。 之后, 有多少要修改, 就给子进程拷贝多少, 需要拷贝多, 就拷贝多少。——这种技术成为数据层面的写实拷贝。

        那么, 回到我们的第三个问题, 一个变量为什么有不同的内容。 首先我们知道,对于id来说, 它是不是父进程里面的数据?那么当fork返回的时候, 当返回的是父进程的返回值时, 那么写入的就是父进程的数据。 当返回的是子进程的返回值时, 那么就会发生写诗拷贝!!所以, 操作系统对于id变量拷贝了一份, 现在操作系统里面就有两份id变脸, 这就是为什么一个变量会有不同的内容。 

        至于为什么同一个id会去访问不同的内存空间, 这就涉及到了进程地址空间的问题!这些在后续的进程地址空间会讲到。

        现在来看最后一个问题, 对于一个父子进程来说, 哪个进程限制性呢?——这个答案是不确定的, 这个是由调度器决定的。 不同的环境是不一样的。 所以无法确定。 

        对于bash来说, 我们在bash命令行运行指令的时候, 那么我们就知道了, bash一定调用了fork, 然后原本的bash命令行继续进程命令行读取, 而fork生成的子进程, 则执行命令。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1932269.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java数据结构】初始线性表之一:链表

为什么要有链表 上一节我们描述了顺序表:【Java数据结构】初识线性表之一:顺序表-CSDN博客 并且进行了简单模拟实现。通过源码知道,ArrayList底层使用数组来存储元素。 由于其底层是一段连续空间,当在ArrayList任意位置插入或者…

GESP CCF C++ 七级认证真题 2024年6月

第 1 题 下列C代码的输出结果是&#xff08; &#xff09;。 #include <iostream> #include <cmath> using namespace std; int main() { cout << sin(3.1415926 / 2); return 0; } A. 0 B. 1 C.0.5 D.0.7071 第 2 题 对于如下图的二叉树&#x…

「C++」类和对象(1)

欢迎来到海盗猫鸥的博客~~ 本篇我们将学习部分C中的类和对象相关知识沃~ (• ω •)&#xff89;算我一个&#xff5e; 目录 类的定义 类的定义及使用 访问限定符 类域 实例化 实例化概念&#xff1a; 对象大小&#xff1a; 内存对齐规则&#xff1a; 注意点&#xff…

卸载docker简单且ok的方法

杀死所有容器 docker kill $(docker ps -a -q) 删除所有容器 docker rm $(docker ps -a -q) 删除所有镜像 docker rmi $(docker images -q) 停止docker服务 systemctl stop docker 查看安装列表 yum list installed|grep docker 依次卸载已安装的docker yum -y remove docke…

入职前回顾一下git-01

git安装 Linux上安装git 在linux上建议用二进制的方式来安装git&#xff0c;可以使用发行版包含的基础软件包管理工具来安装。 红帽系 sudo yum install gitDebian系 sudo apt install gitWindows上安装git 去官网下载和操作系统位数相同的安装包.或者可以直接安装GitHub…

【C++】类和对象·this指针

C中的类与C语言中的结构体有很多的相似的地方&#xff0c;可以说本质上除了结构体只能定义成员变量&#xff0c;以及结构体默认的访问控制权限是public之外与class没啥区别。但是结构体变量每次调用函数的时候需要指针&#xff0c;而类中的成员函数明明被保存在公共代码段&…

SCI一区级 | Matlab实现SSA-CNN-GRU-Multihead-Attention多变量时间序列预测

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.【SCI一区级】Matlab实现SSA-CNN-GRU-Multihead-Attention麻雀算法优化卷积门控循环单元融合多头注意力机制多变量时间序列预测&#xff0c;要求Matlab2023版以上&#xff1b; 2.输入多个特征&#xff0c;输出单个…

“深入JVM内部:揭秘Java程序运行的神秘黑盒“(二)

一.双亲委派模型(在加载环节) 简单描述了如何查找 .class 文件的策略. 概念&#xff1a;如果一个类加载器收到了类加载的请求&#xff0c;它首先不会自己去尝试加载这个类&#xff0c;而是把这个请求委派给父类加载器去完成&#xff0c;每一个层次的类加载器都是如此&#x…

C++ | Leetcode C++题解之第238题除自身以外数组的乘积

题目&#xff1a; 题解&#xff1a; class Solution { public:vector<int> productExceptSelf(vector<int>& nums) {int length nums.size();// L 和 R 分别表示左右两侧的乘积列表vector<int> L(length, 0), R(length, 0);vector<int> answer(l…

RK3568平台(文件系统篇)Buildroot文件系统

一.Buildroot文件系统概述 Buildroot 是Linux平台上一个开源的嵌入式Linux系统自动构建框架。整个Buildroot是由Makefile脚本和Kconfig配置文件构成的。可通过Buildroot配置&#xff0c;编译出一个完整的可以直接烧写到机器上运行的Linux系统软件。 获取buildroot官方源码&am…

人工智能 (AI) 应用:一个异常肺呼吸声辅助诊断系统

关键词&#xff1a;深度学习、肺癌、多标签、轻量级模型设计、异常肺音、音频分类 近年来&#xff0c;流感对人类的危害不断增加&#xff0c;COVID-19疾病的迅速传播加剧了这一问题&#xff0c;导致大多数患者因呼吸系统异常而死亡。在这次流行病爆发之前&#xff0c;呼吸系统…

【Vue3】4个比较重要的设计模式!!

大家好,我是CodeQi! 一位热衷于技术分享的码仔。 在我投身于前端开发的职业生涯期间,曾有一次承接了一个大型项目的维护工作。此项目运用的是 Vue 框架,然而其代码结构紊乱不堪,可维护性极度糟糕😫。 这使我深刻领会到,理解并运用 Vue 中的重要设计模式是何等关键! …

Codeforces Round 958 (Div. 2)(A~C)题

A. Split the Multiset 思路: 最优的策略是每次操作分出 k−1&#x1d458;−1 个 1&#xff0c;然后考虑最后是否会剩下一个单独的 1。 代码: #include<bits/stdc.h> using namespace std; #define N 1000005 typedef long long ll; typedef unsigned long long ull;…

VGMShield:揭秘视频生成模型滥用的检测与追踪技术

人工智能咨询培训老师叶梓 转载标明出处 视频生成模型&#xff0c;如 Stable Video Diffusion 和 Videocrafter&#xff0c;已经能够生成合理且高分辨率的视频。但这些技术进步也带来了被恶意利用的风险&#xff0c;比如用于制造假新闻或进行政治宣传。因此&#xff0c;来自弗…

BUUCTF逆向wp [HDCTF2019]Maze

第一步 查壳&#xff0c;本题是32位&#xff0c;有壳&#xff0c;进行脱壳。 第二步 这里的 jnz 指令会实现一个跳转&#xff0c;并且下面的0EC85D78Bh被标红了&#xff0c;应该是一个不存在的地址&#xff0c;这些东西就会导致IDA无法正常反汇编出原始代码&#xff0c;也称…

Kafka 高并发设计之数据压缩与批量消息处理

《Kafka 高性能架构设计 7 大秘诀》专栏第 6 章。 压缩&#xff0c;是一种用时间换空间的 trade-off 思想&#xff0c;用 CPU 的时间去换磁盘或者网络 I/O 传输量&#xff0c;用较小的 CPU 开销来换取更具性价比的磁盘占用和更少的网络 I/O 传输。 Kafka 是一个高吞吐量、可扩展…

python课设——宾馆管理系统

python课设——宾馆管理系统 数据库课设-宾馆管理系统-python3.7pyqt5 简介 大二数据库课程设计&#xff08;3-4天工作量&#xff09;的项目&#xff0c;登录界面的ui设计参考了他人成果&#xff0c;其余ui以及所有后端部分全部独立完成&#xff0c;详细功能见功能模块图使用…

国内新能源汽车芯片自给,承认差距,任重道远

【科技明说 &#xff5c; 科技热点关注】 据近日工信部电子五所元器件与材料研究院高级副院长罗道军表示&#xff0c;中国拥有最大的新能源车产能&#xff0c;芯片用量也是越来越多。但是芯片的自给率目前不到10%&#xff0c;是结构性的短缺。 中国拥有最大新能源车产能&#…

入门【消息队列】这一篇就够了

消息队列 消息队列的模型为什么要用消息队列分布式消息队列应用场景分布式消息队列选型RabbitMQ入门实战singleWorkFanoutDirectTopic核心特性消息过期机制消息确认机制死信队列消息队列的模型 生产者:Producer,发送消息的人(客户端) 消费者:Consumer,接受消息的人(客…

NLCISBNPlugin,从“中国国家图书馆”获取图书信息Calibre插件

NLCISBNPlugin可以从中国国家图书馆获取图书信息&#xff0c;包括 ISBN、书名、作者、出版日期等信息&#xff0c;然后将这些信息添加Calibre中。 插件安装:NLCISBNPlugin.zip 安装说明&#xff1a; 在 Calibre官方网站 上下载并安装Calibre。下载最新版本的 NLCISBNPlugin …