Linux--fork创建子进程详解

news2026/2/12 13:34:59

一.初识fork函数

二.fork的返回值

三.fork原理

1.fork是如何创建子进程的？

2.为什么fork会有两个返回值？

3.为什么父进程的返回值是子进程的pid，子进程返回值是0？

4.fork之后，父子进程谁先运行？

5.如何理解同一个变量，会有不同的值？

一.初识fork函数

创建子进程的方式：

1.在命令行上创建

2.在代码中使用fork创建

今天讲述的是fork创造子进程。

使用man手册查看fork

验证：fork()创建了子进程

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    printf("我是一父个进程，我的pid是：%d，ppid:%d\n",getpid(),getppid());
    fork();
    printf("我是一个进程，我的pid是：%d，ppid:%d\n",getpid(),getppid());
    sleep(1);
    return 0;
}

观察图片，注意pid与ppid

在写一个循环情况观察：

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    printf("我是一父个进程，我的pid是：%d，ppid:%d\n",getpid(),getppid());
    fork();
    while(1)
    {
        printf("我是一个进程，我的pid是：%d，ppid:%d\n",getpid(),getppid());
        sleep(1);
    }
    return 0;
}

从图中我们可以看出fork()之后的代码执行行了两次，根据pid与ppid，我们可以看出是两个不同进程执行的且可以分出那个是子进程，那个是父进程

结论：只有父进程执行了fork之前的代码，fork之后，父子进程都要执行后续代码

二.fork的返回值

fork函数的返回值：

当创建子进程成功时：

有两个返回值，子进程的返回值是0，父进程的返回值是子进程的pid

当创建子进程失败：

有一个返回值，小于0.

代码验证：

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    printf("我是一父个进程，我的pid是：%d，ppid:%d\n",getpid(),getppid());
    pid_t id=fork();
    while(1)
    {
        printf("我是一个进程，我的pid是：%d，ppid:%d\n, id=%d",getpid(),getppid(),id);
        sleep(1);
    }
    return 0;
}

为什么fork函数的返回值要有两个呢？

这里我们就不得不提为什么创建子进程。

原因：我们想要子进程协助父进程完成一些单进程解决不了的工作。如：对于想要电影边下载，边播放（可能不恰当，但有助于理解）。

因此，我们想要子进程与父进程执行不一样的代码。为了实现这个这个目的，我们让fork的返回值有两个，然后通过判断fork的返回值，判断谁是父进程，谁是子进程，然后让他们执行不同的代码

代码实例：

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    printf("我是一个父进程，pid是：%d\n",getpid());
    pid_t id=fork();
    if(id<0)
    return 1;
    else if(id==0)
    {
        while(1)
        {
            //child
            printf("我是子进程；pid:%d,  ppid:%d, id=%d  正在执行下载任务\n",getpid(),getppid(),id);
        sleep(1);
        }
    }
    else
    {
        while(1)
        {
            //parent
            printf("我是父进程；pid:%d,  ppid:%d, id=%d  正在执行播放任务\n",getpid(),getppid(),id);
        sleep(1);
        }
    }
    return 0;
}

三.fork原理

1.fork是如何创建子进程的？

我们知道

进程=可执行文件+内核数据结构（PCB）

在fork创建子进程时，系统会多一个子进程。

1.在内存中为子进程malloc申请空间并以父进程为模板，为子进程创建PCB并初始化（对父进程的PCB进行局部拷贝）

2.与父进程共享代码和数据.(这也是父子进程执行同样代码的原因)

这里我们知道了父子进程共享同一份代码与数据，那么为什么子进程不会执行fork之前的代码呢？

我们要知道程序之所以能够从上往下的顺序执行，依靠的是CPU中存在的pc/eip（程序计数器），当执行进程时，CPU会读取该进程的PCB里的pc/eip的值，然后从对应的代码开始执行。而fork创建子进程后，父进程的pc/eip指向了fork之后的代码，而子进程的PCB在创建的时候刚好拷贝了父进程的pc/eip，因此子进程不会执行fork之前的代码。

2.为什么fork会有两个返回值？

这里问大家一个问题：

如果一个函数已经执行到return了，它的核心工作做完了吗？

这里我们可以以swap(int* x,int* y)函数为例，我们可以通过调试发现，在函数执行到return的时候，两个数的数值早已交换。

因此可以认为函数在执行到return时，它的工作就已经做完了

而fork就是一个系统调用函数，fork的工作如下：

因此，在fork执行到return的时候，进已经完成了子进程的创建了。我们知道父子进程共享代码，而return时代码，因此return也被父子进程共享执行。

所以

父进程被调度，就要执行return

子进程被调度，也要执行return

3.为什么父进程的返回值是子进程的pid，子进程返回值是0？

这里我们举现实生活的例子：

在现实生活中，一个父亲可以有多个子女，但是子女只有一个父亲。

父：子=1：n，所以我们有一个天然的需求，父进程要管理子进程，需要标识子进程的唯一性，而子进程访问父进程时不需要的。而又由于子进程的pid具有唯一性，因此采用了该方法

4.fork之后，父子进程谁先运行？

在创建完子进程之后，系统的其他进程，父进程和子进程，接下来是要被调度的。

这里我们知道，操作系统是依靠双链表来管理进程的PCB的。

当父子进程的PCB都被创建并在运行队列中排队时，哪一个进程的PCB先被调度，那个进程就先运行。

而那个进程先被调度在用户层面上是不清楚的，因此我们并不知道父子进程谁先运行

因为它是由各自PCB中的调度信息（时间片，优先级）+调度器算法共同决定，完完全全又操作系统自主实现

5.如何理解同一个变量，会有不同的值？

这里由于牵扯到地址空间，会在地址空间详细解释，这里只是一个开头！

在前面我们知道fork在成功创建子进程时，两个返回值。但是这里我们使用一个变量接受的，为什么一个变量，会有不同的值？！！！

这里我们先说一个现象。

如果启动一个QQ，微信，浏览器。这些都是进程，如果杀掉微信进程，QQ进程，浏览器进程还在吗？当然还在。

如果父子进程中，父进程被杀掉，子进程还在吗？或者反过来。

实例：

#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>

int main()
{
    printf("我是一个父进程，pid是：%d\n",getpid());
    pid_t id=fork();
    if(id<0)
    return 1;
    else if(id==0)
    {
        while(1)
        {
            //child
            printf("我是子进程；pid:%d,  ppid:%d, id=%d  正在执行下载任务\n",getpid(),getppid(),id);
        sleep(1);
        }
    }
    else
    {
        while(1)
        {
            //parent
            printf("我是父进程；pid:%d,  ppid:%d, id=%d  正在执行播放任务\n",getpid(),getppid(),id);
        sleep(1);
        }
    }
    return 0;
}