【Linux】进程的控制①之进程创建与进程退出

一、进程的创建

1、fork函数

fork函数功能：从已经存在的进程中创建一个新进程。新进程为子进程，原进程为父进程。

fork函数创建进程过后，父子进程代码和数据是共享的。在前面也讲过。

2.函数的返回值

如果进程创建成功，给父进程返回子进程的pid（进程标识符），给当前的进程返回0，创建失败返回-1.返回值类型是pid_t类型。

下面我们来写一段代码手动创建一个进程：

 #include<stdio.h>
  2 
  3 #include <sys/types.h>
  4 #include <unistd.h>
  5 
  6 
  7 int main()
  8 {
  9   pid_t id = fork();//创建子进程
 10   if(id == 0)
 11   {
 12     //子进程
 13     printf("i am a child process,mypid:%d  myppid:%d \n",getpid(),getppid());
 14     sleep(1);
 15   }
 16   //父进程
 17 
 18     printf("i am a father process,mypid:%d  myppid:%d \n",getpid(),getppid());                                                                                                             
 19     sleep(1);
 20 
 21 
 22   return 0;
 23 }

创建进程过后，父进程与子进程是两个独立的进程，但是代码和数据共享，如果当其中一个数据改变或者写入数据的时候，会发生写实拷贝。父子进程的代码区域是共享的，但是每个进程维护自己的数据区域。也就是说子进程会继承父进程的大部分属性进程的pcb,进程的进程地址空间，进程的页表等等，这些使得父子进程几乎共同拥有数据区和代码区。

fork函数的返回值由一个变量接收，但是却保存两个值原因：

①return 可以返回两次，使得父子进程读到的id有两个值

进程调用 fork ，当控制转移到内核中的 fork 代码后，内核做：

分配新的内存块和内核数据结构给子进程
将父进程部分数据结构内容拷贝至子进程
添加子进程到系统进程列表当中
fork返回，开始调度器调度

fork 之前父进程独立执行， fork 之后，父子两个执行流分别执行。注意， fork 之后，谁先执行完全由调度器决定。

那么这里就很好理解，我们知道的一个函数当执行到return的时候，这个函数的主要工作或者主要逻辑就已经完成了，fork也是函数，在执行返回pid之前，就已经以调用进程也就是父进程为模版创建好了子进程，将子进程对应的pcb放入了运行队列里面，等待调度，那么此时，父子进程共享代码，分别执行一次return，就可以返回两次，而父子进程的细微差异性让return的值不同，那么当我们使用同一个变量来接收，为什么一块地址会保存两个值呢，这就是第二个原因，写实拷贝和进程的地址空间所做的工作。

②写实拷贝，使得父子进程读到的值都对自身有意义

我们创建进程，就是为了让进程独立的去帮助我们完成工作，那么代码是只读的，父子进程共享代码执行没有问题，可以通过if语句来执行不同的功能，但是如果，两个进程要对代码中或者程序中的数据进行修改，那么势必会影响互相的工作，但是进程是互相独立的呀，怎么能够让彼此乱改数据呢，所以，为了防止这种情况，我们的操作系统内部就存在一种解决机制，我们称为写实拷贝：

当父子进程执行时，有一方要修改数据，就在内存重新开辟空间，然后修改子进程的页表映射关系，让父子进程拥有不同的数据区域，自此以后，两个进程就互相有自己的数据区域，随便修改互相不影响。这就是为什么我们的一个返回值接收变量里面可以存储两个值，并且两个值都有意义的原因。但是我们发现父子进程打印的这个id变量的地址都是一样的，这是因为我们弟弟进程有进程地址空间存在，我们用户所看到的地址，就是打印出来这些，并不是真正的地址，而是虚拟地址，操作系统中存在页表，建立了虚拟内存到实际内存空间的映射关系，由于子进程继续了父进程1页表也相应的继承了页表的映射关系，但是只修改了虚拟内存到实际内存的映射，所以父子进程打印出来的虚拟地址是一样的。

下面我们要来说一下关于写实拷贝的几个问题

a.为什么要写实拷贝，而不是在创建子进程的时候直接就将空间给子进程开辟好？

我们为什么非要等到子进程要进行数据写入了操作系统才给我们的子进程去开辟空间，建立映射呢？直接在创建的时候就做好这些工作呢？那么我们说，子进程创建出来是为了帮助我们完成工作，但是这个工作需不需要新的数据，会不会产生新的数据，要不要访问内存等等都还是不确定的，那么如果子进程不使用，操作系统提前给子进程分配内存，甚至单独给子进程拷贝一份代码，造成资源浪费，所以，当子进程在尝试写入的时候，此时会发生缺页中断，操作系统介入，创建内存，建立映射。其次，如果我们在创建子进程时就给子进程分配空间，那么创建的过程也会变长，因为除了拷贝进程的pcb、页表、进程地址空间还要拷贝进程数据，fork函数的成本增加，效率变得低下。

b.为什么给子进程分配空间的时候，老的数据要拷贝过来，而不是直接写入新的数据，开辟空白空间？

当我们的子进程要进行数据写入的视乎，此时子进程要写入新的数据了，操作系统给子进程拷贝老的数据过来干什么，多此一举。直接给空间就好了，写实，给子进程开辟空间没有问题，但是为什么要将父进程数据进行拷贝？首先，我们要理解写入数据的本质就是对数据进行增删查改，写入数据不一定能够做到对原来的数据进行完全覆盖，如果只开辟空间，怎么能够知道原来的数据是多少，就比如我们子进程要对父进程的某一个数值进行++操作，不知道原来的数据怎么行。所以拷贝也是操作系统为了增加确定性的策略，能在应用层规避很多问题。

c.写实拷贝是如何做到的？怎么做到当子进程需要，操作系统就过来开辟空间的？

页表除了有虚拟地址和实际地址外，实际上还有这每一个映射条目对应的权限。

有时当我们写代码的时候，要对内存进行数据写入的时候，此时程序会报错不不让我们写入，就是因为有权限在限制。

比如执行以下代码：

char * str = "hello world";
*str = 'H';

代码的本意是想将原先字符串的首字母改成大写，但是我们执行带啊时候：

是异常的，可以编译通过，但是运行挂掉。我们在学习语言的时候我们说，字符串常量是具有常属性的，在字符常量区不能够对常量数据进行更改。那么为什么对我们的常量区就不可以改呢，换句话说常量区是怎么维护你的常性的。

char* str = "hello world";

str里面保存的地址是虚拟地址，当我们要对这个地址空间里面的内容进行修改，也就是赋值，那么必然要伴随着虚拟地址到物理地址的转换，赋值的本质就是写入数据，当写入时，转换映射的条目位的权限为只读，所以也就不可以修改。那么，我们在写代码的时候有时候会在这些不可以改变的常量前去加const来修饰，不是因为我们加了const使得它不可修改，而是其本身的映射权限就是不可修改，我们加上const，只是为了提前帮我们发现问题，就是说编译器在编译的时候，如果遇到这个const修饰的值被修改，那么编译器就知道这个值不可修改，就报错，而不是等到进程运行起来了崩溃再去找原因，这是一种防御性策略。

那么我们的子进程写实拷贝的过程粗略过程是怎么样的呢：

首先，代码区域为只读权限没有问题，而对于数据区域，在创建子进程的时候，操作系统会将父子进程数据映射在页表中的相应权限修改为r，都是只可以读。当子进程或者父进程尝试进行写入数据的时候，由于权限不允许，此时就会出问题报错，操作系统就会过来查看，此时操作系统对报错进行种类判断，发生缺页中断，那么之前将数据区域的映射条目权限设置为r就是为了触发报错。让os过来，知道我们的进程要写入数据，此时就可以根据进程需要及时为进程开辟内存建立映射，将映射条件由r改为rw,此时进程可以写入数据，而操作系统也就完成了写实拷贝。

3.一般情况下创建子进程的情形：

循环查看当前运行进程的指令：

while :; do ps axj | head -1 && ps axj | grep 可执行程序名 | grep -v grep; sleep 1; done

4.fork调用失败原因

系统中有太多的进程
实际用户的进程数超过了限制

二、进程退出

1 函数返回值与进程退出码

我们写C语言或者c++的时候，总喜欢在main函数结束时写上：

return 0；

这样的语句，那么可以不可以return 1,return 2 呢？首先我们来说一下为什么会有return 0,main函数也是一个函数，会有返回值，也会被调用，当我们的代码运行起来变成进程，我们自然而然会关心，这个进程运行的结果，我们编写代码很多时候是希望代码给我们返回一个结果的，那么我们或者操作系统怎么知道这个进程运行得怎么样，运行的效果好不好，我们的bash怎么知道当前运行的指令对不对。所以main函数的返回值，作为程序执行的最后一条语句，也叫作进程的退出码，可以由用户自定义，由main函数的返回值来判断进程的执行情况，所以这个返回值叫做进程的退出码，为0表示成功，非0表示失败。当我们程序执行失败，我们最关心的东西是错误的原因是什么，所以非0的数字：1，2,3.。。。。不同的数字代表了不同的错误原因。这个数字由系统去判别。

可以使用一个命令来查看最近一个进程退出时的退出码：

echo $?:记录最忌一次进程退出时候的退出码

那么作为用户我们是不懂数字背后的意义，计算机知道的话，我们想看见错误码对应的原因：

①我们可以使用系统自带的方法，将错误码：ernum进行转化为错误原因：

C 库函数 char *strerror(int errnum) 从内部数组中搜索错误号 errnum，并返回一个指向错误消息字符串的指针。strerror 生成的错误字符串取决于开发平台和编译器。

写一段代码：

25 #include<string.h>
 26 int main()
 27 {
 28 
 29   int i = 200;
 30   for(i = 0;i<200;i++)
 31   {
 32     printf("error[%d]:%s\n",i,strerror(i));                                                                                                                                                
 33   }                          
 34   return 0;                  
 35 }                            
~

当前操作系统有133个错误，错误码的个数由系统决定

②可以自己定义我们的错误原因：

结论：mian函数return返回时，表示进程已经退出，return后跟的数字是进程退出码，可以自行设置退出码的字符串意义。

③普通函数的return

void Print()
{

printf("%d\n");
return 0;
}

普通函数的return 仅仅表示函数调用完毕。所以除了进程退出还有函数退出，函数退出时，调用这个函数的地方肯定是想要知道调用这个函数的执行情况，成功还是失败，失败原因是什么，所以一般情况下，函数都会有返回值，但是不是所有函数都能够用函数返回值来表示执行结果成功或者执行情况。

比如fopen函数：