目录
前言:
进程的创建
前言:
继上文介绍了着重介绍了进程的内部属性,以及在操作系统层面进程如何被组织起来的,如何调用系统接口,有关task_struct,进程的部分理解等,今天,我们就从进程的相关属性入手,
进程的创建
承接上文。
上文介绍了进程的创建方式是调用系统接口fork,所以有的时候,对子进程理解不深的人会写出如下代码:
while(1)
{
printf("aaa\n");
fork();
printf("...\n");
}
代码本身是没有什么错误的,但是打印出来的时候,会发现打印出来并不是一个父进程一个子进程的打印,因为子进程会执行父进程后面的代码,所以也会执行这个死循环,从而导致子进程创建子进程,变成了指数级别的增长,所以打印第二个printf是1 2 4 8 的打印,容易让人摸不着头脑。
下一个场景,我们写了如下代码:
printf("I am a child process,my pid is %d\n",getpid());
printf("I am a parent process,my pid is %d\n",getppid());
当我们不管怎么运行,发现pid是会改变的,这很正常,但是为什么ppid是不变的呢?这是正常的吗?
当我们使用指令ps -xaj打开了任务管理器的界面,我们就会发现2878的进程是bash(不一定2878就是bash,也可能会有变化,参照./test,每个进程的pid都是会变化的)
那么什么是bash呢?
当我们运行:
就会有bash提示你说,./是个目录,无法运行。
其实bash就是命令行解释器,我们刚才运行的./test就像是一个公司的实习生而已,它呢,实际上就是公司的boss,掌管所有的实习生(子进程)。
提问,我们为什么创建子进程呢?
根据前面的代码我们知道,子进程会继承父进程后面的所有代码,但是我们创建子进程就是为了执行后面的代码吗?父进程也可以执行啊,为什么要创建呢?这时候,前面埋下的伏笔就起作用了,这里有个很让人迷惑的问题,一个函数的返回值可以返回几次呢?
欸大多数初学者可能都会回答一次,但是fork的奇异之处就在这里:
当我们man fork之后,在手册里面查询返回值的时候,返回值的描述是这样的:
On success, the PID of the child process is returned in the parent, and 0 is returned in the child. On failure, -1 is returned in the parent, no child process is created, and errno is ...
翻译过来就是,成功创建子进程,那么子进程的Pid就会返回给父进程,0返回给子进程,失败了就是返回-1给父进程,也就是说,成功了会有两个返回值,我们就可以写如下代码:
7 pid_t id = fork();
8 if(id == 0)
9 {
10 printf("hehehe\n");
11 }
12 else
13 {
14 printf("hahahha\n");
15 }
16
最后的打印结果是:
按照以前C语言的逻辑,是只会打印一个的,这里就有点颠覆了代码三观了~
但是奇怪了,明明变量只有一个id啊,为什么会有两份?
实际上在fork的时候,fork的实现部分,return id是代码吧?在fork的函数体内,已经创建了子进程,所以会返回两份id,因为父进程也会进入fork函数,那么有了两份id,至于为什么会有“两份”,埋个伏笔~
所以得出结论,子进程的创建是用来干其他事情的,不是用来干和父进程一样的事情的。
那么我们如何创建指定量的进程呢?
如果我们采用最开始的指数级别的来创建,肯定是不好控制的,那么我们就可以使用fork的返回值,来帮助我们创建指定数量的进程。因为创建成功了,会返回0给子进程,那么我们可以让这个子进程进入到一个函数体里面再也出不来,也就不会导致子进程创建子进程的情况了:
5 void Run()
6 {
7 while(1)
8 {
9 printf("My pid is %d,ppid is %d\n",getpid(),getppid());
10 sleep(1);
11 }
12 }
13
14 int main()
15 {
16 for(int i = 0; i < 5; i++)
17 {
18 pid_t pid = fork();
19 if(pid == 0)
20 {
21 Run();
22 }
23 }
24 while(1)
25 {
26 printf("I am a parent,my pid is %d,ppid is %d\n",getpid(),getppid());
27 sleep(1);
28 }
return 0;
}
咱们先来看结果。
不出意外的,我们创建了6个进程,主函数是第一个进程,后面通过for循环创建了5个子进程,并且5个子进程之间是没有关联的,并且通过它们各自的pid我们发现5个子进程的ppid都是父进程的12607,大胆预测的父进程的ppid的4335是bash进程,这点我们就不验证了。
好了,进程的创建我们已经基本熟络了,那么进程的大部分信息我们怎么去看呢?
首先我们引入一个问题,指令是进程吧?那么我们运行了指令之后,指令的工作路径在哪里呢?可能这个问题有点让人摸不着头脑,我们拿文件举例子,如果我们写了如下代码:
int main()
{
chdir("/home/whb/111");
FILE *fp = fopen("log.txt", "w");
(void)fp; // ingore warning
fclose(fp);
while(1)
{
printf("I am a process, pid: %d\n", getpid());
sleep(1);
}
return 0;
}
那么log.txt文件默认会创建在哪里呢?是当前代码的工作路径吧?
在VS里面就像是这样的,那么同理,Linux中的进程工作的时候也应该有自己的工作路径,我们从哪里去看工作路径呢?
在根目录的proc里面,proc是process的缩写。
此时,我们就可以看到proc里面的信息了,如果我们要具体到某一个的进程信息,我们只需要:
同时运行其他两条指令,我们在27847父进程里面就可以注意如下事项:
本文首先注意两个,一个是cwd,一个是exe,cwd是current woek directory,当前工作目录的意思,exe就好理解了,记录对应进程中可执行文件的路径。
而当你对某一个进程进行cd的时候,发现是可以cd进去的,说明进程本质就是一个一个的目录,目录里面记录了进程的所有信息,此时,对于Linux中一切皆文件的理解又更深了一层!
感谢阅读!