1 不可重入函数
为什么会导致节点丢失内存泄露?main函数在执行insert,但是没执行完就被信号中断了,又进了这个函数里,所以这个insert函数在不同的执行流中,同一个函数被重复进入,如果没有问题,该函数被称为可重入函数,如果有问题,该函数被称为不可重入函数
如果一个函数符合以下条件之一则是不可重入的:
- 调用了malloc或free,因为malloc也是用全局链表来管理堆的。
- 调用了标准I/0库函数。标准I/0库的很多实现都以不可重入的方式使用全局数据结构。
2 volatile
一开始程序疯狂的卡在while循环,如果收到了2号信号(ctrl+c),quit由0变1,逻辑反条件就不满足,输出正常退出结果
makefile
mysignal:signal.c
gcc -o $@ $^
.PHONY:clean
clean:
rm -f mysignal
signal.c
#include <stdio.h>
#include <signal.h>
int quit = 0;
void handler(int signo)
{
printf("change quit from 0 to 1\n");
quit = 1;
printf("quit=%d\n", quit);
}
int main()
{
signal(2, handler);
while(!quit); //注意这里故意没有携带while的代码块,故意让编译器认为在main中,quit只会被检测
printf("main 正常退出\n");
return 0;
}
- 无论你在进程里面定义多少变量,最终想能够被访问,必须要加载到物理内存里,只不过是通过虚拟地址空间让我们找到它而已,定义的全局quit变量,当二进制程序开始执行,一定要在内存里把数据(代码)开辟好,所以quit毫无疑问在内存当中;循环判断的时候是一种计算,cpu匹配运算的种类,一种是算术运算(加减乘除取模、各种浮点数运算),一种是逻辑运算(真假判断、逻辑与、逻辑取反),while(!quit)是在CPU上跑,现在的问题是你要检测的数据开始的时候是在内存里,要计算的时候是在CPU内部,所以如果你想要计算,第一件事情是将内存中的数据通过某种方式load到CPU内,cpu中有对应的寄存器、pc指针,把quit=0放进寄存器,它才会对quit做真假判断,PC指针表征当前的进程执行到哪里,如果条件满足,pc指针继续执行while(!quit)代码,如果当前条件不满足,它会让PC指针向下移动,指向下一条语句,开始向后执行,整个逻辑就是这样子的,总结一下就三步,第一要把数据从内存加载到CPU里的寄存器,第二做判断运算,第三判断完成后更改PC指针(继续执行当前语句还是下一条语句)
- 后面加了信号的捕捉,2号信号到来的时候调用handler方法,将quit改成1,后面的逻辑依旧是要做判断,CPU从内存里读取qiit=1,逻辑反之后判断条件满不满足,更改PC指针,这是我们之前退出的原因,数据一旦被修改就可以被while循环检测到,条件不满足就退出了
实际上c++在编译的时候是有优化级别的,查看man手册(man gcc),找到优化选项(/Optimization Options)
按了2号信号,quit改成1了却还不退出的现象,退出指令(ctrl+\)
makefile(在第二行加一个 O2选项)
mysignal:signal.c
gcc -o $@ $^ -O2
.PHONY:clean
clean:
rm -f mysignal
显示
- 在刚刚的过程中,让计算机执行while循环,每一次都要尝试着把数据从内存加载到CPU,在main函数里,我发现quit是没有被修改的,只是在被检测,编译器编译的时候发现,quit变量没有被修改,为什么要重复做把数据加载到cpu里的动作呢,只需要在代码编译形成汇编代码时,把数据加载到CPU里的寄存器,往后循环检测时直接检测寄存器里的就行了,不用再去内存里面查quit,因为每次找结果都是一样的,好比你问某个人问了好几次不同的问题,他都说不知道,那你下次再想问他问题的时候,本来要张口的,心里想着说算了,反正他也不知道,那你对这个人的判断就是以后问他什么问题他都不知道,同样的,编译器就不需要在内存里找了,直接检测寄存器里的数据就可以了,编译器就这么认为的,它会将quit变量直接优化到CPU里的寄存器当中,只有第一次会将quit加载到寄存器里,往后判断时候只检测寄存器是否为真还是假,再决策对应的指针,相当于CPU遵循就近原则,只查寄存器的值而不查内存的值,叫做内存位置不可见了,这就是为什么加了优化,quit=1也执行了,最终这个循环却不退出的原因
所以为了解决这个问题,要告诉编译器保证每次检测都要尝试着从内存中进行数据读取,不要用寄存器中的数据,让内存数据可见!就有了volatile关键字,他的作用就是杜绝对quit变量做寄存器级别的优化,保证内存可见性
加volatile关键字,让main正常退出
volatile int quit = 0;
显示
3 SIGCHLD
子进程退出的时候会向父进程发SIGCHLD信号,但是父进程默认处理动作是忽略的,所以我们为了证明它会发,我们可以自定义捕捉SIGCHLD信号(现象是子进程被创建出来,先正常运行5秒,期间父进程持续做自己的事情,当信号到来的时候会等待5秒钟,但是在等期间这个子进程已经退了,且会处于僵尸状态,因为父进程还没回收它,5秒之后wait它的时候,最终我们就会看到打印等待成功,僵尸状态也会随着消失)
makefile
mysignal:signal.c
gcc -o $@ $^ #-O2
.PHONY:clean
clean:
rm -f mysignal
查看waitpid第一个参数说明(man waipid)
pid_t waitpid(pid_t pid, int *wstatus, int options);
- 大于0代表你传的参数就是你要等的进程的id,-1代表等待任意一个子进程
signal.c
#include <stdio.h>
#include <signal.h>
#include <signal.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/wait.h>
#include <stdlib.h>
//id暂时定义成全局的,一会方便做对比,因为信号和main函数是两个执行流
pid_t id;
void handler(int signo)
{
sleep(5);
printf("捕捉到一个信号:%d,who:%d\n", signo, getpid());
//-1表示等待任意一个子进程,退出结果不关心,阻塞式等待
//虽然写了0,阻塞式等待,我们绝对不会被阻塞,因为我已经收到信号了
//就证明当前的子进程肯定有退的,waitpid就可以返回了
pid_t res = waitpid(-1, NULL, 0);
if (res > 0)
{
//等待成功返回子进程的pid
//id 在父进程中存储的是子进程的 PID
printf("wait success, res: %d, id: %d\n", res, id);
}
}
int main()
{
signal(SIGCHLD, handler);
id = fork();
if (id == 0)
{
int cnt = 5;
while(cnt--)
{
printf("我是子进程,我的pid:%d, ppid: %d\n", getpid(), getppid());
sleep(1);
}
exit(1);
}
while(1)
{
sleep(1);
}
return 0;
}
显示(while :; do ps axj | head -1&&ps axj | grep mysignal | grep -v grep; echo "---------------"; sleep 1; done)
现在来了一大堆的信号,pending位图比特位只有一个,比如第一个子进程退了,pending位设置1,第二个子进程来了,无非就是把1再置为1,此时信号不就相当于丢失了吗,相当于子进程退出发了10个信号,可能导致最终只回收了两三个子进程
signal.c
int main()
{
signal(SIGCHLD, handler);
int i = 1;
for(; i <= 10; ++i)
{
id = fork();
if (id == 0)
{
int cnt = 5;
while(cnt--)
{
printf("我是子进程,我的pid:%d, ppid: %d\n", getpid(), getppid());
sleep(1);
}
exit(1);
}
}
while(1)
{
sleep(1);
}
return 0;
}
显示
- 只回收了两个子进程
所以要while式的循环回收,你有几个进程我就回收几个进程
signal.c
void handler(int signo)
{
printf("捕捉到一个信号:%d,who:%d\n", signo, getpid());
sleep(5);
while(1)
{
//-1表示等待任意一个子进程,退出结果不关心,阻塞式等待
//虽然写了0,阻塞式等待,我们绝对不会被阻塞,因为我已经收到信号了
//就证明当前的子进程肯定有退的,waitpid就可以返回了
pid_t res = waitpid(-1, NULL, 0);
if (res > 0)
{
//等待成功返回子进程的pid, id 在父进程中存储的是子进程的 PID
printf("wait success, res: %d, id: %d\n", res, id);
}
else break; //如果没有子进程了
}
printf("handler done...\n");
}
显示
假如有五个子进程退出五个子进程没退出,waitpid一直循环回收,它总会碰到没有退出的子进程,就会一直处于阻塞状态,导致handler无法返回,代码没办法再向后运行,所以要将它改成非阻塞等待,pid_t res = waitpid(-1, NULL, WNOHANG);完整代码
#include <stdio.h>
#include <signal.h>
#include <signal.h>
#include <sys/types.h>
#include <unistd.h>
#include <sys/wait.h>
#include <stdlib.h>
//id暂时定义成全局的,一会方便做对比,因为信号和main函数是两个执行流
pid_t id;
void waitProcess(int signo)
{
printf("捕捉到一个信号:%d,who:%d\n", signo, getpid());
sleep(5);
while(1)
{
//-1表示等待任意一个子进程,退出结果不关心,阻塞式等待
//虽然写了0,阻塞式等待,我们绝对不会被阻塞,因为我已经收到信号了
//就证明当前的子进程肯定有退的,waitpid就可以返回了
//pid_t res = waitpid(-1, NULL, 0);
//非阻塞等待,有就回收,没有就出错返回
pid_t res = waitpid(-1, NULL, WNOHANG);
if (res > 0)
{
//等待成功返回子进程的pid, id 在父进程中存储的是子进程的 PID
printf("wait success, res: %d, id: %d\n", res, id);
}
else break; //如果没有子进程了
}
printf("handler done...\n");
}
int main()
{
signal(SIGCHLD, waitProcess);
int i = 1;
for(; i <= 10; ++i)
{
id = fork();
if (id == 0)
{
int cnt = 5;
while(cnt--)
{
printf("我是子进程,我的pid:%d, ppid: %d\n", getpid(), getppid());
sleep(1);
}
exit(1);
}
}
while(1)
{
sleep(1);
}
return 0;
}
- 一个基于信号版的回收子进程的代码
显示
要想不产生僵尸进程,还有另一种办法,父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN,往后创建的子进程在退出时就会被操作系统自动清理,不会产生僵尸进程,也不会通知父进程
signal.c(signal(SIGCHLD, waitProcess);)改成
signal(SIGCHLD, SIG_IGN);
显示
子进程退了,会给父进程发信号,父进程默认对该信号的处理动作是忽略,为什么还要再调一下这个signal函数呢
这其实是一种特殊情况,可以理解成在signal方法里,父进程调用signal的时候,如果他检测到你是SIGCHLD, SIG_IGN这种组合,除了设置SIGCHLD信号为忽略之外,他还会修改父进程PCB的状态位,因为子进程的状态是按父进程来的,父进程相当于可以给自己打一个标签,假设我创建的子进程以后就不要僵尸,这个标志位就会在fork的时候被子进程继承下去,所当子进程退出的时候,操作系统发现子进程退了,检测标志时发现这个进程早就设置过了标志位,你退了就直接把你释放掉了,相当于在信号handler表当中,默认是SIG_IGN,他就执行默认动作,如果你自己手动调了signal或sigaction,它是系统调用,会修改未来创建子进程的一些状态位,方便操作系统识别进而直接回收它;也可以这样理解,以前对子进程退出信号的默认动作是SIG_DFL,什么都不做,现在设置成SIG_IGN,操作系统就把它回收掉了
4 线程(看看现象)
makefile
mysignal:signal.c
gcc -o $@ $^ -lpthread
.PHONY:clean
clean:
rm -f mysignal
signal.c
#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
void *thread1_run(void *args)
{
while(1)
{
printf("我是线程1,我正在运行\n");
sleep(1);
}
}
void *thread2_run(void *args)
{
while(1)
{
printf("我是线程2,我正在运行\n");
sleep(1);
}
}
void *thread3_run(void *args)
{
while(1)
{
printf("我是线程3,我正在运行\n");
sleep(1);
}
}
int main()
{
pthread_t t1, t2, t3;
pthread_create(&t1, NULL, thread1_run, NULL);
pthread_create(&t2, NULL, thread2_run, NULL);
pthread_create(&t3, NULL, thread3_run, NULL);
while(1)
{
printf("我是主线程,我正在运行\n");
sleep(1);
}
}
查看线程(ps -aL | head -1&&ps -aL | grep mysignal)
- 可以看出他们是属于同一个进程的,因为他们的PID都是一样的,LWP叫做轻量级进程,第一行执行流他的PID和LWP数字是一样的,那操作系统调度的时候如何区分呢,所以真正意义上,操作系统调度的时候,看的是LWP,所以CPU调度的时候,根据LWP,调度不同的线程去运行,以前我们说根据PID也没有错,因为当你的进程当中只有一个执行流时,PID和LWP数字是一样的,看哪个都行