目录
- 1.信号如何被保存?
- 1.信号其他相关常见概念
- 2.信号在内核中的表示
- 3.sigset_t -- 本质是个位图
- 4.信号集操作函数
- sigset_t:
- sigprocmask()
- sigpending()
- 5.思考
- 6.使用
- 2.信号处理
- 0.内核态和用户态
- 1.内核空间和用户空间
- 2.信号何时被处理?
- 3.信号捕捉 -- 信号如何被处理?
- 4.sigaction()
- 5.思考
- 3.补充内容
- 1.可重入函数
- 2.SIGCHLD
1.信号如何被保存?
1.信号其他相关常见概念
- 实际执行信号的处理动作称为信号递达(Delivery)
- 信号从产生到递达之间的状态称为信号未决(Pending)
- 进程可以选择阻塞(Block)某个信号
- 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作
- 注意:阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作
- 一个信号被处理,是怎样的一个处理过程?
- pending --> block --> handler
2.信号在内核中的表示
- 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作
- 信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志
- 在上图的例子中:
- SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作
- SIGINT信号产生过,但正在被阻塞,所以暂时不能递达
- 虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞
- SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler
- 如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?
- 允许系统递送该信号一次或多次
- Linux是这样实现的:
- 常规信号在递达之前产生多次只计一次
- 实时信号在递达之前产生多次可以依次放在一个队列里
3.sigset_t – 本质是个位图
- 未决和阻塞标志可以用相同的数据类型sigset_t来表示,sigset_t称为信号集,这个类型可以表示每个信号的"有效"或"无效"状态
- 每个信号用一个bit来表示状态,非0即1,不记录该信号产生了多少次
- 在阻塞信号集中"有效"和"无效"的含义是该信号是否被阻塞
- 在未决信号集中"有效"和"无效"的含义是该信号是否处于未决状态
- 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask)
- 这里的"屏蔽"应该理解为阻塞而不是忽略
4.信号集操作函数
sigset_t:
- 不允许用户自己进行位操作,OS提供了对应的操作位图的方法
- 用户可以直接使用该类型,就像使用内置类型和自定义类型一样
- 一定需要对应的系统接口,来完成对应的功能,其中系统接口需要的参数,可能就包含了sigset_t变量/对象
函数 | 功能 |
---|---|
int sigemptyset(sigset_t *set); | 初始化set指向的信号集,将所有信号的对应bit清零,表示该信号集不包含任何有效信号 |
int sigfillset(sigset_t *set); | 初始化set指向的信号集,将所有信号的对应bit置位,表示该信号集包含系统的所有信号 |
int sigaddset (sigset_t *set, int signo); | 在对应信号集中添加某种有效信号 |
int sigdelset(sigset_t *set, int signo); | 在对应信号集中删除某种有效信号 |
int sigismember(const sigset_t *set, int signo); | 判断信号集的有效信号中是否包含某种信号,包含返回1,不包含返回0,出错返回-1 |
- 注意:在使用sigset_ t类型的变量之前一定要调用sigemptyset或sigfillset做初始化,使信号集处于确定的状态
- 前四个函数都是成功返回0,出错返回-1
sigprocmask()
- **功能:**读取或更改进程的信号屏蔽字(阻塞信号集)
- **原型:int sigprocmask(int how, const sigset_t set, sigset_t oset);
- 参数:
- set**:**若set是非空指针,则更改进程的信号屏蔽字,
- oset**:**若oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出
- 若oset和set都是非空指针,则先将原来的信号屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字
- how**:**指示如何更改信号屏蔽字,假设当前的信号屏蔽字为mask
SIG_BLOCK | set包含了希望添加到当前信号屏蔽字的信号,相当于mask=mask|set |
---|---|
SIG_UNBLOCK | set包含了希望从当前信号屏蔽字中解除阻塞的信号,相当于mask=mask&~set |
SIG_SETMASK | 设置当前信号屏蔽字为set所指向的值,相当于mask=set |
- **返回值:**成功返回0,失败返回-1
- 注意:如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达
sigpending()
- 功能:读取当前进程的未决信号集,通过set参数传出
- *原型:int sigpending(sigset_t set);
5.思考
- 貌似没有一个接口用来设置pending位图?
- 所有的信号发送方式,都是修改pending位图的过程
- 如果对所有的信号都进行了自定义捕捉,是不是就写了一个不会被异常或者用户杀掉的进程?
- 并不能,9号信号无法被捕获
- 如果对所有的信号都进行block,是不是就写了一个不会被异常或者用户杀掉的进程?
- 并不能,9号信物无法被屏蔽
6.使用
void showPending(sigset_t &set)
{
for (int sig = 1; sig <= 31; sig++)
{
if(sigismember(&set, sig))
{
cout << "1";
}
else
{
cout << "0";
}
}
cout << endl;
}
int main()
{
signal(2, catchSig);
// 1.定义信号集对象
sigset_t bset, obset;
sigset_t pending;
// 2.初始化
sigemptyset(&bset);
sigemptyset(&obset);
sigemptyset(&pending);
// 3.添加要进行屏蔽的信号
sigaddset(&bset, 2);
// 4.设置set到内核中对应的进程内部
int n = sigprocmask(SIG_BLOCK, &bset, &obset);
assert(n == 0);
(void)n; // release下,assert失效,为了方式未使用变量警告,作此处理
cout << "block 2号信号成功... PID: " << getpid() << endl;
// 5.重复打印当前进程的pending信号集
int count = 0;
while(true)
{
// 5.1获取当前进程的pending信号集
sigpending(&pending);
// 5.2显示pending信号集中没有被递达的信号
showPending(pending);
sleep(1);
count++;
if (count == 10)
{
cout << "解除对2号信号的block" << endl;
int n = sigprocmask(SIG_UNBLOCK, &bset, nullptr);
assert(n == 0);
(void)n;
}
}
return 0;
}
2.信号处理
0.内核态和用户态
- **内核态:**OS执行自己代码和数据的一个状态,具备非常高的优先级
- **用户态:**用户代码和数据被访问或者执行的时候,所处的状态,是一个受管控的状态
- **主要区别:**权限大小,内核态权限远远大于用户态
- 为什么会进入内核态?
- 用户进行系统调用
- 遇到缺陷、陷阱、异常等
1.内核空间和用户空间
- 每一个进程都有自己的进程地址空间,该进程地址空间由内核空间和用户空间组成
- 用户所写的代码和数据位于用户空间,通过用户级页表与物理内存之间建立映射关系
- 内核空间存储的实际上是OS的代码和数据,通过内核级页表与物理内存之间建立映射关系
- 内核级页表是一个全局的页表,每个进程都能看到,它用来维护OS的代码与进程之间的关系
- 因此,在每个进程的进程地址空间中,用户空间是属于当前进程的,每个进程看到的代码和数据是完全不同的
- 但内核空间所存放的都是OS的代码和数据,所有进程看到的都是一样的内容
- 进程无论如何切换,都能看到OS,但是不一定能访问
- 进程之间无论如何切换,都能找到同一个OS,因为我们每个进程都有3~4G的地址空间,用的是同一张内核级页表,因此访问的都是同一个OS
- OS可以在进程的上下文中直接运行,因为OS代码已经被映射到地址空间3~4G中
- 系统调用就是进程的身份切换到内核态,根据内核页表找到系统函数,执行
2.信号何时被处理?
- 信号相关的数据字段都是在进程PCB内部的,属于内核范畴
- 所以要检测信号,一定要在内核状态才有权限去做
- 进程从内核态返回到用户态的时候,进行信号检测与信号的处理
3.信号捕捉 – 信号如何被处理?
-
在执行主控制流程的时候,可能因为某些情况而陷入内核,当内核处理完毕准备返回用户态时,就需要进行信号pending的检查
- 此时仍处于内核态,有权力查看当前进程的pending位图
-
在查看pending位图时,如果发现有未决信号,并且该信号没有被阻塞,那么此时就需要对信号进行处理。
- 如果待处理信号的处理动作是默认或者忽略,则执行该信号的处理动作后清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,从主控制流程中上次被中断的地方继续向下执行即可。
- 但如果待处理信号是自定义捕捉的,即该信号的处理动作是由用户提供的,那么处理该信号时就需要先返回用户态执行对应的自定义处理动作,执行完后再通过特殊的系统调用sigreturn再次陷入内核并清除对应的pending标志位,如果没有新的信号要递达,就直接返回用户态,继续执行主控制流程的代码
-
无穷大记忆法
- 该图形与直线有几个交点就代表在这期间有几次状态切换,而箭头的方向就代表着此次状态切换的方向
- 图形中间的圆点就代表着检查pending表
-
为什么执行自定义处理函数要从内核态 --> 用户态?不切换也可以执行,但是为什么要切换呢?
- 首先明确:内核态有权利执行用户态的代码,但OS不相信任何人
- 假如允许这么做,若sighandler()中有一些非法动作,如rm、scp等操作,如果内核态做了,就会对OS造成伤害
- 不能让OS直接去执行用户的代码,因为OS无法保证用户的代码是合法代码
4.sigaction()
-
**功能:捕捉信号,**读取和修改与指定信号相关联的处理动作
-
原型:
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);
-
参数:
- **signo:**指定信号的编号
- **act:**输入型参数,根据act修改该信号的处理动作
- **oact:**输出型参数,通过oact传出该信号原来的处理动作
-
**返回值:**成功返回0,出错则返回- 1
-
act和oact指向sigaction结构体:
- sa_handler:
- 赋值为常数SIG_IGN传给sigaction表示忽略信号
- 赋值为常数SIG_DFL表示执行系统默认动作
- 赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数
- 该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号
- 显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用
- sa_mask**:指定一个信号集(sigset_t),用于在信号处理函数执行期间阻止其他信号的传递**
- sa_flags字段包含一些选项,本章的代码都把sa_flags设为0
- sa_sigaction是实时信号的处理函数
- sa_handler:
-
使用
int main()
{
// 内核数据类型
struct sigaction act, oact;
act.sa_flags = 0;
sigemptyset(&act.sa_mask);
act.sa_handler = catchSig;
sigaddset(&act.sa_mask, 3);
sigaddset(&act.sa_mask, 4);
sigaddset(&act.sa_mask, 5);
// 设置进当前调用进程的PCB中
sigaction(2, &act, &oact);
return 0;
}
5.思考
- 处理信号的时候,执行自定义动作,如果在处理信号期间,又来了同样的信号,OS如何处理?
- 当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,信号处理函数返回时自动恢复原来的信号屏蔽字
- 这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止。
- 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字
- 当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,信号处理函数返回时自动恢复原来的信号屏蔽字
3.补充内容
1.可重入函数
- main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续往下执行,先前做第一步之后被打断,现在继续做完第二步
- **结果:**main函数和sighandler先后向链表中插入两个节点,而最后只有一个节点真正插入链表中了
- 像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入
- insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数
- 反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant)函数
- 如果一个函数符合以下条件之一则是不可重入的
- 调用了malloc或free,因为malloc也是用全局链表来管理堆的
- 调用了标准I/O库函数 --> 标准I/O库的很多实现都以不可重入的方式使用全局数据结构
2.SIGCHLD
-
用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(也就是轮询的方式)
- 采用第一种方式,父进程阻塞了就不能处理自己的工作了
- 采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一 下,程序实现复杂
-
其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,父进程可以自定义SIGCHLD信号的处理函数
- 子进程终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可
- 这样父进程只需专心处理自己的工作,不必关心子进程了
- 注意:
- SIGCHLD属于普通信号,记录该信号的pending位只有一个,如果在同一时刻有多个子进程同时退出,那么在handler函数当中实际上只清理了一个子进程,这样的话其他子进程就没有回收,因此在使用waitpid函数清理子进程时需要使用while不断进行清理回收
- 使用waitpid函数时,需要设置WNOHANG选项,即非阻塞式等待,否则当所有子进程都已经清理完毕时,由于while循环,会再次调用waitpid函数,此时就会在这里阻塞住, 导致程序在handler这里回不来
- 只要waitpid失败了就证明把所有子进程都回收完了,然后再继续运行父进程
-
事实上,由于UNIX的历史原因,要想不产生僵尸进程还有另外一种办法:
-
父进程调用sigaction将SIGCHLD的处理动作置为SIG_IGN
- 这样fork出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程
-
系统默认的忽略动作和用户用sigaction函数自定义的忽略通常是没有区别的,但这是一个特例
- 即:SIGCHLD默认忽略和用户设置忽略是有区别的
-
此方法对于Linux可用,但不保证在其它UNIX系统上都可用
-