task_struct-PCB的一种
一、PID
1、ps/top/proc查看进程
2、kill-9 PID 杀死进程
3、getpid/getppid
ps等指令是外部程序,而PID是每个PCB中的属性,即ps会遍历PCB结构体所在的数据结构
又因为PCB为OS创建的,内核不能让用户之间访问,就需要提供getpid接口,使得用户能够方便的获取进程的pid。
写一个观察PID的程序
再写一个观测其属性的脚本程序
运行后如下:
PID为20626,两边一致。
4、为什么pid变化ppid不变?
每次结束进程重启时,PID会更新,为什么PPID不会更新呢?
每次要创建进程时,bash不自己去做,而是创建一个子进程,让子进程去完成。
二、利用fork创建进程
fork分叉、分流,创建子进程,变为两个执行流。
使用fork函数可以创建一个子进程
return value:
成功时有2个返回值,怎么解释?
几个问题
1、为什么fork给子进程返回0,给父进程返回子进程的PID?
1、为什么分别给父子进程返回2个值?
2、为什么父进程是PID,子进程是0?
为了便于后续父进程通过子进程PID来控制子进程
2、一个函数怎样做到返回2次?
3、一个变量为什么会有不同的内容?
父子进程共享代码,但数据是独立的。
即各自有一个相应的变量数据存储返回值。return为写入
父进程return直接写入,子进程return则会写时拷贝
为了节省资源,父子进程之间采用 数据层面上的写时拷贝。
4、fork函数内部做了什么?
5、父子进程谁先运行?
由调度器决定,用户无法影响。
调度器保证 各个进程之间被公平调度。
应用:bash中调用fork创建子进程,用子进程完成相关工作
三、进程状态
(一)、操作系统学科中
1、运行态:
task_struct结构体对象放在运行队列中,对象内部有一个时间片,使得各个进程之间的运行可以及时切换,例如10ms一次,从而实现在某一时间段内的并发运行。
大量将进程拿上、拿下CPU的操作叫做进程切换。
2、阻塞态:
每个设备都有自己的结构体对象,自己的等待队列
进程在等待队列中等待硬件就绪,就绪后移入运行队列中(唤醒进程)
3、(阻塞)挂起状态:
内存代码和数据的换入、换出(内存<-->磁盘)
一个进程只有在被CPU调度时是需要其代码和数据的,在运行、等待队列中的进程的代码和数据会占用大量内存空间,而起到排队作用的仅仅是其task_struct结构体对象,因此可以暂时将代码和数据换出内存,仅保留task_struct结构体对象,此时称为挂起状态。
(二)、Linux系统中
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32
1、S状态
死循环时为S+状态,一直进行while判断时为R+状态。
原因:有printf时(或scanf),存在IO,会等待“屏幕”(云服务器不在本地,printf是将数据放在网络中传输,所以需要时间,即为等待 )这个外设就绪S状态相当于之前的阻塞态
无printf时,没有IO,一直进行判断,R为运行态
带+的为前台进程,ctrl+c即可杀掉,普通的R为后台进程,通过kill -9+PID杀掉
2、D状态(高IO状态)
disk sleep 深度睡眠 sleeping 浅度睡眠(可以被唤醒) OS、用户都不能杀死该D进程
不响应任何请求
D状态比较少见,一般出现时(被用户察觉 ms或s状态),此时OS已经快没有空间了
3、T/t状态stop
进程暂停和继续
kill -18 kill -19
问题:stop和sleep状态的区别?
S-sleep一定是在等待某种资源就绪
t-stop可能在等待资源,也可能正在被其它进程控制。
例如:gdb调试时,可以控制进程,使其被暂停在t状态
4、Z(zombie)状态
一个进程退出后,不会立马回收,先保持一段时间Z状态,维护一段时间的进程信息(需要父进程来查看)
然后才进入X状态,然后OS进行资源回收
僵尸进程的PCB不被释放,就会一直占用内存空间,导致内存泄漏。
解决方法:父进程waitpid,后面细说。
5、孤儿进程:
1号init进程
特别的:如果存在僵尸进程,其父进程在回收之前退出,会自动被OS领养,OS判断其为僵尸进程,直接回收。
注意:是OS领养根据内核信息领养,不是bash等领养,它们不知道“孙子进程的相关信息”