一、进程和程序:
1.1什么是程序?
- 程序由代码、数据、逻辑、接口和文档组成的一组按特定顺序执行的计算机指令,用于实现特定功能或解决问题。
- 程序存储在磁盘上。
1.2什么是进程?
- 进程是一个正在执行的程序实例,包含程序代码、数据、堆栈和处理器状态。
- 程序被双击后加载到内存,相当于从磁盘拷贝到内存,由操作系统内核分配进程控制块(PCB),初始化进程的基本信息(如进程ID、状态、优先级等),分配内存空间,设置页表等。
- 在Linux中,进程的本质是一个C语言的结构体对象,即task_struct结构体。这个结构体的一个个结构体成员就是进程的所有信息,如进程ID、状态、寄存器内容、内存管理信息等。
二、进程是如何被管理的?
2.1进程被谁管理?
- 在程序被加载到内存之前,首先肯定有一个程序被先加载到内存中,那就是操作系统。操作系统通过调度器、内存管理、文件系统和其他系统资源来管理进程的生命周期,包括创建、执行、暂停、恢复和终止。
2.2操作系统如何管理进程?
- 总结为一句话:“先描述,再组织”。使用C语言进行描述,使用结构体组织和管理进程的数据和状态。
- 先描述:内核分配进程控制块(PCB),初始化进程的基本信息(如进程ID、状态、优先级等),分配内存空间,设置页表等。
- 再组织:将初始化的进程加入进程调度队列,准备好进程的执行环境,确保所有资源和数据结构正确连接,使进程能够被调度和执行。
三、进程控制块-PCB
3.1PCB是什么?
- PCB可以理解为“进程的结构体对象”,PCB是一个统称, Linux下的PCB是task_struct。
3.2操作系统如何管理PCB?
- Linux系统通过双向链表将`task_struct`结构体连接起来,形成一个进程控制块(PCB)链表。系统提供了一组函数用于管理这个链表,包括创建新的PCB、销毁PCB、在链表中插入或删除PCB等。此外,调度器根据PCB链表中的信息来决定下一个要运行的进程。
3.3对进程的总结
- 进程=可执行程序+内核数据结构(PCB)
- 对进程的管理就是对PCB的管理。
四、进程标识符pid
4.1使用ps指令打印进程的信息,包括pid、ppid等:
ps ajx | head -1 && ps ajx | grep mycode
使用了grep命令,grep也成为了一个进程,我们之前运行的所有指令,程序,软件,最终都是进程。
4.2可执行程序内部调用函数,打印当前进程pid。
函数名为getpid,需要包含头文件<sys/types.h>和<unistd.h>,函数的返回使用pid_t类型接收,也可以使用%d打印。
4.3通过进程的pid,杀死进程:
kill -9 进程pid
4.4可执行程序每次运行的pid不相同,但是其ppid始终相同的原因:
- PID是系统内唯一标识每个正在运行进程的数值。当一个程序启动时,操作系统分配一个当前未使用的PID给新进程,以确保每个进程都有唯一的标识。这是为了管理进程和资源的分配,避免冲突和混淆。
- PPID(父进程标识符)在同一会话中的多个子进程之间可能相同,因为它标识的是创建这些子进程的父进程。当一个父进程生成子进程时,这些子进程的PPID都等于父进程的PID。因此,只要这些子进程的父进程保持不变,它们的PPID就会始终相同。