进程和程序的区别
程序
程序是静态的,是存储在硬盘、SSD等存储介质中的一个文件,通常由源代码(如 .c
文件)编译生成的二进制可执行文件(如 a.out
)。程序包含了指令和数据,但在未被执行时,它只是一个静态的代码和数据的集合。
在编译过程中,源代码文件(如
.c
文件)通过编译器生成一个可执行文件(如a.out
)。这个可执行文件在磁盘上静静地存在,直到被操作系统加载和执行
进程
进程是程序的运行实例,它是动态的。进程不仅包括程序的代码,还包括在程序运行过程中创建的各种资源和状态,如内存地址空间、CPU寄存器、文件句柄等。
进程的生命周期包括创建、执行、调度、等待、终止等多个阶段。当一个程序被加载到内存中并开始执行时,它就成为一个进程,并被分配一个唯一的进程标识符(PID)。
程序执行的过程,包括进程的创建、调度、消亡
.c——> a.out——> process(pid)
在终端中运行
./a.out
时,操作系统会加载a.out
文件到内存中,分配必要的资源并生成一个进程。这个进程在操作系统中有一个唯一的 PID,它会占用 CPU 资源并执行a.out
中的指令,直到程序结束或被终止。
区别总结
- 静态 vs 动态:程序是静态的,它是代码和数据的集合,存储在磁盘上;而进程是动态的,它是程序在运行时的一个实例,具有自己的执行环境和状态。
- 执行状态:程序本身并没有执行状态,它只是指令和数据;而进程包含了执行状态,比如当前的程序计数器(指示当前执行到的指令)、栈指针、内存地址空间等。
- 唯一性:同一个程序可以被多次加载并运行,生成多个进程,每个进程都有自己的 PID 和独立的执行环境。
1)程序是永存,进程是暂时的
2)进程有程序状态的变化,程序没有
3)进程可以并发,程序无并发
4)进程与进程会存在竞争计算机的资源
5)一个程序可以运行多次,变成多个进程;一个进程可以运行一个或多个程序
内存的分布
地址空间大小
内存的分布32位:2^32
在32位系统中,地址空间的大小是 2^32 字节,等于4GB。这意味着32位系统中的每个地址可以指向一个从0到2^32−1(即4GB)的内存位置
用户空间和内核空间
- 0-3G,是进程的空间
这个范围通常被分配给用户进程使用,即用户空间。每个进程都可以访问这部分虚拟地址空间,独立于其他进程。用户空间中的地址对每个进程来说都是独立的,彼此之间不会干扰
3G的内存空间
Code 段(只读):
- 这个区域存储了程序的可执行代码部分(即指令)。这个段通常是只读的,以防止程序在运行时意外修改自己的代码。
Data 段(静态全局变量):
- Data段存储了程序中已初始化的全局变量和静态变量。这个区域的内容在程序开始时已经被初始化,并在程序运行期间保留其状态。
Heap 段(堆):
- 堆是一个用于动态内存分配的区域。程序运行时,当调用
malloc
、calloc
、realloc
等函数时,动态分配的内存块来自于堆。堆的大小可以在程序运行时增长或缩小,具体取决于内存分配和释放操作。Map/Share 段(共享内存映射区):
- 这一部分用于内存映射文件(mmap)和共享内存。通过内存映射,文件可以直接映射到进程的地址空间中,这样可以更高效地访问文件数据。共享内存则允许不同的进程共享内存区域,便于进程间通信。
Stack 段(栈,8MB):
- 栈用于存储函数调用的局部变量、函数参数、返回地址等。栈的大小通常有一定限制(如8MB),它是从高地址向低地址增长的。
这些区域组成了进程的虚拟地址空间,并通过内存管理单元(MMU)映射到实际的物理内存。这种分段机制帮助操作系统有效地管理内存资源,并确保程序的安全性和稳定性
堆申请上限2.9G
size xxx查看
- 3G-4G是内核的空间
这一部分地址空间是为操作系统内核保留的。内核空间是共享的,所有进程都可以访问,但通常只有在内核模式下才能进行访问,用户模式下的访问会导致访问违例(如段错误)
虚拟内存和物理内存
-
虚拟地址:虚拟内存是操作系统提供的一种抽象,使得每个进程看到的内存都是连续且独立的,即使在物理上不是如此。虚拟地址是进程访问内存时使用的地址。
-
物理内存:物理内存是计算机中实际的RAM。由于虚拟地址与物理内存之间并不直接对应,操作系统使用一种叫做页表(Page Table)的结构来管理这种映射。
地址映射和页表
-
地址映射:操作系统通过页表将虚拟地址映射到物理地址。页表存储了虚拟页到物理页的映射信息。当进程访问某个虚拟地址时,内存管理单元(MMU, Memory Management Unit)会通过页表查找相应的物理地址,并将该访问操作重定向到实际的物理内存。
-
页(Page):在32位系统中,内存通常被划分为多个固定大小的块,称为页(Page)。一个典型的页大小是4KB,即 4096 字节。当进程需要访问内存时,MMU 会通过页表找到该虚拟地址所属的页,并确定该页在物理内存中的位置。
内存管理单元(MMU)
- MMU:内存管理单元是处理器中的一个硬件组件,负责将虚拟地址转换为物理地址。MMU 使用页表进行地址转换,并且能够处理各种内存管理任务,如内存保护、页交换(paging)等。
进程分类
1、交互式进程 用户与系统交互
2、批处理进程 shell脚本
3、 守护进程 输入法、杀毒软件
进程的作用
实现多任务处理
并发并行区别
并发:同一时刻同时运行(同时完成多个任务)
并发:指在同一时间段内,多个任务都在推进,但不一定是同时进行。这些任务可能会交替执行,由于 CPU 切换速度非常快,给人一种多个任务同时进行的错觉。
并行:指在同一时刻,多个任务真正地同时执行。这通常需要多个 CPU 核心或者多个处理器来实现。
进程的状态
3个状态,就绪→执行态→阻塞(等待,睡眠)基本操作系统
linux中的状态,运行态,睡眠态,僵尸,暂停态
调度算法、时间片、20ms、缓存
hdd机械硬盘、ssd固态硬盘
进程的调度,进程上下文切换
内核主要功能之一就是完成进程调度, 硬件,bios,io,文件系统,驱动
调度算法, other,idle
rr,fifo
宏观并行
微观串行从用户的角度来看,多个进程似乎是在并行运行的,但在微观层面上,CPU 只能依次执行每个进程的指令。这种看似矛盾的现象是通过操作系统的高效调度和快速的任务切换来实现的。