内核
计算机是由各种外部硬件设备组成的,比如内存、CPU、硬盘等,如果每个应用都要和这些硬件设备对接通信协议,那这样太累了,所以这个中间人由内核来负责,让内核作为应用连接硬件设备的桥梁,应用程序只关心与内核交互,不用关心硬件的细节。
现代操作系统内核一般会提供4个基本能力:
- 管理进程、线程,决定哪个进程、线程使用CPU,也就是进程调度能力
- 管理内存,决定内存的分配和回收,也就是内存管理的能力
- 管理硬件设备,为进程与硬件设备之间提供通信能力,也就是硬件通信能力
- 提供系统调用,如果应用程序要运行更高权限运行的服务,那么就需要由系统调用,它是用户程序和操作系统之间的接口。
内核如何工作?
内核具有很高的权限,可以控制cpu、内存、硬盘等硬件,而应用程序具有的权限很小,因此大多数操作系统,把内存分成了两个区域:
- 内核空间,这个内存空间只有内核程序可以访问
- 用户空间,这个内存空间专门给应用程序使用
用户空间的代码只能访问一个局部的内存空间,而内核空间的代码可以访问所有的内存空间。因此,当程序使用用户空间时,我们常说该程序在用户态执行,而当程序使用内核空间时,程序则在内核态执行。
应用程序如果需要进入内核空间,就需要通过系统调用,系统调用过程:
内核程序执行在内核态,用户程序执行在用户态。当应用程序使用系统调用时,会产生一个中断。发生中断后,cpu会中断当前在执行的用户程序,转而跳转到中断处理程序,也就是开始执行内核程序。内核处理完成后,主动触发中断,把CPU执行权限交回给用户程序,回到用户态继续工作。
Linux的设计
Linux的内核设计理念主要有这几个点:
- MultiTask ,多任务
- SMP,对称多处理
- ELF,可执行文件链接格式
- Monolithic Kernel,宏内核
MultiTask
MultiTask 的意思是多任务,代表着Linux是一个多任务的操作系统
多任务意味着可以有多个任务同时执行,这里的同时可以是并发或并行:
- 对于单核CPU时,可以让每个任务执行一小段时间,时间到就切换另一个任务,从宏观角度看,一段时间内执行了多个任务,这被称为并发
- 对于多核CPU时,多个任务可以同时被不同核心的CPU同时执行,这被称为并行。
SMP
SMP的意思是对称多处理,代表每个CPU的地位是相等的,对资源的使用权限也是相同的,多个CPU共享同一个内存,每个CPU都可以访问完整的内存和硬件资源。
这个特点决定了Linux操作系统不会有某个CPU单独服务应用程序或内核程序,而是每个程序都可以被分配到任意一个CPU上执行。
ELF
ELF的意思是可执行文件链接格式,它是Linux操作系统中可执行文件的存储格式,结构如下:
ELF把文件分成了一个个分段,每个段都有自己的作用。另外ELF文件有两种索引,Program header table 记录了二进制文件中各个[段的首地址]。
ELF文件如何生成?
我们编写的代码,首先通过[编译器]编译成汇编代码,接着通过[汇编器]变成目标代码,也就是目标文件,最后通过[链接器]把多个目标文件以及调用的各种函数库链接起来,形成一个可执行文件,也就是ELF文件。
ELF文件怎么被执行?
执行ELF文件的时候,会通过[装载器]把ELF文件装载到内存里,CPU读取内存中的指令和数据,于是程序就被执行起来了。
Monolithic Kernel
Monolithic Kernel的意思是宏内核,Linux内核架构就是宏内核,意味着Linux的内核是一个完整的可执行程序,且拥有最高的权限。
宏内核的特征是系统内核的所有模块,比如进程调度、内存管理、文件系统、设备驱动等,都运行在内核态。
不过Linux也实现了动态加载内核模块的功能,例如大部分设备驱动都是以可加载模块的形式存在的,与内核其他模块解耦,让驱动开发和驱动加载更加方便、灵活。
与宏内核相反的是微内核,微内核架构的内核只保留最基本的能力,比如进程调度、虚拟内存、中断等,把一些应用放到了用户空间,比如驱动程序、文件系统等。这样服务与服务之间是隔离的,单个服务出现故障或者完全攻击,也不会导致整个操作系统挂掉,提高了操作系统的稳定性和可靠性。
微内核的功能少,可移植性高,相比宏内核有一点不好的地方在于,由于驱动程序不在内核中,而且驱动程序一般会频繁调用底层能力,于是驱动盒硬件设备之间的交互需要频繁地切换到内核态,这样会带来性能损耗。鸿蒙系统的内核架构就是微内核。
还有一种内核叫混合类型内核,它的架构有点像微内核,内核里面会有一个嘴角版本的内核,然后其他模块会在这个基础上搭建,实现的时候会与宏内核类似,把整个内核做成一个完整的程序,大部分服务都在内核中,这就像是宏内核的方式包裹着一个微内核。
Windows设计
Windows的内核,又称NT内核,是Windows系统的内部核心。 每一个Windows发行版都有一个内核版本号,也称为NT版本号,这是从Windows NT 3.1时代就开始命名方式。NT全称叫做New Technology。
Windows和Linux一样,同样支持MultiTask和SMP,但不同的是,Windows的内核设计是混合型内核,上图内核中有一个MicroKernel模块,这个就是最小版本的内核,整个内核实现是一个完整的版本,含有非常多的模块。
Windows的可执行文件的格式也与Linux不同,所以这两个系统的可执行文件是不可以在对方上运行的。Windows的可执行文件的格式叫PE,称为可移植执行文件,扩展名通常是.exe、.dll、.sys等。PE的结构如下:
总结
内核架构一般有三种:
- 宏内核,包含多个模块,整个内核像一个完整的程序
- 微内核,有一个最小版本的内核,一些模块和服务则由用户态管理
- 混合内核,是宏内核和微内核的结合体,内核中抽象出了微内核的概念,也就是内核中会有一个小型的内核,其他模块就在这个基础上搭建,整个内核是一个完整的程序。
Linux的内核设计采用了宏内核,Window的内核设计则是采用了混合内核。
这两个操作系统的可执行文件格式也不一样,Linux可执行文件格式叫做ELF,Windows可执行文件格式叫做PE。