在ARM32中,MMU主要完成虚拟地址到物理地址的映射,并且能够控制内存的访问权限,而页表是实现上述功能的主要手段。页表又分为一级页表、二级页表,在ARM64中甚至还有三级页表。为了便于理解,本章主要讲述一级页表完成段映射的详细过程,二级页表将在下一章节进行详述,约定下文提到的页表均为一级页表。
1. MMU和页表
1.1 MMU
MMU是一种硬件电路,再直白一点,就是使用与或非门组合而成的数字电路,既然是电路,那么就有输入和输出,输入就是CPU发起的虚拟地址,输出就是最终转换后的物理地址。
CPU根本不知道访问的地址是物理的还是虚拟的,它只访问一个地址,然后从数据线上获取数据。未开启MMU时,CPU的访问地址直接通过地址总线访问到外部内存,此时CPU的访问地址就是物理地址。启用MMU时,CPU的访问地址是虚拟地址,经过MMU转化为物理地址,从而访问外部内存里的数据。
暂且把MMU看成一个黑盒,下图为一个使用虚拟地址寻址的系统框图,CPU发起访问虚拟地址0x00000000来访问内存,在0x00000000被送到内存之前,先经过了MMU做了虚拟地址到物理地址的转换,MMU输出为0xC0000000,然后通过并行总线访问了物理地址为0xC0000000的地址空间。
1.2 页表
页表是一种数据结构,再直白点,基本在32位的ARM处理器中,页表是uint32类型的数组,且数组大小为4K,页表存放在内存当中,页表里存放了虚拟地址与物理地址的对应关系,VA到PA的转换过程其实就是MMU查询和解析页表的过程。
学习直通车:
Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈ke.qq.com/course/4032547?flowToken=1040236
页表在内存中的存储如下图所示,软件在DDR中开辟了16KByte连续的空间用来存储一级页表,也就是定义了一个数组用来存放虚拟地址与物理地址的对应关系,代码实现上大体如下:
uint32 L1Table[4096];
1.2.1 一级描述符
什么是一级描述符,从数学上说,一级页表是一级描述符的集合
L1Table中的每一个元素都描述了虚拟地址到物理地址或二级页表的映射关系,因为这些元素位于一级页表,所以称为一级描述符。
一级描述符的格式如下图所示,本章只介绍和段映射有关的bit,其他bit的含义会在后面的章节再进行介绍:
bit1:0:
00,缺页,虚拟存储空间没有被映射到物理存储空间,因而访问该存储空间将产生缺页异常。
01,该一级描述符中包含了粗粒度的二级页表的物理地址。该粗粒度的二级页表定义了对应的 1MB 的虚拟存储空间的地址映射关系。它可以实现以大页和小页为单位的地址映射。
2. 完成虚拟地址到物理地址的段映射
在ARM32中,以1M为单位进行虚拟地址到物理地址的映射称为段映射,我们已经知道一级页表有4096个描述符,每个描述符描述了1M的虚拟地址到物理地址的映射关系,正好是4G。
2.1 页表基地址寄存器
既然页表里存放了(VA)虚拟地址到(PA)物理地址的对应关系,且页表存放在内存里,在做VA到PA的转换时,MMU需要到页表里去取数据,那么MMU怎么知道页表在内存的什么位置呢?
在ARM32中,协处理器CP15的C2寄存器用来存放一级页表的基地址,但只使用了bit31:14,bit13:bit0并未使用,这就决定了一级页表在内存中一定是16K对齐的(2的14次方等于16K)。C2寄存器的格式如下图所示
2.2 一级描述符所在的物理地址
当CPU发起一次寻址操作时,虚拟地址作为MMU的输入,被MMU内的逻辑门电路进行运算,将C2寄存器的bit31:bit14作为高位,将虚拟地址的bit31:bit20作为低位,将两者拼接,低2位补0,如下图所示,最终找到一级描述符所在的物理地址。
用软件模拟一级描述符的查找过程:
uint32_t GetPTE所在的物理地址(uint32 虚拟地址)
{
uint32 页表基地址 = 页表基地址寄存器 & 0xffffc000 ;
//与上0xfffffffc;是因为页表是4字节对齐的
uint32 PTE所在的物理地址 = (虚拟地址>>18) | 页表基地址 & 0xfffffffc;
return PTE所在的物理地址;
}
2.3 完成虚拟地址到物理地址的段映射
如上图所示,假设,CPU此刻要读取虚拟地址0x12345678上连续4Byte的数据,ARM32的C2寄存器值为0xC0009000,按照上一节所讲方式进行拼接。
得出一级描述符位于物理地址0xC000848C处,0xC000848C地址存储的是一条段描述符,此描述符映射物理地址0xB00000000~0xb00fffff共1M的物理地址空间,虚拟地址的低20位(0x45678)为段内地址的偏移,虚拟地址0x12345678对应的物理地址是0xB0045678,该物理地址存放的数据为0x57280000,所以CPU读取到的数据为0x57280000
2.4 再补充一张段映射的系统框图
文章最后,根据下图再巩固一下段映射的过程