Linux入门---页表的理解

news2025/1/18 9:47:17

目录标题

  • 第一次认识页表
  • 第二次认识页表
  • 如何看待页表
  • 页表的大致构成

第一次认识页表

我们第一次认识页表是在介绍地址空间的时候,我们知道操作系统将内存划分为好几个区域,比如说栈区,堆区,未初始化区,已初始化区,代码区,每个区的大小不同所对应的功能也不同,并且在内存中每个字节大小的空间都有一个属于自己的地址,通过这个地址我们就可以访问到内存中具体某个位置所记载的内容,地址从0x00000000开始一直到0xFFFFFFFF结束所以在内存中又有高地址和低地址之分,那么我们就可以简单的画出一个内存的图片出来:
在这里插入图片描述
那么这就是我们之前学的内存地址空间的分布,我们平时写的程序和程序在运行的过程中产生的数据就会存放在内存上面,但是我们能向内存上申请非常大的一块数据吗?内存上的每个地址都能被访问被修改吗?答案是肯定不行的因为内存在计算机的组成中有着很大的作用,如果我们向内存申请了很多的空间但是却不对该空间进行使用的话是不是就照成了空间的浪费了呢?你一个进程申请了那么多的空间但是整个计算机中并不只有你一个进程在运行啊!你把内存都申请完了,那其他的进程该怎么存储数据呢?同样的道理进程不能够访问内存上的所以地址上的内容,因为在操作系统中,有些内存空间是被保护的,只有特权级别高的程序才能访问。这些被保护的内存空间包括操作系统的内核空间、硬件设备的映射空间等,既然不是所有的地址都能被访问那就跟不要谈的地址上的所有内容能被修改了,如果内存地址上的内容都能被修改的话,那就很难保护内存上的重要数据被恶意程序修改,所以内存是一个很脆弱的东西,如果将内存直接暴露给用户使用的话就很容易出现问题,出现问题的原因就是用户违规申请,违规使用,违规访问了,但是要想让每个用户都按规范几乎不可能,而且内存上的数据一旦被修改了就很难恢复了,所以我们只能对内存进行保护,那如何保护呢?答案就是迷惑进程我们创建一个名为mm_struct的数据结构

struct mm_struct
{
	uint32_t code_start,code_end;
	uint32_t date_start,date_end;
	uint32_t heap_start,heap_end;
	uint32_t stack_start,stack_end;
}

这个数据结构可以维护一个跟内存一摸一样的虚拟内存,我们把这个虚拟内存称之为虚拟地址空间,操作系统每创建一个进程的时候都会给该进程分配一个该数据结构对象,因为维护出来的虚拟地址空间跟内存看起来一摸一样,所以进程申请,访问,修改内存的数据时就可以无缝扭转的对虚拟地址进行操作,这样即使有一些违规的操作也不会伤害物理内存而是伤害虚拟内存,
在这里插入图片描述

但是玩归玩闹归闹不拿虚拟地址空间的生命开玩笑,虽然虚拟地址空间上不会跟内存记录一样的数据,但是当访问出现问题的时候我们还是得知道的,比如说申请很多的空间,内存肯定是不会给的,但是虚拟地址空间可以给啊,他修改一下内部变量的值就可以了,至于这块空间你用不用用多少最后虚拟内存再根据你的真实情况才会向物理内存申请合适的空间,再比如说修改内存上的值,进程得先访问虚拟内存然后再修改内存上的值,如果虚拟内存在映射到物理内存的过程中发现有问题就会停止本次的访问和修改,那么这就是虚拟内存的好处,他可以保护物理内存,但是光光一个虚拟地址空间还是不够的,我们上面说虚拟地址空间要映射到物理内存上去,物理内存和虚拟内存是有很强的关联的,那么要维持这个关联要完成虚拟内存到物理内存上的映射靠的就是页表:
在这里插入图片描述
所以通过这里我们就知道虚拟地址空间上是通过页表转换到物理内存上的地址,当出现违规访问和修改的时候页表在转换的过程中将其拦截下来,那么这就是我们第一认识的页表,他只有一个映射地址空间和检查空间的访问和修改是否合理的功能。

第二次认识页表

我们第二次认识页表是在学习信号的时候,我们说操作系统会在合适的时间检查是否收到了信号,也就是检查pending表和block表里面值,判断是否需要处理,如果需要处理就在handler表上查找对应的方法,那么这里就有个问题:什么是合适的时候?答案是从内核态转换到用户态的时候就会检查一下那三张表的内容,因为那三张表属于操作系统管理的内容,作为用户身份的我们是没有能力查看三张表的内容的,所以得将当前的身份转换成为内核态,又因为将身份从用户态转到内核态换会消耗一些资源所以从每次从内核态转换到用户态的时候操作系统都会想来都来了要不再消耗点资源检查一下是否有信号要被处理吧,所以从内核态转换到用户态的时候都会检查一下那三个表,既然我们知道了内核态转换到用户态会检查一下三张表,那么什么时候从用户态转换到内核态呢?那么这就跟我们写的程序有关,我们在写程序的时候难免会访问到操作系统的资源(getpid,waitpid)和硬件资源(printf,read,write),当我们访问操作系统的资源或者硬件资源的时候,我们都得直接或者间接的访问系统提供的借口,通过这些接口来访问操作系统的资源,我们把这些接口称为系统调用
在这里插入图片描述
虽然将其称之为接口,但是这些接口本质上还是函数,既然是函数就有内容,有内容就要被执行,那么在执行这些函数内容的时候必须得以内核态的身份来执行:
在这里插入图片描述所以在执行系统调用访问硬件资源操作系统资源的时候就会将身份从用户态转换到内核态然后执行对应系统调用的代码,这些代码一定是在开机的时候由硬盘加载进内存里面,然后进程在访问的时候也是先通过虚拟地址空间加上页表来访问对应在内存上的系统调用代码,但是这里就存在一个问题我们知道操作系统的代码通常是在内存中的固定位置,这是因为操作系统需要在启动时加载到内存中,并且需要一直运行,因此需要一个固定的位置来存储它的代码和数据,在一些嵌入式系统中,操作系统的代码可能会被编译成只读存储器(ROM)中,以确保其不会被修改,也就是说在内存上操作系统的代码是固定的,并且一般情况下,操作系统有关的代码在不同进程的虚拟地址空间上是相同位置的。这是因为操作系统内核代码是共享的,每个进程都有自己的虚拟地址空间,但是内核代码在所有进程中都是相同的,因此它们在不同进程的虚拟地址空间上的位置是相同的。这也是为什么操作系统可以在不同进程之间共享内存的原因之一,那么这就说明操作系统的代码在内存和虚拟地址空间上的位置都是固定的,而我们之前说操作系统每创建一个进程的时候都会创建对应的页表来完成映射,也就说操作系统如果有10个进程那么就会有10个页表,但是操作系统对应的代码不管是在内存上还是在虚拟地址空间上都是固定的啊,每个进程都可以访问这部分的代码,那创建多个页表来完成这部分的转换是不是有点多余啊对吧,我们只创建一个页表然后所有的进程共用这个页表不就可以了吗?所以我们之前讲的页表是用户级页表用来完成0~3GB的地址空间到内存的转换,然后内存还剩下的4-4GB的空间就靠内核级页表来进行映射,因为页表两侧的地址都是固定的,所以内核级页表就只有一个:
在这里插入图片描述
那么这就是我们第二次认识的页表。

如何看待页表

在c语言中str="hello world"运行的时候是不会报错的,比如说下面的代码:

#include<stdio.h>
int main()
{
	char* s = "abc";
	return 0;
}

代码的运行结果如下:
在这里插入图片描述

但是使用*str="world hello"就会报错:

#include<stdio.h>
int main()
{
	char* s = "abc";
	*s = 'a';
	return 0;
}

在这里插入图片描述
加上const并修改的话也是会报错的但是这个报错是语言上的报错并不是系统上的报错,之所以出现这样的原因是因为常量区位于已初始化数据和代码区之间,这部分区域的数据是不允许被修改的,那操作系统是怎么知道我们要对这部分的数据进行修改的呢?答案是通过页表来得知的,页表包含几个部分:物理地址,是否命中,rwx权限,U/K权限
在这里插入图片描述

当对地址解引用的时候虚拟地址会映射到物理地址,然后页表中就会记录这个地址的RWX权限,常量区中的权限是没有W的但是刚刚的操作是W操作,所以当页表就发现执行行为出现了异常,mmu就会对当前的操作进行终止,终止的方式就是硬件报错,然后操作系统再将报错直接转换称为信号发送给进程,进程就会处理这个信号并退出,U/K就表示访问当前区域的权限,当进程访问某个区域的时候操作系统就会根据页表来判断当前的cpu的运行级别是是内核级别还是用户级别,内核级别才能访问带K的,用户级别只能访问U的,看到了这里想必大家能够更加的理解页表的功能,那我们应该如何看待页表呢?
1:地址空间是进程能看到的资源窗口。
2.:页表决定进程真正拥有的资源亲况。
3:合理的对地址空间+页表进行资源划分,我们就可以对一个进程的所有资源进行分类,地址空间划分为哪些区域,页表再将不同的区域映射到内存的不同的区域。

页表的大致构成

地址空间存在2^32个地址,如果页表要对应内存上的每个地址的话那与之对应的页表中就应该存在2^32个条目来进行映射,假设每个条目的类型为6个字节,那么这样的话光一个页表就需要24GB的空间,这还只是一个页表如果存在多个页表的话大小将不敢想象,所以我们之前的对页表的理解是不正确的,虚拟地址有32个比特位,而操作系统为了方便管理物理内存,将物理内存分为一个一个的数据块(也可以称之为数据页),因为操作系统要对物理内存进行管理,管理的方式也是先描述再组织,所以有一个名为page的结构体,这个结构体里面包含有内存的属性(大小很小),这些属性就管理这4KB大小的内存,在操作系统中我们就把这样4KB的大小的物理内存称为页框,那么操作系统要想管理物理内存就只需要管理page结构体就行,这样操作系统就知道内存哪些地方被使用了,哪些地方没有被使用,所以操作系统就采用一个名为伙伴系统的管理算法来管理着物理内存,其次磁盘在编译生成对应的可执行程序的时候,其实也是被划分称为一个一个4KB的数据块的,那么我们把磁盘中的一个一个4KB数据就称为页帧,那么将磁盘的数据搬到内存中时不是一个字节一个字节的搬而是4KB的4KB的搬,虚拟地址有32个比特位,那么我们把32个比特位分为10 10 12
在这里插入图片描述

而且页表不只有一张页表,第一个页表称为页目录这个目录里面存放着2^10个索引也就对应着虚拟地址的前10个比特位:
在这里插入图片描述
2^10也就差不多1KB的大小,假设每个条目的大小为10个字节,那么这个页目录的大小就是10KB的大小,因为页目录中的每个元素都是索引,所以他们也指向了一个对象,我们把这个对象称为页表项也可以叫为页表,而每个页表又有2^10个元素,所以每个页表就对应的是地址中的10个比特位
在这里插入图片描述
而页表中每个元素记录的是页框的起始物理地址,因为页框的大小刚好为4KB也就是2的12次方,也就刚好是32个比特位中的最后12个:
在这里插入图片描述
所以虚拟地址在向物理地址进行映射的时候首先根据虚拟地址的前10个比特位结合数组的起始位置和偏移量就可以找到页目录中指向的元素,找到对应的页表之后就又可以根据32个比特位的中间10个比特位找到页表中的指定元素,根据该元素我们就可以找到对应页框在内存上的起始地址,得到该地址之后就可以根据32个比特位中的最后12个比特位和页框的起始地址找打数据位于页框的具体位置,因为每个变量都有自己具体的大小,然后根据该变量的大小往后边偏移边读取就可以得到我们想要的所有数据,这就是为什么我们在写c语言取地址的时候得到都是起始地址,而不是所有地址,因为根据起始地址加上大小进行偏移就可以了,那么这就是页表的构成,并且并不是每个页表都需要创建,当页目录中不需要某个页表的时候就可以不创建该页表,所以页表的创建就变成了按需申请进而再减小了页表所占用的内存所以经过上面的操作页表的占用的空间一点都不大了,那么这就是页表构成希望大家能够理解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1104146.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

力扣刷题 day47:10-17

1.位1的个数 编写一个函数&#xff0c;输入是一个无符号整数&#xff08;以二进制串的形式&#xff09;&#xff0c;返回其二进制表达式中数字位数为 1 的个数&#xff08;也被称为汉明重量&#xff09;。 方法一&#xff1a;逐个判断 利用n&1 #方法一&#xff1a;逐个…

重载、重写(覆盖)与重定义(隐藏)

重载、重写&#xff08;覆盖&#xff09;与重定义&#xff08;隐藏&#xff09; 重载隐藏&#xff08;重定义&#xff09;多态&#xff1a;重写&#xff08;覆盖&#xff09; 三者的区别 重载 必须是在一个作用域&#xff0c;函数名相同&#xff0c;参数不同&#xff08;个数不…

C复习-基础知识

参考&#xff1a; 里科《C和指针》Bryant, Hallaron 《深入理解计算机系统》何昊&#xff0c;叶向阳《程序员面试笔试宝典》 从hello.c到可执行文件hello 在Unix系统中&#xff0c;从源文件到目标文件的转化是由编译器驱动程序完成的&#xff1a; root> gcc -o hello hel…

RTOS(4)自己的第一个FreeRTOS程序

创建两个任务 什么是任务呢&#xff1f; 对于整个单片机程序&#xff0c;我们称之为application&#xff0c;应用程序。 使用FreeRTOS时&#xff0c;我们可以在application中创建多个任务(task)&#xff0c;有些文档把任务也称为线程 (thread)。 void Task1Function(void *p…

课时4作业3

Description 某人想将手中的一张面值100元的人民币换成10元、5元、2元和1元面值的票子。要求换正好40张&#xff0c;且每种票子至少一张。问&#xff1a;有几种换法&#xff1f; Input 无输入 Output 一个数&#xff0c;表示共有多少种换法 Sample Input 1 无 Sample O…

手写一个PrattParser基本运算解析器1: 编译原理概述

点击查看 基于Swift的PrattParser项目 编译原理概述 编译原理是我们每一个程序猿必须要了解的技能, 编译原理实际上并没有啥高深的技术, 我们如果在做业务开发, 也很少会用到编译开发的知识, 但是编译原理又是我们必备的基础知识之一. 所以我们需要对编译原理的内容有一个大概的…

76.C++ STL list容器

目录 1.什么是list容器 2.list构造函数 3. 元素插⼊和删除操作 4.大小操作 5.赋值操作 6.数据存取操作 7.反转、排序 1.什么是list容器 list 是 C 标准库提供的双向链表容器。它与 vector 和 deque 不同&#xff0c;不是连续的内存块&#xff0c;而是由节点组成的链表结…

C语言——二周目——数据在内存中的存储

目录 一、整数的存储方式 二、浮点数的存储方式 一、整数的存储方式 因为CPU只有加法器&#xff0c;所以对于整型来说&#xff0c;数据在内存中通常采用补码的方式进行储存。 在这里复习一下原码、反码、补码。 正数和无符号数的原码、反码、补码相同&#xff1b; 负数的原…

考察软件开发公司的能力

当公司需要与软件外包公司合作时需要考察软件开发公司的能力和水平&#xff0c;这会涉及到很多方面的因素。需要通过综合考察和了解软件开发公司的能力和水平&#xff0c;选择合适的合作伙伴&#xff0c;确保项目的成功交付。下面分享一些关键步骤和方法&#xff0c;希望对大家…

【JVM】JVM的垃圾回收机制

JVM的垃圾回收机制 对象死亡判断方法引用计数算法可达性分析算法 垃圾回收算法标记清除法复制算法标记整理算法分代算法 Java运行时内存的各个区域,对于程序计数器,虚拟机栈,本地方法栈这三个部分区域而言,其生命周期与相关线程有关,随线程而生,随线程而灭,并且这三个区域的内存…

Excel冻结窗格

1、冻结表格首行 点击菜单栏中的“视图”&#xff0c;选择“窗口”选项卡中的“冻结窗格”下的小三角&#xff0c;再选择“冻结首行”&#xff1b; 2.冻结表格首列 点击菜单栏中的“视图”&#xff0c;选择“窗口”选项卡中的“冻结窗格”下的小三角&#xff0c;再选择“冻结…

图扑智慧仓储数据可视化监控平台

随着市场竞争加剧和市场需求的不断提高&#xff0c;企业亟需更加高效、智能且可靠的仓储物流管理方式&#xff0c;以提升企业的物流效率&#xff0c;减少其输出成本&#xff0c;有效应对市场上的变化和挑战。 图扑软件应用自研 HT for Web 产品搭建的 2D 智慧仓储可视化平台&a…

【轻松搞定】Edge 或 Google 无法上网问题

目录 前言 一、解决 Edge 无法上网的问题 1.1 键盘按下 WIN R 或 右键开始标志&#xff0c;启动运行 1.2 输入 regedit 进入注册表管理 1.3 打开到 \HKEY_LOCAL_MACHINE\SOFTWARE\Policies\Microsoft 位置下新建项 Edge 1.4 右键 Edge 新建 DWORD (32) 文件&#xff0c…

<FPGA>好的编码风格(1)--尽量避免组合逻辑环路(Combinational Loops)

什么是组合逻辑环路&#xff1f; 组合逻辑环路&#xff08;Combinational Loops&#xff09;&#xff1a;指组合逻辑的输出信号不经过任何时序逻辑&#xff08;FF等&#xff09;&#xff0c;而是直接反馈到输入节点&#xff0c;从而构成的电路环路。 此外&#xff0c;如果直接将…

【开源分享】基于Html开发的房贷计算器,模仿新浪财经

房贷计算器是一种房贷计算的在线计算Web应用&#xff0c;按用户选择的贷款类型、贷款金额、期限、利率可计算得出每月月供参考、支付利息、还款总额这些信息。本文模仿新浪财经开发的房贷计算器。 作品预览 https://fangdai.gitapp.cn 源码地址 https://github.com/geeeeeee…

Qt5.12.12构建64位QMYSQL数据库驱动“driver not loaded”

在调用QSqlDatabase::open()时,会报错:“driver not loaded” 原因实际上是mysql 的驱动 qsqlmysql.dll 没有成功加载。 所以本篇文章将详细介绍一下:Qt5.12.12如何构建64位QMYSQL数据库驱动。 执行 写在最前,以下出现的文件路径为我自己电脑安装的路径,可根据自己的路…

vim快捷指令

普通模式—>插入模式 i:插入到当前光标的前面&#xff08;insert&#xff09; a:插入到光标的后面&#xff08;append&#xff09; o:插入到下一行 I:插入到行首 A:插入到行尾 O&#xff1a;插入到前一行 H:行首 L:页的最后一行的行首 W:光标跳到下一个单词词首 b:上一个单…

广州华锐互动:VR模拟高楼层建筑应急逃生,提供身临其境的虚拟体验

随着城市化进程的不断加速&#xff0c;高层建筑越来越多地出现在我们的生活中。然而&#xff0c;高层建筑的安全问题也日益凸显。一旦发生火灾、地震等突发事件&#xff0c;如何迅速、安全地逃离高楼成为了人们关注的焦点。近年来&#xff0c;虚拟现实&#xff08;VR&#xff0…

JUC并发编程——ForkJoin与异步回调

ForkJoin &#xff08;分支合并&#xff09; 什么是ForkJoin ForkJoin在JDK1.7出现 &#xff0c;并行执行任务&#xff0c;在大数据量下&#xff0c;能够提高效率 讯飞星火提供的说法&#xff1a; Forkjoin是一种并行计算的算法&#xff0c;用于将一个大任务分解为多个小任务…

【PSO-RFR预测】基于粒子群算法优化随机森林回归预测研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…