---- 整理自狄泰软件唐佐林老师课程
1. 突破限制的思路
-
限制:主引导程序的代码不能超过512字节
-
主引导程序完成:
- 完成最基本的初始化工作
- 从存储介质中加载程序到内存
- 将控制权交由新加载的程序执行
- ……
问题:
- 主引导程序如何加载存储介质中的其它程序?
- ==> 文件系统
2. 文件系统
存储介质上组织文件数据的方法(数据组织的方式)
FAT12文件格式 | 数据区 |
根目录区 | |
FAT2 | |
FAT1 | |
引导扇区 |
- 文件系统示例:
- FAT12是DOS时代的早期文件系统
- FAT12结构简单,一直沿用于软盘
- FAT12的基本组织单位:字节 < 扇区 < 簇
- 字节(Byte):基本数据单位
- 扇区(Sector):磁盘中的最小数据单元
- 簇(Cluster):一个或多个扇区
3. 解决方案
- 使用FAT12格式对软盘(data.img)进行格式化,之后可以自由得在软盘上拷贝文件
- 编写可执行程序Loader(loader.asm),并将其拷贝到软盘中
- 主引导程序Boot(boot.asm)按照FAT12的文件格式在文件系统中查找Loader
- 将Loader复制到内存中,并跳转到Loader入口处执行
4. 实验:往虚拟软盘fd中写入文件
4.1 准备
FreeDos,Bochs,bximage
4.2 步骤
- 创建虚拟软盘data.img(创建虚拟软盘在《02 - Hello, DTOS》中已经有实验过)
bximage
- 在FreeDos中进行格式化(data.img被格式化成FAT12文件格式)
format B:
- 将data.img挂载到Linux中,并写入文件
注:这里挂载到Linux下是为了写一些文件到data.img,写完后从Linux卸载,文件就保存在了data.img中,然后再通过FreeDos启动,可以查看data.img中的文件
mount -o loop data.img /mnt/hgfs/mount_files/
umount /mnt/hgfs/mount_files/
经过步骤3后,结果如下:
5. 下一步的工作
Boot查找目标文件(Loader),并读取文件的内容。
6. 深入FAT12文件系统
FAT12文件系统由 引导区、FAT表、根目录项表和文件数据区 组成。
扇区位置 | 长度 | 内容 |
---|---|---|
0 | 1(512Bytes) | 引导程序 |
1 | 9(4608Bytes) | FAT表1 |
10 | 9(4608Bytes) | FAT表2 |
19 | 14(9728Bytes) | 目录文件项 |
33 | ...... | 文件数据 |
6.1 FAT12的主引导区
- 主引导区存储的比较重要的信息是 文件系统的类型,文件系统逻辑扇区总数,每簇包含的扇区数,等等。
- 主引导区最后以 0x55aa 两个字节 作为结束,主引导区共占用 一个扇区(512字节)。
6.1.1 实验:读取虚拟软盘data.img中的文件系统信息
-
步骤:
- 创建Fat12Header结构体类型
- 使用文件流读取前512字节的内容
- 解析并打印相关的信息
-
实验内容:
https://gitee.com/wuxiang16/myos/blob/master/04/Fat12Test/main.cpp -
实验结论:
- FreeDos中的format程序在格式化软盘的时候自动在第0扇区生成了一个主引导程序,这个主引导程序只打印一个字符串。
- 文件格式和文件系统都是用于定义数据如何存放的规则,只要遵循这个规则就能够成功读写目标数据。
6.1.2 问题
- 如何在FAT12根目录中查找是否存在目标文件?
6.2 FAT12文件系统中的根目录区
6.2.1 根目录区的大小和位置
6.2.2 根目录区的目录项
根目录区由 目录项 构成,每一个目录项代表根目录中的 文件索引
6.2.3 实验:读取FAT12文件系统的根目录信息
步骤:
创建根目录RootEntry结构体类型
使用文件流顺序读取每个目录项的内容
解析并打印相关的信息
目录项中的关键成员
DIR_Name:文件名(用于判断是否为目标文件)
DIR_FstClus:文件数据起始存储位置(用于确定读取位置)
DIR_FileSize:文件大小(用于确定读取的字节数)
6.3 FAT表-FAT12的数据组织核心
- FAT1和FAT2是 相互备份 的关系,数据内容 完全一致
- FAT表是一个 关系图,记录了 文件数据的 先后关系
- 每一个FAT表项占用 12比特
- FAT表的 前2个 表项 规定不使用
问题:
- 假设现在一个文件需要5个簇才能将文件内容存储完, 那这5个簇是如何分布的?是连续的还是离散的?
- 怎么确定这些簇之间的先后关系?
6.3.1 FAT表中的先后关系
- 以 簇(FAT12中 一簇 等于 一扇区)为单位存储文件数据
- 每个表项(
vec[i]
)表示文件数据的实际位置(簇)- DIR_FstClus 表示文件第0簇(扇区)的位置
- vec[ DIR_FstClus ] 表示文件第1簇(扇区)的位置
- vec[ vec[ DIR_FstClus ] ] 表示文件第2簇(扇区)的位置
- ……
- FAT12 数据物理组织示意(结合逻辑示意图进行理解):
数据区的数据簇和FAT表中的表项一一对应,就可以解决上述的问题。
- FAT12 数据逻辑组织示意:
6.3.2 实验:加载FAT12中的文件数据
-
步骤:
- 在根目录区查找文件对应的目录项
- 根据目录项的成员可以获取目标文件的起始簇号和文件大小
- 根据FAT表中记录的逻辑先后关系读取数据
-
小贴士:
- FAT表中的每个表项只占用12比特(1.5字节)
- FAT表一共记录了
BPB_BytsPerSec * 9 / 1.5
个表项(总字节数除以每个表项占用的字节数)
-
方案:
- 可以使用一个short(2字节)表示一个表项的值
- 如果表项值 大于等于0xFF8,则说明已经 到达最后一个簇
- 如果表项值 等于0xFF7,则说明 当前簇已经损坏
- 数据区起始簇(扇区)号为 33,地址为 0x4200
- 数据区 起始地址所对应的编号为2
(不为0,FAT表前2个表项规定不使用) - 因此,目标文件的起始簇号 DIR_FstClus 对应的地址 为:
0x4200 + (DIR_FstClus - 2 ) * 512
(因为FAT表 以簇为单位存储文件数据)
-
实验内容
https://gitee.com/wuxiang16/myos/blob/master/05/Fat12Test/main.cpp
7. 小结
-
FAT12根目录区记录了文件的起始簇号和长度
-
通过查找根目录区能够确定是否存在目标文件
-
FAT12文件数据的组织使用了单链表的思想
-
文件数据离散的分布于存储介质中
-
文件数据通过FAT表项进行关联