81-82-83-84-85-86 - 文件系统设计与实现

news2025/2/23 10:47:50

---- 整理自狄泰软件唐佐林老师课程

查看所有文章链接:(更新中)深入浅出操作系统 - 目录

文章目录

  • 1. 问题
    • 1.1 硬盘上最最最简单的文件系统支持方式
    • 1.2 改进思路
    • 1.3 更多细节问题
    • 1.4 文件系统概要设计
    • 1.5 硬盘数据逻辑示意图
    • 1.6 硬盘数据物理组织示意
  • 2. 问题
    • 2.1 硬盘基础概念
    • 2.2 课程中的解决方案
    • 2.3 数据结构设计
    • 2.4 格式化的关键
    • 2.5 编程实验:文件系统的初步实现
  • 3. 问题
    • 3.1 根目录的本质
    • 3.2 根目录逻辑结构
    • 3.3 文件实现的基础:扇区管理
    • 3.4 扇区申请
    • 3.5 一些注意事项
    • 3.6 访问数据扇区对应的分配表项
    • 3.7 核心数据结构及数量关系
    • 3.8 需要实现的部分扇区管理函数
    • 3.9 编程实验:扇区管理函数的实现
  • 4. 问题
    • 4.1 根目录本质回顾
    • 4.2 根目录中创建文件的流程
      • 4.2.1 在根目录中创建文件
      • 4.2.2 CheckStorage() - 写入数据前的检查
      • 4.2.3 在根目录中写入新文件信息
      • 4.2.4 编程实验:在根目录中创建文件
      • 4.2.5 思考
    • 4.3 根目录中查找文件的流程
      • 4.3.1 文件查找的本质
      • 4.3.2 FindFileEntry() - 文件查找的核心
      • 4.3.3 在扇区中查找FileEntry
      • 4.3.4 编程实验:在根目录中查找文件
      • 4.3.5 思考
    • 4.4 在根目录中删除文件
      • 4.4.1 实现思路
      • 4.4.2 根目录中删除文件的流程
      • 4.4.3 关键细节
      • 4.4.4 数据链表中的字节删除
      • 4.4.5 数据链表容量调整
      • 4.4.6 编程实验:在根目录中删除文件
      • 4.4.7 思考
    • 4.5 重命名根目录中的文件
      • 4.5.1 解决方案
      • 4.5.2 根目录中重命名文件的流程
      • 4.5.3 文件重命名
      • 4.5.4 FileEntry写回硬盘
      • 4.5.5 编程实验:在根目录中重命名文件
      • 4.5.6 思考
    • 4.6 读写已经存在的文件
      • 4.6.1 文件读写的常规流程
      • 4.6.2 需要深入思考的问题
      • 4.6.3 文件描述符数据结构设计
      • 4.6.4 文件打开与关闭函数的实现
      • 4.6.5 写文件时需要考虑的问题
      • 4.6.6 文件数据写入函数
      • 4.6.7 编程实验:文件数据写入
      • 4.6.8 思考
    • 4.7 从文件中读取数据
      • 4.7.1 读文件时需要考虑的问题
      • 4.7.2 文件数据读取函数
      • 4.7.3 编程实验:文件数据读取
      • 4.7.4 文件系统中的辅助函数
      • 4.7.5 数据擦除函数的定义与实现
      • 4.7.6 文件读写指针移动函数
      • 4.7.7 FSeek & FTell
      • 4.7.8 编程实验:辅助函数的实现
      • 4.7.9 扩展思考
  • 5. 系列完结

1. 问题

  • 能够读写硬盘扇区是否就可以创建文件?
  • 对硬盘而言只有扇区的概念,没有文件的概念,文件是操作系统中的概念。
  • 文件是 有逻辑关联的数据集合,并且 数据之间有存储上的先后关系
  • 那么,硬盘和文件是如何联系在一起的呢?

1.1 硬盘上最最最简单的文件系统支持方式

  • 一个扇区就是一个文件,则:
    • 文件名就是逻辑扇区号(LBA)
    • 扇区第0字节存储文件长度
    • 文件大小最多511字节

在这里插入图片描述

  • 缺陷:
    • 文件数量太多:用不上那么多文件
    • 文件名不友好:使用不方便
    • 文件容量太小:完全不够用
  • 启示
    • 文件中有一个逻辑上的“指针”,用于标识读写位置
    • 文件背后有一个“缓冲区”,方便指定位置数据读写

1.2 改进思路

  • 支持自定义文件名(仅限制文件名字符数量)
  • 使用硬盘固定位置 文件名扇区号映射
  • 将多个扇区组织在一起,共同存储属于同一文件的数据

在这里插入图片描述
如:DELPHI.TXT文件名和第35号扇区做映射

1.3 更多细节问题

  • 如何区分硬盘上的哪些扇区空闲,哪些扇区被文件使用?
  • 硬盘上的哪个位置记录文件名和扇区的映射关系?
  • 文件内容超过512字节时,如何增加扇区并维护前后关系?

1.4 文件系统概要设计

在这里插入图片描述

1.5 硬盘数据逻辑示意图

在这里插入图片描述

1.6 硬盘数据物理组织示意

在这里插入图片描述

2. 问题

  • 当目标文件需要保存的数据大于512字节时,如何获取更多的存储空间?
    • 选择一个(多个)空闲扇区分配给目标文件使用即可。
  • 如何高效的查询以及获取空闲扇区?
    • 将扇区分配表组织成不同的链表
    • 扇区分配表中的 每个链表 代表 一个文件
    • 未使用的扇区也组织成一个链表(即:空闲链表,每次从头部取扇区,O(1))
    • 文件管理的过程可看作扇区在不同链表中移动的过程

2.1 硬盘基础概念

  • 硬盘分区
    • 对硬盘进行分割,分割成不同的硬盘区域
  • 格式化
    • 格式化是指对硬盘分区进行的一种初始化操作(设置扇区分配表的初始状态,比如说:在扇区分配表中将所有的扇区标记为空闲扇区)
    • 格式化会使得硬盘分区中的所有文件被清除

2.2 课程中的解决方案

  • 将整个硬盘当作唯一分区使用
  • 对硬盘分区进行格式化
    • 建立 引导区根目录区扇区分配表
  • 根目录的本质就是一个文件
    • 目录(文件夹)本质 就是 文件

2.3 数据结构设计

在这里插入图片描述

2.4 格式化的关键

  • 计算扇区分配表的大小(map size):

在这里插入图片描述

  • 构建空闲扇区链表:
    • 将扇区分配表中的所有成员全部组织到空闲链表中

在这里插入图片描述

2.5 编程实验:文件系统的初步实现

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 81

  1. qt上结果如下:

在这里插入图片描述
在这里插入图片描述

  1. 将qt下格式化的“hd.img”放入到D.T.OS路径下,结果如下:

在这里插入图片描述
在这里插入图片描述

3. 问题

  • 如何在根目录区中创建文件?

3.1 根目录的本质

  • 根目录 在文件系统中是一个特殊的文件
  • 根目录中存储了 文件的基本信息(FileEntry
    • FileEntry包含了文件名,文件起始扇区,文件大小等信息

在这里插入图片描述

3.2 根目录逻辑结构

在这里插入图片描述

3.3 文件实现的基础:扇区管理

  • 如何 获取 / 归还 空闲扇区?
  • 如何 查找当前扇区的后续扇区
  • 如何为当前文件 增加 / 删除 一个扇区?
    ……

3.4 扇区申请

在这里插入图片描述

3.5 一些注意事项

  • 扇区操作是一种 外存操作,因此需要仔细计算目标位置
  • 扇区管理时 使用 相对扇区地址扇区读写时 使用 绝对地址
    在这里插入图片描述

●关系如下:
在这里插入图片描述

3.6 访问数据扇区对应的分配表项

  • 分配表项就是管理单元
    • 计算相对扇区地址:offset = si - mapSize - 2
      (注释:即扇区分配表中的第几个扇区)
    • 计算目标扇区:sctOff = offset / MAP_ITEM_CNT
      (注释:一个扇区包含MAP_ITEM_CNT个分配单元,这里的除法算完后即可得到目标在扇区分配表中是第几个扇区)
    • 计算目标扇区内偏移:idxOff = offset % MAP_ITEM_CNT
      (注释:得到扇区分配表中的第几个扇区之后,计算出在该扇区内的偏移,即在该扇区中偏移了几个分配单元)

在这里插入图片描述

3.7 核心数据结构及数量关系

在这里插入图片描述

3.8 需要实现的部分扇区管理函数

在这里插入图片描述

3.9 编程实验:扇区管理函数的实现

  1. 获取 / 归还空闲扇区

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 82 / 00获取归还空闲扇区

在这里插入图片描述
在这里插入图片描述

  1. NextSector测试

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 82 / 01testNextSector

在这里插入图片描述
在这里插入图片描述

  1. 所有扇区管理函数

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 82 / 02

4. 问题

  • 如何在根目录区中 创建文件
  • 申请扇区,写入文件信息数据(FileEntry)
  • 扇区申请成功后,还需要做哪些工作?

4.1 根目录本质回顾

根目录(文件) 中存储的是FileEntry类型 的值,每个FileEntry值表示一个硬盘上的文件。

在这里插入图片描述

4.2 根目录中创建文件的流程

在这里插入图片描述

4.2.1 在根目录中创建文件

在这里插入图片描述

4.2.2 CheckStorage() - 写入数据前的检查

在这里插入图片描述

4.2.3 在根目录中写入新文件信息

在这里插入图片描述

4.2.4 编程实验:在根目录中创建文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 83 / 00在根目录中创建文件

在这里插入图片描述

4.2.5 思考

  • 如何判断在根目录中是否存在指定文件?
  • 直接查找根目录的数据链表,如果文件存在,那么必然能够查找到对应的FileEntry。

4.3 根目录中查找文件的流程

在这里插入图片描述

4.3.1 文件查找的本质

  • 在数据链表中查找FileEntry值

在这里插入图片描述

4.3.2 FindFileEntry() - 文件查找的核心

在这里插入图片描述

4.3.3 在扇区中查找FileEntry

在这里插入图片描述

4.3.4 编程实验:在根目录中查找文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 83 / 01在根目录中查找文件

在这里插入图片描述

4.3.5 思考

  • 如何在根目录中删除文件?

4.4 在根目录中删除文件

4.4.1 实现思路

根据 文件名 在根目录的数据链表中查找FileEntry值
当查找成功时:从数据链表中删除FileEntry值

  • 关键问题:
    FileEntry值的实际位置是在硬盘上,那么如何从硬盘上抹除这个值呢?
  • 解决方案:
    1. 判断目标文件是否打开(只有关闭状态能被删除)
    2. 根据名字查找目标FileEntry的位置(如:FileEntry 2)
    3. 将数据链表中最后一个FileEntry值复制到FileEntry的位置
    4. lastBytes = lastBytes - sizeof(FileEntry)

在这里插入图片描述

4.4.2 根目录中删除文件的流程

在这里插入图片描述

4.4.3 关键细节

  • FileEntry移动时需要保留原inSctIdx和inSctOff的值
    在这里插入图片描述

  • 抹除最后一个FileEntry所占用的空间,即:修改lastBytes,使其减少64字节

  • 扩展问题:

    • 删除最后一个FileEntry之后,如果lastBytes的值为0,那么应该做什么样的操作?
    • 归还扇区的操作

4.4.4 数据链表中的字节删除

在这里插入图片描述

4.4.5 数据链表容量调整

在这里插入图片描述

4.4.6 编程实验:在根目录中删除文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 84 / 00在根目录中删除文件

在这里插入图片描述
在这里插入图片描述

4.4.7 思考

  • 如何重命名根目录中的文件?

4.5 重命名根目录中的文件

4.5.1 解决方案

  1. 判断目标文件是否已经打开(只有关闭状态能重命名)
  2. 根据名字查找目标FileEntry的位置(如:FileEntry 4)
  3. 查找新名字是否已经被占用
    • 如果没有占用,修改目标FileEntry的name成员
    • 如果已经占用,返回失败

4.5.2 根目录中重命名文件的流程

在这里插入图片描述

4.5.3 文件重命名

在这里插入图片描述

4.5.4 FileEntry写回硬盘

在这里插入图片描述

4.5.5 编程实验:在根目录中重命名文件

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 84 / 01在根目录中重命名文件

在这里插入图片描述
在这里插入图片描述

4.5.6 思考

  • 如何 读写 已经存在的文件?

4.6 读写已经存在的文件

4.6.1 文件读写的常规流程

在这里插入图片描述

4.6.2 需要深入思考的问题

  • 打开一个文件意味着什么?
  • 如何高效的标识已打开的文件?
  • 读写文件数据时必须操作硬盘吗?
  • 如何指定读写文件的位置?
  • ……

4.6.3 文件描述符数据结构设计

文件描述符 需要反映当前文件的状态,如:文件名,读写位置,文件长度,等。

4.6.4 文件打开与关闭函数的实现

  • FOpen:

在这里插入图片描述

  • FClose:

在这里插入图片描述

4.6.5 写文件时需要考虑的问题

  • 需要写入的数据量与文件读写指针的关系
    如:当缓冲区满时,需要如何处理?
  • 写入数据的同时,文件数据链表是否发生变化?
    如:对刚创建的文件写入数据时会发生什么?

4.6.6 文件数据写入函数

在这里插入图片描述

  • 缓冲区的准备

在这里插入图片描述

  • 缓冲区数据写入

在这里插入图片描述

4.6.7 编程实验:文件数据写入

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 85

在这里插入图片描述
在这里插入图片描述

4.6.8 思考

  • 如何从文件中读取数据?

4.7 从文件中读取数据

4.7.1 读文件时需要考虑的问题

  • 需要读取的数据量与文件读写指针的关系
    如:文件数据总量小于读取需求量,该如何处理?
  • 读取数据时,文件数据数据缓冲区如何变化?即:是否需要使用数据缓冲区?

4.7.2 文件数据读取函数

在这里插入图片描述

  • 缓冲区数据读取

在这里插入图片描述

  • 辅助函数的实现

在这里插入图片描述

4.7.3 编程实验:文件数据读取

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 86 / 00文件数据读取

在这里插入图片描述
在这里插入图片描述

4.7.4 文件系统中的辅助函数

在这里插入图片描述

4.7.5 数据擦除函数的定义与实现

在这里插入图片描述

4.7.6 文件读写指针移动函数

在这里插入图片描述

4.7.7 FSeek & FTell

在这里插入图片描述

4.7.8 编程实验:辅助函数的实现

【参看链接】:81-82-83-84-85-86 - 文件系统设计与实现 / 86 / 01辅助函数的实现

在这里插入图片描述
在这里插入图片描述

4.7.9 扩展思考

  • 有了文件系统后,内核可以发生怎样的变化?

5. 系列完结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422786.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

文心一言 VS chatgpt (8)-- 算法导论2.3 5~6题

五、回顾查找问题(参见练习 2.1-3),注意到,如果序列 A 已排好序,就可以将该序列的中点与v进行比较。根据比较的结果,原序列中有一半就可以不用再做进一步的考虑了。二分查找算法重复这个过程,每次都将序列剩余部分的规…

数据结构之七大排序

数据结构之七大排序🔆排序的概念及其运用排序的概念常见的排序算法🔆插入排序直接插入排序希尔排序🔆选择排序直接选择排序堆排序🔆交换排序冒泡排序快排🔆归并排序🔆非比较排序🔆结语&#x1f…

深度探索list

1.list的基本组成 list是一个双向链表,它的基本组成就是 成员作用prev指针指向上一个元素next指针指向下一个元素data用来保存数据2.list的迭代器 由于人们一般习惯于:迭代器是找到下一个元素,迭代器–是找到上一个元素。在双向链表list中…

C++的命名空间

C和C语言是有一些相似的地方的,而且C就是C语言的改进版本,所以学习C也得学习C语言,但是他们又是有很多不同的地方 下面我们就看一下C的命名空间 我们首先看一下 如果是这一段代码,那么这里输出的是多少呢? 很好这里输…

Nacos服务端服务注册源码分析 - 篇四

Nacos服务端服务注册源码分析 - 篇四 服务端调用接口 嗨 ~~~ 上班除了无聊的摸鱼,我还学了一个新技能,偷偷写博客。。。。 我们先回忆一下之前的三篇文章 🕐Nacos 客户端服务注册源码分析-篇一 🕑Nacos 客户端服务注册源码分析…

路由器的两种工作模式及快速通过express搭建微型服务器流程,解决刷新页面服务端404的问题

history模式与hash模式 首先这个#叫做hash,最大的特点就是不会随的http请求,发给服务器。 默认的模式是hash模式,如果想要修改,可以在router里面的index.js中配置mode属性, 它们俩直接的区别最明面上的有没有#和hist…

Python第三方库安装

看见更大的Python世界 Python社区PyPI The Python Package Index PyPI: Python Package Index PSF维护的展示全球Python计算生态的主站 学会检索并利用PyPI,找到合适的第三方库开发程序 实例:开发与区块链相关的程序 第1步:在pypi.org…

【服务器数据恢复】EVA存储数据硬盘掉线导致LUN不可用的数据恢复

服务器数据恢复环境: HP-EVA存储环境:EVA某型号控制器EVA扩展柜FC硬盘。 服务器故障: EVA存储中两块磁盘掉线导致存储中某些LUN丢失不可用。 服务器数据恢复过程: 1、首先对故障存储中所有磁盘做物理故障检测,经过…

在Spring Boot微服务使用RedisTemplate操作Redis

记录:400 场景:在Spring Boot微服务使用RedisTemplate操作Redis缓存和队列。 使用ValueOperations操作Redis String字符串;使用ListOperations操作Redis List列表,使用HashOperations操作Redis Hash哈希散列,使用SetO…

基于LNMP架构搭建网站

一、编译安装Nginx 服务 1、编译安装Nginx 服务的操作步骤 systemctl stop firewalld systemctl disable firewalld setenforce 01.1 安装依赖包 yum -y install pcre-devel zlib-devel gcc gcc-c make1.2 创建运行用户 useradd -M -s /sbin/nologin nginx1.3 编译安装 cd…

Claude注册安装教程【403 Forbidden】

Claude注册安装教程 尝试注册Claude的兄弟需要注意,最后一步需要科学上网 本来打算看看csdn,结果可能是时效性,和我情况不一样 按照他们的意思,点击add a stack 就进去了,我却被403 这个时候我就搜索stack,…

钢网是SMT生产使用的一种工具,如何制作?

钢网是SMT生产使用的一种工具,其主要功能是将锡膏准确地涂敷在有需要焊接的PCB焊盘上。 钢网的好坏,直接影响印刷工作的质量,目前一般使用的金属钢网,是由薄薄的、带有小孔的金属板制作成的,在开孔处,锡膏…

React中Context的使用,跨组件传值

目录Context 是什么?使用ContextXxx.Provider正式使用Context中的数据Context 是什么? Context 提供了一个无需为每层组件手动添加 props,就能在组件树间进行数据传递的方法。 在一个典型的 React 应用中,数据是通过 props 属性自…

容器镜像的设计原理

1 概述: 1.1 历史概要 2016年,Docker制定了镜像规范v2,并在Docker 1.10中实现了这个规范。镜像规范v2分为Schema 1和Schema 2。 Schema 1主要兼容使用v1规范的Docker客户端(从2017年2月起,镜像规范v1不再被Registry支…

云计算基础——云服务

目录 云服务概述 云服务简介 云服务的产生和发展 云服务产生的前提: 接入云端的主要前端工具: 云服务的优缺点 优点 缺点 云服务的类型 SaaS PaaS IaaS 云部署模型 云服务概述 云服务简介 云计算通过使计算分布在大量的分布式计算机上&…

在线旅游变局:新老玩家的攻与防、危与机

配图来自Canva可画 五一小长假未到,大学生、职场人就早早制定了旅游路线,准备了旅游装备,还预订了机票和酒店。这边消费者们旅游之心急不可待,那边各地文旅局发布旅游消费券、完善旅游设施配套、花式宣传本地特色,使浑…

城市轨道交通列车时刻表优化问题【最优题解】

文章目录城市轨道交通列车时刻表优化问题思路文章底部城市轨道交通列车时刻表优化问题 最新进度在文章最下方卡片,加入获取思路数据代码论文:2023十三届MathorCup交流 (第一时间在CSDN分享,文章底部) 题目为数据分析类题目。列车时刻表优化…

基于.Net开源Html解析器,此外还支持SVG、XML等格式

今天给大家推荐一个Html解析器,可以用于网络爬虫Html源码的解析、Html源码编辑等场景。 项目简介 这是一个基于.Net开发的,Html代码解析器,支持通过C#实现类似Jquery的方式来解析Html源码、节点创建、节点删除、节点修改、属性的添加修改等&…

【算法与数据结构】3 知行合一,线性查找的自定义类测试

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流 本文收录于算法与数据结构体系专栏,本专栏对于0基础者极为友好,欢迎与我一起完成算法与数据结构的从0到1的跨越 线性查找的测试应用1.前言2.使用自定义类测试2.1⛏创建Student类并测…

记录一下verilog重复例化的两种方式

文章目录0 前言1 for循环方式例化方法2 数组的方式例化4 一些其他的技巧0 前言 这段时间例化了挺多mem,过程中也了解到了一些新的东西,在这里记录一下 1 for循环方式例化方法 先给出 sub_module module sub(input [7:0] din,output logic [7:0] dout…