4.1_4 文件的物理结构

news2024/11/16 20:25:55

文章目录

  • 4.1_4 文件的物理结构
    • (一)文件块、磁盘块
    • (二)文件分配方式——连续分配
    • (三)文件分配方式——链接分配
      • (1)链接分配——隐式链接
      • (2)链接分配——显式链接
    • (四)文件分配方式——索引分配
  • 总结

4.1_4 文件的物理结构

image-20240317170152691

image-20240317170243206

(一)文件块、磁盘块

image-20240317170338420

  在内存管理中,进程的逻辑地址空间被分为一个一个页面。

  同样的,在外存管理中,为了方便对文件数据的管理,文件的逻辑地址空间也被分为了一个一个的文件“块”

  于是文件的逻辑地址也可以表示为(逻辑块号,块内地址)的形式。

image-20240317170551305

(二)文件分配方式——连续分配

  连续分配方式要求每个文件在磁盘上占有一组连续的块

image-20240317170756328

image-20240317170819264

image-20240317170840755

  用户给出要访问的逻辑块号,操作系统找到该文件对应的目录项(FCB)…

  物理块号 = 起始块号 + 逻辑块号

  当然,还需要检查用户提供的逻辑块号是否合法(逻辑块号 ≥ 长度 就不合法)。

  可以直接算出逻辑块号对应的物理块号,因此连续分配支持顺序访问和直接访问(即随机访问)


image-20240317171159362

  读取某个磁盘块时,需要移动磁头。访问的两个磁盘块相隔越远,移动磁头所需时间就越长。

  结论:连续分配的文件在顺序读/写时速度最快


image-20240317171336440

  若此时文件A要拓展,需要再增加一个磁盘块(总共需要连续的4个磁盘块)。

  由于采用连续结构,因此文件A占用的磁盘块必须是连续的。 因此只能将文件A全部“迁移”到绿色区域。

  结论:物理上采用连续分配的文件不方便拓展


image-20240317171459834

  结论:物理上采用连续分配, 存储空间利用率低,会产生难以利用的磁盘碎片

  可以用紧凑来处理碎片,但是需要耗费很大的时间代价。


连续分配——总结

  连续分配方式要求每个文件在磁盘上占有一组连续的块

  优点:支持顺序访问和直接访问(即随机访问);连续分配的文件在顺序访问时速度最快。

  缺点:不方便文件拓展;存储空间利用率低,会产生磁盘碎片。

(三)文件分配方式——链接分配

  链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接显式链接两种。

(1)链接分配——隐式链接

image-20240317171828272

image-20240317171849185

  用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)…

  从目录项中找到起始块号(即0号块),将0号逻辑块读入内存,由此知道1号逻辑块存 放的物理块号,于是读入1号逻辑块,再找到2号逻辑块的存放位置……以此类推。

  因此,读入i号逻辑块,总共需要i+1次磁盘I/O。

  结论:采用链式分配(隐式链接)方式的文件,只支持顺序访问,不支持随机访问,查找效率低。另外,指向下一个盘块的指针也需要耗费少量的存储空间。


image-20240317172152444

  结论:采用隐式链接的链接分配方式,很方便文件拓展。 另外,所有的空闲磁盘块都可以被利用,不会有碎片问题, 外存利用率高

(2)链接分配——显式链接

  把用于链接文件各物理块的指针显式地存放在一张表中。即文件分配表(FAT,File Allocation Table)。

image-20240317172451925

image-20240317172705081

  假设某个新创建的文件“aaa”依 次存放在磁盘块2—>5—>0—>1。

  假设某个新创建的文件“bbb”依次存放在磁盘块4—>23—>3。

  注意:一个磁盘仅设置一张FAT。 开机时,将FAT读入内存,并常驻内存。 FAT的各个表项在物理上连续存储,且每一个表项长度相 同,因此“物理块号”字段可以是隐含的。


image-20240317172744726

image-20240317172753078

  用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项 (FCB)…

  从目录项中找到起始块号,若i>0,则查询内存中的文件分配表FAT, 往后找到i号逻辑块对应的物理块号。逻辑块号转换成物理块号的过程不需要读磁盘操作

  结论:采用链式分配(显式链接)方式的文件,支持顺序访问,也支持随机访问(想访问i号逻辑块时,并不需要依次访问之前的0 ~ i-1号逻辑块),由于块号转换的过程不需要访问磁盘,因此相比于隐式链接来说,访问速度快很多。

  显然,显式链接也不会产生外部碎片,也可以很方便地对文件进行拓展


链接分配-总结

  链接分配采取离散分配的方式,可以为文件分配离散的磁盘块。分为隐式链接显式链接两种。

  隐式链接——除文件的最后一个盘块之外,每个盘块中都存有指向下一个盘块的指针。文件目录包括文件第一块的指针和最后一块的指针。

  优点:很方便文件拓展,不会有碎片问题,外存利用率高。

  缺点:只支持顺序访问,不支持随机访问,查找效率低,指向下一个盘块的指针也需要耗费少量的存储空间。

  显式链接——把用于链接文件各物理块的指针显式地存放在一张表中,即文件分配表FAT,File Allocation Table)。一个磁盘只会建立一张文件分配表。开机时文件分配表放入内存,并常驻内存

  优点:很方便文件拓展,不会有碎片问题,外存利用率高,并且支持随机访问。相比于隐式链接来说,地址转换时不需要访问磁盘,因此文件的访问效率更高

  缺点:文件分配表的需要占用一定的存储空间。

  考试题目中遇到未指明隐式/显式的“链接分配”,默认指的是隐式链接的链接分配。

(四)文件分配方式——索引分配

  索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表,索引表中记录了文件的各个逻辑块对应的物理块。索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块

image-20240317173927111

  假设某个新创建的文件“aaa”的数据依次存放在磁盘块2—>5—>13—>9。

  7号磁盘块作为“aaa”的索引块, 索引块中保存了索引表的内容。

  注:在显式链接的链式分配方式中,文件分配表FAT是一个磁盘对应一张。而索引分配方式中,索引表是一个文件对应一张。

  可以用固定的长度表示物理块号(如:假设磁盘总容量为1TB= 2 40 2^{40} 240B,磁盘块大小为1KB,则共有 2 30 2^{30} 230个磁盘块,则可用4B表示磁盘块号),因此,索引表中的“逻辑块号”可以是隐含的。

  有点类似于页式存储管理当中进程的页表。


image-20240317173623818

image-20240317173614240

  用户给出要访问的逻辑块号i,操作系统找到该文件对应的目录项(FCB)…

  从目录项中可知索引表存放位置,将索引表从外存读入内存,并查找索引表即可知i号逻辑块在外存中的存放位置。

  可见,索引分配方式可以支持随机访问文件拓展也很容易实现(只需要给文件分配 一个空闲块,并增加一个索引表项即可) 但是索引表需要占用一定的存储空间


image-20240317174706255

  1.链接方案;

  2.多层索引;

  3.混合索引。


1.链接方案

  如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放。

image-20240317174811077

  假设磁盘块大小为1KB,一个索引表项占4B,则一个磁盘块只能存放256个索引项。

  若一个文件大小为256*256KB = 65,536 KB = 64MB。

  该文件共有256*256个块,也就对应256*256个索引项,也就需要256个索引块来存储,这些索引块用链接方案连起来。

  若想要访问文件的最后一个逻辑块, 就必须找到最后一个索引块(第256个索引块),而各个索引块之间是用指针链接起来的,因此必须先顺序地读入前255个索引块。

  这显然是很低效的。如何解决呢?

2.多层索引

  建立多层索引(原理类似于多级页表)。使第一层索引块指向第二层的索引块。还可根据 文件大小的要求再建立第三层、第四层索引块。

image-20240317175209051

  假设磁盘块大小为1KB,一个索引表项占4B,则一个磁盘块只能存放256个索引项。

  若某文件采用两层索引,则该文件的最大长度可以到256*256*1KB = 65,536 KB = 64MB。

  可根据逻辑块号算出应该查找索引表中的哪个表项。

  如:要访问1026号逻辑块,则1026/256 = 4,1026%256 = 2。

  因此可以先将一级索引表调入内存,查询4号表项,将其对应的二级索引表调入内存,再查询二级索引表的2号表项即可知道1026号逻辑块存放的磁盘块号了。访问目标数据块,需要3次磁盘I/O

  采用K层索引结构,且顶级索引表未调入内存,则访问一个数据块只需要K+1次读磁盘操作。

  若采用三层索引,则文件的最大长度256*256*256*1KB = 16GB。

3.混合索引

  多种索引分配方式的结合。例如,一个文件的顶级索引表中,既包含直接地址索引(直接指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表) 。

image-20240317180022410

  上图这种结构的索引支持的最大文件长度为65800KB。

  若顶级索引表还没读入内存

  访问0~7号逻辑块:两次读磁盘;

  访问8~263:三次读磁盘;

  访问264~65799:四次读磁盘。

  对于小文件,只需较少的读磁盘次数就可以访问目标数据块。(一般计算机中小文件更多)


索引分配-总结

  索引分配允许文件离散地分配在各个磁盘块中,系统会为每个文件建立一张索引表,索引表中记录了文件的各个逻辑块对应的物理块(索引表的功能类似于内存管理中的页表——建立逻辑页面到物理页之间 的映射关系)。索引表存放的磁盘块称为索引块。文件数据存放的磁盘块称为数据块

  若文件太大,索引表项太多,可以采取以下三种方法解决:

  ①链接方案:如果索引表太大,一个索引块装不下,那么可以将多个索引块链接起来存放。缺点:若文 件很大,索引表很长,就需要将很多个索引块链接起来。想要找到i号索引块,必须先依次读入0 ~ i-1号索引块,这就导致磁盘I/O次数过多,查找效率低下。

  ②多层索引:建立多层索引(原理类似于多级页表)。使第一层索引块指向第二层的索引块。还可根据文件大小的要求再建立第三层、第四层索引块。采用K层索引结构,且顶级索引表未调入内存,则访问一个数据块只需要K+1次读磁盘操作。

  缺点:即使是小文件,访问一个数据块依然需要K+1次读磁盘。

  ③混合索引:多种索引分配方式的结合。例如,一个文件的顶级索引表中,既包含直接地址索引(直接指向数据块),又包含一级间接索引(指向单层索引表)、还包含两级间接索引(指向两层索引表) 。

  优点:对于小文件来说,访问一个数据块所需的读磁盘次数更少。


超级超级超级重要考点

  ①要会根据多层索引、混合索引的结构计算出文件的最大长度(Key:各级索引表最大不能超过一个块);

  ②要能自己分析访问某个数据块所需要的读磁盘次数(Key:FCB中会存有 指向顶级索引块的指针,因此可以根据FCB读入顶级索引块。每次读入下一级的索引块都需要一次读磁盘操作。另外,要注意题目条件——顶级索引块是否已调入内存)。

总结

image-20240317181103706

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1526191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JETSON 配置并跑通 NanoDet

JETSON 配置 NanoDet 文章目录 JETSON 配置 NanoDetNanoDet 介绍源码环境搭建及测试配置 NanoDet 的环境环境配置过程中遇到的问题:环境配置完毕验证 NanoDet NanoDet 介绍 可以参考这个博客:NanoDet:这是个小于4M超轻量目标检测模型 源码 …

什么是网站?为什么要搭建网站?

网站:简单来说,网站就是通过互联网来展示信息的页面集合。它可以在电脑或者手机上打开,提供各种功能,比如查看新闻、购买商品、搜索信息等。 一、建网站的目的:展示个人或企业的存在 网站建设的首要目的之一是展示个人…

23-分支和循环语句_习题练习

1、转换以下ASClI码为对应字符并输出他们:73,32,99, 97,110,32,100,111,32,105,116,33 输入:无 输出:一行输出转换题目中给出的所有ASClI码对应的字符,无需以空格隔开。 输入: int main() {int i 0;int arr[] { …

加拿大光量子计算公司Xanadu入局英国多企业量子合作计划

内容来源:量子前哨(ID:Qforepost) 编辑丨慕一 编译/排版丨沛贤 深度好文:1200字丨8分钟阅读 英国航空发动机制造商罗尔斯罗伊斯(Rolls-Royce)、英国量子计算公司Riverlane和加拿大量子计算公…

【Nutx3】middleware目录介绍

简言 记录下nuxt3middleware目录的使用方法。 middleware middleware是存放路由中间件的文件目录。 路由中间件有三种: 匿名(或内联)路由中间件直接在页面中定义。已命名的路由中间件,放在 middleware/ 中,页面使用…

leetcode代码记录(移除元素

目录 1. 题目:2. 我的代码:小结: 1. 题目: 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空间,你必须仅使用 O(1)…

Docker入门二(应用部署、迁移与备份、DockerFile、docker私有仓库、Docker-Compose)

文章目录 一、应用部署1.MySQL部署2.Redis部署3.Nginx部署 二、迁移与备份1.容器做成镜像2.镜像备份和恢复(打包成压缩包) 三、DockerFile0.镜像从哪里来?1.什么是DockerFile2.DockerFile 构建特征3.DockerFile命令描述4.构建一个带vim的centos镜像案例5…

网安渗透攻击作业(4)

Unload-labs-01 function checkFile() { var file document.getElementsByName(upload_file)[0].value; if (file null || file "") { alert("请选择要上传的文件!"); return false; } //定义允许上传的文件类型 v…

面渣逆袭:Java基础面试题,46道Java基础八股文(4.8万字,30+手绘图)

1、什么是 Java? Java是一种广泛使用的编程语言,由Sun Microsystems(现为Oracle Corporation的一部分)在1995年首次发布。它是一种面向对象的语言,这意味着它支持通过类和对象的概念来构造程序。 Java设计有一个核心理…

软件工程-第5章 结构化设计

5.1 总体设计的目标及其表示方法 5.2 总体设计 变换设计基本步骤: 第1步:设计准备--复审并精华系统模型; 第2步:确定输入、变换、输出这三部分之间的边界; 第3步:第一级分解--系统模块结构图顶层和第一层…

arcgis数据导出到excel

将arcgis属性数据导出到excel: 1) 工具箱\系统工具箱\Conversion Tools.tbx\Excel\Excel 转表 2)用excel打开导出的图层文件中后缀为.dbf的数据(方便快捷,但是中文易乱码)

GPT-5:人工智能的下一个前沿即将到来

当我们站在人工智能新时代的门槛上时,GPT-5即将到来的呼声愈发高涨且迫切。作为革命性的GPT-3的继任者,GPT-5承诺将在人工智能领域迈出量子跃迁式的进步,其能力可能重新定义我们与技术的互动方式。 通往GPT-5之路 通往GPT-5的旅程已经标记着…

鸿蒙Harmony应用开发—ArkTS声明式开发(容器组件:FolderStack)

FolderStack继承于Stack(层叠布局)控件,新增了折叠屏悬停能力,通过识别upperItems自动避让折叠屏折痕区后移到上半屏 说明: 该组件从API Version 11开始支持。后续版本如有新增内容,则采用上角标单独标记该内容的起始版本。 子组件…

探秘atoi与atof的模拟之路:从原理到实践的全能指南!

目录 ​编辑 一.atoi及atof库函数的工作原理 1.1atoi 1.2atof 1.3使用时的注意事项 注意事项 1. 检查输入字符串是否为 NULL 2. 检查字符串是否仅包含有效的数字字符 3. 检查转换结果是否在预期范围内 4. 使用更健壮的替代函数 二. 模拟实现atoi和atof 2.1模拟 atoi…

罗马不是一天建成的:DevOps 转型分步指南

“罗马不是一天建成的”这句格言非常适合 DevOps。许多公司都渴望通过“闪电战”获得市场主导地位的即时满足感,但DevOps 的真正成功是一场马拉松,而不是短跑。它需要致力于建立可持续的 DevOps 文化——一种从头开始促进协作、自动化和安全性的文化。 …

计算机设计大赛 题目:基于深度学习的中文对话问答机器人

文章目录 0 简介1 项目架构2 项目的主要过程2.1 数据清洗、预处理2.2 分桶2.3 训练 3 项目的整体结构4 重要的API4.1 LSTM cells部分:4.2 损失函数:4.3 搭建seq2seq框架:4.4 测试部分:4.5 评价NLP测试效果:4.6 梯度截断…

Linux编程4.8 网络编程-建立连接

1、服务器端 #include <sys/types.h> #include <sys/socket.h>int listen(int sockfd, int backlog);返回&#xff1a;成功返回0&#xff0c;出错返回-1。参数&#xff1a;sockfd:套接字的文件描述符backlog:定义了sockfd的挂起连接队列可能增长的最大长度。…

使用 ZipArchiveInputStream 读取压缩包内文件总数

读取压缩包内文件总数 简介 ZipArchiveInputStream 是 Apache Commons Compress 库中的一个类&#xff0c;用于读取 ZIP 格式的压缩文件。在处理 ZIP 文件时&#xff0c;编码格式是一个重要的问题&#xff0c;因为它决定了如何解释文件中的字符数据。通常情况下&#xff0c;Z…

【新手】win10安装nodejs V16.9.0详细教程

&#x1f468;‍&#x1f393;博主简介 &#x1f3c5;云计算领域优质创作者   &#x1f3c5;华为云开发者社区专家博主   &#x1f3c5;阿里云开发者社区专家博主 &#x1f48a;交流社区&#xff1a;运维交流社区 欢迎大家的加入&#xff01; &#x1f40b; 希望大家多多支…

【数据挖掘】练习2:数据管理1

课后作业2&#xff1a;数据管理1 一&#xff1a;上机实验1 # 读入数据 data("CO2") # 查看数据集CO2中的变量名称&#xff0c;并将变量Treatment的名称更改为Treat names(CO2) names(CO2)[names(CO2) "Treatment"] <- "Treat" names(CO2)…