操作系统-笔记-第四章-文件管理

news2024/11/23 20:10:59

目录

四、第四章——文件管理

1、文件管理——基础概念

(1)文件结构

(2)操作系统提供的接口

(3)总结

2、文件的逻辑结构

(1)有结构文件(类似SQL表文件)

(2)顺序文件

(3)索引文件——类似(SQL索引)

(4)索引顺序文件(结合了顺序+索引)

(5)多级索引——(开始套娃啦~)

(6)总结

3、文件目录

(1)文件控制块

(2)单级目录结构(out)

(3)两级目录结构(out)

(4)树形目录结构(out)

(4)无环图目录结构

(5)索引结点

(6)总结

4、文件的物理结构

(1)连续分配(可以理解为malloc)

(2)链接分配(2种)——隐式链接

(2)链接分配(2种)——显式链接

(3)索引分配

(3)索引表太大——链接方案

(3)索引表太大——多层索引

(3)索引表太大——混合索引(最优解)

(4)还有一种方式(自己想的)

(5)总结

5、物理结构 & 逻辑结构

6、文件存储——空间管理

(1)存储空间的划分(文件卷)

(2)管理方法——空闲表法

(3)管理方法——空闲链表法

(3)管理方法——位示图法

(4)成组链表法(数组+链表)

(5)总结

7、文件的基本操作 (重点——打开+读)

(1)创建文件

(2)删除文件

(3)打开文件

(3)打开文件——打开文件表

(4)关闭文件

(5)读文件——读出外存

(6)写文件——写回外存

(7)总结

8、文件共享

(1)硬链接

(2)软链接 (Windows里面的快捷方式)

(3)总结

(4)硬链接和软链接的区别

9、文件保护

(1)口令保护

(2)加密保护

(3)访问控制

(4)总结

10、文件系统的层次结构

11、文件系统的全局结构

12、虚拟文件系统 

(1)统一接口

(2)下层的文件系统(需要实现特点功能,否则操作系统将不认~)

(3)iNode和Vnode

(4)文件系统的挂载(挂载到操作系统上)

13、磁盘的结构

(1)柱面号、盘面号、扇区号

(2)活动磁头、固定磁头

(3)可换磁盘、固定磁盘

14、磁盘调度算法(重点)

(1)读写操作——花费的时间

(2)先来先服务(绝对公平-简单)

(3)最短寻找时间优先(SSFT-贪心算法-有饥饿现象)

(4)扫描算法【SCAN】

(5)LOOK调度算法【LOOK】(边走边看)

(6)循环扫描算法【C-SCAN】

(6)C-LOOK调度算法【C-LOOK】

(7)总结

15、减少磁盘延迟时间的方法

(1)交替编号

(2)减少磁道移动

(3)不同盘片中的扇区-错位命名

(4)总结

16、磁盘管理

(1)磁盘初始化

(2)引导块

(3)损害的磁盘块

17、固态硬盘

(1)固态和机械

(2)结构

(3)寿命问题(不要担心玩坏~)


四、第四章——文件管理

1、文件管理——基础概念

(1)文件结构

(2)操作系统提供的接口

(3)总结

2、文件的逻辑结构

(1)有结构文件(类似SQL表文件)

无结构——txt文件

有结构——SQL表文件

定长(char)——可变长(varchar)

(2)顺序文件

链式(不考察)

顺序(考察)——注意:他的增加和删除(开销比较大!但是串比较简单)

(3)索引文件——类似(SQL索引)

索引文件——类比——SQL中的索引

能够高效的进行检索——(空间换时间)

注意:你还要维护这个索引表(有额外的开销~)

(4)索引顺序文件(结合了顺序+索引)

创建的索引是进行分组过的——(这是一个折中的方法,结合前两者的优点)

相当于——先对全部数据进行【分组】——再把每一组的特点提出来——创建索引

(5)多级索引——(开始套娃啦~)

既然可以创建一次索引,那么就可以在索引的基础上,再创建一个~

(6)总结

3、文件目录

(1)文件控制块

(2)单级目录结构(out)

(3)两级目录结构(out)

(4)树形目录结构(out)

(4)无环图目录结构

有软链接,还有快捷链接~(这是实际应用中有的唉~)

(5)索引结点

把【目录项】再一次提取信息——创建【一个索引结点】——方便查找

类似——SQL索引(注意:这里也可以套娃~)

【创建了索引——空间换时间】——同时可以减少磁盘IO总数(就是减少了查找范围)

(6)总结

4、文件的物理结构

3种——连续、链接、索引

(1)连续分配(可以理解为malloc)

优点:速度快,可以直接找到【指定磁盘块】

缺点:拓展大小不方便,会产生很多【磁盘碎片】

结论:物理上采用连续分配的文件不方便拓展。

结论:物理上采用连续分配,存储空间利用率低,会产生难以利用的磁盘碎片

可以用紧凑来处理碎片,但是需要耗费很大的时间代价。

(2)链接分配(2种)——隐式链接

方便拓展,但是只能顺序访问~

(2)链接分配(2种)——显式链接

创建一个索引表(文件分配表——FAT)

空间换时间(和索引一样)

为什么叫显式?为什么叫隐式?估计你也知道了

一个链接是放在每个内存块的屁股,一个是专门创建一个索引表~

但是:一个磁盘,他只会建立一张表!!!(然后开机就读入内存-常驻内存~)

一个磁盘中的所有文件,共用一张表!!!

(3)索引分配

每有一个文件——就为其专门创建一个索引表(太贴心了~)(可以随机访问)

显示就只有共用~

可见,索引分配方式可以支持随机访问。文件拓展也很容易实现(只需要给文件分配一个空闲块,并增加一个索引表项即可)但是索引表需要占用一定的存储空间

(3)索引表太大——链接方案

把索引表分为多个就好啦~(因为你一个磁盘块放不下嘛~那分为几个部分就行了~)

文件太大——这个方案就很低效!!!

(对比一下,MySQL的【B+树索引】,貌似是这样的,狗头.jpg)

(3)索引表太大——多层索引

刚刚提到B+树索引,这里不就来了~(多级索引,树型索引,套娃开始~)

每一层索引,都可以存放不同的大小(2层-64MB,3层-16GB)

(3)索引表太大——混合索引(最优解)

前面几个——直接索引

中间几个——一级索引

后面几个——二级索引

如果还有——三级索引…(以此类推)

软考也考唉~~~(很熟悉,嘻嘻)

优点:灵活(IO次数适中)

小文件——直接索引

中型文件——(直接+二级)

大文件——(直接+二级+三级…)

(4)还有一种方式(自己想的)

在Java中,数组超过一定长度时,会自动转为红黑树

那么咱也可以自动切换,当你小于多少时,用直接索引,大于多少时,变为二级索引~

以此类推(临时的想法,虽经不住推敲,但是还是想记录下来~)

同时,咱要知道,索引方法还有其他的,不止这几张,长路漫漫,学无止境,加油!

(5)总结

5、物理结构 & 逻辑结构

一个是用户来操心(逻辑)

一个是操作系统来操心(物理)

互相独立,互不干扰

6、文件存储——空间管理

(1)存储空间的划分(文件卷)

(2)管理方法——空闲表法

和内存管理类似

如何分配空间?(有对应的算法)——参考【内存分配】

如何回收空间?(有没有相邻的空间,需要合并?)

(3)管理方法——空闲链表法

类似链表(适用于离散空间)

(3)管理方法——位示图法

离散和连续分配——都适用

被占用——为1

未使用——为0

(4)成组链表法(数组+链表)

注意分配+回收的方法【不容易考】

(5)总结

7、文件的基本操作 (重点——打开+读)

记住这些是单独进行的,只是软件把动作添加了而已

比如,你【打开文件】之后,就会自然有一个【读文件的】操作

这里把动作拆解开来,是方便理解每一步具体干了什么!

(1)创建文件

1、申请空闲空间—2、创建目录项——(索引表也得维护)

目录项——你可以理解为SQL创建了一条数据(里面包含他所有的信息)

但是内容是在外存里面的——他只是存储了对应的【磁盘块号】~

(2)删除文件

1、找到目录项——2、回收磁盘块 —— (索引表什么的~)

(3)打开文件

1、找到目录项——2、权限检测——3、将目录项+放入内存——3、【打开计算器】+1

(3)打开文件——打开文件表

打开计数器(用于数据共享)——设计一个【打开文件的总表】

(当文件要被删除时,就可以查看该表,是否打开~)

(4)关闭文件

1、打开文件表中【对应的表项】删除——2、内存资源回收——3、打开计算器-1

(如果为0,则直接删除对应的表项)

(5)读文件——读出外存

(6)写文件——写回外存

(7)总结

8、文件共享

(1)硬链接

硬链接是在文件系统中【创建多个文件名】指向【同一个文件的数据块】。

这些文件名在文件系统中被视为等同的,因为它们指向相同的数据块。

(2)软链接 (Windows里面的快捷方式)

(3)总结

硬链接和软链接的主要区别:

硬链接是指多个文件名指向同一个文件数据块,

软链接则是指一个特殊的文件,其中包含了指向另一个文件的路径。

硬链接通常用于在不同的目录中创建相同文件的多个副本,以节省存储空间。

软链接通常用于创建指向其他文件或目录的快捷方式,以方便用户访问。

(4)硬链接和软链接的区别

1、本质不同

硬链接:同一个文件,多个名称。

软链接:不同的文件。

2、跨分区

硬链接:不支持跨分区。

软链接:支持跨分区。

3、目录

硬链接:不支持对目录创建。

软链接:支持对目录创建。

4、相互关系

硬链接:删除某一个硬链接,另一个硬链接不影响使用。

软链接:原始文件和软链接有依赖关系,原始文件删了,软链接就失效了。

5inode编号

硬链接:inode编号是相同的。

软链接:inode编号不同。

6、链接数

硬链接:删除一个硬链接,硬链接的链接数会有变化。

软链接:删除一个软链接,链接数不会有变化,删除的相当于是一个文件(或快捷方式)。

7、相对路径:原始文件路径

硬链接:硬链接的相对路径,是相对的当前工作目录的相对路径。

软链接:软链接的原始文件路径是,相对的软链接的相对路径,而不是相对当前工作目录。

8、文件类型

硬链接:硬链接的文件类型是,原来是什么就是什么,例如:原来是普通文件,还是普通文件。

软链接:软链接的文件类型是L

9、命令的实现不一样

硬链接:ln

软链接:ln -s

9、文件保护

(1)口令保护

保存在操作系统中,不够安全~

(2)加密保护

编码和译码,要花费额外时间(不过保密性不错~

除了简单的异或加密之外,还有一些常用的文件加密保护算法。以下是其中几种:

  1. 对称加密算法:对称加密使用相同的密钥来加密和解密数据。常见的对称加密算法包括 AES(高级加密标准)和DES(数据加密标准)等。
  2. 非对称加密算法:非对称加密使用一对密钥,即公钥和私钥。公钥用于加密数据,而私钥用于解密数据。常见的非对称加密算法包括 RSA ECC(椭圆曲线加密)等。
  3. 哈希函数:哈希函数将输入数据转换为固定长度的哈希值,通常是一个唯一的标识符。常见的哈希函数包括 SHA-256 MD5 等。虽然哈希函数本身不是加密算法,但它们常用于验证数据完整性和生成数字签名。
  4. 混淆和编码:混淆和编码是通过改变数据的表示形式来隐藏其真实内容。常见的技术包括 Base64 编码和 URL 编码等。这些方法并不提供真正的加密,但可以用于隐藏敏感数据的原始格式。

(3)访问控制

大部分操作系统都支持控制访问(分组、给文件加权限…)

用户分组——Linux中就有(root用户可以建立分组,并把用户进行分组~

还有chmod 修改文件权限~

Windows中,也可以设置权限~

(4)总结

10、文件系统的层次结构

例子:

用户使用—文件查询—权限查询—逻辑地址—物理地址—完成操作—空间重组

11、文件系统的全局结构

Open(打开文件)——在目录缓存中查询文件

找到文件后——文件表信息更新

在该进程中——新建信息(记录文件操作)【方便后续操作】

12、虚拟文件系统 

(1)统一接口

(2)下层的文件系统(需要实现特点功能,否则操作系统将不认~)

(3)iNode和Vnode

将【iNode】读入主存后,进一步封装,变为【vnode】,方便后续操作

PSVnodeiNode的加强版

目的:方便操作系统对文件进行操作

(4)文件系统的挂载(挂载到操作系统上)

比如:你插了一个U盘,U盘的文件就需要挂载到操作系统上~

1注册到挂载表上,让【虚拟文件系统】发现【新的文件系统】

2、【新的文件系统】提供功能函数给【操作系统】

目的:方便【虚拟文件系统】操作。【类似:告诉他如何在本地实行各种权利】

3、把文件系统加入到【挂载点】

挂载后的截图:

13、磁盘的结构

 

         

(1)柱面号、盘面号、扇区号

(2)活动磁头、固定磁头

(3)可换磁盘、固定磁盘

14、磁盘调度算法(重点)

(1)读写操作——花费的时间

时间优化问题:

1、硬件——转速(延迟、传输)

2、软件(操作系统)——寻道时间——尽可能让磁头减少移动!!!

(2)先来先服务(绝对公平-简单)

(3)最短寻找时间优先(SSFT-贪心算法-有饥饿现象)

在一系列的磁道请求中,找到目前离他最短的磁道

(4)扫描算法【SCAN】

我愿称之为——【调头算法】~或者【老牛算法】

一条路走到头,才死心!(这是缺点)

(往一个方向走到头,才可以调头~)

(5)LOOK调度算法【LOOK】(边走边看)

边走边看【当前面没有需求时,就调头~

(6)循环扫描算法【C-SCAN】

扫描算法的优化

原来的扫描——往返扫描(类似往返跑)

循环扫描是(只能从头到脚,不能再从脚到头)

目的:响应磁道平均~

(但是也有点呆板,需要加一个LOOK~边走边看)

(6)C-LOOK调度算法【C-LOOK】

循环扫描的加强版——边走边看~

(7)总结

其实,SCAN和LOOK差不多C-SACN和C-LOOK差不多

都只是加了一个边走边看~

15、减少磁盘延迟时间的方法

相邻的扇区,无法连续读取(因为每读取一个扇区,就得处理数据)

要读下一个扇区,就等他在转一圈~

如何实现连续的读取呢?

(1)交替编号

把扇区交替编号~【给读取数据加一个间隔时间,来处理数据】

(2)减少磁道移动

磁盘编址方式——【磁道号,盘面号,扇区号】(不能随意换位置哟~)

连续地址都是从低位到高位

那么就可以【减少移动磁头】,【切盘】就行了~

(3)不同盘片中的扇区-错位命名

磁头不需要移动了,但是切盘后读取来不及,得错位命名

留出空闲时间,来处理数据

(4)总结

16、磁盘管理

(1)磁盘初始化

(2)引导块

(3)损害的磁盘块

17、固态硬盘

固态硬盘(Solid State Disk或Solid State Drive,简称SSD),又称固态驱动器,是用固态电子存储芯片阵列制成的硬盘。

(1)固态和机械

(2)结构

(3)寿命问题(不要担心玩坏~)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/912056.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据分析案例丨商品零售购物篮分析(下)

数据分析案例丨商品零售购物篮分析(上) 03 数据预处理 通过对数据探索分析,发现数据数据完整,并不存在缺失值。建模之前需要转变数据的格式,才能使用apriori函数进行关联分析。对数据进行转换,如代码清单…

TIA博途中的数据类型基本介绍

TIA博途中的数据类型基本介绍 基本数据类型 Bool 布尔 FALSE 或TRUE 举例: I0.0 Q0.2 M100.0 DB0.DBX2.5 Byte 字节 二进制:2#0000 0000 到2#1111 1111 无符号整数:0到255 有符号整数:-128到127 十六进制:16#00到16#FF 举例: IB2 MB100 DB1.DBB2 Word 字 二进制:2#0000 …

钉钉公布AI版本商业定价,调用一次大模型不到5分钱

8月22日,在2023年钉钉生态大会上,钉钉总裁叶军公布了钉钉全面智能化的最新进展:已有17条产品线、55个场景全面接入大模型,完成智能化再造;钉钉同时面向生态伙伴和客户开放智能化底座AI PaaS,表示将用大模型…

基于Java水果售卖系统设计与实现(论文+源码)_kaic

第1章 绪 论 1.1 课题研究的背景 随着信息技术的发展,互联网经济快速兴起,电子商务发展迅速,网上购物受到人们的广泛关注和普遍欢迎。水果传统售卖模式的缺点不断暴露,不能满足当今人们快节奏的生活模式需要。将水果的售卖带…

Dubbo服务

dubbo服务分为服务的提供者和消费者 1.服务提供者在nacos注册后通过 DubboService 暴漏服务 2.dubbo服务消费者通过 DubboReference来进行远程服务调用 dubbo的高级特性 1.启动检查:如果启动消费者无提供者则报错,通过配置文件check: fa…

实战演练 | Navicat 导入向导

数据库工具中的导入导出功能是指将数据从一个数据库系统导出到另一个数据库系统,或者将数据从一个文件格式导出到另一个文件格式。导入导出功能可以通过各种方式实现,例如使用SQL语句、数据库管理工具或第三方库和工具。在进行数据迁移时,通常…

排序算法合集

F B I W a r n i n g : \color{red}FBI \qquad Warning: FBIWarning: 本人没有完整的计算机科班的教育经历,但是一直在兢兢业业,努力学习。 这些排序函数都是自己零零散散写的,也没有经过深思熟虑和优化,纯粹是为了自娱自乐。 …

c++ qt--信号与槽(一) (第三部分)

c qt–信号与槽(一) (第三部分) 一.用qt自带的方法添加信号槽 1.第一种 1.如何添加 2.在何处进行绑定 2.第二种 1.如何添加 2.在何处进行绑定 而且会在mainwindow.h中添加槽函数的声明,在mainwindow.cpp中添加槽函数的定义 在mainwindow…

C语言入门 Day_8数据与运算小结

目录 前言 1.精度 2.运算 2.易错点 3.思维导图 前言 到目前为止我们一共学习了四种数据类型,他们分别是表示整数的整型;表示小数的浮点型;表示字符的字符型;和表示布尔数的布尔型。 表示整数的整型,它的变量类型名…

如何搭建智能问答FAQ的底层数据基础呢?

搭建智能问答FAQ的底层数据基础是构建一个高效和准确的问答系统的关键。在这篇文章中,我们将探讨如何搭建智能问答FAQ的底层数据基础,并介绍需要注意的几个方面。 一、了解智能问答FAQ的概念和优势 智能问答FAQ是一种基于人工智能技术的问答系统&#…

趣解设计原则之单一职责(论一个小老板的发家史)

一、前言 今天我们来聊一聊设计原则中的单一职责,还是按照惯例,先介绍一下含义,然后呢,我们再来讲一个小故事。 单一职责(SRP:Single Reposibility Principle)的定义: 一个类或者模…

static的使用

static的使用 在C语言中,static是一个关键字,用于指定变量、函数和代码块的作用域和生命周期。 用法: 静态变量 1.修饰变量:使用static关键字声明的变量是静态变量,它们的作用域被限制在定义它们的源文件中&#x…

SRE 与开发的自动化协同 -- 生产环境出现 bug 自动生成异常追踪

简介 生产环境 bug 的定义:RUM 应用和 APM 应用的 error_stack 信息被捕捉后成为 bug。 以 APM 新增错误巡检为例,当出现新错误时,在观测云控制台的「事件」模块下生成新的事件报告,捕捉为 bug。同时利用 Dataflux Func 创建异常…

一篇文章带你认识重构

文章目录 一、重构的目的:为什么要重构(why)?二、重构的对象:到底重构什么(what)?三、重构的时机:什么时候重构(when)?四、重构的方法…

Transformer在医学影像中的应用综述-分类

文章目录 COVID-19 Diagnosis黑盒模型可解释的模型 肿瘤分类黑盒模型可解释模型 视网膜疾病分类小结 总体结构 COVID-19 Diagnosis 黑盒模型 Point-of-Care Transformer(POCFormer):利用Linformer将自注意的空间和时间复杂度从二次型降低到线性型。POCFormer有200…

Unscreen-AI自动删除视频背景工具 无需绿屏

Unscreen是什么 Unscreen是一款AI自动删除视频背景工具,可以帮你把视频和GIF中的背景去除,目前支持的格式:.mp4、.webm、.ogg、.ogg、.ogv、.mov、.gif,用户不需要手动选择像素、颜色和掩码,而是使用AI 自动分析视频&…

ms-tpm-20-ref构建脚本说明

bootstrap 这个脚本主要做了以下几件事情: 1. 设置环境变量:将 AUTORECONF 环境变量设置为 autoreconf,如果该变量已经定义,则不会进行重新设置。 2. 生成文件列表:通过 src_listvar 函数生成各个目录下的源文件列表&…

易云维智慧实验室综合管理平台以技术赋能和数据驱动,助力实验室设备集中管控和能耗管理

目前,我国实验室存在纸质记录多、信息孤岛、不可追溯、安全隐患多、运行能耗高、管理难等问题;同时,国内LIMS实验室信息系统专业化程度低,功能结构单一,不能满足现阶段实验室管理需要;构建一个基于物联网技…

macOS M1使用TensorFlow GPU加速

本人是在pycharm运行代码,安装了tensorflow版本2.13.0 先运行代码查看有没有使用GPU加速: import tensorflow as tf# Press the green button in the gutter to run the script. if __name__ __main__:physical_devices tf.config.list_physical_dev…

Leetcode每日一题:849. 到最近的人的最大距离(2023.8.22 C++)

目录 849. 到最近的人的最大距离 题目描述: 实现代码与解析: 双指针 原理思路: 849. 到最近的人的最大距离 题目描述: 给你一个数组 seats 表示一排座位,其中 seats[i] 1 代表有人坐在第 i 个座位上&#xff0c…