Linux-文件系统理解(磁盘的物理与逻辑结构、什么是inode、OS如何管理磁盘)

news2024/10/7 16:20:13

一、磁盘

磁盘的物理结构

        磁盘的本质是一个机械设备,可以存储大量的二进制信息,是实现数据存储的基础硬件设施,磁盘的盘片类似于光盘,不过盘片的两面都是可读可写可擦除的,每个盘面都有一个磁头马达可以使盘片旋转起,磁头悬浮在非常接近盘片表面的位置,通过感应磁性变化来读取或改变磁性以读写数据。

        

        

磁盘的存储结构

        一个磁盘可能拥有多个盘片,一个盘片存在两个盘面,而每个盘面以距离圆心的远近可以分为许多磁道,每个磁道又会被分为许多的扇区,同一径向位置的所有磁道组成一个柱面。

        盘片的旋转是为了定位对应扇区,磁头左右摇摆是为了确定对应的磁道

  1. 盘片(Platters)

    • 硬盘内部包含一组或多组圆形的薄金属盘片,它们堆叠在一起,并且每个盘片表面都涂覆一层磁性材料,用于记录二进制数据。
    • 磁盘片可以双面存储数据,即每个盘片通常会有两个磁化表面。
  2. 磁道(Tracks)

    • 每个盘片表面被划分为一系列同心圆,这些圆轨迹被称为磁道。磁道是记录数据的基本轨道,磁道越靠近中心,其直径越小,容纳的比特密度相对较高。
  3. 扇区(Sectors)

    • 每个磁道进一步被划分为多个扇区,扇区是磁盘上能够独立寻址并存储固定大小数据块的最小单元,常见的扇区大小是512字节或4KB。
  4. 柱面(Cylinders)

    • 同一径向位置的所有磁道组成一个柱面。也就是说,硬盘中所有盘片上相同半径的磁道构成一个柱面。在访问数据时,磁头同时移动到对应柱面上的同一磁道位置。
  5. 磁头(Heads)

    • 每个盘面都有一个读写磁头,它们安装在磁臂(Actuator Arm)上。当磁盘旋转时,磁头悬浮在非常接近盘片表面的位置,通过感应磁性变化来读取或改变磁性以读写数据。

磁盘的逻辑结构

        对于磁带我们知道它是一个线性的存储介质,在录音机中通过磁带在两个圈的旋转便可以访问其中的数据,对于磁盘,我们也可以把他抽象的想象为一个线性的结构,将每个盘面展开,将磁道连接到一起,此时该线性结构就为一个以扇区为基本单位的一个数组,通过数组下标就可以访问对应扇区的内容,只要有扇区对应的下标就可以通过一些简单的计算找到其在磁盘的物理位置。故文件就是在磁盘中占几个扇区的问题

例如:若扇区的下标为index,一个盘面有10个磁道,一个磁道分为了100个扇区,那么一个盘面就拥有1000个扇区,index/1000为该扇区位于哪个盘面,tmp=(index%1000),tmp为该扇位于哥这个盘面的第几个扇区,tmp/100为位于该盘面的哪个磁道,tmp%100为位于该磁道到的第几个扇区。

所以找到一个指定扇区分为三步:

  1. 找到对应的磁头(Header)
  2. 找到对应的磁道(Cylinder)
  3. 找到对应扇区(Sector)

该方法成为CHS定址法

        一个扇区为512个字节,在操作系统与磁盘进行交互的时候,OS认为一次读取512个字节的内容太少了,所以规定与磁盘交互的基本单位为4kb,也就是8个连续的扇区,所以我们可以进一步对磁盘进行抽象,将每8个扇区抽象为一个块,这样磁盘就被抽象为了一个以块为基本单位的数组,称为LBA 逻辑区块地址(块中的8个扇区最后是连续的,不然磁头和盘片要进行大量的旋转寻址,会影响效率),通过块数组下标,我们就可以找到对应扇区的数组下标,n*8就为该块对应第一个扇区的下标,而该块的8个扇区都是连续的,这样就可以锁定该块所有的扇区了。

        所以只要有一个起始,知道磁盘的总大小,该磁盘有多少块,每个块的块号,如何转换到对应的多个CHS地址我们就全部知道了。

        综上所述,一个磁盘被分为了许多的块,操作系统维护这么多的块其实是有一定难度的,一般会对磁盘在进行分区,其实我们的电脑一般就只有一个磁盘,其中的C盘、D盘就是所谓的分区,只要能管理好一个分区就能管理好整个磁盘

二、inode与文件系统

        为了管理好一个分区,OS还会将一个分区进行分组,此时问题就到了如何管理好一个分组?

这样一层一层剥开分析的思想叫做分治。接下来就讲解一下如何管理好一个分组:

文件=内容+属性,文件储存在磁盘的本质就是文件的内容与文件的属性数据保存在磁盘,在Linux下,文件的内容与属性数据是分开保存的

  • Data Blocks:数据区,及保存文件内容的地方,在数据区内抽象存在着许多的块,每个块都有自己的块号,数据就保存在这些快中
  • Block Bitmap:块位图,Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没 有被占用
  • inode:文件的类型与内容是不同的,但是描述文件的属性却是相同的,例如文件的大小,文件的创建时间等等,这些数据被保存在一个一个结构体中,这个结构体就称为inode。一般这个结构体的大小是固定的128个字节,每一个文件被一个inode描述,但是inode中并不会保存文件的名字,在内核层面上每一个inode都会有一个inode_number,只要有inode号就可以在inode表中定位一个inode,其中inode中还会存在一个数组:datablock[N],这个数组会保存文件内容保存在Data Blocks中块的下标,通过这个数组就可以找到文件的内容了,总之只要有了inode号就可以找到文件的内容+属性
  • inode Table:inode表就是管理inode的结构,保存着分组内部所有的可用(已经使用 + 没有使用)inode。
  • inode Bitmap: inode位图,每一个比特位表示一个inode是否空闲可用
  • GDT,Group Descriptor Table:块组描述符,描述块组属性信息,记录了当前块inode与块的使用情况等等
  • super block:超级块,super block中保存的是整个分区的使用情况,记录的信息主要有:bolck 和 inode的总量, 未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的 时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个 文件系统结构就被破坏了
  • 补充:inode的编号是分区级别的,一个分区中的inode不能相同,分区之间的inode可以有重复,每个组都有自己起始的inode编号与结束inode编号,保存在GDT中,而超级块保存着整个分区所有分组的start_inode_num与end_inode_num,这样只要有inode编号,就可以快速定位inode的位置(Data Block也是这样做的)
  • 为什么超级块保存在组中呢,不应该是分区级别的吗?要知道磁盘信息的写入与读取离不了盘片的旋转与磁头的摆动,如果发生了一些意外情况,将分区超级块的信息刮花了,那么这个分区就损坏掉了,其实并不是所有的分组都会保存超级块,一般是隔几个组保存一个,这么做的原因是当一个组中的超级块数据发生错误,可以将其他组超级块正确的内容加载过来,这样提高了磁盘的复用性。
  • 将分区进行分组,并将GDT等文件管理信息写入,这个操作叫做格式化,这样整个分区的文件系统框架就搭建好了

想要得到一个文件的信息,首先需要这个文件的inode编号,我们平常使用的是文件名是怎么获取inode呢?

        首先我们谈一谈目录,目录也是文件,既然是文件就有文件的属性和文件的内容,而目录的内容其实保存的是文件名与inode编号的映射关系,这样我们通过文件名就可以找到该文件的inode编号了,而目录中不允许出现同名文件就是为了避免找到错误的映射关系,并且我们知道在一个目录中想要创建新文件就需要写权限,这是因为新建一个文件需要在所处目中内容中写入文件名与inode的映射关系

        通过上面的讲述我们理解了,想要管理一个文件,只要找到其所在目录下文件名与inode的映射关系就好了,及访问一个文件需要先访问其目录,而目录也是文件,这样就会一层一层的进行逆向路径解析,在Linux下当遇到根目录时就会停止,因为在机器开机时就会导入数据,OS是知道根目录保存在哪里的,这就是为什么我们进行文件操作时必须带文件的路径

inode编号是分区级别的,那怎么判断文件的inode是哪个分区的呢?

        一个分区想要使用,必须与一个目录进行挂载,也就是进入这个分区就相当于进入了这个目录,这样当我们访问一个文件时,只需要对比该文件的路径前缀是与哪个目录相同,然后确定该目录是与哪个分区挂载的,这样就可以找到这个文件的分区了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1594462.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

keil无法查看外设寄存器(生成SFR文件)

1.前言 自从更新了keil,用的是越来越不顺手了,一会是cannot evaluate,一会是与强制与cubemx强制联系了,这次也是的(地铁,老人,手机)折腾了一下总是搞好了(网上的解法只能…

安卓刷机fastboot分段传输

win10 fastboot 无法识别,驱动下载地址GitHub - xushuan/google_latest_usb_driver_windows 把inf文件更新到设备管理器驱动更新即可 问题 archive does not contain super_empty.img Sending vbmeta_a (4 KB) OKAY [ 0.117s] Writing …

Open CASCADE学习|实现Extrude功能

首先定义了一些基本的几何元素,如线、圆和平面,然后使用makeExtrudebydir函数来对一个面进行挤出操作。下面是详细过程: 定义Extrude函数:makeExtrudebydir函数接受一个TopoDS_Shape对象和一个gp_Vec对象作为参数。TopoDS_Shape是…

【vs2019】window10环境变量设置

【vs2019】window10环境变量设置 【先赞后看养成习惯】求关注点赞收藏😊 安装VS2019时建议默认安装地址,最好不要改动,不然容易出问题 以下是安装完VS2019后环境变量的设置情况,C:\Program Files (x86)\Microsoft Visual Studi…

【Unity添加远程桌面】使用Unity账号远程控制N台电脑

设置地址: URDP终极远程桌面;功能强大,足以让开发人员、设计师、建筑师、工程师等等随时随地完成工作或协助别人https://cloud-desktop.u3dcloud.cn/在网站登录自己的Unity 账号上去 下载安装被控端安装 保持登录 3.代码添加当前主机 "…

初探vercel托管项目

文章目录 第一步、注册与登录第二步、本地部署 在个人网站部署的助手vercel,支持 Github部署,只需简单操作,即可发布,方便快捷! 第一步、注册与登录 进入vercel【官网】,在右上角 login on,可登…

【小迪安全2023】第23天:WEB攻防-Python考点CTF与CMS-SSTI模版注入PYC反编译

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…

Linux 文件页反向映射

0. 引言 操作系统中与匿名页相对的是文件页,文件页的反向映射对比匿名页的反向映射更为简单。如果还不清楚匿名页反向映射逻辑的,请移步 匿名页反向映射 1. 文件页反向映射数据结构 struct file: 用户进程每open()一次文件,则会生…

微服务相关

1. 微服务主要七个模块 中央管理平台:生产者、消费者注册,服务发现,服务治理,调用关系生产者消费者权限管理流量管理自定义传输协议序列化反序列化 2. 中央管理平台 生产者A在中央管理平台注册后,中央管理平台会给他…

BLIP 算法阅读记录---一个许多多模态大语言模型的基本组件

论文地址:😈 目录 一、环境配置以及数据集准备 数据集准备 数据集格式展示 环境配置,按照官网所述即可 二、一些调整 vit_base的预训练模型 远程debug的设置 Tokenizer初始化失败 读入网络图片的调整 三、训练过程 Image Encoder …

Kylin IPv4 setting config

Kylin IPv4 setting-CSDN博客 上次配置完重启又没了,永久需要修改配置文件 /etc/sysconfig/network-scripts ifcfg-ens33

langchain-chatchat指定一个或多个文件回答,不允许回答内容有其他文件内容,即屏蔽其他文件内容

1.找到langchain-chatchat中的knowledge_base_chat.py 2.knowledge_base_chat.py的api内容加上一个flie_name参数,即传过来你需要指定一个文件名称,或多个文件名称,同时也可以不指定,加上以下代码: flie_name: List …

腾讯云优惠券详细介绍及领券步骤详解

随着云计算技术的不断发展和普及,越来越多的企业和个人开始选择使用云服务来满足自身的需求。腾讯云作为国内领先的云服务提供商,以其稳定、高效、安全的服务赢得了广大用户的信赖。为了回馈广大用户,腾讯云经常推出各种优惠活动,…

linux下安装nacos2.2.0

1、获取下载地址并下载 1.1、打开nacos官网 1.2、找到对应版本,点进去 ## 1.3、复制地址 1.4下载 # 进入要安装的目录,cd /usr/local/src # 执行wget https://github.com/alibaba/nacos/releases/download/2.2.0/nacos-server-2.2.0.tar.gz2、 安装…

深入理解计算机网络分层结构

一、 为什么要分层? 计算机网络分层的主要目的是将复杂的网络通信过程分解为多个相互独立的层次,每个层次负责特定的功能。这样做有以下几个好处: 模块化设计:每个层次都有清晰定义的功能和接口,使得网络系统更易于设…

放弃powershell? 启动 sqlps!免杀| 红队攻防

0x00 前言 sql server 默认安装后,会发现有一个 sqlps.exe: 此文件本身自带微软签名: sqlps的功能,竟然是!启动 powershell??? 而且由于此文件无依赖,因此可以单独取出在…

刷题之Leetcode206题(超级详细)

206.反转链表 力扣题目链接(opens new window)https://leetcode.cn/problems/reverse-linked-list/ 题意:反转一个单链表。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->NULL 思路 如果再定义一个新的链表&#xff0…

18 进程替换

目录 1.什么是进程替换 2.替换原理 3.替换函数 4.函数解释 5.具体应用 6.makefile构建多个文件 7.运行自己程序 8.运行其他语言程序 9.简易shell 什么是进程替换 fork之后的父子程序共享代码,如果子进程想执行一个全新的程序。就用进程替换来完成这个功能&#x…

python3高级特性

1. 装饰器 装饰器是 Python 的一种高阶函数,它可以在不修改函数内部代码的情况下,给函数增加额外的功能。 案例:记录函数执行时间的装饰器 import time def timing_decorator(func): def wrapper(*args, **kwargs): start_time time.t…

Spring高手之路17——动态代理的艺术与实践

文章目录 1. 背景2. JDK动态代理2.1 定义和演示2.2 不同方法分别代理2.3 熔断限流和日志监控 3. CGLIB动态代理3.1 定义和演示3.2 不同方法分别代理(对比JDK动态代理写法)3.3 熔断限流和日志监控(对比JDK动态代理写法) 4. 动态代理…