Linux中文件描述符与重定向的深入探索

news2025/4/21 19:32:28

目录

1. 理解C语言的文件操作函数

2. 操作系统的文件操作接口

3. 文件描述符详解和其内核本质

4. 如何理解Linux下一切皆文件

5. Linux中的重定向

5.1 输出重定向

5.2 追加重定向

5.3 输入重定向

6. 结合文件描述符理解重定向

 7.重定向的系统调用


在Linux操作系统中,文件描述符和重定向是处理文件输入/输出(IO)操作的两个核心概念。本文将深入探讨这两个概念,帮助您更好地理解它们的工作原理以及在实际应用中的使用。

1. 理解C语言的文件操作函数

在C语言中,文件操作是通过一系列函数来实现的,如fopenfclosefreadfwrite等。这些函数提供了创建、打开、读取、写入和关闭文件的基本功能。然而,这些函数只是操作系统提供的文件操作接口的一种封装。实际的文件操作是由操作系统内核来完成的。

2. 操作系统的文件操作接口

操作系统为应用程序提供了一组统一的文件操作接口,使得应用程序可以以相同的方式处理各种类型的文件,包括普通数据文件、设备文件、网络套接字等。这种统一的处理方式大大简化了程序设计和开发的复杂性。

操作系统的文件操作接口是连接上层应用软件和底层硬件的桥梁,它屏蔽了底层硬件的细节,使得用户可以通过程序(应用软件)直接对计算机中的文件进行各种操作。

文件操作接口提供了丰富的功能,使用户可以对文件进行创建、打开、读取、写入、删除、重定位等操作。这些操作通常通过系统调用的方式实现,而用户无需关心底层硬件是如何实现这些功能的。

以下是一些常见的文件操作接口及其功能:

  • 打开文件:在对文件进行读取或写入之前,需要先通过系统调用(如open)打开文件。打开文件时,操作系统会检查文件的访问权限,并为该文件分配一个文件描述符,以便后续操作。

返回值:返回一个整数fd,如果是-1则代表打开失败,fd>0则表示成功,且用户通过fd来操作文件

参数:

pathname:(文件路径)+文件名 , 如果只有文件名则表示该文件在当前路径

flags:按位图方式传递信息,有如下选项,通过按位或叠加想要的效果

  • 读取文件:通过调用读取系统调用(如read),可以将文件的内容读取到程序的缓冲区中。读取操作可以根据需要读取文件的全部内容或部分内容。

在fd指向的文件中拷贝count字节的数据到buf中

  • 写入文件:通过调用写入系统调用(如write),可以将程序缓冲区中的数据写入到文件中。写入操作可以追加到文件的末尾,也可以覆盖文件的现有内容。

把buf中count字节的数据拷贝到fd指向的文件中

  • 删除文件:通过调用删除系统调用(如unlinkremove),可以删除文件系统中的指定文件。删除文件时,操作系统会释放与该文件相关的所有资源。
  • 文件重定位:通过调用文件重定位系统调用(如lseek),可以改变文件的读写指针位置,从而实现对文件的任意位置进行读写操作。

这些文件操作接口通常都以函数的形式提供,用户只需要知道函数的功能和调用方式,就可以直接调用这些函数来操作文件,而无需关心底层硬件的实现细节。

举例来说,假设我们有一个文本文件example.txt,我们想要读取其中的内容。我们可以使用以下步骤通过文件操作接口来实现:

  1. 使用open系统调用打开文件example.txt,并获取其文件描述符。
  2. 使用read系统调用通过文件描述符读取文件的内容到程序的缓冲区中。
  3. 对读取到的内容进行处理或显示。
  4. 使用close系统调用关闭文件描述符,释放资源。

通过这个过程,我们可以轻松地实现对文件的读取操作,而无需关心底层硬件是如何进行磁盘读写等操作的。这就是操作系统文件操作接口的重要作用之一。

3. 文件描述符详解和其内核本质

在Linux中,文件描述符是一个非负整数,用于在内核中唯一标识一个打开的文件或设备。当程序打开一个文件或设备时,操作系统会为其分配一个文件描述符。文件描述符是内核中打开文件表的一个索引,通过这个索引,内核可以跟踪和管理每个打开的文件或设备的状态和信息。

文件描述符其实就是数组下标,哪个数组?文件描述符表这个数组,它是个指针数组;

访问文件的对象是进程,进程通过系统调用接口,先把文件打开,为了方便管理每个打开的文件,操作系统会为每个打开的文件创建一个文件结构体(先描述,再组织),通过对struct file这一串数据结构的增删查改从而实现对文件系统的管理,文件是由进程打开的,所以文件和进程是有关系的,但是,为了把文件管理和进程管理解耦合,操作系统通过一个结构体struct file_struct中的struct file* fd_array[ ] 来把进程和其打开的文件联系起来,这个指针数组就是文件描述符表,这个数组对应的数组下标就是文件描述符。

每个进程都会有一个文件描述符表,表中0、1、2位置默认是已经被使用了,里面分别存储了指向标准输入(键盘)、标准输出(屏幕)、标准错误(屏幕)这三个文件的指针

4. 如何理解Linux下一切皆文件

在Linux中,将一切事物都看作文件的原理基于其统一的接口设计和内核中的数据结构。这种设计哲学极大地简化了操作系统的设计和编程工作,使得设备驱动、进程间通信(IPC)和其他系统资源都可以像文件一样被访问和操作。

对于每个被视为文件的对象,Linux内核中都会为其创建一个struct file结构体实例。这个结构体包含了与该文件对象相关的所有信息,比如文件类型、文件位置、访问权限等。更重要的是,struct file结构体中包含了一组函数指针,这些函数指针指向了实现文件操作的具体函数。

这些函数指针的实现根据文件类型的不同而有所不同,从而实现了多态的效果。例如,对于普通文件,这些函数指针可能指向实现文件读写、定位等操作的函数;而对于设备文件,这些函数指针则可能指向实现设备驱动操作的函数。

通过这种方式,Linux内核能够将不同类型的文件对象统一起来,通过相同的接口进行访问和操作。无论是读取磁盘上的数据、向打印机发送数据,还是进行进程间通信,都可以使用相同的系统调用和文件操作函数。这种统一的处理方式极大地提高了Linux系统的灵活性和可扩展性。

需要注意的是,虽然从用户空间的角度来看,所有事物都像文件一样被处理,但在内核空间中,这些对象实际上是通过不同的数据结构和机制来实现的。struct file只是其中的一个关键组成部分,它与其他内核数据结构(如struct inodestruct file_operations等)共同协作,实现了Linux中文件系统的强大功能。

5. Linux中的重定向

重定向是Linux中一种强大的IO处理机制,它允许我们将命令的标准输入、标准输出或标准错误输出重定向到其他位置,如文件、其他命令或设备。

5.1 输出重定向

输出重定向是将命令的标准输出重定向到文件或其他命令。例如,使用>符号可以将命令的输出重定向到一个文件

echo "Hello, World!" > output.txt

这会将字符串"Hello, World!"写入到output.txt文件中,而不是输出到终端,而且是覆盖式输出!

5.2 追加重定向

追加重定向与输出重定向类似,但它会将输出追加到文件的末尾,而不是覆盖文件内容。这可以通过>>符号来实现:

echo "Another line." >> output.txt

这会将字符串"Another line."追加到output.txt文件的末尾。

5.3 输入重定向

输入重定向则是将命令的标准输入重定向到文件或其他命令。例如,使用<符号可以将文件的内容作为命令的输入:

cat < input.txt

这会将input.txt文件的内容作为cat命令的输入,并在终端上显示。

6. 结合文件描述符理解重定向

在Linux中,标准输入、标准输出和标准错误输出分别对应文件描述符0、1和2。重定向操作实际上就是改变这些文件描述符的指向。例如,输出重定向实际上是将文件描述符1(标准输出)重定向到指定的文件或设备。

结合例子:

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
 
int main()
{
 close(1);
 int fd = open("myfile", O_WRONLY|O_CREAT, 00644);
 if(fd < 0){
 perror("open");
 return 1;
 }
 printf("fd: %d\n", fd);
 fflush(stdout);
 
 close(fd);
 exit(0);
}

代码中,先是关闭了标准输出,然后要打开一个文件,通过文件描述符分配规则(分配空闲中最小的),此时会把1分配给这个刚打开的文件myfile,那么printf是通过stdout输出的,stdout是C语言封装的一个结构体FILE*,内部封装了fd=1,所以它还是会通过fd=1来找到要输出的文件,从而在myfile中输出数据。

所以重定向的原理其实就是用户层被封装的fd不变,操作系统内核内fd指向已经变了,从而通过改变不同的指向来实现输入、输出、追加重定向。

 7.重定向的系统调用

重定向在底层是通过系统调用来实现的。在C语言中,我们可以使用dup2close等系统调用来改变文件描述符的指向,从而实现重定向的功能。这些系统调用允许程序在运行时动态地改变IO流的方向,从而实现了灵活的文件处理机制。

总结:

文件操作主要由进程完成,这些进程通过操作系统来打开、处理和关闭文件。由于涉及到操作系统,我们引入了系统调用和文件描述符等概念。在OS内核中,文件的管理遵循“先描述,再组织”的原则。为了实现用户层的输入/输出重定向,我们利用用户层和内核层数据的不一致性,修改内核层中文件描述符的指向实现重定向功能

简而言之,进程通过系统调用和文件描述符与操作系统交互,实现对文件的操作,并可通过修改文件描述符的指向实现重定向功能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1618214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker容器:镜像与容器命令管理

目录 一、镜像管理命令 1、搜索镜像 2、获取镜像 3、镜像加速下载 4、查看下载的镜像文件信息 5、查看下载到本地的所有镜像 6、获取指定镜像的详细信息 7、为本地的镜像添加新的标签 8、删除镜像 8.1 删除指定的镜像 8.2 批量删除多个镜像 9、导出镜像与导入镜像 …

CUDA线程管理

核函数在主机端启动时&#xff0c;执行会转移到设备上&#xff0c;并且将控制权转移回主机。当核函数在GPU上运行时&#xff0c;主机可以运行其他函数。因此&#xff0c;主机与核函数是异步的。 此时&#xff0c;设备端也就是GPU上会产生大量的线程&#xff0c;并且每个线程都…

汇编期末复习知识点

参考文献1 第一章 概述 组成 计算机系统由硬件子系统和软件子系统组成。硬件子系统&#xff1a;组成计算机系统的所有电子的&#xff0c;机械的&#xff0c;光学的和磁性的元部件。 计算机中常用进制数表示 十进制(Decimal):数据尾部加一后缀D&#xff0c;如2355D二进制&a…

【技巧】Git 版本控制工具没有图标提示怎么办?

Git 版本控制工具在日常开发中使用率是非常高的&#xff0c;多数情况下会安装 TortoiseGit 之类的插件&#xff0c;让文件夹显示图标&#xff0c;方便观察文件的状态。但是有时装完插件之后发现&#xff0c;文件夹/文件并没有图标显示&#xff0c;可以按照以下思路进行排查&…

Git 核心概念与实操

这里写目录标题 1 版本回退2 工作区、暂存区、本地仓库、远程仓库 1 版本回退 原文链接&#xff1a;https://www.liaoxuefeng.com/wiki/896043488029600/897013573512192 首先 git log 查看提交记录 在Git中&#xff0c;用 HEAD 表示当前版本 上一个版本就是 HEAD^ &#xff…

Abaqus2024 安装教程(附免费安装包资源)

鼠标右击软件压缩包&#xff0c;选择“解压到Abaqus2024”。 鼠标右击“此电脑”&#xff0c;选择“属性”。 点击“高级系统设置”。 点击“环境变量”。 点击“新建”。 变量名输入&#xff1a;NOLICENSECHECK 变量值输入&#xff1a;true 然后点击“确定”。 点击“确定”。…

裤裤带你一起学C语言内存函数啦!

目录 1.memcpy的使用和模拟实现 2.memmove使用和模拟实现 3.memset函数的使用 4.memcmp函数的使用 内存函数在<string.h>库中&#xff0c;我们使用内存函数必须先引入<string.h>头文件 1.memcpy的使用和模拟实现 memcpy的函数原型如下&#xff1a; void * m…

【重要】Heygen订阅指南和用法详解!让照片学说话?一张照片变演讲?Heygen订阅值得吗?

常见问题 Q&#xff1a;Heygen是什么&#xff1f;Heygen是什么玩意&#xff1f; A&#xff1a;Heygen是一款由AI视频工具,创作者只需要上传视频并选择要翻译的语言&#xff0c;该工具可实现自动翻译、调整音色、匹配嘴型。为了方便理解&#xff0c;笔者利用Heygen制作了一个AI视…

QA测试开发工程师面试题满分问答20: 软件的安全性应从哪几个方面去测试?

软件的安全性测试应从多个方面进行&#xff0c;并确保覆盖以下关键方面&#xff1a; 当回答问题时&#xff0c;可以根据自己的经验和知识&#xff0c;从上述要点中选择适合的方面进行详细说明。强调测试的综合性、全面性和持续性&#xff0c;并强调测试的重要性以及如何与开发团…

cdp集群主节点根目录磁盘扩容

查看挂载点 df -h可以看到&#xff0c;根目录容量只有37G&#xff0c;现在对根目录进行扩容 查看根目录挂载的磁盘大小 lsblk挂载磁盘名字为vda&#xff0c;磁盘容量有80G&#xff0c;现在磁盘使用量为vda下面三个分区vda1&#xff0c;vda2&#xff0c;vda3容量之和&#xf…

OpenWRT磁盘扩容(PVE虚拟机方案)

官方扩容指导文档 PVE给虚拟机磁盘扩容 给虚拟机磁盘扩容&#xff0c;选中OpenWRT的硬盘&#xff0c;随后选择调整大小 输入增量大小&#xff0c;即增加多少磁盘空间给硬盘。这里我选择增加4G 进入OpenWRT控制台界面安装一些linux常用查看磁盘的工具&#xff08;也可以通过网…

SpringCloud系列(12)--服务提供者(Service Provider)集群搭建

前言&#xff1a;在上一章节中我们成功把微服务注册进了Eureka集群&#xff0c;但这还不够&#xff0c;虽然注册服务中心Eureka已经是服务配置了&#xff0c;但服务提供者目前只有一个&#xff0c;如果服务提供者宕机了或者流量过大&#xff0c;都会影响到用户即服务使用者的使…

自己手动在Linux上实现一个简易的端口扫描器

背景 常常听到网络攻击有一个东西叫做端口扫描器&#xff0c;可以扫描指定服务器开放的端口&#xff0c;然后尝试连接&#xff0c;并寻找漏洞&#xff0c;最终攻破服务器。而那些使用的端口扫描器都是一个个现成的程序&#xff0c;看上去很厉害的样子。而实际上这些东西对于懂…

springcloud alibaba 整合seata的TCC

一、seata服务端搭建同上篇。 Seata的AT模式客户端两阶段提交流程源码分析 二、seata客户端的结构 1.示例DEMO工程 下单&#xff0c;扣余额&#xff0c; 减库存。 2. MAVEN配置。 父工程&#xff1a;由于spring-cloud-starter-alibaba-seata依赖的seata-spring-boot-starter…

深度学习-数据预处理

目录 创建一个人工数据集处理缺失的数据插入对inputs中的类别值或离散值&#xff0c;将NaN视为一个类别对inputs和outputs中的数值类型转换为张量格式 创建一个人工数据集 import os import pandas as pd os.makedirs(os.path.join(.., data), exist_okTrue) data_file os.p…

C++判断一个点是否在一个在任意空间中的长方体中

目录 不旋转的长方体计算旋转矩阵及旋转后的长方体计算旋转矩阵计算旋转后的长方体 判断点是否在旋转后的长方体内 不旋转的长方体 如果这个长方体是规则的&#xff0c;不进行任何旋转&#xff0c;可以先计算长方体的BoundingBox&#xff0c;判断点是否在3D的BoundingBox中即可…

自制Apache-Doris 2.0.4镜像Docker部署一Fe和一Be集群及遇到的问题解决

自制Apache-Doris 2.0.4镜像Docker部署一Fe和一Be集群及遇到的问题解决 文章目录 1.前言2.doris是什么&#xff1f;2.1简介2.2介绍2.3使用场景2.4架构 3.官网4.构建部署4.1 构建环境4.2 doris2.0.4的fe和be镜像构建4.2.1 fe2.0.4镜像构建脚本4.2.2 be2.0.4镜像构建4.2.3 启动脚…

Matlab对多个输入信号进行数值排序提取特定值

1、将多个信号转为一个数组信号输出&#xff0c;在这里需要注意&#xff0c;数据类型是否统一&#xff1b; 2、使用Sort模块&#xff0c;进行排序&#xff08;可设置排序方向&#xff09;&#xff0c;得到排序后的新数组以及对应的索引号&#xff1b; 3、设置想要的索引号&…

YOLOv8改进项目汇总-超全改进-ultralyticsPro介绍:订阅了《芒果YOLOv8原创改进专栏》的读者免费赠送,包括很多稀有改进

&#x1f525;&#x1f525;&#x1f525;专注于YOLOv8改进&#xff0c;NEW - YOLOv8 &#x1f680; in PyTorch >, Support to improve Backbone, Neck, Head, Loss, IoU, LA, NMS and other modules&#x1f680; Makes YOLOv8 improvements easy again 芒果出品 YOLOv8…

前端CSS基础8(盒子模型(margin、border、padding、content))

前端CSS基础8&#xff08;盒子模型&#xff08;margin、border、padding、content&#xff09;&#xff09; CSS盒子模型CSS中常用的长度单位元素的分类&#xff0c;各个元素的显示模式修改元素的显示模式&#xff08;类型&#xff09;盒子模型的组成部分盒子内容区-contentCSS…