【linux基础I/O(1)】文件描述符的本质重定向的本质

news2025/1/7 7:25:38

目录

  • 前言
  • 1. 理解C语言的文件接口
  • 2. 操作文件的系统调用接口
    • 2.1 open函数详解
    • 2.2 close函数详解
    • 2.3 write函数详解
    • 2.4 read函数详解
  • 3. 文件描述符fd详解
  • 4. 文件描述符的内核本质
  • 5. 怎样理解Linux下一切皆文件?
  • 6. 理解输出输入重定向
  • 7. 重定向的系统调用
  • 8. 总结

前言

“在Linux系统下,一切皆文件”,相信你也听过这句话,,那么怎样理解这句话呢?学会这篇文字,你就能理解了。

本章重点:

本篇文章着重讲解I/O的四个系统调用接口, 以及文件描述符fd的认识与fd的本质, 最后讲解应该怎样理解Linux下一切皆文件这一说法.在此之前,会先复习一下C语言的文件相关的库函数。

1. 理解C语言的文件接口

首先C\C++程序会默认打开stdin,stdout和stderr三个标准文件方便程序员直接进行读写.

但是显然有点不对劲, 我们平时使用printf和scanf时是从显示器中显示和从键盘输入, 是不是代表显示器和键盘在OS内部其实也可以看作文件?是的,向显示器打印和向磁盘写入无本质区别!

C语言打开文件的方式: fopen
C语言的读取: fread, fscanf, fgets
C语言的写入: fwrite, fprintf, fputs

fopen的返回值和三个标准文件类型都是FILE*

2. 操作文件的系统调用接口

每个语言都有一套自己的文件操作函数,但不管上层语言怎样变化,它都是封装了系统调用,所以文件的系统调用很重要!

一共四个函数:
1.open: 打开文件
2.close: 关闭文件
3.write: 向文件写入
4.read: 从文件中读取

2.1 open函数详解

在这里插入图片描述
open函数的解释如下:
在这里插入图片描述

这个flag比较特殊,虽然它是整型,但是内部却当作了位图在使用,即传递过来的选项会被当作位图中的不同位,通过判断某位是否为1来查看是否有这个选项.

open的选项(实际上是宏定义的整数)
在这里插入图片描述
open的用法: 多个选项用或|分割

int fd = open("/home/cc/test.txt",O_WRONLY | O_CREAT);

2.2 close函数详解

在这里插入图片描述
close函数很简单,意思就是关闭文件描述符fd对应的文件, 调用成功返回0.

2.3 write函数详解

在这里插入图片描述
write是向文件描述符fd对应的文件中写入数据, 数据的来源是buf, 要写入的字节数是count, 调用成功返回写入到文件中的字节数.

write的一般用法:

char* buffer = "abcdef";
int fd = open("/home/cc/text.txt",O_WRONLY);
write(fd,buffer,sizeof(buffer));

2.4 read函数详解

在这里插入图片描述
read是从文件描述符fd对应的文件中读取数据, 将数据读取到buf中,要读取的长度是count, 调用成功返回读取到的字节数.

read的一般用法:

char buffer[1024];
int fd = open("/home/cc/text.txt",O_WRONLY);
ssize_t n = read(fd,buffer,sizeof(buffer));
if(n > 0)
	buffer[n] = '\0';//将字符串变成C语言风格,以\0结尾

3. 文件描述符fd详解

我们知道文件描述符是一个整数,那么它是否有什么规律呢?请看下面的代码:

int fd1 = open("/home/kwy/text1.txt",O_WRONLY | O_CREAT);
int fd2 = open("/home/kwy/text2.txt",O_WRONLY | O_CREAT);
int fd3 = open("/home/kwy/text3.txt",O_WRONLY | O_CREAT);
int fd4 = open("/home/kwy/text4.txt",O_WRONLY | O_CREAT);
printf("%d, %d, %d, %d",fd1,fd2,fd3,fd4);

会发现fa1,2,3,4的整数值分别是:
3,4,5,6,这是为什么?需要回答两个问题:

1. 0号1号和2号描述符去哪儿了?
2. 文件描述符的增长规律是什么?

首先, 在最开始说过C/C++程序会默认打开stdin, stdout, stderr三个标准文件,所以其实0,1,2号文件描述符就是这三个标准文件.

其次, 0,1,2被使用后, 后面的文件描述符会从3开始, 依次+1, 一共创建到6号描述符,若此时将3号文件描述符关闭,下次打开文件对应的描述符就是3,而不是7!

可以使用下面的代码来验证第一个猜想:

//向屏幕打印信息
const char* str = "abcdef";
write(1, str, strlen(str));
//从屏幕读取信息
char buffer[1024];
int n = read(0, buffer, sizeof(buffer));
if(n > 0)
	buffer[n] = '\0';

4. 文件描述符的内核本质

进程想要访问某个文件的前提是打开文件,在操作系统内可能会有很多个打开的文件,OS为了维护这些资源,需要对它进行管理,会为每个打开的文件创建struct file结构体, 再用链表将这些结构体连接起来.
在这里插入图片描述

这是文件在OS内部的管理体系,而每个进程都要知道自己打开了哪些文件, 所以进程PCB中会保存一张文件描述符表(本质是结构体指针),这个表中存放了这个进程打开的所有文件!
在这里插入图片描述

从这个图中可以看见, 文件描述符的本质其实就是数组的下标,每次打开文件会去数组中扫描,找到最近的没有被使用的下标!

5. 怎样理解Linux下一切皆文件?

首先,底层不同的硬件如磁盘,显卡,键盘等一定对应了不同的操作方法,但这些设备的核心功能就是读写,也就是I/O.

在这里插入图片描述
操作系统会为每一个底层硬件创建struct file结构体,此结构体中一定包含了两个函数指针,分别指向这个硬件对应的读方法和写方法.

所以当我们使用键盘或打开显示器时,就会有对应的指针指向对应的那个方法。
所以当我们使用键盘时,0S就会去找到那个structfile,并且找到里面的方法调用。当我们从 struct file 的角度向上看时,就不用关心底层外设的差异了,操作它们的方法都是:read/write的函数指针,在上层我们看到是所有设备就叫做 一切皆文件!

6. 理解输出输入重定向

根据上面的推论,如果我先把1号描述符关闭了,再打开一个文件,它的描述符就应该是1,此时再进行输出会发现什么?

int main()
{
    close(1);
    int fd = open("log.txt",O_WRONLY | O_CREAT | O_TRUNC, 0666);
    printf("fd: %d\n",fd);
    fprintf(stdout,"hello fprintf,我是一号文件描述符\n");
    return 0;
}

在这里插入图片描述

两个现象,第一个确实如刚刚所说的新打开的文件的描述符就是1,并且此时使用printf输出也不会输出到屏幕使用fprintf向stdout也不会输出到屏幕而是输出到文件log.txt中.说明stdout只认文件描述符1,不管1此时还是不是标准输出,printf函数也是如此.

结论:重定向本质就是在OS内部修改fd对应的内容指向.

在这里插入图片描述

7. 重定向的系统调用

如果每次写重定向都要先关闭一个文件,再来操作未免有些麻烦了,可以直接使用系统调用dup或dup2函数.
在这里插入图片描述

我们一般都使用dup2,它的意思是把原本写入到newfile 文件的内容,重定向到 oldfile 文件中!最终和oldfd描述符是一样的。比如现在想把本来应该打印在显示器(1号描述符)的信息打印在log.txt中(3号描述符),应该这样使用:

open("log.txt",O_WRONLY | O_CREAT);
dup2(3,1);

8. 总结

文件描述符是学习Linux下I/O的关键,而基础IO的知识将会一直陪伴我们到学习Linux网络和高级IO,掌握文件描述符fd的本质对后续的学习至关重要!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2271832.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

全面解析 Node-RED:功能、Docker 部署与实战示例

言简意赅的讲解Node-RED解决的痛点 Node-RED 是一个基于流的编程工具,专为物联网(IoT)应用而设计。它通过可视化的编程界面,使开发者能够轻松地连接各种硬件设备、API 以及在线服务,构建复杂的应用流程。本文将详细介…

2、pycharm常用快捷命令和配置【持续更新中】

1、常用快捷命令 Ctrl / 行注释/取消行注释 Ctrl Alt L 代码格式化 Ctrl Alt I 自动缩进 Tab / Shift Tab 缩进、不缩进当前行 Ctrl N 跳转到类 Ctrl 鼠标点击方法 可以跳转到方法所在的类 2、使用pip命令安装request库 命令:pip install requests 安装好了…

2025-01-04 Unity插件 YodaSheet1 —— 插件介绍

文章目录 1 介绍2 工作原理2.1 ScriptableObject -> YadeSheetData2.2 YadeDatabase 存储多个 YadeSheetData 3 用途4 缺点5 推荐 1 介绍 ​ Yade 提供类似于 Excel 或者 Google Sheets 的表格编辑器,可以轻松地在 Unity 编辑器中 编辑,搜索&#xf…

用 C++ 创建控制台计算器

本文内容 先决条件创建应用项目验证新应用是否生成并运行编辑代码 显示另外 5 个 C 程序员通常从在命令行上运行的“Hello, world!”应用程序开始。 你将以本文为起点,逐步进阶,加深学习难度:计算器应用。 先决条件 在 Visual Studio 中…

IDEA 撤销 merge 操作(详解)

作为一个开发者,我们都知道Git是一个非常重要的版本控制工具,尤其是在协作开发的过程中。然而,在使用Git的过程中难免会踩一些坑,今天我来给大家分享一个我曾经遇到的问题:在使用IDEA中进行merge操作后如何撤销错误的合…

限时特惠,香港服务器,低至53元/年

家人们谁懂啊!香港服务器这价格简直逆天了,居然比内地的还便宜!就拿阿里云来说,人家最低配置的服务器,价格都很难做到这么亲民。 最低配的就不说了,2 核 4G 的配置,应对日常业务稳稳当当&#x…

EF Core配置及使用

Entity Framework Core是微软官方的ORM框架。 ORM:Object Relational Mapping。让开发者用对象操作的形式操作关系数据库。 EF Core是对于底层ADO.NET Core的封装,因此ADO.NET Core支持的数据库不一定被EF Core支持。 代码创建数据库Code First 建实…

GPT分区 使用parted标准分区划分,以及相邻分区扩容

parted 是一个功能强大的命令行工具,用于创建和管理磁盘分区表和分区。它支持多种分区表类型,如 MBR(msdos)、GPT(GUID Partition Table)等,并且可以处理大容量磁盘。parted 提供了一个交互式界…

【mybatis-plus问题集锦系列】使用mybatis实现数据的基础增删改查

使用mybatis实现数据的基础增删改查,简单的增删改查操作方法步骤 代码实现 pom.xml <dependencies><dependency><groupId>org.mybatis.spring.boot</groupId><artifactId>mybatis-spring-boot-starter</artifactId><version>3.0.…

tlias项目实战笔记

一个小项目写了一个多月&#xff0c;在考试周穿插&#xff0c;终于能有时间来写个小总结了&#xff0c;废话少说&#xff0c;我们直接来步入正题。 一、项目开发规范 1.开发风格Restful 案例是基于当前最为主流的前后端分离模式进行开发。 在前后端分离的开发模式中&#xff…

Arduino Uno简介与使用方法

目录 一、Arduino Uno概述 1. 硬件特性 2. 开发环境 二、Arduino Uno的基本使用方法 1. 硬件连接 2. 软件编程 三、Arduino Uno编程基础 1. 基本语法 2. 常用函数 四、Arduino Uno应用举例 1. LED闪烁 2. 温度检测 3. 超声波测距 五、Arduino Uno的扩展与应用 1…

go 模拟TCP粘包和拆包,及解决方法

1. 什么是 TCP 粘包与拆包&#xff1f; 粘包&#xff08;Sticky Packet&#xff09; 粘包是指在发送多个小的数据包时&#xff0c;接收端会将这些数据包合并成一个数据包接收。由于 TCP 是面向流的协议&#xff0c;它并不会在每次数据发送时附加边界信息。所以当多个数据包按顺…

新能源电动汽车动力电池技术

新能源电动汽车动力电池技术是新能源汽车发展的核心之一&#xff0c;以下是动力电池技术的一些关键方面&#xff1a; 技术进展 能量密度提升&#xff1a;近年来&#xff0c;动力电池的能量密度有了显著提升&#xff0c;从2010年的100Wh/kg提高到2024年的300Wh/kg。能量密度的…

仓颉笔记——windows11安装启用cangjie语言,并使用vscode编写“你好,世界”

2025年1月1日第一篇日记&#xff0c;大家新年好。 去年就大致看了一下&#xff0c;感觉还不错&#xff0c;但一直没上手&#xff0c;这次借着元旦的晚上安装了一下&#xff0c;今年正式开动&#xff0c;公司众多的应用国产化正等着~~ 第一步&#xff1a;准备 官网&#xff1a;…

JVM对象内存结构

1对象内存结构说明 注意&#xff1a; 如果对象为数组对象&#xff0c;在对象头后面有4字节存储数组长度&#xff1b; 1.1对象头 对象头分为Mark Word和Class Pointer两部分&#xff1b; Mark Word&#xff1a;对象基础信息 32位操作系统中占4字节&#xff0c;64位操作系统中占8…

doris:基于 Arrow Flight SQL 的高速数据传输链路

Doris 基于 Arrow Flight SQL 协议实现了高速数据链路&#xff0c;支持多种语言使用 SQL 从 Doris 高速读取大批量数据。 用途​ 从 Doris 加载大批量数据到其他组件&#xff0c;如 Python/Java/Spark/Flink&#xff0c;可以使用基于 Arrow Flight SQL 的 ADBC/JDBC 替代过去…

算法题(25):只出现一次的数字(三)

审题&#xff1a; 该题中有两个元素只出现一次并且其他元素都出现两次&#xff0c;需要返回这两个只出现一次的数&#xff0c;并且不要求返回顺序 思路: 由于对空间复杂度有要求&#xff0c;我们这里不考虑哈希表。我们采用位运算的方法解题 方法&#xff1a;位运算 首先&#…

HTML——75. 内联框架

<!DOCTYPE html> <html><head><meta charset"UTF-8"><title>内联框架</title><style type"text/css">iframe{width: 100%;height: 500px;}</style></head><body><!--iframe元素会创建包含…

MotionCtrl: A Unified and Flexible Motion Controller for Video Generation 论文解读

目录 一、概述 二、相关工作 三、前置知识 1、LVDM Introduction 2、LVDM Method 3、LVDM for Short Video Generation 4、Hierarchical LVDM for Long Video Generation 5、训练细节 6、推理过程 四、MotionCtrl 1、CMCM 2、OMCM 3、训练策略 五、实验 一、概述…

vue2实现excel文件预览

一、插件 通过xlsx插件解析excel数据&#xff0c;对解析后的html组件进行渲染展示。 npm install xlsx 二、完整代码 <template><!-- excel文件预览 --><divelement-loading-text"拼命加载中"element-loading-spinner"el-icon-loading"…