多谢梅花,伴我微吟。 - 《高阳台·除夜》(韩疁)
2024.8.23
目录
1、文件描述符fd
文件操作符概念(简单带过)
重点:如何理解文件操作符使得系统实现了设备无关性?(使得操作系统无需关心具体的硬件细节)
示例代码:标准输入、标准输出和标准错误
文件描述符的分配规则
注意
2、重定向
重定向的简单例子
思考
重点:使用dup2函数进行重定向
重定向的重要应用
文件描述符,一个看似简单的整数,实际上是Linux系统中用于标识和访问文件、设备和其他输入输出资源的关键。每个进程在启动时,都会继承一组标准的文件描述符,它们是:标准输入(stdin)、标准输出(stdout)和标准错误(stderr)。这些描述符不仅是进程与外部世界通信的桥梁,更是操作系统抽象硬件细节、实现设备无关性的关键。通过重定向技术,我们可以灵活地改变输出的目的地,无论是将标准输出重定向到文件,还是将错误信息发送到日志系统,甚至是将输入从文件中读取。这种灵活性,正是Linux系统强大功能的一部分。
1、文件描述符fd
文件操作符概念(简单带过)
文件描述符(fd)是一个用于表示打开文件的整数,每个进程在启动时会有三个标准文件描述符:标准输入(0)、标准输出(1)和标准错误(2)。
在Linux系统中,每个进程在启动时都会打开一组标准的文件描述符,它们是:
- 标准输入(stdin):文件描述符为0,通常关联到键盘输入。
- 标准输出(stdout):文件描述符为1,通常关联到显示器输出。
- 标准错误(stderr):文件描述符为2,同样通常关联到显示器,用于输出错误信息。
这些文件描述符允许程序以一种标准和约定的方式来进行输入和输出操作,而无需关心具体的设备细节,实现了设备无关性。
重点:如何理解文件操作符使得系统实现了设备无关性?(使得操作系统无需关心具体的硬件细节)
比如说:3号文件描述符是打印机,4号文件描述符是音响。OK,我执行输出操作的时候操作系统不需要关系你到底是打印机还是音响,我都通过固定的输出接口把数据给到设备,让设备自己处理系统发来的输出数据做处理,处理成设备自己能识别的格式(一般是驱动对数据处理之后发送给设备,所以说驱动是系统和硬件的中间件~~),黑白打印机就识别为黑白像素点,音响就识别为频率振幅等等~~
打印机和音响的输出设备如此,扫描仪和麦克风等输入设备也是一样的~~,设备将数据处理成同一格式再通过唯一的系统输入接口传入电脑。
我的理解:其实,这就是一种“多态”,系统提供固定的输入输出接口,根据设备的不同执行不同的IO细节操作,极大降低了系统和硬件的耦合度!!!(当时还没有提出多态概念,这可能是最早的“多态”,所以说当时写操作系统的大佬思想相当厉害!!! 再次膜拜~)
示例代码:标准输入、标准输出和标准错误
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
int main() {
char buf[1024]; // 定义一个缓冲区用于存储读取的数据
ssize_t s = read(0, buf, sizeof(buf)); // 从标准输入(键盘)读取数据
// // 等价于read(stdin, buf, strlen(buf));
if (s > 0) {
buf[s] = 0; // 将读取的字符串末尾添加null终止符
write(1, buf, strlen(buf)); // 将数据写入标准输出(显示器)
// 等价于write(stdout, buf, strlen(buf));
write(2, buf, strlen(buf)); // 将数据同时写入标准错误(显示器)
// 等价于write(stderr, buf, strlen(buf));
}
return 0;
}
文件描述符的分配规则
文件描述符本质上是一个小整数,它是一个指向进程打开文件表(files_struct
)中特定条目的索引。每个条目都包含了一个指向打开文件的数据结构(如file
结构体)的指针。当调用open
系统调用时,操作系统会分配一个新的文件描述符,并在这个表中创建一个新的条目。
在files_struct数组当中,找到当前没有被使用的最小的一个下标,作为新的文件描述符。
注意
read
函数尝试从文件描述符0(标准输入)读取数据到缓冲区buf
中,返回值是实际读取的字节数。- 如果
read
成功,使用write
函数将读取的数据写入到文件描述符1(标准输出)和文件描述符2(标准错误)。write
函数将数据写入指定的文件描述符,返回值是成功写入的字节数。- 如果读取或写入失败,
read
和write
函数都会返回-1,并设置errno
以指示错误类型。buf[s] = 0;
这行代码确保了从标准输入读取的字符串是正确终止的,这对于字符串操作是安全的。
2、重定向
重定向的简单例子
根据文件fd的分配规则:在files_struct数组当中,找到当前没有被使用的最小的一个下标,作为新的文件描述符。当我们关闭系统默认开启的、较小的fd操作符,再次分配时就会将新的文件插入分配到此位置。
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
int main()
{
close(1);
int fd = open("myfile", O_WRONLY|O_CREAT, 0644);
if(fd < 0){
perror("open");
return 1;
}
printf("fd: %d\n", fd);
fflush(stdout);
close(fd);
exit(0);
}
我们发现,新打开的myfile文件在进程中分配的fd果然是我们关闭的1号文件描述符(对应的是stdout向显示器输出)。
思考
结果:printf输出的内容没有出现在显示器上,而是写入了myfile文件中,为什么会这样?
解释:printf默认是向stdout对应的文件操作符(对应的fd是1)执行输出,当我们一关一开1号文件描述符后,1号文件描述符的指向目标已近由显示器改为myfile(重定向到myfile),最后执行printf时,函数向1号文件描述符输出,结果就输出到了myfile文件之中。
重点:使用dup2函数进行重定向
前面,我们演示了重定向的简单例子,通过对系统提供的文件描述符先关闭,再打开文件,重定向了1号文件描述符。上述方式可以进行重定向操作,但是步骤繁琐、容易出错、而且对不了解内部原理的同学不够友好。Linux系统提供了一个系统调用接口dup2
来完成重定向操作,dup2
是一个 UNIX 和类 UNIX 系统上的系统调用,用于复制文件描述符。
dup2
函数的原型如下:
#include <unistd.h>
int dup2(int oldfd, int newfd);
dup2
函数有两个参数:
oldfd
:要复制的原始文件描述符。newfd
:复制后新的文件描述符。- 通过man手册查这个接口,解释晦涩难懂,必须狠狠吐槽! 我们直接看例子比较清晰。
前文演示的,将myfile重定向为1号文件描述符,等价于:
int myfile_fd = open("myfile", O_WRONLY|O_CREAT, 0644);
dup2(myfile_fd, 1);
如果 newfd
已经打开,dup2
会关闭它并用 oldfd
的副本来替换。newfd
将指向与 oldfd
相同的文件表项,从而共享相同的文件偏移量和文件状态标志。
如果 dup2
成功,它会返回新的文件描述符(即 newfd
)。如果调用失败,它会返回 -1
并设置全局变量 errno
以指示错误。
下面是使用 dup2
的一个示例代码:
#include <stdio.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>
int main() {
int oldfd, newfd;
const char *filename = "example.txt";
// 打开一个文件,获取文件描述符
oldfd = open(filename, O_WRONLY | O_CREAT | O_TRUNC, 0644);
if (oldfd < 0) {
perror("open");
return 1;
}
// 使用 dup2 将标准输出重定向到文件
newfd = dup2(oldfd, 1); // 将文件描述符 1 (stdout) 指向 oldfd
if (newfd < 0) {
perror("dup2");
close(oldfd);
return 1;
}
// 现在 printf 将输出到文件而不是控制台
printf("Hello, this is a test output to the file.\n");
// 关闭文件描述符
close(oldfd);
return 0;
}
在这个示例中,我们首先打开一个名为 "example.txt" 的文件,并获取它的文件描述符 oldfd
。然后,我们使用 dup2
将标准输出(stdout
,文件描述符为 1)重定向到这个文件。之后,任何对 printf
的调用都会将输出写入 "example.txt" 而不是显示器。最后,我们关闭文件描述符并退出程序。
重定向的重要应用
-
控制输出:重定向允许开发者控制程序输出的目标,例如将输出从控制台重定向到文件中,通过将错误信息重定向到单独的文件,开发者可以更容易地监控和分析程序运行中的错误,而不影响标准输出的清晰度。这对于日志记录、数据收集和后续分析非常有用(将日志持久化保存是重定向的重要应用~~)。
-
资源管理:重定向可以用于管理输入和输出资源,例如将一个程序的输出作为另一个程序的输入,实现管道操作。
-
测试和调试:在开发过程中,重定向可以帮助开发者将程序的输出保存到文件中,便于后续的测试和调试。