2 文件IO

2.1 文件描述符

对于内核而言，所有打开文件都由文件描述符引用。文件描述符是一个非负整数。当打开一个现存文件或创建一个新文件时，内核向进程返回一个文件描述符。当读、写一个文件时，用open或creat返回的文件描述符标识该文件，将其作为参数传送给 read或write。

UNIX shell使文件描述符0与进程的标准输入相结合，文件描述符 1与标准输出相结合，文件描述符2与标准出错输出相结合。

幻数 0、1、2应被代换成符号常数 STDIN _ FILENO、STDOUT _ FILENO和STDERR_FILENO。

2.2 open函数

调用open函数可以打开或创建一个文件。

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

//返回：若成功为文件描述符，若出错为- 1
//由open返回的文件描述符一定是最小的未用描述符数字
int open(const char *pathname , int oflag,.../*, mode_t mode * /) ;

对于open函数而言，仅当创建新文件时才使用第三个参数。

pathname是要打开或创建的文件的名字。oflag参数可用来说明此函数的多个选择项。用下列一个或多个常数进行或运算构成oflag参数(这些常数定义在<fcntl . h>头文件中)：

O_RDONLY 只读打开。
O_WRONLY 只写打开。
O_RDWR 读、写打开。

这三个常数中只能指定一个。下列常数是可选择的：

O_APPEND 每次写时都加到文件的尾端。
O_CREAT 若此文件不存在则创建它。使用此选择项时，需同时说明第三个参数 mode，用其说明该新文件的存取许可权位。
O_EXCL 如果同时指定了O_CREAT，而文件已经存在，则出错。这可测试一个文件是否存在，如果不存在则创建此文件成为一个原子操作。
O_TRUNC 如果此文件存在，而且为只读或只写成功打开，则将其长度截短为 0。
O_NOCTTY 如果pathname指的是终端设备，则不将此设备分配作为此进程的控制终端。
O_NONBLOCK 如果pathname指的是一个FIFO、一个块特殊文件或一个字符特殊文件，则此选择项为此文件的本次打开操作和后续的 I / O操作设置非阻塞方式。
O_SYNC 使每次write都等到物理I / O操作完成。

2.3 create函数

creat函数创建一个新文件。

#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

//返回：若成功为只写打开的文件描述符，若出错为- 1
int creat(const char *pathname, mode_t mode) ;


//这个函数等效于：
open (pathname, O_WRONLY｜O_CREAT｜O_TRUNC, mode) ;

2.4 close函数

用close函数关闭一个打开文件：

#include <unistd.h>
int close (int filedes)；

关闭一个文件时也释放该进程加在该文件上的所有记录锁。当一个进程终止时，它所有的打开文件都由内核自动关闭。

2.5 lseek函数

每个打开文件都有一个与其相关联的“当前文件位移量”。它是一个非负整数，用以度量从文件开始处计算的字节数。一般来说，读、写操作都从当前文件位移量处开始，并使位移量增加所读或写的字节数。按系统默认，当打开一个文件时，除非指定O_APPEND选择项，否则该位移量被设置为0。

可以调用lseek显式地定位一个打开文件。

#include <sys/types.h>
#include <unistd.h>

//返回：若成功为新的文件位移，若出错为- 1
off_t lseek(int filedes, off_t offset, int whence) ;

对参数offset 的解释与参数whence的值有关。

若whence是SEEK_SET，则将该文件的位移量设置为距文件开始处offset 个字节。
若whence是SEEK_CUR，则将该文件的位移量设置为其当前值加offset, offset可为正或负。
若whence是SEEK_END，则将该文件的位移量设置为文件长度加offset, offset可为正或负。
若lseek成功执行，则返回新的文件位移量，为此可以用下列方式确定一个打开文件的当前位移量：

off_t currpos;
currpos = lseek(fd, 0, SEEK_CUR);

这种方法也可用来确定所涉及的文件是否可以设置位移量。如果文件描述符引用的是一个管道或FIFO，则lseek返回－1，并将errno设置为EPIPE。

2.6 read函数

#include <unistd.h>

//返回：读到的字节数，若已到文件尾为 0，若出错为-1
ssize_t read(int filedes, void *buff, size_t nbytes) ;

如read成功，则返回读到的字节数。如已到达文件的尾端，则返回 0。有多种情况可使实际读到的字节数少于要求读字节数：

读普通文件时，在读到要求字节数之前已到达了文件尾端。例如，若在到达文件尾端之前还有30个字节，而要求读100个字节，则read返回30，下一次再调用read时，它将返回0 (文件尾端)。
当从终端设备读时，通常一次最多读一行。
当从网络读时，网络中的缓冲机构可能造成返回值小于所要求读的字节数。
某些面向记录的设备，例如磁带，一次最多返回一个记录。读操作从文件的当前位移量处开始，在成功返回之前，该位移量增加实际读得的字节数。

2.7 write函数

#include <unistd.h>

//返回：若成功为已写的字节数，若出错为- 1
ssize_t write(int filedes, const void * buff, size_t nbytes) ;

其返回值通常与参数nbytes的值不同，否则表示出错。write出错的一个常见原因是：磁盘已写满，或者超过了对一个给定进程的文件长度限制。

2.8 文件共享

UNIX支持在不同进程间共享打开文件。内核使用了三种I/O的数据结构，它们之间的关系决定了在文件共享方面一个进程对另一个进程可能产生的影响。

（1）每个进程在进程表中都有一个记录项，每个记录项中有一张打开文件描述符表，可将其视为一个矢量，每个描述符占用一项。与每个文件描述符相关联的是：

（a）文件描述符标志。

（b）指向一个文件表项的指针。

（2）内核为所有打开文件维持一张文件表。每个文件表项包含：

（a）文件状态标志(读、写、增写、同步、非阻塞等)。

（b）当前文件位移量。

（c）指向该文件v节点表项的指针。

（3）每个打开文件（或设备）都有一个 v节点结构。 v节点包含了文件类型和对此文件进行各种操作的函数的指针信息。对于大多数文件， v节点还包含了该文件的i节点（索引节点）。这些信息是在打开文件时从盘上读入内存的，所以所有关于文件的信息都是快速可供使用的。例如， i节点包含了文件的所有者、文件长度、文件所在的设备、指向文件在盘上所使用的实际数据块的指针等等。

如果两个独立进程各自打开了同一文件，则有下图中所示的安排。我们假定第一个进程使该文件在文件描述符 3上打开，而另一个进程则使此文件在文件描述符 4上打开。打开此文件的每个进程都得到一个文件表项，但对一个给定的文件只有一个 v节点表项。每个进程都有自己的文件表项的一个理由是：这种安排使每个进程都有它自己的对该文件的当前位移量。

在完成每个write后，在文件表项中的当前文件位移量即增加所写的字节数。如果这使当前文件位移量超过了当前文件长度，则在i节点表项中的当前文件长度被设置为当前文件位移量（也就是该文件加长了）。
如果用O_APPEND标志打开了一个文件，则相应标志也被设置到文件表项的文件状态标志中。每次对这种具有添写标志的文件执行写操作时，在文件表项中的当前文件位移量首先被设置为i节点表项中的文件长度。这就使得每次写的数据都添加到文件的当前尾端处。
lseek函数只修改文件表项中的当前文件位移量，没有进行任何 I / O操作。
若一个文件用lseek被定位到文件当前的尾端，则文件表项中的当前文件位移量被设置为 i 节点表项中的当前文件长度。可能有多个文件描述符项指向同一文件表项。

2.9 原子操作

2.9.1 添加至一个文件

假定有两个独立的进程A和B，都对同一文件进行添加操作。每个进程都已打开了该文件，但未使用O_APPEND标志。此时每个进程都有它自己的文件表项，但是共享一个v节点表项。假定进程A调用了lseek，进程B也调用了lseek，这时如果有一个进程写了数据，那么文件的长度就会发生改变，就会影响另一个进程的操作。

UNIX提供了一种方法使这种操作成为原子操作，其方法就是在打开文件时设置 O_APPEND标志。使内核每次对这种文件进行写之前，都将进程的当前位移量设置到该文件的尾端处，于是在每次写之前就不再需要调用 lseek。

2.10 dup和dup2函数

两个函数都可用来复制一个现存的文件描述符：

#include <unistd.h>

//两函数的返回：若成功为新的文件描述符，若出错为- 1
int dup(int filedes) ;
int dup2(int filedes, int filedes2) ;

由dup返回的新文件描述符一定是当前可用文件描述符中的最小数值。用dup2则可以用filedes2参数指定新描述符的数值。如果filedes2已经打开，则先将其关闭。如若filedes等于filedes2，则dup2返回filedes2，而不关闭它。

2.11 fcntl函数

fcntl函数可以改变已经打开文件的性质。

#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>

//返回：若成功则依赖于cmd，若出错为-1
int fcntl(int filedes, int cmd,.../* int arg * / ) ;

fcntl函数有五种功能：

• 复制一个现存的描述符（cmd＝F_DUPFD）。

• 获得/设置文件描述符标记（cmd = F_GETFD或F_SETFD）。

• 获得/设置文件状态标志（cmd = F_GETFL或F_SETFL）。

• 获得/设置异步I / O有权（cmd = F_GETOWN或F_SETOWN）。

• 获得/设置记录锁（cmd = F_GETLK , F_SETLK或F_SETLKW）。

文件状态标志	说明
O_RDONLY	只读打开
O_WRONLY	只写打开
O_RDWR	读/写打开
O_APPEND	写时都添加至文件尾
O_NONBLOCK	非阻塞方式
O_SYNC	等待写完成
O_ASYNC	异步I / O

2.12 ioctl函数

ioctl 函数是I / O操作的杂物箱。不能用本章中其他函数表示的 I / O操作通常都能用ioctl表示。终端I / O是ioctl 的最大使用方面。

#include <unistd.h> 
#include <sys/ioctl.h> 

//返回：若出错则为- 1，若成功则为其他值
int ioctl(int f i l e d e s, int re q u e s t, . . . ) ;

2.13 /dev/fd

比较新的系统都提供名为 /dev/fd的目录，其目录项是名为 0、1、2等的文件。打开文件/dev/fd/n等效于复制描述符n。

fd = open("/dev/fd/0", mode);

2 文件IO

2.1 文件描述符

2.2 open函数

2.3 create函数

2.4 close函数

2.5 lseek函数

2.6 read函数

2.7 write函数

2.8 文件共享

2.9 原子操作

2.9.1 添加至一个文件

2.10 dup和dup2函数

2.11 fcntl函数

2.12 ioctl函数

2.13 /dev/fd

相关文章

QT 网络编程之主机信息查询（QHostInfo 和 QNetworkInterface类）简介

【Redis】Redis中的5种基础数据类型详解

ref在Vue2、Vue3中的使用

@PostConstruct注解和@PreDestroy注解

java 获取当前线程的方法

一键导出ChatGPT聊天记录：让备份更简单

FT2000+ qemu kvm 64C64G 通过频繁设置CPU online 状态导致虚拟机红旗操作系统假死测试用例

北京 Meetup 预告 | 内含六个话题，满满干货，期待见面！

Day3_Springboot框架搭建

Spring(4) Spring是如何使用三级缓存来解决循环依赖问题？

【Docker】1、认识 Docker 和安装 Docker

爬虫（requsets）笔记

VS2022汇编环境搭建

【RabbitMQ】| Lion带你 (超详细) 从0到1使用SpringBoot操作RabbitMQ

Spring MVC开发及使用（8000字详解）

颜色空间转换RGB-YCbCr

2023五一杯数学建模竞赛ABC题思路解析+代码+论文

金陵科技学院五年一贯制专转本电路分析考试大纲

R 安装函数包及绘制图形

【二】MATLAB矩阵处理