Linux 应用编程中最需要掌握的基础就是文件 I/O的操作,学习过linux或者有过了解的应该都会听过一句话:linux中一切皆文件,文件是linux系统的核心设计思想。所以掌握文件的操作是很重要的。
那文件 I/O 又是什么?文件I/O指的是对文件的输入/输出操作,简单点说就是对文件进行的读写操作,包括打开文件、关闭文件、从文件中读取数据和向文件中写入数据等的操作。
本文就分享linux下的一些文件的简单操作,涉及文件描述符、文件打开、读文件、写文件、文件指针lseek。
1、文件描述符(fd)
linux中打开的文件不管是现有文件还是新创建的文件,内核都会为文件分配一个编号,这个编号用于指代这个被打开的文件,在IO操作中会返回到进程中,这个编号就是文件描述符。
文件描述符对于一个进程来说是一种有限资源,并不是无限的。
一个进程中的文件描述符是从 0 开始分配的,一直到最大的文件描述的数量位置。
假如说进程中最大的文件描述符数量为1024个,而第一个被打开的文件对应的文件描述符是 0、第二个文件是 1、第三个文件是 2、第 4 个文件是 3……以此类推,所以由此可知,文件描述符数字最大值为 1023(0~1023)。
每一个被打开的文件在同一个进程中都有一个唯一的文件描述符,不会重复,如果文件被关闭后,它对应的文件描述符将会被释放,那么这个文件描述符将可以再次分配给其它打开的文件、与对应的文件绑定起来。
对于linux系统中进程允许打开的最大的文件数是多少,可以用指令进行查看,如下:
ulimit -n
如下示例:
注意:在实际使用中,我们在程序调用函数打开文件的时,分配的文件描述符一般都是从 3 开始,0、1、2 这三个文件描述符是默认被系统占用的,它们分配给了系统标准输入(0)、标准输出(1)、标准错误(2)。
2、文件打开操作(open)
Linux 系统中要操作一个文件,需要先打开该文件,得到文件描述符,然后再对文件进行相应的操作。
open 函数用于打开文件,它除了能打开已经存在的文件,还能创建新的文件。函数原型如下:
#include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> int open(const char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode);
使用linux时,如果想要查看某些系统调用API函数的原型和用法,可以通过man命令获得帮助,如下:man 2 open
函数open的帮助如下:
3、文件读操作(read)
当使用open函数成功打开一个文件之后,就可以使用read函数读取文件中的内容,同样可以使用man指令查询read函数的用法,如下:
read函数的原型如下:
#include <unistd.h>
ssize_t read(int fd, void *buf, size_t count);
4、文件写操作(write)
调用 write 函数可向打开的文件写入数据,通过man 2 write 可以查看该函数的用法,如下:
函数原型如下:
#include <unistd.h>
ssize_t write(int fd, const void *buf, size_t count);
5、文件指针偏移(lseek)
每个打开的文件,系统都会记录它的读写位置偏移量,也把这个读写位置偏移量称为文件指针,它记录了文件当前的读写位置。
当调用 read()或 write()函数对文件进行读写操作时,会从当前读写位置偏移量开始进行数据读写。
并且这个偏移量是以相对于文件头部的位置开始偏移的,文件第一个字节数据的位置偏移量为 0。
所以有些时候我们对文件进行操作时是需要知道文件当前的偏移位置在哪里的。又或者说需要从文件的某些位置开始操作时,就需要设置文件指针的偏移,这样才能让我们操作到需要操作的文件的位置。
设置文件指针偏移的函数为lseek,它的函数原型如下:
#include <sys/types.h>
#include <unistd.h>
off_t lseek(int fd, off_t offset, int whence);
函数参数如下:
fd :文件描述符。
offset :偏移量,以字节为单位。
whence :用于定义参数 offset 偏移量对应的参考值,该参数为下列其中一种:
1)SEEK_SET:读写偏移量将指向 offset 字节位置处(从文件头部开始算);
2)SEEK_CUR:读写偏移量将指向当前位置偏移量 + offset 字节位置处,offset 可以为正、也可以为负,如果是正数表示往后偏移,如果是负数则表示往前偏移;
3)SEEK_END:读写偏移量将指向文件末尾 + offset 字节位置处,同样 offset 可以为正、也可以为负,如果是正数表示往后偏移、如果是负数则表示往前偏移。
返回值:
成功将返回从文件头部开始算起的位置偏移量(字节为单位),也就是当前的读写位置;发生错误将返回-1。
该函数的使用示例:
1)将读写位置移动到文件开头处:
off_t offSet = lseek(fd, 0, SEEK_SET);
2)将读写位置移动到文件末尾:
off_t offSet = lseek(fd, 0, SEEK_END);
3)将读写位置移动到偏移文件开头 500 个字节处:
off_t offSet = lseek(fd, 500, SEEK_SET);
4)获取当前读写位置偏移量:
off_t offSet = lseek(fd, 0, SEEK_CUR);
6、文件关闭操作(close)
如果一个文件已经执行完操作,以后或者暂时不打算用到,那么这个被打开的文件是需要将其关闭的,文件需要使用时要打开,不再使用时要关闭,这是一种编程的习惯,平时也是需要去注意养成的。
关闭文件可以使用close,该函数的原型如下:
#include <unistd.h>
int close(int fd);
函数参数和返回值如下:
fd :文件描述符,需要关闭的文件所对应的文件描述符。
返回值:如果成功返回 0,如果失败则返回-1。
注意:close 函数是用于显式关闭文件的,在 Linux 系统中,如果一个进程终止了,内核会自动关闭这个进程打开的所有文件,这是一种隐式的关闭文件的方式。