文章目录
- Linux系统IO
- sysio简介
- sysio版本的copy
- 示例代码
- 代码说明
- 函数讲解
- 如何编译 运行
- 系统IO与标准IO的区别
- 示例代码
- 函数讲解
- 编译 运行?
- 程序中的重定向
- 代码示例
- 代码说明
- 函数讲解
- 编译 运行?
- 代码示例
- 函数讲解
- 编译 运行
Linux系统IO
sysio简介
所谓文件IO就是指文件的 输入(input)和 输出(output)
Linux 把大部分系统资源当作文件并呈现给用户,用户只需按照文件 I/O 的方式,就能完成数据的输入输出。 Linux 文件按其代表的具体对象,可大致分类为:
- 普通文件,即一般意义上的文件、磁盘文件;
- 设备文件,代表的是系统中一个具体的设备;
- 管道文件、 FIFO 文件,一种特殊文件,常用于进程间通信;
- 套接字(socket)文件,主要用在网络通信方面。
Linux 系统提供的文件 I/O 接口函数,是以最基本的系统服务形式提供的,又称它们为基本 I/O 函 数。这些函数有个共同的特点: 它们都通过文件描述符(file descriptor)来完成对指定文件的 I/O 操 作。文件描述符 fd(file descriptor)是进程中用来表示某个文件的整数, 有的文献资料中又称它为文件句柄(file handle)。
在Linux中,文件IO有两种实现方式,一种称为标准IO(stdio),一种称为系统IO(sysio)。这两者也就类似于普通话与方言的区别。
在本文来介绍系统IO,系统IO与标准IO不同的是:系统IO有一个概念叫文件描述符fd贯穿始终,而在标准IO中是FILE类型贯穿始终,我们知道系统IO是指系统底层的syscall(系统调用),每一个系统都有不同的系统调用,标准IO的出现才有了意义。
接下来,请跟我着手几个小例子,一起掌握Linux下的系统IO吧。
sysio版本的copy
大家应该都在shell中使用过cp命令吧。
cp命令用来copy一个文件或者是文件夹,这次我们使用sysio实现一个简易版的cp命令。
对于Linux自带的cp来说,要求我们在终端中输入具体的选项以及原路径和目标路径。
我们的简易版的mycopy也要具备这样的功能。
示例代码
#include "iostream"
#include "stdio.h"
#include "sys/stat.h"
#include "sys/wait.h"
#include "sys/types.h"
#include "unistd.h"
#include "errno.h"
#include "string.h"
#include <fcntl.h>
using namespace std;
#define BUFSIZE 9
int main(int argc, char **argv)
{
char buffer[BUFSIZE];
ssize_t ret = 0;
if (argc < 3)
{
fprintf(stderr, "Usage....\n");
exit(1);
}
/*
以只读的方式打开src文件
*/
int sfd = open(argv[1], O_RDONLY);
if (sfd < 0)
{
/*源文件打开失败*/
fprintf(stderr, "open() %s\n", strerror(errno));
exit(1);
}
int dfd = open(argv[2], O_WRONLY | O_CREAT | O_TRUNC, 0600);
if (dfd < 0)
{
/*目标文件打开失败*/
/*记得关闭源文件*/
close(sfd);
fprintf(stderr, "open() %s\n", strerror(errno));
exit(1);
}
/*从源文件中读取BUFSIZE个字节放道数据缓冲区中*/
int len = read(sfd, buffer, BUFSIZE);
if (len <= 0)
{
fprintf(stderr, "read() %s\n", strerror(errno));
exit(1);
}
if (len > 0)
{
/*以防写入不足*/
ret = write(dfd, buffer, BUFSIZE);
if (ret < 0)
{
fprintf(stderr, "write() %s\n", strerror(errno));
exit(1);
}
}
close(dfd);
close(sfd);
exit(0);
}
代码说明
以只读的方式打开源文件src,从src中读取BUFSIZE个字节到buffer缓冲区中。同时以只写的方式打开目标文件dest,从buffer缓冲区中向目标文件写入数据,一次性写入BUFSIZE个字节
函数讲解
open()函数定义如下:
open()函数打开或者创建一个文件
int open(const char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode);
open()函数要求传入一个const char *pathname路径名称。
参数flags参考如下:
通过open()函数创建的文件权限是多少呢?man手册给出了明确的解释:
当前的创建的文件权限为mode & ~umask。
同时,open()函数会返回一个打开文件的文件描述符fd,如果出错则返回-1,并设置errno。
read()函数定义如下:
read()函数从一个fd文件描述符中读取数据
ssize_t read(int fd, void *buf, size_t count);
int fd:fd指向要读取的源文件
void *buf:存储源文件中读取的字符串
size_t count:读取的字节数
read()函数从fd对应的文件中读取字符串,一次性读取count个字节,读取的字符串会存放在缓冲区buffer中。
man手册中还提到了,如果操作成功,read()函数会返回读取的字节数;如果操作失败,会返回-1,并设置errno。
write()函数定义如下:
write()函数向fd对应的文件中写入数据。
ssize_t write(int fd, const void *buf, size_t count);
int fd:fd对应的目标文件
const void *buf:从缓冲区buffer中向fd对应的目标文件写入数据
size_t count:一次性向目标文件写入的字节数
如果成功,write()函数会返回写入的字节数,如果失败,会返回-1,并设置errno。
close()函数定义如下:
close()函数关闭已经打开的文件
int close(int fd);
int fd:已经通过open打开的文件对应的文件描述符
如果成功返回0,如果失败则返回-1,并设置errno。这个close()函数与标准IO中的fclose()函数一般都是
操作成功的,不需要进行异常处理
如何编译 运行
首先您的当前路径中要存在一个源文件,
g++ main.cpp -o mycopy
./mycopy src dest
系统IO与标准IO的区别
标准IO的吞吐量大 系统IO的响应速度快(是对程序而言,对用户而言stdio的速度“更快”)
示例代码
#include "iostream"
#include "stdio.h"
#include "stdlib.h"
#include "unistd.h"
int main(int argc, char **argv)
{
for (int i = 0; i < 1025; i++)
{
putchar('a');
write(1, "b", 1);
}
exit(0);
}
函数讲解
标准IO与系统IO联系的纽带:fileno() fdopen()
我们要注意,标准IO与系统IO不可以混用。
fileno()定义如下:
int fileno(FILE *stream);
fileno()函数要求输入一个FILE类型,并返回一个文件描述符
fdopen()定义如下:
FILE *fdopen(int fd, const char *mode);
int fd:已经打开文件的对应文件描述符
const char *mode:权限模式
将FILE流与现有的文件描述符相关联。
如果成功返回一个文件指针;如果失败返回一个NULL,并设置errno
编译 运行?
g++ main.cpp -o main.o
./main.o
strace可以用来查看一个可执行文件的系统调用,使用strace ./main.o可以看到先进行1024次系统调用然后缓冲区满了1024合并为一次系统调用
putchar()是标准IO write()是系统IO。标准IO的吞吐量大 系统IO的响应速度快(是对程序而言,对用户而言stdio的速度“更快”)
在考虑到源代码的移植性好,通常选用标准IO而不是系统IO
程序中的重定向
dup 将传入的文件描述符复制到可使用的(未使用的)最小新文件描述符,在下面的例子中,将标准输出关闭后,文件描述符1空闲(不发生竞争时),dup将会把打开了文件out的文件描述符复制给文件描述符1 ,之后对文件描述符1 的操作就相当与操作文件out
代码示例
#include "stdio.h"
#include "iostream"
#include "stdlib.h"
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include "string.h"
#include "errno.h"
#include "unistd.h"
using namespace std;
#define FNAME "out"
int main(int argc, char **argv)
{
int fd = -1;
fd = open(FNAME, O_WRONLY | O_CREAT | O_TRUNC, 0600);
if (fd < 0)
{
fprintf(stderr, "open() %s\n", strerror(errno));
exit(1);
}
close(1);
dup(fd);
close(fd);
printf("hello world\n");
exit(0);
}
代码说明
通过open()函数以只写的方式打开FNAME文件,如果不存在这个文件则进行创建,如果存在则执行截断操作,并赋予对应的权限。如果fd < 0 代表错误,输出对应的错误信息并退出。如果成功,关闭1号文件描述符,使用dup()函数复制fd。
函数讲解
dup定义如下:
dup()函数是复制一个文件描述符
int dup(int oldfd);
int oldfd:一个文件描述符fd
dup()系统调用创建文件描述符oldfd的副本,为新的描述符使用编号最低的未使用文件描述符。
dup()函数如果操作成功,会返回一个新的文件描述符,如果出错返回-1,并设置errno。
注意:dup()函数的操作不原子
何谓原子性操作,即为最小的操作单元,比如i=1,就是一个原子性操作,这个过程只涉及一个赋值操作。 又如i++就不是一个原子操作,它相当于语句i=i+1;这里包括读取i,i+1,结果写入内存三个操作单元。 因此如果操作不符合原子性操作,那么整个语句的执行就会出现混乱,导致出现错误的结果,从而导致线程安全问题。
编译 运行?
由于dup()操作不原子,会导致线程安全问题,接下来会介绍一个具有原子性操作的函数dup2()
代码示例
#include "stdio.h"
#include "stdlib.h"
#include "iostream"
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include "string.h"
#include "errno.h"
#include "unistd.h"
using namespace std;
#define FNAME "out"
int main(int argc, char **argv)
{
int fd = -1;
fd = open(FNAME, O_WRONLY | O_CREAT | O_TRUNC, 0600);
if (fd < 0)
{
fprintf(stderr, "open() %s\n", strerror(errno));
exit(1);
}
dup2(fd,1);
if (fd != 1)
{
close(fd);
}
printf("hello world\n");
exit(0);
}
函数讲解
dup2()函数:
dup2()函数可以避免关闭文件描述符后被其他线程抢占
int dup2(int oldfd, int newfd);
dup2()和dup()函数一样,同样都是复制文件描述符,但它不使用编号最低的未使用文件描述符,它使用newfd中指定的文件描述符编号。
dup()函数在使用是,是返回的编号最低的未使用的文件描述符,这个文件描述符极可能会被其他文件占用,而dup2()函数就恰好解决了这个问题。
同样,dup2()函数成功会返回新的文件描述符,如果失败则返回-1,并设置errno。
编译 运行
同步
sync 设备即将解除挂载时进行全局催促,将buffer cache的数据刷新
fsync 刷新文件的数据
fdatasync 刷新文件的数据部分,不修改文件元数据