目录
- 🥅什么是文件:
- 🏑程序文件:
- 🏑数据文件:
- 🏑文件名:
- 🥅文件的打开和关闭:
- 🏑文件指针:
- 🏑fopen和fclose:
- 🥅文件的顺序读写:
- 🏑输出、输入和读取、写入:
- 🏑输出流、输入流的
- 🏑fgetc:
- 🏑fputc:
- 🏑fgets:
- 🏑fputs:
- 🏑fscanf:
- 🏑fprintf:
- 🏑fwrite:
- 🏑fread:
- 🏑对比scanf、fscanf、sscanf:
- 🏑对比printf、fprintf、sprintf:
- 🥅文件的随机读写:
- 🏑fseek:
- 🏑ftell:
- 🏑rewind:
- 🥅文本文件和二进制文件:
- 🥅文件读取结束的判定:
- 🏑如何判断文件读取结束:
- 🏑被错误使用feof:
- 🏑ferror:
- 🥅文件缓冲区:
前言:
今天分享的内容是和文件有关的操作。使用文件可以让我们的数据直接存存放到电脑的硬盘上,做到数据的 持久化,因此掌握对文件的操作,是一名程序员的必备技能,接下来就让我们进入今天的正题,看看到底如何对文件进行操作吧。
🥅什么是文件:
在磁盘上的文件是文件。在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能功能的角度来分类的)。
🏑程序文件:
主要包括以下几类:
- 源程序文件(后缀为.c)
- 目标文件(Windows环境后缀为.obj)
- 可执行程序文件(Windows环境下后缀为.exe)
🏑数据文件:
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者需要输出内容的文件.
今天我们谈的文件操作,都是针对数据文件来说的。在以前我们处理数据的输入输出都是已终端作为对象,即从键盘的终端输入数据,再将结果显示到终端的显示器上。有时后我们也会把信息输出到磁盘上,当需要的时候再把磁盘上的数据读取到内存中使用,这里处理的就是磁盘上的文件
🏑文件名:
一个文件要有一个唯一的标识符,一遍用户识别和引用。文件名包含以下三部分:文件路径+文件名主干+文件后缀。例如:
- c:\code\test.txt
其中c:\\code\\
就是文件路径,test
就是文件名主干,.txt
就是文件名后缀。
🥅文件的打开和关闭:
🏑文件指针:
缓冲文件系统中,关键的概念是“文件类型指针”简称文件指针。每一个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件相关的信息(如:文件的名字、文件的状态、文件当前的位置等信息)。这些信息保存在一个结构体变量中,该结构体类型是由系统声明的,取名FILE
。也就是说,每当我们打开一个文件,内存中都会创建一个FILE
类型的结构体变量与我们打开的文件对应。下图是VS2013中对FILE
的定义。不同的C编译器的FILE
类型包含的内容不完全相同,但是都大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE
结构体的变量,并填充里面的信息,我们不必关系里面的细节,只需要会用它就可以。一般我们都是通过一个FILE
的指针来维护这个FILE
结构体变量,这样使用起来更加方便。通过文件指针变量能够找到与他关联的文件
🏑fopen和fclose:
文件在读取之前要打开文件,在使用结束之后要关闭文件。在编写程序的时候,在打开文件的同时,会返回一个FILE*
的指针变量指向该文件,也相当于建立了文件和指针之间的关系。ANSIC规定使用fopen
函数来打开文件,fclose
函数来关闭文件
⚾:fopen
FILE * fopen ( const char * filename, const char * mode );
- 第一个参数
filename
是要被打开的文件的文件名,可以是文件的绝对路径(从根目录开始,例如c:\\code\\test.txt
就是一个绝对路径),也可以是文件的相对路径(相对与当前工程目录,例如:test.txt
,它表示当前工程目录里的test.txt
,..\\test.txt
表示当前工程目录的上一级目录中的test.txt
,其中..\\
代表的就是上一级目录) - 第二个参数
mode
是文件的打开方式,主要有以下几种:
文件使用方式 | 含义 | 如果指定文件不存在 |
---|---|---|
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件,会清空文本文件中的内容 | 建立一个新文件 |
“a”(追加) | 向文本文件尾添数据 | 建立一个新文件 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建立一个新的文件夹 | 建立一个新文件 |
“a+”(读写) | 打开一个新文件,在文件尾进行读写 | 建立一个新文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新文件 |
- 如果文件打开成功,则返回一个
FILE
类型的指针与打开的文件关联起来,后面就可以利用这个指针对此文件进行一定的操作,如果打开失败则返回一个空指针
⚾:fclose
int fclose ( FILE * stream );
- 参数是一个与要关闭的文件有关的
FILE
类型的指针,此函数的返回值是一个整形,当文件被成功关闭,会返回一个0
,如果返回失败则会返回EOF
。一般的文件打开和关闭流程,如下面的代码:
int main()
{
FILE* pf = fopen("D:\\code\\test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
//读文件
//...
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
//结果:fopen: No such file or directory
从打印的结果可以看出文件打开失败了,原因是:首先我们D:\\code\\
这个路径下没有创建test.txt
这个文件,其次我们是以“r”
(只读)的方式打开的,根据上面的表格,此时如果没有对应的文件,打开时就会出错。
这里补充一个小细节,我们最好在电脑中打开显式文件扩展名,也就是我们常说的文件后缀,这样文件的名称会显示的比较齐全,避免我们在写程序打开文件时出错。
🥅文件的顺序读写:
所谓顺序读写就是从文件中的第一个字符开始往后依次读取或写入。文件的顺序读写主要涉及以下几个函数:
功能 | 函数名 | 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
🏑输出、输入和读取、写入:
在深入了解文件顺序读写函数之前,先要明确输出、输入和读取、写入这两组概念。输出和输入都是针对内存来说的,以内存作为输出和输入的对象,输出准确来说是从内存中输出,输入准确来说是往内存中输入。而读取和写入时针对文件来说的,读取准确来说是从文件中进行读取,写入准确来说是往文件中进行写入。程序是在内存中运行的,因此要把程序运行时产生的数据存储到文件中,其实就是内存输出数据写入到文件中。而程序运行时从文件中获取数据,其实就是从文件中读取数据输入到内存当中。注意,键盘和显示器本质上也是文件。因此我们每次通过scanf从键盘上键入数据,其本质上是从键盘文件中读取数据输入到内存当中供程序运行时使用。而使用printf将程序运行的结果打印到显示器上,其本质是将程序运行时产生的数据从内存中输出写入到显示器文件当中。
总结一下:输入是和读取绑定的,输出是和写入绑定的
🏑输出流、输入流的
从上面的表格中我们可以看到,有些函数可以适用于所有的输出流或者输入流,而有的文件只适用于文件的输出流或者输入流,这里的流到底是什么意思呢?
流可以帮助我们简化输入输出操作,已输出为例,我们可能会将程序运行中产生的数据输出到不同的输出设备中(比如:屏幕、文件、网络等),针对不同的输出设备其写入方式也有所不同,作为程序员我们就需要掌握对不同输出设备的写入方式,这样才能把数据正确的写入到输出设备上,这无疑给程序员增添了许多麻烦。为了简化操作,于是就在内存和输出设备之间抽象出来了一个流的概念,此时程序员只需要知道如何把数据输出到流中去就可以,而从流中把数据写入到不同的输出设备这一过程C语言已经帮我们封装好了。流的类型是FILE*
任何一个C语言程序运行的时候会默认打开以下三个流:
- stdin ---- 标准输入流(键盘)
- stdout ----标准输出流(屏幕)
- stderr ---- 标准错误流(屏幕)
这三个流的类型也都是FILE*
,由于这三个流是在C语言程序运行的时候默认打开的,所以在一个C程序中我们可以直接使用scanf和printf。而对于一个文件,C语言程序在运行的时候不会默认打开,因此如果要对文件进行操作我们需要自己写代码来打开文件,例如:FILE* pf = fopen("test.txt", "r");
,其本质上是获取一个文件流
所以上表中提到的适用于所有的输入流或输出流,就意味着此函数不仅可以从文件流里面获取或写入数据,以getc和putc为例:
int main()
{
char ret = fgetc(stdin);//从标准输入流中读取字符,输入到内存当中
fputc(ret, stdout);//从内存中输出一个字符,写入到标准的输出流里面
return 0;
}
🏑fgetc:
int fgetc ( FILE * stream );
- 参数是一个文件类型的指针
FILE
结构体中有一个定位指针,指向文件中待读取的字符,最初一定是指向文件中的第一个字符- 读取成功会返回定位指针当前所指向的字符,并且定位指针前进一位(这就是顺序读的实现原理),读取结束会返回
EOF
- 因为是从文件中读取字符,因此文件一定是以读的方式打开
🏑fputc:
int fputc ( int character, FILE * stream );
- 第一个参数
character
是待写入的字符 - 第二个参数
stream
是与待写入文件所关联的文件指针(对应的文件流) - 此时是向文件中写数据,所以文件必须是以写或追加的方式进行打开
- 向定位指针当前指向的位置写入一个字符,写入成功会返回所写入的字符,并且定位指针前进以为。写入失败会返回
EOF
🏑fgets:
char * fgets ( char * str, int num, FILE * stream );
- 第一个参数
str
表示把读取到的字符串拷贝到str所指向的空间 - 第二个参数
num
表示读取num的字符,其中会包含一个’\0’,因此实际上只会读取num-1个字符 - 第三个参数
stream
是与待读取文件关联的文件指针(对应的文件流) - 读取成功会返回
str
,读取结束会返回NULL
- fgets是文本行输入函数,因此当一行没有读取完的时候,下一次读取会从上一次读取结束的位置继续读取当前行的文本。如果待读取的字符个数num大于当前文本行的字符个数,那此次读取只会把当前行的所有字符读取出来,不会去读取下一行的字符。
🏑fputs:
int fputs ( const char * str, FILE * stream );
- 第一个参数
str
表示待写入的字符串 - 第二个参数
stream
表示与待写入文件关联的文件指针 - 写入成功会返回一个非负数,写入失败会返回
EOF
🏑fscanf:
int fscanf ( FILE * stream, const char * format, ... );
- 格式化的输入函数,可以通过指定格式从文件中读取任意类型的数据
- 第一个参数
stream
是与待读取文件关联的文件指针(对应的文件流) - 后面的…表示可变参数列表,与我们平时所使用的
scanf
中的参数一样,是根据自己的需求来传参的。通过下面的代码来演示fscanf的用法
struct Student
{
char name[10];
int age;
float weight;
};
int main()
{
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
struct Student s1;
struct Student s2;
//读文件
//...
fscanf(pf, "%s%d%f", s1.name, &s1.age, &s1.weight);
fscanf(pf, "%s%d%f", s2.name,&s2.age,&s2.weight);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
首先我们定义了一个Student
类型的结构体,然后在主函数中定义了两个Student类型的变量s1
和s2
,接着我们希望从与pf所关联的test.txt
文件中去读取信息,分别存放到s1和s2里面,通过下面的执行结果可以看出,成功的从文件中读取了信息。
🏑fprintf:
int fprintf ( FILE * stream, const char * format, ... );
- 格式化的输出函数,可以通过指定格式向文件中写入数据
- 第一个参数
stream
是与待写入文件关联的文件指针(对应的文件流) - 后面的…表示可变参数列表,与我们平时使用的
printf
函数中的参数列表是一样的,是根据需要进行传参的,下面通过代码演示fprintf函数的用法
struct Student
{
char name[10];
int age;
float weight;
};
int main()
{
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("fopen");
return 1;
}
struct Student s1 = {"wangwu", 35, 56.6};
struct Student s2 = {"liming", 80, 45.1};
//读文件
//...
fprintf(pf, "%s, %d, %f\n", s1.name, s1.age, s1.weight);
fprintf(pf, "%s, %d, %f\n", s2.name, s2.age, s2.weight);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
这次我们在主函数中定义了两个Student类型的变量s1
和s2
,并且进行了初始化,希望把这两个学生的信息写入到与文件指针pf
关联的test.txt
文件中,通过下面的结果可以看出写入数据成功
🏑fwrite:
size_t fwrite ( const void * ptr, size_t size, size_t count, FILE * stream );
- 首先fwrite是输出二进制文件,因此文件需要以二进制的方式打开,也就是“
wb
” - 第一个参数
ptr
是待输出数据变量的地址,由于可以将任何类型的数据以二进制形式的输出,所以ptr的类型是void* - 第二个参数
size
是待输出数据类型的大小 - 第三个参数
count
是待输出数据的个数 - 第四个参数
stream
是与被写入文件关联的文件指针(对应的文件流)
struct Student
{
char name[10];
int age;
float weight;
};
int main()
{
FILE* pf = fopen("test.txt", "wb");
if (pf == NULL)
{
perror("fopen");
return 1;
}
struct Student s1 = {"wangwu", 35, 56.6};
struct Student s2 = {"liming", 80, 45.1};
//读文件
//...
fwrite(&s1, sizeof(struct Student), 1, pf);//把s1以二进制的形式写入到test.txt文件中去
fwrite(&s2, sizeof(struct Student), 1, pf);//把s2以二进制的形式写入到test.txt文件中去
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
🏑fread:
size_t fread ( void * ptr, size_t size, size_t count, FILE * stream );
- 首先fread是以二进制的形式从文件中读取数据输入到内存中,所以文件必须是以二进制读的方式打开的
- 第一个参数
ptr
指向输入到内存中的地址 - 第二个参数
size
是待输入数据类型的大小 - 第三个参数
count
是带输入数据的个数 - 第四个参数
stream
是与待读取数据关联的文件指针(对应的文件流)
struct Student
{
char name[10];
int age;
float weight;
};
int main()
{
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
perror("fopen");
return 1;
}
struct Student s[3] = {0};
//读文件
//...
fread(s, sizeof(struct Student), 2, pf);//从test.txt文件中以二进制形式读取两个struct Student类型的数据
printf("%s %d %f\n", s[0].name, s[0].age, s[0].weight);
printf("%s %d %f\n", s[1].name, s[1].age, s[1].weight);
//关闭文件
fclose(pf);
pf = NULL;
return 0;
}
🏑对比scanf、fscanf、sscanf:
scanf
----仅适用于标准输入流stdin,也就是从键盘读取数据输入到内存中fscanf
----适用于所有的输入流,也就是可以从各种输出设备(文件、键盘等)读取数据输入到内存中sscanf
----把一个字符串转换成格式化的数据
struct Student
{
char name[10];
int age;
float weight;
};
int main()
{
struct Student s1;
char* str = "zhangsan 12 35.5";//一个字符串
sscanf(str, "%s%d%f", s1.name, &s1.age, &s1.weight);//从字符串str中格式化的读取数据存到s1里面去
printf("%s %d %f", s1.name, s1.age, s1.weight);//打印s1的内容
return 0;
}
🏑对比printf、fprintf、sprintf:
printf
----只适用于标准输出流stdout,也就是把内存中的数据输出到显示器上fprintf
----适用于所有的输出流,可以把内存中的数据输出到各种输出设备上(文件、显示器等)sprintf
----以格式化的形式把数据存到(转换)到一个字符串中
struct Student
{
char name[10];
int age;
float weight;
};
int main()
{
struct Student s1 = {"张三", 15, 36.3};//定义一个学生
char arr[100] = { 0 };//定义一个字符数组
sprintf(arr, "%s %d %f", s1.name, s1.age, s1.weight);//把学生的信息,以格式化的形式输出到字符数组arr中
printf(arr);//打印字符数组
return 0;
}
🥅文件的随机读写:
🏑fseek:
int fseek ( FILE * stream, long int offset, int origin );
- 根据文件指针的位置和偏移量来定位文件指针。
- 第一个参数
stream
是对应的文件流 - 第二个参数
offset
是相对于第三个参数origin
的偏移量,向左偏移为负数,向右偏移为正数 - 第三个参数
origin
是第二个参数偏移量所参考的位置,有以下三个选项
选项 | 参考位置 |
---|---|
SEEK_SET | 文件的开始位置 |
SEEK_CUR | 文件指针当前指向的位置 |
SEEK_END | 文件的结尾 |
int main()
{
FILE* pf = fopen("test.txt", "r");//已知test.txt文件中存放的数据是---abcdefg
if (pf == NULL)
{
perror("fopen");
return 1;
}
//用fgetc进行顺序读取
char ret1 = fgetc(pf);//第一次一定读到的是a
printf("%c\n", ret1);
char ret2 = fgetc(pf);//第二次一定读到的的b
printf("%c\n", ret2);
char ret3 = fgetc(pf);//第三次一定读到的是c
printf("%c\n", ret3);
//第三次读完之后,文件指针已经指向了d
//如果想继续读b该怎么做?
fseek(pf, 1, SEEK_SET);//重新对文件指针进行定位,相对于文件的起始位置,向右偏移一个单位
//fseek(pf, -2, SEEK_CUR);//相对于文件指针当前位置,向左偏移两个单位
//fseek(pf, -6, SEEK_END);//相对于文件的结尾,向左偏移6个单位
//此时文件指针指向b
char ret4 = fgetc(pf);//再一次读取
printf("%c\n", ret4);
fclose(pf);
pf = NULL;
return 0;
}
从结果中可以看出,读取了两个b,具体过程如下动图所示
🏑ftell:
long int ftell ( FILE * stream );
- 返回文件指针相对于起始位置的偏移量
🏑rewind:
void rewind ( FILE * stream );
- 让文件指针的位置回到文件的起始位置
🥅文本文件和二进制文件:
根据数据的组织形式,数据文件称为文本文件或者二进制文件。数据在内存中是以二进制的形式进行存储的,如果不加转换的输出到外存,就是二进制文件。如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件
一个数据在内存中是如何存储的呢?
字符一律是用ASCII码形式存储,数值型数据既可以用ASCII形式存储,也可以用二进制形式存储,例如正数10000,以ASCII形式输出到磁盘,需要占用5个字节(每个字符一个字节),如果以二进制形式输出到磁盘,则在磁盘上需要占用4个字节
int main()
{
FILE* pf = fopen("test.txt", "wb");
if (pf == NULL)
{
perror("fopen");
return 1;
}
int a = 10000;
fwrite(&a, 4, 1, pf);//把10000以二进制形式写入到文件中
fclose(pf);
pf = NULL;
return 0;
}
⚾:如何查看一个二进制文件?
🥅文件读取结束的判定:
🏑如何判断文件读取结束:
文本文件读取是否结束,判断返回值是否为EOF
(fgetc),或者NULL
(fgets)
fgetc
判断返回值是否为EOF
fgets
判断返回值是否为NULL
二进制文件是否读取结束,判断返回值是否小于实际要读的个数
fread
判断返回值是否小于实际要读的个数
🏑被错误使用feof:
int feof ( FILE * stream );
在文件读取过程中,不能用feof
函数的返回值来判断文件读取是否结束。feof
是用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束,所以feof
是用来判断文件是因为什么原因而读取结束的。如果返回一个非零的值说明文件是正常读取遇到了文件结束标志而结束的。
🏑ferror:
int ferror ( FILE * stream );
检查错误指示器,如果返回一个非零的值说明是在文件读取过程中出错而导致文件读取结束的。
🥅文件缓冲区:
ANSIC标准采用“文件缓冲区系统”处理数据文件,所谓缓冲文件系统是指系统自动的在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。可以通过setbuf
、setvbuf
等函数去修改缓冲区的大小。
#include <stdio.h>
#include <windows.h>
//VS2013 WIN10环境测试
int main()
{
FILE* pf = fopen("test.txt", "w");
fputs("abcdef", pf);//先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
//注:fflush 在高版本的VS上不能使用了
printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
Sleep(10000);
fclose(pf);
//注:fclose在关闭文件的时候,也会刷新缓冲区
pf = NULL;
return 0;
}
通过上面的代码我们可以得出一个结论:因为有缓冲区的存在,C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不做,可能导致读写文件的问题。
今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,您的支持就是春人前进的动力!