文章目录
- 前言
- 1. 为什么使用文件
- 2. 什么是文件
- 程序文件
- 数据文件
- 3. 文件的打开和关闭
- 4. 文件的顺序读写
- `fgetc`
- `fputc`
- `fgets`
- `fputs`
- `fprintf`
- `fscanf`
- 流的介绍
- `fwrite`
- `fread`
- 5. 文本文件和二进制文件
- 6. 文件读取结束的判定
- 被错误使用的feof
- 7. 文件缓冲区
- 写在最后
前言
- 相信大家对文件都不陌生,我们在计算机的一系列操作都离不开文件,如果Linux没有了文件,那他就不叫Linux了,有了文件,我们的计算机才能够正常运行,有了文件我们才能够在计算机上写东西并能够帮我们保存下来。
- C语言也提供了一系列的函数来操控文件,本篇文章只介绍那些常见和常用的函数。
1. 为什么使用文件
我们有可能会写通讯录,写过通讯录的都知道,如果没有文件操作,程序运行后输入的数据在程序结束就没有了,联系人信息也就没有了,如果不能存放联系人的信息,那通讯录还有什么用?所以必然的我们需要文件操作来将输入的联系人的信息存放到文件当中,下一次运行时再将之前已经保存在文件中的联系人的信息拿出来,这一系列的操作就是C语言的文件操作,对应的就需要使用一些相关操作函数。简单来说,文件操作能够将输入的通讯录的数据存放在硬盘文件中,这样就做到了数据的持久化。
所以使用文件,只有好处没有坏处。
2. 什么是文件
- 硬盘上的文件就是文件。
- 而文件又分为程序文件和数据文件
程序文件
程序文件就是一段程序,包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
数据文件
- 数据文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
- 本章讨论的是数据文件。
- 在前面我们所学习所处理的数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
- 其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件
3. 文件的打开和关闭
在理解前面的文件介绍后,这里我们开始学习C语言是如何进行文件操作的?
要进行文件操作,当然要知道文件的打开和关闭,在这之前,我们要学习文件指针。
-
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
-
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名
FILE
。例如,VS2013编译环境提供的 stdio.h 头文件中有以下的文件类型申明:
struct _iobuf { // 是一个结构体
// 文件的各类信息
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE; // 取名FILE
-
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
-
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,我们使用者不必关心细节。
-
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
例如,这里创建一个FILE*
的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf
指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说通过文件指针变量能够找到与它关联的文件。
如下图:
有了上面的文件指针相关概念的认知后,接下来就可以进行文件的打开和关闭了
-
文件的打开和关闭
- 文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
- 在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC
规定使用fopen
函数来打开文件,fclose
来关闭文件。
-
fopen
:
如果打开文件失败,返回一个NULL
;
fclose
:
int fclose ( FILE * stream );
// 可以直接这样关闭
fclose(pf); // pf 是一个 FILE* 的指针变量,他此时指向一个文件,这里将他关闭
// 最后这里最好将这个pf指针置空
pf = NULL;
这两个函数的头文件都是<stdio.h>
。
文件的打开方式有很多,如下图:
当然,这么多方式,我们只要着重熟练使用前5个就Ok了。
说了这么多,下面实例操作一下:
假设不自己创建文件以读的方式打开文件:
#include <stdio.h>
#include <stdlib.h>
int main()
{
// 这里读文件,如果此时当前目录下没有这个文件,fopen返回一个空指针
// 假设此时没有这个文件
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
// 没有打开成功
// 打印错误信息
perror("open fail");
exit(-1);
}
else
{
// 打开成功后
// ......
// 一系列文件操作
// 关闭文件
fclose(pf); // 传递指向文件的指针
pf = NULL;
}
return 0;
}
可以看到,报错信息很明显:没有这个文件,说明读
需要文件已经存在,这也就对应了上面文件打开方式图的内容,如果此时以写(w)
的方式打开?根据上面的内容,他会自动创建一个文件。
打开文件代码改为:
FILE* pf = fopen("test.txt", "w");
此时程序运行,终端什么都没有,但是在当前文件多出了一个文件,正是fopen里的那个test.txt文件:
所以,以何种形式打开文件,其效果是不一样的,这也给了我们更多的选择。
4. 文件的顺序读写
文件的顺序读写当然需要一批函数来帮助我们操作,下面是一系列这样有这样功能的函数,接下来一一介绍和使用:
fgetc
fgetc
是从文件中读取一个字符的函数
下面是函数参数原型:
话不多说,先在当前文件创建一个test.txt
,并在里面输入abcdef
,然后进行fgetc
的文件操作:
#include <stdio.h> // 对应函数头文件
#include <stdlib.h>
int main()
{
// fgetc 相当于从文件中读取字符,所以这里要以r的形式打开文件
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开成功
// 开始读取字符
int ch = fgetc(pf); // 得到字符的ASCLL码值
printf("%c\n", ch);
ch = fgetc(pf); // 得到下一个字符的ASCLL码值,函数会自动往下找
printf("%c\n", ch);
ch = fgetc(pf); // 得到下一个字符的ASCLL码值,函数会自动往下找
printf("%c\n", ch);
ch = fgetc(pf); // 得到下一个字符的ASCLL码值,函数会自动往下找
printf("%c\n", ch);
ch = fgetc(pf); // 得到下一个字符的ASCLL码值,函数会自动往下找
printf("%c\n", ch);
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
当然我们也可以不必这么麻烦,直接写个循环瞬间将文件里的字符弄出来打印。
fputc
fputc
是将字符写入文件当中,既然是写入,回顾写(w)
的特点,如果文件不存在,自动创建一个文件,如果文件存在,则覆盖那个已经存在的文件。
这里不创建文件,直接使用(当前文件里没有test.txt
文件):
#include <stdio.h>
#include <stdlib.h>
int main()
{
// fputc 将字符写入文件,所以这里用w
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开文件成功
// 开始写入
for (char ch = 'a'; ch <= 'z'; ++ch)
{
// 循环写入a-z 26 个字母
fputc(ch, pf);
}
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
我们打开test.txt
文件观察是否写入:
可以看到,的确将26个字母写入文件。
fgets
fgets
与fgetc
很相似,只有s和c的差别,但fgets
是从文件里得到一行字符(一读就读一行),也就是一行字符串,而fgetc
只是得到一个字符,这功能上的差别还是很大的。
下面就以在上面由fputc
写好的文件test.txt
来作为fgets
使用的文件对象来展示fgets
的使用效果:
#include <stdio.h>
#include <stdlib.h>
int main()
{
// 得字符串 用 'r'
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开文件成功
// 开始从文件读字符串
char buf[100];
// 从pf中读取十个,用buf指向这一字符串
fgets(buf, 10, pf);
printf("%s\n", buf);
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
fputs
理解了fgets函数后,该函数得功能也就很清楚了:将字符串输入到文件中
该函数的使用:
#include <stdio.h>
#include <stdlib.h>
int main()
{
// 输入字符串到文件中 用 'w'
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开文件成功
// 输入字符串到文件中
char s[] = "I love you!";
fputs(s, pf);
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
fprintf
该函数是以格式化的形式向文件输入数据。
fprintf
纯概念有些难理解,使用起来其实没那么难:
#include <stdio.h> // 对应头文件
#include <stdlib.h>
struct S
{
char s[20];
int a;
float b;
};
int main()
{
// 结构体成员数据
struct S s = { "zhangsan", 520, 13.14 };
// 输入数据到文件中 用 'w'
FILE* pf = fopen("test.txt", "w");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开文件成功
// 输入数据到文件中
fprintf(pf, "%s %d %f", s.s, s.a, s.b);
// printf("%s %d %f", s.s, s.a, s.b);
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
fscanf
有了
fprintf
的理解,fscanf
也很容易明白了,scanf
是从键盘输入到内存当中,而fscanf
则是从文件当中读取数据输入到内存当中。
我们将上面fprintf
输入到文件test.txt
的数据在读取出来放入一个结构体当中:
#include <stdio.h> // 对应头文件
#include <stdlib.h>
struct S
{
char s[20];
int a;
float b;
};
int main()
{
// 结构体成员数据
struct S s = { 0 };
// 输入数据到文件中 用 'r'
FILE* pf = fopen("test.txt", "r");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开文件成功
// 从文件中读取数据
fscanf(pf, "%s %d %f", s.s, &s.a, &s.b);
// 打印结果
printf("%s %d %f\n", s.s, s.a, s.b);
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
可以看到,fscanf
的确把文件中的数据放到了结构体变量s
中。
流的介绍
任何一个C语言程序运行的时候,默认打开三个流:
- stdin - 标准输入流(键盘)类型:FILE*
- stdout - 标准输出流(屏幕)类型:FILE*
- stderr - 标准错误流(屏幕)类型:FILE*
以上的函数不但适用于文件,还是用于这三个流,上面的函数图后面一条就表示了,这些函数适用于所有流。
例如:
#include <stdio.h>
int main()
{
int ch = fgetc(stdin); // 从键盘输入
fputc(ch, stdout); // 在屏幕上输出
return 0;
}
当然,以上的函数都可以进行相关的操作,流就是用来输入输出的。
fwrite
该函数与上面的函数不同,他是以二进制的方式将数据写入文件,也就是当我们打开写入数据的文件时会发现里面都是一些二进制乱码,完全看不懂。
既然是二进制写入,那fopen
哪里就要写成wb(表示以二进制写入)
。
使用如下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
// fwrite写,二进制形式的写“wb”
FILE* pf = fopen("test.txt", "wb");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开成功
int arr[] = { 1,2,3,4,5,6 };
// 从arr处写入 写入的大小为整个数组的大小 写入1个 写到pf指向的文件当中
for (int i = 0; i < 6; i++)
{
// 循环将arr中的每一个元素写入文件
fwrite(arr + i, sizeof(int), 1, pf);
}
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
可以看到,文件test.txt
里面是一些乱东西。
fread
该函数是进行二进制数据文件的读取的,跟
fwrite
函数一个读一个写,下面是其函数原型:
就将fwrite
写进test.txt
的二进制乱码读取出来看是不是开始的arr
数组数据:
#include <stdio.h>
#include <stdlib.h>
int main()
{
// fread写,二进制形式的读取“wb”
FILE* pf = fopen("test.txt", "rb");
if (pf == NULL)
{
perror("open fail");
exit(-1);
}
// 打开成功
int arr[20];
// 将文件的数据写入arr 一个整型一个整型的写入 写入1个 从pf指向的文件中读取
for (int i = 0; i < 6; i++)
{
fread(arr + i, sizeof(int), 1, pf);
}
// 打印
for (int i = 0; i < 6; i++)
{
printf("%d ", arr[i]);
}
// 关闭文件
fclose(pf);
pf = NULL;
return 0;
}
5. 文本文件和二进制文件
-
根据数据的组织形式,数据文件被称为文本文件或者二进制文件。
-
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
-
如果要求在外存上以
ASCII
码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。 -
一个数据在内存中是怎么存储的呢?
字符一律以ASCII
形式存储,数值型数据既可以用ASCII
形式存储,也可以使用二进制形式存储。- 当以二进制形式存储,文件里是一系列的二进制乱码;
- 当以
ASCLL
形式储存,则是以字符形式表达其面值。
6. 文件读取结束的判定
- 有两个函数可以用作文件读取结束的判定
feof
ferror
被错误使用的feof
- 牢记:在文件读取过程中,不能用
feof
函数的返回值直接用来判断文件的是否结束。而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
- 文本文件读取是否结束,判断返回值是否为
EOF ( fgetc )
,或者NULL ( fgets )
例如:
fgetc
判断是否为EOF
.
fgets
判断返回值是否为NULL
. - 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread
判断返回值是否小于实际要读的个数。
7. 文件缓冲区
- ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
写在最后
文件操作实际上是不常用的,大部分公司都有其内部的文件管理系统,所以,对文件操作的困惑不要停留太久。
感谢阅读本小白的博客,错误的地方请严厉指出噢!