文件是什么
在我们日常使用的电脑上我们在电脑磁盘上会看到许许多多的文件夹,那里面的东西其实就是文件,为什么我们要使用文件?那是因为我们的电脑肯定会要用来存储东西的,如果没有文件,那么我们的东西都全部存放在内存上面,如果电脑一关机那么全没了,所以就需要一个文件来存放我们想永久存放的东西
文件也分很多种类型比如程序文件,程序⽂件包括源程序⽂件(后缀为.c),⽬标⽂件(windows环境后缀为.obj),可执⾏程序(windows环境后缀为.exe)。
还有数据文件,⽂件的内容不⼀定是程序,⽽是程序运⾏时读写的数据,⽐如程序运⾏需要从中读取数据的⽂件,或者输出内容的⽂件。
数据文件又包括二进制文件和文本文件数据在内存中以⼆进制的形式存储,如果不加转换的输出到外存的⽂件中,就是⼆进制⽂件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的⽂件就是文本文件
这里我们讨论的是数据文件
文件的使用和操作
在了解打开和关闭之前我们先要了解一个东西叫流
所谓的流就是我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输⼊输出操作各不相同,为了⽅便程序员对各种设备进⾏⽅便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。
C程序针对⽂件、画⾯、键盘等的数据输⼊输出操作都是通过流操作的。
⼀般情况下,我们要想向流⾥写数据,或者从流中读取数据,都是要打开流,然后操作。
那为什么我们从键盘输⼊数据,向屏幕上输出数据,并没有打开流呢?
那是因为C语⾔程序在启动的时候,默认打开了3个流:
1 stdin - 标准输⼊流,在⼤多数的环境中从键盘输⼊,scanf函数就是从标准输⼊流中读取数据。
2 stdout - 标准输出流,⼤多数的环境中输出⾄显⽰器界⾯,printf函数就是将信息输出到标准输出流中。
3 stderr - 标准错误流,⼤多数环境中输出到显⽰器界⾯。
这是默认打开了这三个流,我们使⽤scanf、printf等函数就可以直接进⾏输⼊输出操作的。
stdin、stdout、stderr 三个流的类型是: FILE* ,通常称为⽂件指针。C语⾔中,就是通过 FILE* 的⽂件指针来维护流的各种操作的。
⽂件指针
缓冲⽂件系统中,关键的概念是“⽂件类型指针”,简称“⽂件指针”。每个被使⽤的⽂件都在内存中开辟了⼀个相应的⽂件信息区,⽤来存放⽂件的相关信息(如⽂件的名字,⽂件状态及⽂件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名 FILE。
在我们每打开一个文件的时候都会产生一个文件信息区对于这个我们可以画图来看一下
而在文件信息区中是存放像这样的一些信息的
struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
每当打开⼀个⽂件的时候,系统会根据⽂件的情况⾃动创建⼀个FILE结构的变量,并填充其中的信
息,使⽤者不必关⼼细节。
⼀般都是通过⼀个FILE的指针来维护这个FILE结构的变量,这样使⽤起来更加⽅便。下面我们来具体讲讲文件怎么打开。
文件的打开和关闭
⽂件在读写之前应该先打开⽂件,在使⽤结束之后应该关闭⽂件。
在编写程序的时候,在打开⽂件的同时,都会返回⼀个FILE*的指针变量指向该⽂件,也相当于建⽴了
指针和⽂件的关系。
ANSI C 规定使⽤ fopen 函数来打开⽂件, fclose 来关闭⽂件。
//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//关闭⽂件
int fclose ( FILE * stream );
mode代表文件的打开方式,以什么形式打开是以读还是写的形式,在C语言中提供了以下方式
有了这些基础之后我们来写一个打开文件的代码看看
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
FILE*p = fopen("test.txt", "r");
if (p == NULL)
{
perror("fopen");
return 1;
}
return 0;
}
//.......
fclose(p);
这里我们用来perror来检测文件到底有没有打开
当我们尝试运行程序的时候,我们发现报错了,这里显示没有找到相应的文件,这是为什么呢,那是因为在我们创建的C程序的根目录下根本就没有test.txt这个文件,我们创建一个就行了像这样
有了上面打开文件的格式,还有上面相应的对照表之后我们就能以自己的想法来以什么样的形式打开和关闭文件了,打开了文件我们肯定要做一些什么事情,这里就要引入一个叫⽂件的顺序读写的这个概念了
⽂件的顺序读写
下面有个对照表
我们来分别解释一下这几个函数;
fgetc
fgetc
在c++官网中我们可以看到是这样解释的
通俗来讲第一个参数指定流就是你所打开的文件,返回类型是int,我们来看看下面代码
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
FILE*p = fopen("test.txt", "r");
if (p == NULL)
{
perror("fopen");
return 1;
}
int ch = 0;
ch = fgetc(p);
printf("%c", ch);
fclose(p);
return 0;
}
我们在我们的所打开的文件里面放入几个字符abcdef,然后运行这个代码
我们发现他读取了我们的第一个字符,如果我们在多读取几次呢,又会是什么效果
这里我们发现我们每读取一次文件指针就像后偏移一位读取下一个字符,我们因此可以写一个循环来得到打印所有字符,根据上面c++官网的定义在他读取完字符的时候将会返回EOF那我们可以根据这个定义来试一下。
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
FILE*p = fopen("test.txt", "r");
if (p == NULL)
{
perror("fopen");
return 1;
}
int ch = 0;
while ((ch = fgetc(p))!=EOF)
{
printf("%c", ch);
}
return 0;
}
下面来讲讲fputc
fputc
在c++官网是这样定义的
和fgetc差不多一样,一个是输出,一个是输入,只是多了一个字符参数也就是你想写入的字符,我们来看看下面这段代码,这里实现的是从字符a一直往文件里面输入到字符z的程序,注意要把r只读换成w只写
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
FILE*p = fopen("test.txt", "w");
if (p == NULL)
{
perror("fopen");
return 1;
}
char c = 0;
for ( c = 'a'; c <= 'z'; c++)
{
fputc(c, p);
}
fclose(p);
return 0;
}
fgets
fgets,在c++官网是这样介绍的wm1
我们和fgetc来对比一下,fgetc的参数只有一个是流,也就是打开的那个文件,但fgets有3个参数,其中两个不一样,一个是大小,一个是字符串指针,这个字符串代表的意思是指向从文件里面读取到的字符放到指定的字符串里面,但是这个函数有一点不一样的地方,我们来看看下面这个代码。
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
FILE*p = fopen("test.txt", "r");
if (p == NULL)
{
perror("fopen");
return 1;
}
char ch[5] = { 0 };
fgets(ch, 5, p);
printf("%s", ch);
fclose(p);
p = NULL;
return 0;
}
这里我们发现我们想要让他读取5个字符但只读取了4个,这是因为这个函数会在结尾放置一个\0,我们可以调试来看看
还有这个函数只会读取一行,不会换行读取下一行
如果长度允许他会把\n换行字符也一起读进去,我们来打开监视看看
fputs
在c++官网中是这样定义的
这个函数就是把指定的字符串写入到文件中去,下面是代码;
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
FILE*p = fopen("test.txt", "w");
if (p == NULL)
{
perror("fopen");
return 1;
}
char ch[] = { "abcdefg" };
fputs(ch, p);
fclose(p);
p = NULL;
return 0;
}
fscanf
在c++官网是这样定义的
这个函数是专门从文件中读取指定的格式数据,专门用于从文件流里面读取输入,和scanf不一样scanf是从标准输入例如键盘中读取。下面是码。
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
struct student
{
char name[20];
int age;
};
int main()
{
struct student s = { 0 };
FILE* p = fopen("test.txt", "r");
if (p == NULL)
{
perror("fopen");
return 1;
}
fscanf(p,"%s %d", s.name,&(s.age));
printf("%s %d", s.name, s.age);
fclose(p);
p = NULL;
return 0;
这里我们用了一个结构体创建了一个s的变量,在我们的文本文件中有一个zhansan 18的char类型和int类型的数据,我们用fscanf指定的格式输出到结构体p变量中,并把他打印出来。
fprintf
在c++官网是这样定义的
这个函数的意思就是按照指定的格式输入指定的文件中,我们来看看下面代码
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
struct student
{
char name[20];
int age;
};
int main()
{
struct student s = { "lisi",18};//想存放的数据
FILE* p = fopen("test.txt", "w");
if (p == NULL)
{
perror("fopen");
return 1;
}
fprintf(p,"%s %d", s.name, s.age);
fclose(p);
p = NULL;
return 0;
}
这段代码我们用fprintf来对结构体里面的初始化数据进行格式化输入到文本文件里面。
fwrite
在c++官网是这样定义的
顾名思义这个函数是会把要输入的数据转换成2进制的形式进行输入,下面是代码我们来看看
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
int arr[10] = { 0 };
int sz = sizeof(arr) / sizeof(arr[0]);
for (int i = 0; i < 10; i++)
{
arr[i] = i;
}
FILE* p = fopen("test.txt", "wb");
if (p == NULL)
{
perror("fopen");
return 1;
}
fwrite(arr, sizeof(arr[0]), 10, p);
fclose(p);
p = NULL;
return 0;
}
这里我们把从0到9的数据以二进制的形式输入到文本文件中,如果我们直接点开txt文档将会看见一些乱码看不懂的东西,这是因为我们是按照2进制的形式输入的二进制的文件后缀名为.bin而这里是.txt所以是乱码。我们可以用fread打印出来看一下
fread
在c++官网中是这样定义的
这里其实就是和fwrite相反,一个读取一个写入,这个就是从指定的文件中读取二进制文件出来变成我们看的懂的形式,并写入到数组里面,我们来看看代码
# define _CRT_SECURE_NO_WARNINGS
# include<stdio.h>
int main()
{
int arr[10] = { 0 };
int sz = sizeof(arr) / sizeof(arr[0]);
for (int i = 0; i < 10; i++)
{
arr[i] = i;
}
FILE* p = fopen("test.txt", "wb");
if (p == NULL)
{
perror("fopen");
return 1;
}
fread(arr, sizeof(arr[0]), 10, p);
for (int i = 0; i < 10; i++)
{
printf("%d", arr[i]);
}
fclose(p);
p = NULL;
return 0;
}
这样上面的表格我们就介绍完成了,现在我们发现每一个函数都是从文件指针的开头进行写入和读取的,那么我们有没有什么办法进行想从指定的地方开始进行读取文件或者写入文件呢,这里就要牵扯到文件的随机读写了
文件的随机读写
随机读写,顾名思义就是能让打开的文件在任何地方都能读取和写入比如在文本文档的开头,中间,和结尾。
fseek
根据⽂件指针的位置和偏移量来定位⽂件指针。在c++官网中是这样定义的
这里我们来写几个代码看看
fseek(pf, 4, SEEK_CUR);
fseek(pf, 6, SEEK_SET);
fseek(pf, -1, SEEK_END);
第一个代表从文件指针当前的位置向前偏移4个单位
第二个代表从文件开头向后偏移6个单位
第三个代表从文件末尾向前走1个单位
我们来写一个代码试一下
# define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
int main()
{
FILE* pFile;
pFile = fopen("test.txt", "wb");
if (pFile == NULL)
{
perror("fopen");
return 1;
}
fputs("This is an boot.", pFile);
fseek(pFile, 9, SEEK_SET);
fputs(" car", pFile);
fclose(pFile);
pFile = NULL;
return 0;
}
我们首先打开文件像向里面输入了this is an boot 然后用fseek函数从文件开头向后偏移九个单位,从第九个单位开始把 car替换到后面去,同样我们也可以从文件结尾往前偏移-5个单位同样也可以完成替换
rewind
在c++官网中是这样介绍这个函数的
这个函数的意思就是回到文件的开头,我们来看看这个代码
# define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
int main()
{
FILE* pFile;
pFile = fopen("test.txt", "w");
if (pFile == NULL)
{
perror("fopen");
return 1;
}
char ipt = 0;
char b = 'k';
for (ipt = 'a'; ipt <= 'z'; ipt++)
{
fputc(ipt, pFile);
}
rewind(pFile);
fputc(b, pFile);
fclose(pFile);
pFile = NULL;
return 0;
}
这里我们用代码实现了打开一个文本文件以读取的方式打开,在往里面写入从a到z的小写字符,最后用rewind函数回到开头,并把开头的字母a变成了字母k
ftell
这个函数其实可以理解成一个文件指针的定位,我们可以用这个函数来写一个统计文本文档中到底有多大以字节为单位。下面是代码。
# define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
int main()
{
long int size = 0;//防止溢出
FILE* pFile;
pFile = fopen("test.txt", "rb");
if (pFile == NULL)
{
perror("fopen");
return 1;
}
fseek(pFile, 0, SEEK_END);//相较于文件末尾偏移0个单位,
//也就是说此时文件指针指向文件末尾。
size = ftell(pFile);
printf("文件大小是;%ld\n", size);
fclose(pFile);
pFile = NULL;
return 0;
}
文件结束的错误判定
在⽂件读取过程中,不能⽤feof函数的返回值直接来判断⽂件的是否结束。
feof 的作⽤是:当⽂件读取结束的时候,判断是读取结束的原因是否是:遇到⽂件尾结束。
- ⽂本⽂件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
• fgetc 判断是否为 EOF .
• fgets 判断返回值是否为 NULL .
- ⼆进制⽂件的读取结束判断,判断返回值是否⼩于实际要读的个数。
文件缓冲区
ANSIC 标准采⽤“缓冲⽂件系统” 处理的数据⽂件的,所谓缓冲⽂件系统是指系统⾃动地在内存中为程序中每⼀个正在使⽤的⽂件开辟⼀块“⽂件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘⽂件中读取数据输⼊到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的⼤⼩根据C编译系统决定的,我们可以画一个图来看看。
为什么要有文件缓冲区呢,那是由于我们向硬盘或者向内存里面输入输出数据的时候不可能遇一遇到一个东西就输入一个东西,那么电脑就无法完成其他工作了全在那输入输出数据,所以我们需要规定一个大小,一个缓冲区当要输入的东西达到一定大小的时候才往里面输入或者输出,这样我们电脑处理任务的效率才会更高。
以上就是全部内容了,如果有什么错误欢迎指正。