一篇博客学懂文件操作——C语言

news2025/1/31 11:04:06

一、为什么使用文件

为什么要使用文件呢?在刚开始学文件操作时,我发出这种疑问。我只需要写好程序就行,保不保存到文件中都无所谓吧。所以从一开始我也就抱着走马观花的心态,“象征性听一听就好啦”“以后能用到时候再学吧”......

但是,我昨天突然换了思路,之前写过的通讯录管理系统,我如何做到真正保存几个重要联系人呢?如果在未来某天我与他们失去联系,我是否真的能用自己写的程序找到他们呢!当我真正实践的时候,我发现这确实挺有意义的。

当我们用二进制写进文件,正常打开文件是我们肉眼读不懂的,只有我们再写专门读取二进制的程序时才能读懂,这样我想:
肉眼无法读懂是独属于二进制的浪漫。

言归正传,当我们想真正保存信息到电脑,只有我们自己选择删除数据的时候,数据才不复存在。
这就涉及到了数据持久化的问题,我们一般数据持久化的方法有,把数据存放在磁盘文件、存放到数据库等方式,而现在学习的使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化

二、什么是文件

磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分的)。

2.1程序文件

包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

2.2数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

这里我们学习的主要是数据文件。

2.3文本文件和二进制文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件


数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。


一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。


如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

2.4文件名

一个文件要有一个唯一的文件标识,以便用户识别和引用。

文件名包含3部分:文件路径+文件名主干+文件后缀

如如: c:\code\test.txt

为了方便起见,文件标识常被称为文件名

三、文件的打开和关闭

3.1 文件指针

缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。

这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE(每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,我们不必关心细节)

一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。

FILE* pf; //文件指针变量

为了和常规指针 p 区分开,我们定义 pf 是一个指向FILE类型数据的指针变量。可以使 pf 指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。

3.2 文件的打开和关闭

文件在读写之前应该先打开文件,在使用结束之后应该关闭文件(这与我们在电脑中使用文件的操作也相同,不对吗)。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系,在接下来的文档中,我们就可以用 pf 去控制我们的文件。

//打开文件
FILE * fopen ( const char * filename, const char * mode );
//关闭文件
int fclose ( FILE * stream );

/*用例*/
int main()
{
    //打开文件
	FILE* pf = fopen("test.txt", "r");

    //判断是否为空
	if (pf == NULL)
	{
		perror("fopen");
		return;
	}
	//文件相关操作
	//......
    
    //关闭文件
	fclose(pf);
    pf = NULL;
	return 0;
}

3.3文件的顺序读写函数

3.3.1流的概念

首先,我们先来了解一下“流”的概念,“流”是一个非常抽象的概念,里面存放的数据通过各种“流”流淌到其对应的领域中,比如屏幕、硬盘、网络......

3.3.2输入输出的概念 

其次,为了避免我们在学习函数时,对输入输出的概念产生歧义,我们先对程序和文件的输入输出关系进行了解: 

因为我们在标准流中都是键盘和程序在互动,而在文件流中,我们操作键盘使程序和文件互动,难免会引起一些歧义,比如我们以为键盘向C程序输入是输入流,但是其实是程序在对文件输出,是输出流......

3.3.3函数操作

现在,我们来正式学习一下能操作文件的函数: 

功能函数名适用于
字符输入函数fgetc所有输入流
字符输出函数fputc所有输出流
文本行输入函数fgets所有输入流
文本行输出函数fputs所有输出流
格式化输入函数fscanf所有输入流
格式化输出函数fprintf所有输出流
二进制输入fread文件
二进制输出fwrite文件

 其中,流分为了文件流和标准输入(输出)流,前六个函数都是既可以向文件传输,也可以向屏幕传输,而后两个函数只能向文件传输。

 当我们想用这六个函数运行标准流时,我们就可以把 FILE *stream 改为对应的 stdout 或 stdin就好啦。

下面我们就来学习属于二进制的浪漫:fwrite 和 fread 函数啦!

 这里 ptr 指向的数组是我们自己创建的,当输出时我们就可以把需要写入文件的内容放在数组里。当输出时我们就把文件中的内容存入数组然后输出数组,这里以我写的通讯录为例:

我们用来接收的文件的数组 (ptr指向的数组) 的格式一定要与文件中的数据格式相同,才能正确读取到二进制文件中的数据,也就是说如果你压根不知道二进制文件中存放的是什么,那你也很难通过 fread 读出来。 

3.4文件的随机读写函数

如果对文件进行操作,单单有上面几个函数肯定是不够的,下面我们来介绍另外几个函数,能让我们随机读取文件中的数据。

3.4.1fseek

根据文件指针的位置和偏移量来定位文件指针

origin: 

名称参考位置
SEEK_SET文件起始位置
SEEK_CUR文件当前位置(光标定位)
SEEK_END

文件结束位置

我们用 fseek 可以指定我们光标的位置,以下我们再进行写文件操作时,光标的位置不会改变。

当我们使用前面的 fgetc 时,我们一个字符一个字符的取出,光标的位置就定位在某个字符前面,这就是 SEEK_CUR 的位置。

下面我们来看一个例子: 

3.4.2 ftell

返回文件指针相对于起始位置的偏移量

和 SEEK_CUR 的位置相同。

3.4.3 rewind

让文件指针的位置回到文件的起始位置

四、文件读取结束的判定

4.1 feof

当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束

feof 函数的返回值不能直接用来判断文件的是否结束!

4.2文本文件

判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )

这时候如果我们想读取文件时,就可以使用 while 循环,类似之前的多组输入。

4.3二进制文件

二进制文件的读取结束判断,判断返回值是否小于实际要读的个数

这就是前面为什么我要使用 for 循环来遍历整个文件,我需要一个准确的值才能完整的遍历二进制文件。

五、文件缓冲区 

ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”

从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。

如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。

代码测试:

#include <stdio.h>
#include <windows.h>
int main()
{
	FILE* pf = fopen("test.txt", "w");
	fputs("夜夜亮晶晶", pf);//先将代码放在输出缓冲区
	printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");
	Sleep(10000);
	printf("刷新缓冲区\n");
	fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)
	printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");
	Sleep(10000);
	fclose(pf);
	//注:fclose在关闭文件的时候,也会刷新缓冲区
	pf = NULL;
	return 0;
}

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1094121.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[爬虫练手]学校院系专业整理

本文基于上一篇博客&#xff1a;[爬虫练手]整理学校招生信息 文章目录 一.改进上一篇的代码二,嵌套爬虫&#xff0c;提取院系和专业信息目前完整代码 三.让AI润色一下代码完整代码代码学习加入print语句&#xff0c;方便理解 其他 一.改进上一篇的代码 上一篇那个页面没有反爬措…

FastBert学习笔记

论文标题《FastBERT: a Self-distilling BERT with Adaptive Inference Time》。 关于这个论文已经有不错的解读了&#xff0c;所以我写的侧重点可能和别人的不太一样&#xff0c;具体的往下看吧&#xff0c;欢迎讨论。 这个论文从两个方面去掌握&#xff1a; 样本自适应推断…

Oracle11g在红帽Linux上的安装教程

一、版本介绍 本次实验环境所使用虚拟机为VMware17&#xff08;16或15版本也可以&#xff09; 镜像版本为Red Hat 7.9&#xff1a; ISO镜像地址&#xff1a; 百度网盘链接 链接&#xff1a;https://pan.baidu.com/s/1p318ZZGMfDp4MllXZXbusg?pwdmpic 提取码&…

C++学习——继承(1)

目录 一&#xff0c;继承是什么&#xff1f; 二&#xff0c;继承的权限 三&#xff0c;继承赋值兼容规则 四&#xff0c;继承中的作用域 一&#xff0c;继承是什么&#xff1f; 我们说面向对象的语言有三大特性&#xff1a;1.封装&#xff0c;2&#xff0c;继承&#xff0c;…

鸿蒙tabbar ArkTS

鸿蒙tabbar ArkTS 做了仿照现在应用的做了一个tabbar。 官方文档地址 参考文档 tabbar 其中有个比较重要的点是&#xff0c;对image资源的引用问题。 资源相关说明 图片是resources目录下的base目录下的。 media目录下的图片的资源不能添加文件夹&#xff0c;只能是文件&a…

【Spring框架】Spring监听器的源码分析

目录 一、Spring监听器模型 二、源码分析 2.1 initApplicationEventMulticaster()&#xff1a;事件广播器的初始化 2.1.1 Spring默认的事件广播器SimpleApplicationEventMulticaste 2.2 registerListeners()&#xff1a;注册事件监听器 2.3 finishRefresh()&#xff1a;完…

京东店铺所有商品数据接口,京东整店所有商品数据接口,京东店铺商品接口,京东API接口

京东店铺所有商品数据接口是开放平台提供的一种API接口&#xff0c;通过调用API接口&#xff0c;开发者可以获取京东整店的商品的标题、价格、库存、月销量、总销量、库存、详情描述、图片、价格信息等详细信息。 京东店铺所有商品数据接口可以用于不同的业务场景&#xff0c;…

【HHO-KELM预测】基于哈里斯鹰算法优化核极限学习机回归预测研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

博图数值按照特定格式(“T000000”)转换成字符串

一、前言 数值按照协议格式&#xff0c;转成字符串。方便和第三方厂家对接。如码垛线使用字符串数据&#xff0c;立库厂家使用dint数据类型&#xff0c;上位机使用DINT数据类型&#xff0c;为了判断数据传输、与动作流程&#xff0c;需要条码的比较&#xff0c;此时可以将数值转…

Kotlin vs Java:为什么Springboot官方教程选择了Kotlin?

导语 作为Java开发者的你&#xff0c;是否在为寻找Java的替代品而烦恼&#xff1f;担心受知识产权问题困扰&#xff1f;别担心&#xff0c;Kotlin来了&#xff01;它是你的救星&#xff0c;也是Springboot官网教程的选择。想知道为什么吗&#xff1f;那就往下翻吧&#xff01;…

“通胀噩梦:恶梦继续还是即将终结?经济前景备受关注!“

尽管美联储采取了激进的利率策略&#xff0c;昨天公布的 9 月份 CPI 数据显示&#xff0c;整体同比增长 3.7%&#xff0c;而预期为 3.6%&#xff0c;高于预期。环比预期&#xff0c;为 0.4%&#xff0c;而预期为 0.3%。核心 CPI 环比上涨 0.3%&#xff0c;同比上涨 4.1%&#x…

极限号可以拿到函数的内部吗?【复合函数中极限的进入】

极限号无脑直接拿进来 1.1 如果f&#xff08;极限值&#xff09;在该点连续&#xff0c;ojbk&#xff0c;拿进来。 1.2 如果f&#xff08;极限值&#xff09;不存在或不连续&#xff0c;不能拿进来&#xff0c;出去。

Flask (Jinja2) 服务端模板注入漏洞复现

文章目录 Flask (Jinja2) 服务端模板注入漏洞1.1 漏洞描述1.2 漏洞原理1.3 漏洞危害1.4 漏洞复现1.4.1 漏洞利用 1.5 漏洞防御 Flask (Jinja2) 服务端模板注入漏洞 1.1 漏洞描述 说明内容漏洞编号漏洞名称Flask (Jinja2) 服务端模板注入漏洞漏洞评级高危影响版本使用Flask框架…

【剑指Offer】27.二叉树的镜像

题目 操作给定的二叉树&#xff0c;将其变换为源二叉树的镜像。 数据范围&#xff1a;二叉树的节点数 0≤n≤1000 &#xff0c; 二叉树每个节点的值 0≤val≤1000 要求&#xff1a; 空间复杂度 O(n) 。本题也有原地操作&#xff0c;即空间复杂度O(1) 的解法&#xff0c;时间…

Servlet--Request请求对象

1.请求对象的概述 请求&#xff1a;获取资源。在BS架构中&#xff0c;就是客户端浏览器向服务器端发出询问 请求对象&#xff1a;就是在项目当中用于发送请求的对象 2.获取各种路径的方法 返回值方法名说明StringgetContextPath()获取虚拟目录名称StringgetServletPath()获…

C++前缀和算法:构造乘积矩阵

题目 给你一个下标从 0 开始、大小为 n * m 的二维整数矩阵 grid &#xff0c;定义一个下标从 0 开始、大小为 n * m 的的二维矩阵 p。如果满足以下条件&#xff0c;则称 p 为 grid 的 乘积矩阵 &#xff1a; 对于每个元素 p[i][j] &#xff0c;它的值等于除了 grid[i][j] 外所…

Django使用Token认证(simplejwt库的配置)

目录 官网文档安装项目配置拓展配置 官网文档 https://django-rest-framework-simplejwt.readthedocs.io/en/latest/ 安装 pip install djangorestframework-simplejwt项目配置 REST_FRAMEWORK {...DEFAULT_AUTHENTICATION_CLASSES: (...rest_framework_simplejwt.authent…

【斗破年番】彩鳞换装美翻,雁落天惨死,萧炎暗杀慕兰三老遇险,彩鳞霸气护夫

Hello,小伙伴们&#xff0c;我是小郑继续为大家深度解析斗破苍穹年番资讯。 斗破苍穹动画已经更新了&#xff0c;小医仙与萧炎相认&#xff0c;三国联军撤退&#xff0c;随后彩鳞与萧炎以及小医仙夜晚相会&#xff0c;一起制定了刺杀行动。从官方公布的第68集预告&#xff0c;彩…

ST‐LINK V2 使用说明(安装,调试,烧录)

目录 1. 初识 ST-LINK V2 1.1 ST-LINK V2 简介 2. ST-LINK V2 驱动的安装与固件升级 2.1 驱动的安装 2.2 固件的升级 3. 使用 STM32 ST-LINK Utility 烧写目标板 hex 3.1 ST-LINK 烧写 hex 文件 4.使用 ST-LINK V2 调试 STM8 4.1 ST‐LINK 调试 STM8 5.…

【GA-ACO-RFR预测】基于混合遗传算法-蚁群算法优化随机森林回归预测研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…