在我们日常生活中,会把许多东西都称之为文件。比如,一份纸质报告,或u盘中的一些文档,都会把它们称为文件。那么,这里说的文件是以操作系统的角度出发的。在操作系统中,会把许多硬件设备和软件资源都抽象成“文件”,并进行统一管理。大部分所说的文件一般都指的是 硬盘中的文件。文件就相当于是“硬盘”数据的一种抽象。
1.文件的组织
一台计算机上有很多的文件,操作系统对这些文件都是通过“文件系统”来组织的。
操作系统 通过“目录”(树形结构)来组织管理文件。
例如,我们通过“此电脑”(根节点)来找到电脑的C盘(分支)和D盘(分支),每个分支又可以继续分支,这样的组织管理方式就是“目录”结构(树形结构)。
2.文件路径
操作系统通过“目录”这种的层次结构来描述某个文件的所在位置,最终找到目标文件的过程所经过的路径称之为 文件路径。
文件路径分为两种:相对路径 和 绝对路径。
(1)相对路径
需要先指定一个目录作为基准目录,从基准目录出发,通过某一路径找到指定文件,这里的某一路径就是相对路径。比如,我从C:/Java(基准目录)出发,找一个文件名为memo2的文本文件
因此,要描述文件memo2的相对路径就可以描述为:./memo2.txt (通过./来 省略基准目录)。
(2) 绝对路径
从C:或者D:出发,找到指定文件的路径称之为 绝对路径。比如,我找到memo2.txt文件的绝对路径就是 C:/Java/memo2.txt.
3. 文件类型
文件类型分为 文本文件 和 二进制文件。
文本文件:文件中保存的数据 都是 字符串,且内容都是合法字符(字符集/字符编码 中有记载)。
二进制文件:文件中保存的数据 仅仅是 二进制数据,内容不要求是 合法字符。
【区分二进制文件和文本文件】
以记事本方式打开一个文件,打开之后,若发现文件内容是乱码,说明该文件就是二进制文件,否则就是文本文件。
4.文件内容的读写
文件的内容,称之为 “数据流”。一般每个文件都保存了许多数据,每次对文件内容读或写的时候,有许多方式,可能读完文件内容要分很多次读,也可能一次读完。因此,把文件的内容比喻成“流”,每次读写操作称之为 输入流 和 输出流。
【区分输入和输出】
读和写,到底哪个是输入,哪个是输出呢。
在Java中,都是以CPU的角度来定义的。
站在CPU的角度,读文件,文件内容 从硬盘-->内存-->CPU,是一个输入的过程;
写文件,写的内容从CPU-->内存-->硬盘,是一个输出过程。
因此,读操作称之为 输入流;写操作称之为 输出流。
针对不同的文件,读写操作的方式也有一定的区别。
(1)对于文本文件
输入流需要用到Reader类,输出流需要用到Writer类。
输入操作,有多种方式,一次读一个字符,一次读多个字符。
【一次读一个字符】
用法如下:
实例化Reader对象,通过构造方法将要操作文件的路径传入,Reader对象会打开这个文件
调用Reader类的read()方法,会一个字符一个字符的读取文件内容,且会返回一个int型的数据,
若返回的是-1说明文件内容已经读完了
【一次读取多个字符】
用法如下:
一次读取多个字符,用到的read()方法 与一次读一个字符用到的read()方法不一样。 这个read()方法传入的参数得是一个字符型的数组。每次从文件中读取数据时,都尽可能的将数组填满。每次读取也会返回一个int型数据,代表此次读取的字符个数。
如上述代码,我指定字符数组容量为500,文件中内容字符不及500字节,因此一次就可以将文件内容读取完,并放入数组中。
如果数组容量小于文件内容字符个数,则会多轮读取,直至读完。
【写操作】
(2)对于二进制文件
输入流 和 输出流 分别用到的类 是 InputStream和 OutputStream类,同样是借助该类的read()方法。
与文本文件操作类似。区别在于,二进制文件中数据单位是字节,文本文件的数据单位是字符。因此,二进制文件的输入流用到的数组是字节类型的
【输入流操作】
针对二进制文件,也是可以一次读入一个或多个字节,与文本文件操作类似。
演示一次读多个字节的代码:
【输出流操作】
5.文件IO操作要重视的问题
在对文件IO操作的过程中,难免会不断打开文件。
每个进程都有一个PCB块,PCB中有一个属性--“文件描述符表”,描述当前进程所持有的文件资源。若该进程一直在打开文件,则文件描述符表中的内容会越来越多,若我们只打开文件,没有关闭文件的话,会导致该进程的文件描述符表装满。当后续再打开文件时,会造成文件资源泄露,这是非常严重的问题。
因此,使用完文件之后一定要记得关闭文件。 为了防止遗忘关闭文件,可以在涉及到文件操作的代码中,使用try(){}来写代码,如上述代码。这种方式可以在try代码执行结束之后自动关闭文件。