【Java EE初阶十一】文件操作(IO)

news2025/1/16 1:08:15

1. 认识文件

        所谓的文件是一个广义的概念,可以代表很多东西;在操作系统里面,会把很多的硬件设备和软件设备都抽象成“文件”,统一进行管理;但是大部分情况下,我们读到的文件,都是指硬盘的文件,文件就相当于是针对“硬盘”数据的一种抽象;

1.1 简单了解硬盘

1.1.1 机械硬盘HDD

1.1.2 固态硬盘SSD

        固态硬盘里面就都是集成程度很高的芯片,且固态硬盘就要比机械硬盘的效率高很多; 

        我们在进行服务器开发的过程中,涉及到的硬盘有的是机械硬盘有的是固态硬盘,特别是一些用来存储大规模数据的机器,任然是机械硬盘为主,但是固态硬盘的读写速速要比内存慢很多;

内存和硬盘的区别:

  1. 内存的速度快,硬盘的速度慢;
  2. 内存的空间小,硬盘的空间大
  3. 内存贵,硬盘便宜;
  4. 内存的数据,断电就丢失,硬盘的数据断电还在

 1.1.3 文件的操作方式

        文件的操作方式是通过操作硬盘来实现的,一台计算机上有很多的文件,这些文件是通过“文件系统”(有由操作系统所提供的模块)来进行组织的,操作系统使用“目录”这样的结构来组织文件;

        即可以使用目录的层次结构(路径)来描述文件所在的位置

        F:\B站下载\【水灰】我们再一起去迪士尼吧

        如上所示的一个字符串,体现了当前文件在哪个目录中。

  1. 绝对路径:就是以C,D盘开头的,这种路径成为“绝对路径”
  2. 相对路径:需要先指定一个目录,从基准目录出发,看看沿啥样的路径能够找到指定文件,此时所涉及的路径就是“相对路径”,

1.2 文件的类型

        从编程的角度来看,文件类型,主要是两大类:

        1、文本(文件中保存的数据,都是字符串,保存的内容都是合法的字符串)

        2、二进制(文件中保存的数据,仅仅是二进制数据,不要求保存的内容是合法的字符)

        合法的字符->字符集/字符编码(主流的就是utf8,一个规定的表格,里面规定了什么样的字符对应什么样的编码),如果我们的文件时utf8编码的,此时文件中的每一个数据都是合法的utf8编码的字符,就可以认为这个文件是文本文件了;如果存在一些不是utf8合法字符的情况,就是二进制文件了;

        本身计算机存储的数据都是二进制的;

        如何判定一个文件时文本文件还是二进制文件?

        直接使用记事本来打开文件,如果打开之后是乱码,文件是二进制文件;否则是文本文件,记事本就是尝试按照字符的方式来展示内容,这个过程就会自动查码表,如下图所示:

        很多文件都是二进制的文件,docx,png……等文件都属于二进制文件;区分文本文件和二进制文件是十分重要的;我们在写代码的时候,文本文件和二进制文件,代码编写的方式是不同的;

        Java针对文件的操作,分成两类:

        1、针对文件系统的操作-> File

        即创建文件,删除文件,判定文件是否存在,判定文件类型,重命名

        2、针对文件内容的操作->流对象

       即读文件,写文件;

2. File 概述

2.1 file的属性

2.2 file类的构造方法

        一个file对象,就表示一个硬盘上的文件,在构造对象的时候,就需要把这个文件的路径指定进来(使用绝对、相对路径都可以)

        File提供的核心方法:文件名=前缀+扩展名->使用路径构造file对象,一定要把前缀和扩展名都写上;一个文件系统上都会对文件有权限的限制(约定了这个文件,那些用户可以读,那些用户可以写),我们是创建file对象的时候,就会使用到java提供的import java.io.File;该包里面的io分别表示:

        I:input

        0:output

2.3 file的相关方法

        一般来说,在使用文件的内容访问时候,io操作都需要抛出import java.io.IOException;下图是关于file类方法的调用:

q:关于下图输出的数值是文件的内存地址吗?

a:首先在jvm上层,java代码中是没有任何方法获取到“内存地址”的,想要获取内存地址,只能靠native方法,进入jvm内部,通过c++代码获取到;其次我们获取到的字符串是哈希值,是通过调用hashcode的方法获取到的

3. 流对象

        基于文件数据传输的特点,将文件中传输的数据称之为“文件流”

        在标准库中,提供的读写文件的流对象,不是一两个类,而是有很多类,但是实际上可以吧这么多类归结于两个类中:

        1、字节流:(对应着二进制文件)

        每次读写的最小单位是字节(8bit)

        提供了两个父类:inputstream,outputstream

        提供了两个父类:reader,writer

        2、字符流:(对应着文本文件)

        每次读写的最小单位是字符(一个字符对应很多个字节,主要是取决于当前的读取对象的字符集,gbk中一个中文字符对应两个字节;utf8中一个中文字符对应3个字节)

        字符流本质上是对字节流进行了又一层封装,字符流,就能够自动的帮我们把文件中的几个相邻的字节,转换成一个字符(帮我们完成了一个自动差字符集表)

        3、关于输入和输出的识别:

        论将数据保存到硬盘中,这个过程是输入还是输出?

        1、站在硬盘的角度,输入

        2、站在cpu的角度,输出;(我们要带入到cpu的视角)

3.1 reader 概述 

        Reader是一个抽象类,不能new实例,只能new一个子类,java标准库提供了一个现成的类filereader类。其创建方法如下图所示:

        创建reader对象的过程,就是“代开文件”的过程,下面是关于reader的三种方法:

        1、五参数read:一次只读取一个字符;

        2、一个参数read:一次读取若干个字符,回答参数指定的cbuf数组给填充满

        3、三个参数read:一次读取若干个字符,回答参数指定的cbuf数组中的从off这个位置开始,到len这么长的范围内尽量填满;代码细节如下所示:

 

         在java标准库内部,对于字符编码是进行了很多处理工作的,如果只使用char,此时使用的字符集,固定的就是unicode;如果是使用string,此时就会自动的把每一个unicode转换为utf8;

        char【】 c ->包含的每一个字符都是unicode,一旦使用这个字符数组构造成string,string s = new string(c),就会在内部把每一个字符都转换成utf8 

        把多个unicode连续放到一起,是很难区分从哪里到哪里地一个完整的字符的,utf8是可以做到区分的;utf8可以认为是针对连续多个字符进行传输时候的一种改进方案

        对于reader.read( )这个方法里面,应该是往这个read里面传入的是一个空的字符数组(不是null,而是没有实际意义数据的数组),然后由read方法内部,对这个数组内容进行填充,此时的cbuf这个参数,称为“输出型参数”

 

        如果文件为空,就直接返回-1了;

        当一个文件读取完了之后,我们要记得进行关闭close,使用colse方法,最主要的就是为了释放文件描述符;

        pcb这里会包含很多的属性:pid,内存指针,文件描述符表(本质上是由数组构成的顺序表),一个进程每一次打开一个文件,就需要早这个表里分配一个元素,但是这个数组的长度是有限的,如果我们的代码中在运行的过程中,一直在进行打开文件而不能及时的关闭,就会是这个表里面的元素越来越多,最终就昂这个数组沾满,后续在尝试打开文件就会出现报错;

        这样的错误就是文件资源泄露,类似于内存泄漏,在java中我们打开的文件还是需要我们进行手动释放的,此时的代码如下所示:

package io;

import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.io.Reader;

// Reader
public class Demo7 {
    public static void main(String[] args) throws IOException {
         Reader reader = new FileReader("d:/test.txt");
            // 2. 一次 read 多个字符
            while (true) {
                char[] cbuf = new char[3];
                // n 表示当前读到的字符的个数.
                int n = reader.read(cbuf);
                if (n == -1) {
                    // 读取完毕
                    break;
                }
                System.out.println("n = " + n);
                for (int i = 0; i < n; i++) {
                    System.out.println(cbuf[i]);
                }
            }
            // 3. 一个文件使用完了, 要记得, close !!!
            reader.close();              
    }
}

        但是代码如上所示,我们的代码依旧存在文件资源泄露的风险,因为如果我们的代码在前期出现逻辑异常而进行抛出异常处理的话,就执行不到close方法,所以对上述代码进行改进处理,如下图所示:

 3.2 writer 概述

        writer对象主要是写入文件,默认情况下就会把原有的文件内容清空掉,如果不想清空,就需要在构造方法中加个参数,如下图所示;

        关于write方法的种类如下图所示:

         System.in ====》inputstream; 

        关于write部分代码如下所示:

package io;

import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStream;
import java.io.PrintWriter;

public class Demo12 {
    public static void main(String[] args) {
        try (OutputStream outputStream = new FileOutputStream("d:/test.txt")) {
            // 这就相当于把字符流转成字节流了.
            PrintWriter writer = new PrintWriter(outputStream);
            writer.println("hello");
            writer.flush();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

        代码分析:

        缓冲区:printwriter这样的类,在进行写入的时候,不一定直接写入硬盘,而是先把数据写在一个内存构成的“缓冲区”中(buffer)

        我们引入缓冲区,目的是为了提高效率;把数据写入内存是非常快的;把数据写到硬盘,是非常慢的;

        这样会导致一个新的问题:当我们写入缓冲区后,如果还没来得及把缓冲区里的数据写进硬盘,进程就结束了,此时数据就会丢失;没有正真的写入硬盘;(进程结束,该内存就会释放)->为了确保数据会被写入硬盘,就应该在合适的时机,使用flush方法进行手动刷新缓冲区;

        该fiush操作,可以理解为“刷新缓冲区”,将我们存放在内存缓冲区中的数据冲刷到硬盘中;

4. 代码实例

        扫描指定目录,并找到名称中包含指定字符的所有普通文件(不包含目录),并且后续询问用户是否要 删除该文件

4.1 案例分析

        文件系统操作:

        1、list列出目录内容

        2、判定文件的类型

        3、删除文件

所谓的扫描指定文件,就是找到目录中的所有文件,以及子目录中的所有文件,只要遇到子目录都能往里面找->采用递归的方式,把所有的子目录都给扫描一遍;

4.2 代码实现

package io;

import java.io.File;
import java.util.Scanner;

public class Demo13 {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
        // 1. 先让用户输入一个要扫描的目录
        System.out.println("请输入要扫描的路径: ");
        String path = scanner.next();
        File rootPath = new File(path);
        if (!rootPath.isDirectory()) {
            System.out.println("您输入的扫描的路径有误!! ");
            return;
        }
        // 2. 再让用户输入一个要查询的关键词.
        System.out.println("请输入要删除文件的关键词: ");
        String word = scanner.next();
        // 3. 可以进行递归的扫描了.
        //    通过这个方法进行递归.
        scanDir(rootPath, word);
    }

    private static void scanDir(File rootPath, String word) {
        // 1. 先列出 rootPath 中所有的文件和目录.
        File[] files = rootPath.listFiles();
        if (files == null) {
            // 当前目录为 null, 就可以直接返回了.
            return;
        }
        // 2. 遍历这里的每个元素, 针对不同类型做出不同的处理.
        for (File f : files) {
            // 加个日志, 方便观察当前递归的执行过程.
            System.out.println("当前扫描的文件: " + f.getAbsolutePath());
            if (f.isFile()) {
                // 普通文件. 检查文件是否要删除. 并执行删除动作.
                checkDelete(f, word);
            } else {
                // 目录. 递归的再去判定子目录里包含的内容
                scanDir(f, word);
            }
        }
    }

    private static void checkDelete(File f, String word) {
        if (!f.getName().contains(word)) {
            // 不必删除, 直接方法结束
            return;
        }
        // 需要删除
        System.out.println("当前文件为: " + f.getAbsolutePath() + ", 请确认是否要删除(Y/n): ");
        Scanner scanner = new Scanner(System.in);
        String choice = scanner.next();
        if (choice.equals("Y") || choice.equals("y")) {
            // 真正执行删除操作
            f.delete();
            System.out.println("删除完毕!");
        } else {
            // 如果输入其他值, 不一定非得是 n, 都会取消删除操作.
            System.out.println("取消删除!");
        }
    }
}

ps:本篇的内容到这里就结束了,如果感兴趣的话就请一键三连哦!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1442528.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计算机网络第6章(应用层)

6.1、应用层概述 我们在浏览器的地址中输入某个网站的域名后&#xff0c;就可以访问该网站的内容&#xff0c;这个就是万维网WWW应用&#xff0c;其相关的应用层协议为超文本传送协议HTTP 用户在浏览器地址栏中输入的是“见名知意”的域名&#xff0c;而TCP/IP的网际层使用IP地…

如何让内网client通过公网地址访问内网server?

第一步&#xff0c;实现任意公网用户访问内网server。按教育网规矩&#xff0c;公网过来的流量要访问校内网的server必须从教育专线&#xff08;路由器接口G0/0/1)进入。 第二步&#xff0c;实现内网主机通过公网地址210.43.2.3能够访问内网server192.168.1.2&#xff0c;图中①…

动漫风博客介绍页面源码

动漫风博客介绍页面源码&#xff0c;HTML源码&#xff0c;图片背景有淡入切换特效 蓝奏云&#xff1a;https://wfr.lanzout.com/iIDZu1nrmjve

科研绘图-半小提琴图-

文章目录 前言1.软件安装-Origin 20222.绘制半小提琴图3.绘制径向条形图 前言 本文叙述记录的是一些科研绘图的实现方法&#xff0c;具体介绍从软件安装到实现图表绘制的详细过程。 1.软件安装-Origin 2022 Origin是一款具有丰富绘图功能的科研绘图软件&#xff0c;安装过程…

百卓Smart管理平台 uploadfile.php 文件上传漏洞(CVE-2024-0939)

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

基于opencv-python模板匹配的银行卡号识别(附源码)

目录 介绍 数字模板处理 银行卡图片处理 导入数字模板 模板匹配及结果 介绍 我们有若干个银行卡图片和一个数字模板图片&#xff0c;如下图 我们的目的就是通过对银行卡图片进行一系列图像操作使得我们可以用这个数字模板检测出银行卡号。 数字模板处理 首先我们先对数…

2024Node.js零基础教程(小白友好型),nodejs新手到高手,(六)NodeJS入门——http模块

047_http模块_获取请求行和请求头 hello&#xff0c;大家好&#xff0c;那第二节我们来介绍一下如何在这个服务当中来提取 HTT 请求报文的相关内容。首先先说一下关于报文的提取的方法&#xff0c;我在这个文档当中都已经记录好了&#xff0c;方便大家后续做一个快速的查阅。 …

Python速成篇(基础语法)下(新年快乐♥)

引言 一天不学编程手就痒&#xff0c;今天是除夕&#xff0c;学C艹vector的话就没时间出去玩了&#xff0c;所以就写写博客。今天要讲的内容是关于&#xff0c;list&#xff08;列表&#xff09;&#xff0c;tuple&#xff08;元组&#xff09;&#xff0c;字典&#xff08;di…

C#,巴都万数列(Padonve Number)的算法与源代码

1 巴都万数列&#xff08;Padovan Sequence&#xff09; 巴都万数列&#xff08;Padovan Sequence&#xff09;是一个整数数列。 首数个值为1, 1, 1, 2, 2, 3, 4, 5, 7, 9, 12, 16, 21, 28, 37 ... 此数列以建筑师理察巴都万命名&#xff0c;他的论文Dom&#xff08;1994年&a…

Select 选择器 el-option 回显错误 value

离谱 回显的内容不是 label 而是 value 的值 返回官方看说明&#xff1a; v-model的值为当前被选中的el-option的 value 属性值 value / v-model 绑定值有3种类型 boolean / string / number 根据自身代码猜测是&#xff1a;tableData.bookId 与 item.id 类型不一致导致 &…

C++入门学习(二十六)for循环

for (初始化; 条件; 递增/递减) { // 代码块 } 打印1~10&#xff1a; #include <iostream> using namespace std; int main() { for (int i 1; i < 10; i) { cout <<i<<endl; } return 0; } 打印九九乘法表&#xff1a; #include <iostream…

大模型基础架构的变革:剖析Transformer的挑战者(下)

上一篇文章中&#xff0c;我们介绍了UniRepLKNet、StripedHyena、PanGu-π等有可能会替代Transformer的模型架构&#xff0c;这一篇文章我们将要介绍另外三个有可能会替代Transformer的模型架构&#xff0c;它们分别是StreamingLLM、SeTformer、Lightning Attention-2&#xff…

1、学习 Eureka 注册中心

学习 Eureka 注册中心 一、创建 Eureka 微服务0、SpringBoot 和 SpringCloud 版本1、引入 Eureka 服务端依赖2、启动类加 EnableEurekaServer 注解3、配置 yaml 文件&#xff0c;把 Eureka 服务注册到 Eureka 注册中心4、访问 Eureka 服务端&#xff0c;查看注册中心的服务列表…

Blazor Wasm Gitee 码云登录

目录: OpenID 与 OAuth2 基础知识Blazor wasm Google 登录Blazor wasm Gitee 码云登录Blazor SSR/WASM IDS/OIDC 单点登录授权实例1-建立和配置IDS身份验证服务Blazor SSR/WASM IDS/OIDC 单点登录授权实例2-登录信息组件wasmBlazor SSR/WASM IDS/OIDC 单点登录授权实例3-服务端…

[神奇代码岛】皮肤功能使用

前言 最近有很多人在制作地图的时候&#xff0c;因该会用到皮肤的功能&#xff0c;但是皮肤操作只知道UI操作&#xff0c;但缺点是&#xff0c;只能设置地图默认皮肤&#xff0c;根本都做不到想要的什么皮肤购买功能&#xff0c;自主穿戴功能&#xff0c;而API官方又放在非常隐…

Blazor SSR/WASM IDS/OIDC 单点登录授权实例2-登录信息组件wasm

目录: OpenID 与 OAuth2 基础知识Blazor wasm Google 登录Blazor wasm Gitee 码云登录Blazor SSR/WASM IDS/OIDC 单点登录授权实例1-建立和配置IDS身份验证服务Blazor SSR/WASM IDS/OIDC 单点登录授权实例2-登录信息组件wasmBlazor SSR/WASM IDS/OIDC 单点登录授权实例3-服务端…

SpringCloud-Ribbon实现负载均衡

在微服务架构中&#xff0c;负载均衡是一项关键的技术&#xff0c;它可以确保各个服务节点间的负载分布均匀&#xff0c;提高整个系统的稳定性和性能。Spring Cloud 中的 Ribbon 就是一种负载均衡的解决方案&#xff0c;本文将深入探讨 Ribbon 的原理和在微服务中的应用。 一、…

12 ABC串口接收原理与思路

1. 串口接收原理 基本原理&#xff1a;通过数据起始位判断要是否要开始接收的数据&#xff0c;通过采样的方式确定每一位数据是0还是1。 如何判断数据起始位到来&#xff1a;通过边沿检测电路检测起始信号的下降沿 如何采样&#xff1a;一位数据采多次&#xff0c;统计得到高…

大水仙花数求解

输入位数&#xff0c;求解水仙花数。暴力求解&#xff0c;位数如果太多&#xff0c;会超时。 思路&#xff1a; &#xff08;1&#xff09;11333355和33331155看上去是不一样的两个数&#xff0c;但是它们又一样&#xff0c;因为相同数字出现的次数一样。 &#xff08;2&…

【Makefile】入门

一、编译工具及构建工具介绍 二、Makefile的简单讲解 1. 编译的四个阶段2. Makefile的规则 a. 基本规则b. 伪目标c. 变量赋值和预定义变量d.注释和换行符e. 变量的替换引用f.常见函数 一、编译工具及构建工具介绍 在之前的课程&#xff0c;都是直接使用gcc对代码进行编译&a…