IO流:字符输入流Reader的超详细用法及底层原理

news2025/1/11 22:49:28

字符输入流Reader的超详细用法及底层原理

  • 一、背景
  • 二、字符输入流Reader正式出场
  • 三、IO流体系图概览
  • 四、Reader继承人:FileReader出场
  • 五、字符流原理解析

一、背景

当我们使用字节输入流时,经常会出现乱码问题,具体原因如下:

  • 解码和编码时的方式不统一
  • 读取数据时未读完整个汉字,因为字节输入流,是一次读一个字节,而一个汉字会占多个字节,当读到某个汉字时,未读完其所有字节,就会出现乱码

二、字符输入流Reader正式出场

核心奥义:

  • 字符输入流Reader,也是一次读一个字节,但是当遇到中文时,就会一次读多个字节,相当于直接读一个汉字出来,这样就解决了字节输入流未读完整个汉字,出现乱码的问题。

字符流 - 底层揭秘

  • 字符流 = 字节流 + 字符集
    在这里插入图片描述
    字符流特点
  • 字符输入流:一次读一个字节,遇到中文时,一次读多个字节(可能是2个字节或3个字节,这个跟字符集有个哦)【对字符集有疑问的同学可以参考我之前的文章https://flypeppa.blog.csdn.net/article/details/133838023】
  • 字符输出流:底层会把数据按照指定的编码方式进行编码,变成字节再写到文件中
  • 最大的特点是,如果文件中有中文,使用字符流操作,不会出现乱码问题

使用场景

  • 对于纯文本文件进行读写操作

三、IO流体系图概览

在这里插入图片描述
因为我们本次学习的是字符流,所以看一下字符流的体系图
在这里插入图片描述

四、Reader继承人:FileReader出场

1、FileReader读取数据的方法

  • public int read() 读取数据,读到末尾返回-1
  • public int read(char cbuf[]) 读取多个数据,读到末尾返回-1

细节1:按字节进行读取,遇到中文,一次读多个字节,读取后解码,返回一个整数
细节2:读到文件末尾了,read方法返回-1。

2、代码实战

读取单个中文

package com.hidata.devops.paas.demo;

import java.io.FileReader;
import java.io.IOException;

/**
 * @Description :
 * @Date: 2023-10-18 10:59
 */
public class TestsDemo {
    public static void main(String[] args) throws IOException {
        FileReader fir = new FileReader("D:\\devops\\paas\\demo\\d.txt");
        int ch;
        while ((ch = fir.read()) != -1){
            System.out.print((char) ch);
        }

        fir.close();
    }
}

读取多个数据

package com.hidata.devops.paas.demo;

import java.io.FileReader;
import java.io.IOException;

/**
 * @Description :
 * @Date: 2023-10-18 10:59
 */
public class TestsDemo {
    public static void main(String[] args) throws IOException {
        FileReader fir = new FileReader("D:\\devops\\paas\\demo\\d.txt");
        int ch;
        char[] chars = new char[2];
        while ((ch = fir.read(chars)) != -1){
            System.out.println(new String(chars,0,ch));
        }

        fir.close();
    }
}

五、字符流原理解析

1、创建字符输入流对象

底层

  • 关联文件,并创建缓冲区(长度为8192的字节数组)

2、读取数据

底层

  • 1.判断缓冲区中是否有数据可以读取
  • 2.缓冲区没有数据:就从文件中获取数据,装到缓冲区中,每次尽可能装满缓冲区;
    如果文件中也没有数据了,返回-1
  • 3.缓冲区有数据:就从缓冲区中读取。
    空参的read方法:一次读取一个字节,遇到中文一次读多个字节,把字节解码并转成十进制返回;
    有参的read方法:把读取字节,解码,强转三步合并了,强转之后的字符放到数组中

3、代码验证原理
debug代码,看截图
在这里插入图片描述

我们发现,一开始就创建了一个缓冲区,长度为8192的字节数组。并且目前缓冲区里面是没有数据的

接下来,我们先往下走一步,
在这里插入图片描述
我们发现,第一次读取的时候,他就会把文件里面的所有字节信息都装到缓冲区里面,并且尽可能装满缓冲区。后面再次读取数据的时候,会直接先从缓冲区里面拿,提供效率

4、扩展

文件大小超过缓冲区默认大小(8192)怎么办 ?

  • 如果当前文件的字节数超过缓冲区的大小(8192字节),那么会先把文件的一部分,装满到缓冲区,当缓冲区数据读完之后,再将文件里面剩余的数据,继续装到缓冲区,以此类推。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1109114.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SBOM实例基础元素分析

有时候,SBOM (软件材料清单)更多的是理论上的,而不是实际的。有很多关于使用 SBOM 的潜在好处的讨论,比如软件供应链安全和守规,以及流行的 SBOM 格式,比如 CyclonedX 和 SPDX。但是我们的一些客户(特别是那些在 SBOM …

MSQL系列(四) Mysql实战-索引分析Explain命令详解

Mysql实战-索引分析Explain命令详解 前面我们讲解了索引的存储结构,我们知道了BTree的索引结构,也了解了索引最左侧匹配原则,到底最左侧匹配原则在我们的项目中有什么用?或者说有什么影响?今天我们来实战操作一下&…

PyTorch 模型性能分析和优化 - 第 6 部分

玩具模型 为了方便我们的讨论,我们使用流行的 timm python 模块(版本 0.9.7)定义了一个简单的基于 Vision Transformer (ViT) 的分类模型。我们将模型的 patch_drop_rate 标志设置为 0.5,这会导致模型在每个训练步骤中随机丢弃一半…

中国模式识别与计算机视觉大会|多模态模型及图像安全的探索及成果

目录 前言一、多模态模型进展与探索1、GPT-4V (多模态)测试2、LLM时代文档图像处理技术趋势3、LLM时代文档图像技术机会4、MLLM时代文档图像处理技术趋势5、知名文档图像大模型OCR性能分析 二、图像安全1、篡改种类2、系统架构3、文档图像处理开放平台4、AIGC假图鉴别5、图像篡…

Linux 回环测试串口RS232 UART

测试平台: ubuntu 18.04 需使用root权限。 1、硬件2脚和3脚短接 2、利用stty命令去掉默认的回显参数 stty -F /dev/ttyUSB0 -echo -onlcr如不设置会无限输出,且看不到信息 3、输入测试指令: 一个终端: cat /dev/ttyUSB0另一…

QtService实现Qt后台服务程序其一_基本使用步骤

QtService基本使用步骤 1、QtService介绍 QtService是一个用于实现windows服务或unix守护进程的开源项目,本文使用QtService演示如何实现一个windows下的后台进程,可用于一些简单的windows服务程序中。 测试使用Qt5.9.2版本。 2、项目引入QtService …

清除el-form表单验证

当创建表单触发表单验证时,关闭弹窗,再次触发创建表单会触发表单验证,出现如下图所示情况: 在每次打开弹窗时,添加如下代码,清除表单验证 this.$nextTick( () > {this.$refs[forName].clearValidate()…

【STM32】--PZ6860L,STM32F4,ARM3.0开发板

一、ARM3.0开发板详细介绍 1.开发板整体介绍 (1)各种外设和主板原理图 (2)主板供电部分5V和3.3V兼容设计 注意跳线帽 2.STM32核心板介绍 3.核心板原理图 STM32和51的IO对应关系 下载电路 二、ARM3.0开发板ISP下载原理分析 1.I…

Git - 异常处理 : Git | SSL certificate problem: certificate has expired

解决方案: 关闭 https 证书验证即可 git config --global http.sslVerify false

运行 XXXApplication 时出错,命令行过长

运行 XXXApplication 时出错,命令行过长 问题原因:当在运行 XXXApplication 时遇到命令行过长的错误,通常是由于操作系统的限制导致的。在某些操作系统中,命令行的长度是有限制的,超过该限制会导致出错。 问题解决&am…

《动手学深度学习 Pytorch版》 9.2 长短期记忆网络(LSTM)

解决隐变量模型长期信息保存和短期输入缺失问题的最早方法之一是长短期存储器(long short-term memory,LSTM)。它与门控循环单元有许多一样的属性。长短期记忆网络的设计比门控循环单元稍微复杂一些,却比门控循环单元早诞生了近 2…

最新XFF注入攻击和代码分析技术

点击星标,即时接收最新推文 本文选自《web安全攻防渗透测试实战指南(第2版)》 点击图片五折购书 XFF注入攻击 XFF注入攻击的测试地址在本书第2章。 X-Forwarded-For简称XFF头,它代表客户端真实的IP地址,通过修改X-Forw…

Day 07 python学习笔记

函数 函数的传参 关键字参数 函数调用时,指定参数的名称,即为关键字参数 允许传入0个或者多个含参数名的参数关键字参数必须放在普通参数的后面 例: def abc(x,a,b):print(x)print(a)print(b)abc(100,b4,a2) #其中a,b作为关键字参数可以随意…

软件性能测试-初步分析性能瓶颈

完成工具使用和脚本编写后,剩下的流程是执行和结果分析,以及复测。现在来学学结果分析,主要是要学会判断压力的来源,当响应时间远远超出我们的期望,测试人员如何判断是由于什么导致的过载响应。 一、性能瓶颈出现的表…

Spring Security登录表单配置(3)

1、登录表单配置 1.1、快速入门 理解了入门案例之后&#xff0c;接下来我们再来看一下登录表单的详细配置&#xff0c;首先创建一个新的Spring Boot项目&#xff0c;引入Web和Spring Security依赖&#xff0c;代码如下&#xff1a; <dependency><groupId>org.sp…

竹云荣膺2023粤港澳大湾区高质量发展标杆企业

10月12日&#xff0c;由深圳市前海深港现代服务业合作区管理局指导&#xff0c;广东省粤港澳大湾区产业协同发展联合会&#xff08;简称&#xff1a;湾区产联&#xff09;、香港大湾区工商业联合会主办的“深港合作前海向前”2023粤港澳大湾区高质量发展企业发布会、香港大湾区…

[计算机提升] 环境变量

1.5 环境变量 在Windows系统中&#xff0c;环境变量是一组参数或值&#xff0c;用于配置和控制操作系统的行为。它们用来确定系统的默认设置、执行文件路径以及其他系统行为。环境变量可以被所有的应用程序和命令行工具访问和使用&#xff0c;而不需要每次手动指定路径或设置参…

SELECT COUNT(*) 会造成全表扫描吗?

前言 SELECT COUNT(*)会不会导致全表扫描引起慢查询呢&#xff1f; SELECT COUNT(*) FROM SomeTable 网上有一种说法&#xff0c;针对无 where_clause 的 COUNT(*)&#xff0c;MySQL 是有优化的&#xff0c;优化器会选择成本最小的辅助索引查询计数&#xff0c;其实反而性能…

笔记本触摸板没反应?实用技巧助你成功修复!

笔记本电脑是我们日常工作和学习的得力工具之一&#xff0c;而触摸板作为一个重要的输入设备&#xff0c;对于操作的流畅性至关重要。然而&#xff0c;有时候我们可能会遇到笔记本触摸板没反应的问题&#xff0c;这可能会导致困扰和不便。本文将介绍解决笔记本触摸板无响应问题…

SPSS|偏度和峰度|正态性分布检验|实战小练-SPSS学习(1)

目录 学习目的软件版本基础数据实战数据准备数据初探输出结果分析两个重要统计量&#xff1a;偏度和峰度正态性检验结果其他图件输出 学习目的 检验数据集是否服从正态分布。 软件版本 IBM SPSS Statistics 26。 基础数据 一组数据&#xff0c;如&#xff1a;73 76 78 77 …