【IO流系列】ConvertStream 转换流

news2024/10/5 22:20:15

转换流

    • 1. 概述
    • 2. 作用
    • 3. 字符编码和字符集
      • 3.1 字符编码
      • 3.2 字符集
    • 4. `InputStreamReader`字符转换输入流
      • 4.1 构造方法
      • 4.2 代码示例
    • 5. `OutputStreamWriter`字符转换输出流
      • 5.1 构造方法
      • 5.2 代码示例
    • 6. 练习
      • 6.1 练习1:转换文件编码
      • 6.2 练习2:读取文件数据
    • 7. 注意事项

文章中的部分照片来源于哔站黑马程序员阿伟老师处,仅用学习,无商用,侵权联系删除!

1. 概述

转换流是 Java 中用于在字节流和字符流之间进行转换的一种特殊流。

在处理数据时,有时候需要将字节流转换为字符流或字符流转换为字节流,这时就可以使用转换流来实现这种转换。转换流通常用于处理不同类型的数据,比如将字节流转换成字符流,或者将字符流转换成字节流。

在 Java 中,提供了两种主要的转换流:

  1. InputStreamReaderInputStreamReader 是用于将字节输入流转换为字符输入流的类。它接受一个字节输入流(如 FileInputStreamSocket.getInputStream())并根据指定的字符编码(如 UTF-8、GBK 等)将字节数据转换为字符数据。

  2. OutputStreamWriterOutputStreamWriter 是用于将字符输出流转换为字节输出流的类。它接受一个字节输出流(如 FileOutputStreamSocket.getOutputStream())并根据指定的字符编码将字符数据转换为字节数据。

在这里插入图片描述

2. 作用

  1. 字节流和字符流的转换:转换流允许将字节流转换为字符流,以便更方便地处理文本数据。通过InputStreamReader将字节输入流转换为字符输入流,通过OutputStreamWriter将字符输出流转换为字节输出流,使得在处理文本数据时更加方便。

  2. 字符编码转换:转换流提供了指定字符编码的功能,可以在转换流的构造方法中指定具体的字符编码,从而确保在字节和字符之间转换时使用指定的编码规则,避免因编码不一致导致的乱码等问题。

  3. 处理不同数据格式:转换流可以帮助处理来自外部数据源的字节数据,将其转换为字符数据进行处理,或者将处理完的字符数据转换为字节数据输出到外部数据源中,使得处理不同格式数据更加灵活。

在这里插入图片描述

3. 字符编码和字符集

3.1 字符编码

计算机中储存的信息都是用二进制数表示的,而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。按照某种规则,将字符存储到计算机中,称为编码

反之,将存储在计算机中的二进制数按照某种规则解析显示出来,称为解码 。比如说,按照A规则存储,同样按照A规则解析,那么就能显示正确的文本符号。反之,按照A规则存储,再按照B规则解析,就会导致乱码现象。

编码:字符(能看懂的)–字节(看不懂的)

解码:字节(看不懂的)–>字符(能看懂的)

  • 字符编码Character Encoding : 就是一套自然语言的字符与二进制数之间的对应规则。

    编码表:生活中文字和计算机中二进制的对应规则

3.2 字符集

  • 字符集 Charset:也叫编码表。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。

计算机要准确的存储和识别各种字符集符号,需要进行字符编码,一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBK字符集、Unicode字符集等。
在这里插入图片描述

可见,当指定了编码,它所对应的字符集自然就指定了,所以编码才是我们最终要关心的。

  • ASCII字符集
    • ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号)。
    • 基本的ASCII字符集,使用7位(bits)表示一个字符,共128字符。ASCII的扩展字符集使用8位(bits)表示一个字符,共256字符,方便支持欧洲常用字符。
  • ISO-8859-1字符集
    • 拉丁码表,别名Latin-1,用于显示欧洲使用的语言,包括荷兰、丹麦、德语、意大利语、西班牙语等。
    • ISO-8859-1使用单字节编码,兼容ASCII编码。
  • GBxxx字符集
    • GB就是国标的意思,是为了显示中文而设计的一套字符集。
    • GB2312:简体中文码表。一个小于127的字符的意义与原来相同。但两个大于127的字符连在一起时,就表示一个汉字,这样大约可以组合了包含7000多个简体汉字,此外数学符号、罗马希腊的字母、日文的假名们都编进去了,连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,这就是常说的"全角"字符,而原来在127号以下的那些就叫"半角"字符了。
    • GBK:最常用的中文码表。是在GB2312标准基础上的扩展规范,使用了双字节编码方案,共收录了21003个汉字,完全兼容GB2312标准,同时支持繁体汉字以及日韩汉字等。
    • GB18030:最新的中文码表。收录汉字70244个,采用多字节编码,每个字可以由1个、2个或4个字节组成。支持中国国内少数民族的文字,同时支持繁体汉字以及日韩汉字等。
  • Unicode字符集
    • Unicode编码系统为表达任意语言的任意字符而设计,是业界的一种标准,也称为统一码、标准万国码。
    • 它最多使用4个字节的数字来表达每个字母、符号,或者文字。有三种编码方案,UTF-8、UTF-16和UTF-32。最为常用的UTF-8编码。
    • UTF-8编码,可以用来表示Unicode标准中任何字符,它是电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。所以,我们开发Web应用,也要使用UTF-8编码。它使用一至四个字节为每个字符编码,编码规则:
      1. 128个US-ASCII字符,只需一个字节编码。
      2. 拉丁文等字符,需要二个字节编码。
      3. 大部分常用字(含中文),使用三个字节编码。
      4. 其他极少使用的Unicode辅助字符,使用四字节编码。

4. InputStreamReader字符转换输入流

4.1 构造方法

  • InputStreamReader(InputStream in): 创建一个使用默认字符集的字符流。

  • InputStreamReader(InputStream in, String charsetName): 创建一个指定字符集的字符流。

    构造举例,代码如下:

    InputStreamReader isr = new InputStreamReader(new FileInputStream("in.txt"));
    InputStreamReader isr2 = new InputStreamReader(new FileInputStream("in.txt") , "GBK");
    

4.2 代码示例

  • 代码示例
    需求:手动创建一个GBK的文件,把文件中的中文读取到内存中,不能出现乱码

    GBK文件: D:\JavaCode\code\codeText01\src\text\IOStream\ConvertStream\ConvertStream01\GBK01.txt

    package text.IOStream.ConvertStream.ConvertStream01;
    
    import java.io.FileInputStream;
    import java.io.FileReader;
    import java.io.IOException;
    import java.io.InputStreamReader;
    import java.nio.charset.Charset;
    
    /*转换文件编码
    
    需求:手动创建一个GBK的文件,把文件中的中文读取到内存中,不能出现乱码
      GBK文件:  D:\JavaCode\code\codeText01\src\text\IOStream\ConvertStream\ConvertStream01\GBK01.txt
    
     */
    public class ConvertStream01 {
        public static void main(String[] args) throws IOException {
            //原始方法(了解就行)
            System.out.println("原始方法:");
            method1();
    
            System.out.println();
    
            //JDK11以后得方法(需要掌握)
            //在JDK11以后java在FileReader的构造方法中添加了InputStreamReader字符转换流的对象
            System.out.println("JDK11以后得方法:");
            method2();
        }
    
        //原始方法(了解就行)
        public static void method1() throws IOException {
            //创建转换输入流对象
            InputStreamReader isr = new InputStreamReader(new FileInputStream("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream01\\GBK01.txt"), "GBK");
            //读取数据
            int b;
            while ((b = isr.read()) != -1) {
                System.out.print((char) b);
            }
    
            //释放资源
            isr.close();
        }
    
        //JDK11以后得方法(需要掌握)
        public static void method2() throws IOException {
            //创建输入流对象
            FileReader fis = new FileReader("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream01\\GBK01.txt", Charset.forName("GBK"));
            //读取数据
            int b;
            while ((b = fis.read()) != -1) {
                System.out.print((char) b);
            }
    
            //释放资源
            fis.close();
        }
    }
    
    
    
  • 输出结果

    • GBK文件(因为idea默认是UTF-8,因此会出现乱码形象)
      在这里插入图片描述
    • 原始方法
      在这里插入图片描述
    • JDK11以后方法
      在这里插入图片描述

5. OutputStreamWriter字符转换输出流

5.1 构造方法

  • OutputStreamWriter(OutputStream in): 创建一个使用默认字符集的字符流。

  • OutputStreamWriter(OutputStream in, String charsetName): 创建一个指定字符集的字符流。

    构造举例,代码如下:

    OutputStreamWriter isr = new OutputStreamWriter(new FileOutputStream("out.txt"));
    OutputStreamWriter isr2 = new OutputStreamWriter(new FileOutputStream("out.txt") , "GBK");
    

5.2 代码示例

  • 代码示例
    需求:把一段中文按照GBK的方式写到本地文件
    package text.IOStream.ConvertStream.ConvertStream02;
    
    import java.io.*;
    import java.nio.charset.Charset;
    
    /*转换文件编码
    
    需求:把一段中文按照GBK的方式写到本地文件
     */
    public class ConvertStream02 {
        public static void main(String[] args) throws IOException {
            //原始方法(了解就行)
            System.out.println("原始方法:");
            method1();
    
            System.out.println();
    
            //JDK11以后得方法(需要掌握)
            //在JDK11以后java在FileWriter的构造方法中添加了InputStreamWriter字符转换流的对象
            System.out.println("JDK11以后得方法:");
            method2();
        }
    
        //JDK11以后得方法(需要掌握)
        private static void method2() throws IOException {
            //创建对象
            FileWriter fw = new FileWriter("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream02\\a.txt", Charset.forName("GBK"));
            //输出数据
            String str = "星光闪烁,如同我们之间的誓言,\n" +
                    "余生余生,只愿与你相伴。";
            fw.write(str);
            //释放资源
            fw.close();
        }
    
        //原始方法(了解就行)
        private static void method1() throws IOException {
            //创建对象
            OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream02\\a.txt"), "GBK");
            //输出数据
            String str = "星光闪烁,如同我们之间的誓言,\n" +
                    "余生余生,只愿与你相伴。";
            osw.write(str);
            //释放资源
            osw.close();
        }
    
    }
    
    
  • 输出结果
    • ieda里展示的文件(因为idea默认是UTF-8,因此会出现乱码形象)
      在这里插入图片描述
    • 记事本中打开(记事本默认是GBK)
      在这里插入图片描述

6. 练习

6.1 练习1:转换文件编码

  • 需求:将本地文件中的GBK文件,转成UTF-8

    GBK文件:D:\JavaCode\code\codeText01\src\text\IOStream\ConvertStream\ConvertStream03\GBK01.txt
    UTF-8:D:\JavaCode\code\codeText01\src\text\IOStream\ConvertStream\ConvertStream03\UTF8

  • 代码示例
    package text.IOStream.ConvertStream.ConvertStream03;
    
    import java.io.FileInputStream;
    import java.io.FileWriter;
    import java.io.IOException;
    import java.io.InputStreamReader;
    import java.nio.charset.Charset;
    
    /*转换文件编码
    
    需求:将本地文件中的GBK文件,转成UTF-8
    GBK文件:D:\JavaCode\code\codeText01\src\text\IOStream\ConvertStream\ConvertStream03\GBK01.txt
    UTF-8:D:\JavaCode\code\codeText01\src\text\IOStream\ConvertStream\ConvertStream03\UTF8
     */
    public class ConvertStream03 {
        public static void main(String[] args) throws IOException {
            //创建对象
            InputStreamReader isr = new InputStreamReader(new FileInputStream("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream03\\GBK01.txt"), "GBK");
            FileWriter fw = new FileWriter("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream03\\UTF8", Charset.forName("UTF-8"));
            //输入数据
            int b;
            while ((b = isr.read()) != -1) {
                //输出数据
                fw.write((char) b);
            }
    
            //释放资源
            fw.close();
            isr.close();
        }
    }
    
    
  • 输出结果
    • GBK文件(因为idea默认是UTF-8,因此会出现乱码形象)
      在这里插入图片描述
    • UTF-8文件
      在这里插入图片描述

6.2 练习2:读取文件数据

  • 需求:利用字节流读取文件中的数据,每次读一整行,而且不能出现乱码
  • 代码示例
    package text.IOStream.ConvertStream.ConvertStream04;
    
    import java.io.BufferedReader;
    import java.io.FileInputStream;
    import java.io.IOException;
    import java.io.InputStreamReader;
    
    /*读取文件中的数据
    
    需求:利用字节流读取文件中的数据,每次读一整行,而且不能出现乱码
     */
    public class ConvertStream04 {
        public static void main(String[] args) throws IOException {
            //创建转换流对象
            InputStreamReader isr = new InputStreamReader(new FileInputStream("D:\\JavaCode\\code\\codeText01\\src\\text\\IOStream\\ConvertStream\\ConvertStream04\\a.txt"));
            // 创建缓冲流对象,从而调用readline方法,每次读取一行
            BufferedReader br = new BufferedReader(isr);
            //读取数据
            String line;
            while ((line = br.readLine()) != null) {
                System.out.println(line);
            }
            //释放资源
            br.close();
            isr.close();
        }
    }
    
    
  • 输出结果
    • a.txt
      在这里插入图片描述
    • 程序输出
      在这里插入图片描述

7. 注意事项

  1. 字符编码一致性:在创建转换流时,应该明确指定字符编码,确保输入流和输出流之间的字符编码保持一致。不同的字符编码可能会导致数据解析错误或产生乱码。

  2. 异常处理:在使用转换流时,需要及时捕获和处理可能抛出的异常,如字符编码不支持等异常,以避免程序崩溃或产生不可预料的错误。

  3. 适当的缓冲处理:转换流本身并不具备缓冲功能,如果需要使用缓冲功能以提高性能,可以考虑在转换流外包装一层缓冲流(如BufferedReader 或 BufferedWriter)来增加缓冲效果。

  4. 流的关闭:在不再需要使用转换流时,应该手动关闭转换流,以释放资源。可以使用 try-with-resources 结构确保转换流在使用完毕后能够被正确关闭。

  5. 性能考量:转换流可能会引入一定的性能开销,特别是在大规模数据处理时,需要对性能进行适当的评估和优化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1479767.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CY8C42(1.PSoC4 Pioneer Kit开箱及基本使用)

1.开箱 最近了解到赛普拉斯有一种芯片,属于PSoC系列,与传统MCU不同,有点类似跨界芯片,于是就买来玩玩了,老实说用完还是很特别的,因为我没有用过FPGA,不确定是不是FPGA的开发流程(有…

Spring 学习记录

Spring 学习记录 1. Spring和SpringFrameWork1.1 广义的Spring2.1 狭义的Spring2.3 SpringFrameWork / Spring框架图 2. Spring IOC容器(即上图中的Core Container)2.1 相关概念 (IOC DI 容器 组件)2.2 Spring IOC容器的作用2.3 Spring IOC容器接口和具体实现类 3. Spring IOC …

p18 线性代数,行阶梯型矩阵

行阶梯型矩阵 行最简型矩阵

Docker实战——网络通信

目录 一、Docker 容器网络通信的基本原理1、查看 Docker 容器网络(1)新建一个 Dockerfile文件,内容如下:(2)使用以下命令创建镜像(3)基于 debian 的镜像创建一个容器,并进…

QML中表格中数据获取

1.在生成的动态表格中获取某格数据的内容 import QtQuick 2.15 import QtQuick.Window 2.15import QtQuick.Controls 2.0 import Qt.labs.qmlmodels 1.0 import QtQuick.Layouts 1.15Window {width: 640height: 480visible: truetitle: qsTr("Hello World")TableMod…

基于SpringBoot和MyBatisPlus实现的代码插件

1. 为什么自己开发插件 目前市面上基于Mybatis或MybatisPlus的代码生成器或插件有很多,本人前几年也开发了一款:基于SpringBoot微服务代码自动生成插件。之前的开发的这款插件底层使用的持久层框架是通用Mapper,不是现在主流的MyBatisPlus&am…

【探索AI】十二 深度学习之第2周:深度神经网络(一)深度神经网络的结构与设计

第2周:深度神经网络 将从以下几个部分开始学习,第1周的概述有需要详细讲解的的同学自行百度; 深度神经网络的结构与设计 深度学习的参数初始化策略 过拟合与正则化技术 批标准化与Dropout 实践:使用深度学习框架构建简单的深度神…

奇安信发布《2024人工智能安全报告》,AI深度伪造欺诈激增30倍

2024年2月29日,奇安信集团对外发布《2024人工智能安全报告》(以下简称《报告》)。《报告》认为,人工智能技术的恶意使用将快速增长,在政治安全、网络安全、物理安全和军事安全等方面构成严重威胁。 《报告》揭示了基于…

为什么电池对eVTOL来说是一个问题

Electric Power Systems首席技术官Michael Armstrong表示,电动垂直起降(eVTOL)飞机面临着独特的电池挑战,这将要求开发人员改变他们对电池系统和电动汽车设计的看法。 阿姆斯特朗说:“如果我们研究先进空中交通、第23部…

iPhone上备忘录分享到微信 苹果手机备忘录微信分享

在繁忙的生活中,iPhone的备忘录功能一直是我记录琐事、灵感和待办事项的得力助手。然而,每当我精心编辑好一段内容,想要将其分享给微信好友或发到朋友圈时,却常常遭遇分享难题。那种无法将精彩瞬间轻松分享给朋友的无奈&#xff0…

易货模式微信小程序的可行性分析

随着移动互联网技术的快速发展,微信小程序作为一种轻量级的应用形态,已经成为众多创业者和服务提供者关注的焦点。微信小程序以其便捷的使用体验、较低的开发成本和广泛的用户基础,成为了各类业务模式的创新平台。在这样的背景下,…

如何将java程序打包成可执行文件

问题提出 当你写了一个很炫酷的java小游戏,你迫不及待想给朋友分享。然而,你发给朋友之后,他却表示无法执行。因为我们无法保证其他人的电脑上已经安装了java运行环境。 所以,我们有哪些方法把我们的炫酷代码分享给朋友呢&#…

基于SSM SpringBoot vue服装物流管理系统

基于SSM SpringBoot vue服装物流管理系统 系统功能 首页 图片轮播 人个中心 登录注册 后台管理: 登录注册 个人中心 货物信息管理 货物入库管理 订单信息管理 商品出库管理 快递追踪管理 用户管理 供应商信息管理 盘点信息管理 管理员管理 开发环境和技术 开发语言&#xf…

纯css实现-让字符串在文字少时显示为居中对齐,而在文字多时显示为左对齐

纯css实现-让字符串在文字少时显示为居中对齐,而在文字多时显示为左对齐 使用flex实现 思路 容器样式(.container): Flex容器的BFC性质使得其内部的子元素(.text-box)在水平方向上能够居中,通过justify-c…

Python web框架fastapi数据库操作ORM(一)

文章目录 Fastapi ORM操作1、创建模型2、创建数据库连接配置文件3、启动项目4、根据模型类创建数据库表1. 初始化配置,只需要使用一次2. 初始化数据库,一般情况下只用一次3. 更新模型并进行迁移4. 重新执行迁移,写入数据库5. 回到上一个版本6…

RFID射频识别技术的优势

目前RFID在金融支付、物流、零售、制造业、医疗、身份识别、防伪、资产管理、交通、食品、动物识别、汽车、等行业都已经实现不同程度的商业化使用。未来,RFID技术有不可替代的六大优势,也保证了物联网的万物互联的有序发展! 1、无需可视,在无…

第零章_计算机导论

0.1 计算机:辅助人脑的好工具 所谓的计算机就是一种计算器,而计算器其实是:『接受用户输入指令与数据,经由中央处理器的数学与逻辑单元运算处理后,以产生或储存成有用的信息』。因此,只要有输入设备(不管是键盘还是触摸…

【软考高项】【计算专题】- 5 - 进度类 - 横道图/甘特图

一、知识点 1、基本定义 甘特图(Gantt chart )又称为横道图、条状图(Bar chart),通过条状图来显示项目各活动的进 度情况。以提出者亨利劳伦斯甘特( Henry Laurence Gantt)先生的名字命名。 目前许多文档工具都可以画甘特图。 (1)我的举例 …

PSO-CNN-LSTM多输入回归预测|粒子群算法优化的卷积-长短期神经网络回归预测(Matlab)——附代码数据

目录 一、程序及算法内容介绍: 基本内容: 亮点与优势: 二、实际运行效果: 三、算法介绍: 四、完整程序数据分享下载: 一、程序及算法内容介绍: 基本内容: 本代码基于Matlab平台…

javaWeb个人学习04

AOP核心概念: 连接点: JoinPoint, 可以被AOP控制的方法 通知: Advice 指哪些重复的逻辑,也就是共性功能(最终体现为一个方法) 切入点: PointCut, 匹配连接点的条件,通知仅会在切入点方法执行时被应用 目标对象: Target, 通知所应用的对象 通知类…