BufferedInputStream解读

news2024/11/16 7:53:25

  咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java之IO流啦,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好习惯,别被干货淹没了哦~

在这里插入图片描述

前言

  在进行Java编程时,避免不了要进行一些文件操作。虽然Java提供了很多类和方法来进行文件操作,但是由于I/O操作是比较费时的,所以我们需要考虑如何优化文件操作的效率。本文介绍了如何使用Java中的BufferedInputStream类来提高I/O操作的效率。

摘要

  本文主要介绍了如何使用Java中的BufferedInputStream类来优化I/O操作。首先介绍了BufferedInputStream类的作用和原理,然后分别从文件读取和文件写入两个角度,介绍了如何使用BufferedInputStream类来提高文件操作的效率。最后通过测试用例来验证了BufferedInputStream类的优化效果。

BufferedInputStream

简介

  BufferedInputStream是Java中的一个输入流,它实现了输入流的缓冲功能,使读取数据更加高效。当从一个InputStream中读取数据时,Java在内部会一次读取一个字节。这种方式读取数据的效率非常低,因为每次读取都需要和硬盘或网络进行IO操作,而这些操作非常耗时。因此,使用BufferedInputStream可以先将读取的数据缓存到内存中,在内存中慢慢读取,这样就可以减少IO操作的次数,提高读取数据的效率。在使用BufferedInputStream时,可以通过调用read()方法来读取数据,该方法会从缓冲区中读取数据,如果缓冲区中没有数据,则会调用底层流来读取数据。

作用和原理

  BufferedInputStream类是Java中的一个输入流缓冲器,它可以提高I/O操作的效率。BufferedInputStream类的原理是,当我们从文件中读取数据时,它会先将数据读入内存缓冲区中,然后再从缓冲区中逐个地读取数据。这样可以减少一些不必要的I/O操作,从而提高读取数据的效率。

优缺点

  BufferedInputStream是Java中的一个输入流包装类,它提供了输入流缓冲区的功能,可以提高读取数据的效率。

优点:

  1. 提供了输入流的缓冲功能,减少了底层输入流的读取次数。这种减少I/O操作的方式可以显著提高读取数据的性能,特别是在处理大量数据时。
  2. 具有预读的功能,可以一次性读取多个字节到缓冲区中,从而减少了对底层输入流的访问次数。
  3. 可以通过设置合适的缓冲区大小来优化读取性能,尤其是在连续读取大型数据块时。

缺点:

  1. 需要额外的内存空间来存储缓冲区,可能会占用较大的内存。
  2. 当读取数据量较小时,缓冲区的额外开销可能会引起性能下降。

应用场景

  1. 读取大文件或数据流时,使用BufferedInputStream可以提高读取性能。
  2. 在网络传输中,可以使用BufferedInputStream来缓冲输入流,减少网络I/O的次数,提高网络传输性能。
  3. 当需要连续读取大量数据块时,可以使用BufferedInputStream来将其存储在缓冲区中,减少对底层输入流的访问次数。

源码分析

  在BufferedInputStream的源码中,它维护了一个内部的字节数组缓冲区,默认缓冲区大小为8192字节(8KB)。当从BufferedInputStream中读取数据时,它会先检查缓冲区中是否还有可读取的数据,如果有,则直接从缓冲区中返回数据;如果没有,则从底层输入流中读取数据,并同时将读取的数据存入缓冲区中。在写入数据时也是类似的过程,先写入缓冲区,当缓冲区满或者需要刷新缓冲时,再将数据写入底层输出流。

  BufferedInputStream的源码比较复杂,涉及缓冲区的管理、数据读写等操作,通过内部的缓冲区来实现数据的快速读取和写入。在具体使用时,我们只需要关注使用API即可,无需深入理解其具体实现细节。

  由于BufferedInputStream主要的作用是在数据源和程序之间添加一个缓冲区,来提高IO操作的效率。读取数据时,BufferedInputStream先从缓冲区中读取,如果缓冲区中没有数据,则从数据源中读取一定量的数据放入缓冲区中,然后再从缓冲区中读取数据,这样就可以避免频繁地访问物理设备,提高了效率。

下面是BufferedInputStream的源码分析:

public class BufferedInputStream extends FilterInputStream {
    protected volatile byte buf[];
    //缓冲区大小
    protected int count;
    protected int pos;
    protected int markpos = -1;
    protected int marklimit;
    protected boolean mSkipLF = false;
    //默认缓冲区大小
    static int defaultBufferSize = 8192;
    //跳过缓冲区数据并重新读取数据
    private void fill() throws IOException {
        //pos记录缓存区的位置
        pos = 0;
        count = 0;
        int n = in.read(buf, pos, buf.length);
        if (n > 0) {//如果成功从输入流中读取数据
            count = n;
        }
    }
    //构造方法传入InputStream流对象
    public BufferedInputStream(InputStream in) {
        this(in, defaultBufferSize);
    }
    public BufferedInputStream(InputStream in, int size) {
        super(in);
        if (size <= 0) {
            throw new IllegalArgumentException("Buffer size <= 0");
        }
        buf = new byte[size];
    }
    //读取单个字节
    public synchronized int read() throws IOException {
        //如果当前数据已经读取完了,从输入流读取数据并缓存
        if (pos >= count) fill();
        //如果读完了还为空则返回-1
        return (pos < count) ? (buf[pos++] & 0xff) : -1;
    }
    //读取多个字节
    private int read1(byte[] b, int off, int len) throws IOException {
        int avail = count - pos;
        //如果缓存区正在被使用,则重新从流中读取数据到缓冲区中
        if (avail <= 0) {
            if (len >= buf.length && markpos < 0) {
                return in.read(b, off, len);
            }
            fill();
            avail = count - pos;
            if (avail <= 0) return -1;
        }
        int cnt = (avail < len) ? avail : len;
        System.arraycopy(buf, pos, b, off, cnt);
        pos += cnt;
        return cnt;
    }
    //读取多个字节,并返回读取的字节数
    public synchronized int read(byte b[], int off, int len)
        throws IOException {
        //校验参数范围
        if (b == null) {
            throw new NullPointerException();
        } else if (off < 0 || len < 0 || len > b.length - off) {
            throw new IndexOutOfBoundsException();
        } else if (len == 0) {
            return 0;
        }
        int n = 0;
        //连续读取
        for (;;) {
            int nread = read1(b, off + n, len - n);
            if (nread <= 0) return (n == 0) ? nread : n;
            n += nread;
            //读够了就退出循环
            if (n >= len) return n;
        }
    }
    //跳过指定字节数
    public synchronized long skip(long n) throws IOException {
        if (n <= 0) {
            return 0;
        }
        //现将缓存区的数据跳过
        long avail = count - pos;
        if (avail <= 0) {
            //如果缓存区没有数据,则直接跳过n个字节
            return in.skip(n);
        }
        long skipped = (avail < n) ? avail : n;
        pos += skipped;
        n -= skipped;
        //如果还需要跳过的字节数超过了缓存区大小,则直接调用输入流的skip方法跳过
        if (n > 0) {
            skipped += in.skip(n);
        }
        return skipped;
    }
    //返回当前可读取的字节数
    public synchronized int available() throws IOException {
        int n = count - pos;
        int avail = in.available();
        return (n > (Integer.MAX_VALUE - avail)) ? Integer.MAX_VALUE : n + avail;
    }
    //标记当前位置
    public synchronized void mark(int readlimit) {
        marklimit = readlimit;
        markpos = pos;
    }
    //重置到上一次标记的位置
    public synchronized void reset() throws IOException {
        if (markpos < 0) {
            throw new IOException("Resetting to invalid mark");
        }
        pos = markpos;
    }
    //判断是否支持mark和reset方法
    public boolean markSupported() {
        return true;
    }
    //关闭流
    public void close() throws IOException {
        byte[] buffer;
        synchronized (this) {
            buffer = buf;
            buf = null;
        }
        if (buffer != null) {
            //调用输入流的close方法关闭流
            in.close();
        }
    }
}

  从源码中可以看出,BufferedInputStream主要是通过缓冲区来提高了读取效率,其读取过程与InputStream的读取过程基本一致,只不过在数据从输入流中读取后,会先将其缓存到一个缓冲区中,然后再从缓冲区中读取数据。同时,BufferedInputStream还提供了markreset方法,可以对数据流进行标记和重置,方便对流的操作。

使用BufferedInputStream类读取文件

  在进行文件读取时,我们可以使用BufferedInputStream类来提高读取效率。下面是一个使用BufferedInputStream类读取文件的示例代码:

try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream("./template/hello.txt"))) {
    byte[] buffer = new byte[1024];
    int length;
    while ((length = bis.read(buffer)) != -1) {
        // do something with the data
    }
} catch (IOException e) {
    // handle exception
}

  上面的代码中,我们首先创建了一个BufferedInputStream对象,并将其包装在一个try-with-resources语句中,这样可以自动关闭资源。然后我们创建一个字节数组作为缓冲区,读取文件时每次读取1024个字节,读取到文件末尾时返回-1。我们可以在while循环中对读取到的数据进行处理。

  使用BufferedInputStream类读取文件时,每次读取的数据会先被读入缓冲区中,当缓冲区的数据被读取完后,再从文件中读取新的数据。这样可以减少I/O操作的次数,提高读取数据的效率。

使用BufferedInputStream类写入文件

  在进行文件写入时,我们同样可以使用BufferedInputStream类来提高写入效率。下面是一个使用BufferedInputStream类写入文件的示例代码:

try (BufferedOutputStream bos = new BufferedOutputStream(new FileOutputStream("./template/hello.txt"))) {
    byte[] data = "Hello, jym! ".getBytes();
    bos.write(data);
} catch (IOException e) {
    // handle exception
}

  上面的代码中,我们首先创建了一个BufferedOutputStream对象,并将其包装在一个try-with-resources语句中,这样可以自动关闭资源。然后我们将要写入的数据转换成字节数组,并通过BufferedOutputStream对象将数据写入到文件中。

  使用BufferedInputStream类写入文件时,每次写入的数据会先被写入到缓冲区中,当缓冲区的数据写满后,再将缓冲区中的数据一次性写入到文件中。这样可以减少I/O操作的次数,提高写入数据的效率。

测试用例

代码演示

  为了验证BufferedInputStream类的优化效果,我们可以编写一个测试用例。下面是一个使用BufferedInputStream类读取文件的测试用例:

package com.example.javase.io.bufferedInputStream;

import java.io.BufferedInputStream;
import java.io.FileInputStream;
import java.io.IOException;

/**
 * @author bug菌
 * @version 1.0
 * @date 2023/10/13 17:51
 */
public class BufferedInputStreamTest {

    public static void main(String[] args) {
        long start = System.currentTimeMillis();
        try (BufferedInputStream bis = new BufferedInputStream(new FileInputStream("./template/hello.txt"))) {
            byte[] buffer = new byte[1024];
            int length;
            while ((length = bis.read(buffer)) != -1) {
                String content = new String(buffer, 0, length);
                System.out.println("读取内容为:" + content);
            }
        } catch (IOException e) {
            // handle exception
        }
        long end = System.currentTimeMillis();
        System.out.println("Time used: " + (end - start) + "ms");
    }
}

  上面的代码中,我们首先记录了开始时间,然后使用BufferedInputStream类读取文件,并在while循环中对读取到的数据进行处理。最后,在读取数据时,将字节数组转换为字符串,并使用 System.out.println() 方法打印出来;并记录了结束时间,并输出总共使用的时间。

  我们可以在不使用BufferedInputStream类的情况下编写一个相同的测试用例,然后比较两个测试用例的运行时间,从而验证BufferedInputStream类的优化效果。

测试代码解析

这段代码演示了如何使用BufferedInputStream读取文件内容。

  1. 首先导入需要的类,包括BufferedInputStreamFileInputStreamIOException等;

  2. 在main函数中,首先记录程序开始的时间;

  3. 使用try-with-resources语句创建一个BufferedInputStream对象,它包装了一个FileInputStream对象,用于读取指定路径下的hello.txt文件;

  4. 创建一个byte数组作为缓冲区,长度为1024;

  5. 使用while循环读取文件内容,每次读取的数据被存储在缓冲区中,长度由read()方法返回;

  6. 将从缓冲区中读取的字节转换为字符串,输出到控制台;

  7. catch IOException异常,处理异常;

  8. 记录程序结束的时间;

  9. 输出程序执行时间。

  需要注意的是,使用BufferedInputStream可以提高读取文件的效率,但在读取大文件时,可能会导致内存溢出,需要注意调整缓冲区的大小。

测试结果

如下是运行测试用例所得截图,仅供参考:

在这里插入图片描述

小结

  通过本文的介绍,我们了解了如何使用Java中的BufferedInputStream类来提高I/O操作的效率。我们可以使用BufferedInputStream类来读取文件和写入文件,达到减少I/O操作次数、提高效率的目的。同时我们还编写了一个测试用例来验证BufferedInputStream类的优化效果。

总结

  BufferedInputStream类是Java中的一个输入流缓冲器,它可以提高I/O操作的效率。我们可以使用BufferedInputStream类来读取文件和写入文件,达到减少I/O操作次数、提高效率的目的。通过编写测试用例,我们验证了BufferedInputStream类的优化效果。在进行文件操作时,我们可以尽可能使用BufferedInputStream类来提高效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1543164.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

hash冲突四种解决办法,hash冲突除了拉链法还有什么?

1. 看hashmap 源码&#xff0c;有个问题&#xff0c;key 存放是 先hash 再与hash值的高16位值 进行异或运算。再与槽位size() 求模取余。如果多个不同的key 得出de数组位置相同。则采用链表依次存储。 2. 那么除了拉链法还有什么其他解决hash冲突的方法呢&#xff1f; a. 建立…

python程序打包

目录 1. 命令2. 安装2.1 PyInstaller2.2 cx_Freeze(笔者未用过) 3. 打包示例3.1 在 pycharm 中执行3.2 若使用打包命令时报错3.3 路径问题 python打包成可执行文件&#xff0c;用于在没有Python环境的地方运行该程序&#xff0c;与qt打包类似。&#xff08;笔者写的qt打包地址&…

Beans模块之工厂模块BeanNameAware

博主介绍&#xff1a;✌全网粉丝5W&#xff0c;全栈开发工程师&#xff0c;从事多年软件开发&#xff0c;在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战&#xff0c;博主也曾写过优秀论文&#xff0c;查重率极低&#xff0c;在这方面有丰富的经验…

无人驾驶中的坐标转换

无人驾驶中的坐标转换 无人车上拥有各种各样的传感器&#xff0c;每个传感器的安装位置和角度又不尽相同。对于传感器的提供商&#xff0c;开始并不知道传感器会以什么角度&#xff0c;安装在什么位置&#xff0c;因此只能根据传感器自身建立坐标系。无人驾驶系统是一个多传感器…

Jenkins的快速入门

文章目录 一、Jenkins是什么&#xff1f;二、Jenkins安装和持续集成环境配置1.持续集成流程说明2.Gitlab代码托管服务器安装Gitlab简介&#xff1a;Gitlab安装Gitlab的使用切换中文添加组创建用户将用户添加到组创建项目idea中代码上传Gitlab 3.Jenkins持续集成环境服务器安装J…

牛客网python练习题库记录

python格式化输出 python 读入整数数字并且换行输出 python规范输出小数点后几位 afloat(input()) format_a{.2f}.format(a) print(format_a) 小数化整数 afloat(input()) bint(a) print(b) 为整数增加小数点 input_integer int(input()) float_number float(input…

快速上手 Elasticsearch:Docker Compose 部署详解

最近面试竞争日益激烈&#xff0c;Elasticsearch作为一款广泛应用的中间件&#xff0c;几乎成为面试中必考的知识点。最近&#xff0c;AIGC也备受关注&#xff0c;而好多的AI项目中也采用了Elasticsearch作为向量数据库&#xff0c;因此我们迫切希望学习Elasticsearch。对于学习…

【Linux】Centos7安装redis

目录 下载安装包安装1.解压2.环境安装3.查看redis的安装路径4.将之前redis的配置文件&#xff0c;复制到安装路径下&#xff08;新建一个文件夹并复制&#xff09;5.redis 设置默认后台启动&#xff0c;修改配置文件6.启动redis服务默认启动通过配置文件启动查看进程 7.开放637…

【Python小工具系列】使用 Python 循环批量打开网页链接

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

大数据Hadoop生态圈体系视频课程

课程介绍 熟悉大数据概念&#xff0c;明确大数据职位都有哪些&#xff1b;熟悉Hadoop生态系统都有哪些组件&#xff1b;学习Hadoop生态环境架构&#xff0c;了解分布式集群优势&#xff1b;动手操作Hbase的例子&#xff0c;成功部署伪分布式集群&#xff1b;动手Hadoop安装和配…

一文详解常见医学自然语言理解任务和算法

1. 引言 随着人工智能&#xff08;AI&#xff09;技术的不断发展&#xff0c;越来越多的研究者开始关注AI技术在医学健康领域的研究应用&#xff0c;其中加速AI技术产业落地的一个重要环节就是标准数据集和科学评估体系的建立。由中国中文信息学会医疗健康与生物信息处理专业委…

力扣---完全平方数---动态规划

思路&#xff1a; 还是比较好想的&#xff0c;g[i]定义为和为 i 的完全平方数的最少数量。那么递推关系式是g[i]min(g[i-1],g[i-4],g[i-9],...)1&#xff0c;数组初始化是g[0]0,g[1]1。注意这里要对g[0]初始化&#xff0c;&#xff08;举个例子&#xff09;因为在遍历到g[4]时&…

34双体系Java学习之对象的创建和引用

创建对象 ★小贴士 当声明一个引用变量时&#xff0c;要求Java虚拟机分配空间给引用变量&#xff0c;并将此变量命名为myCar。 此引用变量将永远被固定为Car类型。 当创建对象时&#xff0c;要求Java虚拟机分配堆空间给新建立的Car对象。 关键字 new 通常称为创建运算符&#x…

redis在springboot项目中的应用

一&#xff0c;将查询结果放到redis中作为缓存&#xff0c;减轻mysql的压力。 只有在数据量大的时候&#xff0c;查询速度慢的时候才有意义。 本次测试的数据量为百万级别。 测试代码: 功能为根据昵称进行模糊匹配。 GetMapping("/get-by-nick")public String get…

基于K-近邻的PLOSAR图像分类

&#x1f380;个人主页&#xff1a; https://zhangxiaoshu.blog.csdn.net &#x1f4e2;欢迎大家&#xff1a;关注&#x1f50d;点赞&#x1f44d;评论&#x1f4dd;收藏⭐️&#xff0c;如有错误敬请指正! &#x1f495;未来很长&#xff0c;值得我们全力奔赴更美好的生活&…

无代码平台开发AI已经被实现了吗?

一、背景 无代码平台AI开发是一种新兴的开发方式&#xff0c;它允许非程序员或低代码开发者通过图形化界面、拖拽组件和预设模版等方式&#xff0c;无需编写传统的程序代码就能创建、训练和部署AI模型。这种方式极大地降低了AI技术的使用门槛&#xff0c;让更多不具备编程背景…

2024年第14届生物医学工程与技术国际会议(ICBET 2024)即将召开!

2024年第14届生物医学工程与技术国际会议&#xff08;ICBET 2024&#xff09;将于2024年6月14日至17日在韩国首尔举行。 会议旨在汇聚来自世界各地的研究人员、工程师、院士和行业专业人士&#xff0c;展示他们在生物医学工程与技术领域的最新研究成果和进展。 会议以“生物医学…

轻松应对城市内涝:慧天排水数字化分析平台,城市内涝模拟新利器

​在城市排水防涝规划过程中&#xff0c;水文水动力耦合模型已经成为一种不可或缺的分析工具。在模型建立、城市内涝风险评估、排水系统性能诊断以及海绵城市规划等方面&#xff0c;内涝耦合模型提供了相应的模拟及分析工具&#xff1a; 1.1 丰富的数据处理功能&#xff0c;兼…

C语言中如何动态分配内存并进行操作

C语言文章更新目录 C语言学习资源汇总&#xff0c;史上最全面总结&#xff0c;没有之一 C/C学习资源&#xff08;百度云盘链接&#xff09; 计算机二级资料&#xff08;过级专用&#xff09; C语言学习路线&#xff08;从入门到实战&#xff09; 编写C语言程序的7个步骤和编程…

Redis分布式锁—SETNX+Lua脚本实现

使用redis实现分布式锁&#xff0c;就是利用redis中的setnx&#xff0c;如果key不存在则进行set操作返回1&#xff0c;key已经存在则直接返回0。 优点&#xff1a; 设置expiretime过期时间&#xff0c;可以避免程序宕机长期持有锁不释放。redis作为一个中间服务&#xff0c;所…