Apache POI与easyExcel:Excel文件导入导出的技术深度分析

news2024/11/13 12:56:19

在处理Excel文件时,Java开发者经常会面临多种选择,其中Apache POI和easyExcel是两个非常受欢迎的选择。这两个库都提供了强大的Excel文件处理功能,但在性能、内存使用、API设计以及扩展性方面有所不同。本文将深入分析Apache POI和easyExcel在导入导出Excel文件时的技术特点和使用体验。

一、Apache POI:全面但重量级的解决方案

  • Apache POI是一个历史悠久且功能全面的开源项目,用于处理Microsoft Office格式文件,包括Excel。它提供了对Excel文件读写操作的全面支持,在处理Excel文件时,POI通过HSSF和XSSF两个子项目分别支持.xls和.xlsx格式。HSSF针对的是旧版的二进制Excel格式,而XSSF则是为新版的基于XML的Excel格式设计的。

  • 在导入Excel文件时,Apache POI会将整个文件加载到内存中,然后提供API来访问和操作文件中的各个元素,如单元格、行、列等。这种处理方式在处理小型文件时非常有效,因为它允许开发者以任意方式访问文件内容。然而,随着文件大小的增加,内存消耗也会急剧增长,这可能导致性能下降甚至内存溢出。

  • 导出Excel文件时,Apache POI同样需要将所有数据加载到内存中,然后一次性写入文件。这种方式在处理大量数据时可能会变得非常缓慢,并且需要大量的内存资源。

1.1 POI实现读取excel

下面是一演示如何使用 Apache POI 导入(读取)和导出(写入)Excel 文件(.xlsx 格式)

<dependency>  
    <groupId>org.apache.poi</groupId>  
    <artifactId>poi</artifactId>  
    <version>5.2.0</version>  
</dependency>  
<dependency>  
    <groupId>org.apache.poi</groupId>  
    <artifactId>poi-ooxml</artifactId>  
    <version>5.2.0</version>  
</dependency>

开一个Excel文件、读取数据,并将内容打印到控制台上:

import org.apache.poi.ss.usermodel.*;  
import org.apache.poi.xssf.usermodel.XSSFWorkbook;  
  
import java.io.File;  
import java.io.FileInputStream;  
import java.io.IOException;  
  
public class ExcelReaderExample {  
  
    public static void main(String[] args) {  
        // 指定要读取的Excel文件路径  
        String filePath = "path/to/your/excel/file.xlsx";  
  
        // 使用FileInputStream打开文件  
        try (FileInputStream fis = new FileInputStream(new File(filePath))) {  
  
            // 创建工作簿对象  
            Workbook workbook = new XSSFWorkbook(fis);  
  
            // 获取第一个工作表(Sheet),索引从0开始  
            Sheet sheet = workbook.getSheetAt(0);  
  
            // 遍历工作表的每一行  
            for (Row row : sheet) {  
                // 遍历行中的每一个单元格  
                for (Cell cell : row) {  
                    // 读取单元格内容并打印到控制台  
                    System.out.print(getCellValue(cell) + "\t");  
                }  
                // 每读取完一行后换行  
                System.out.println();  
            }  
  
            // 工作完成,关闭工作簿(实际上在这个例子中不需要,因为使用了try-with-resources)  
            // workbook.close();  
  
        } catch (IOException e) {  
            // 处理文件读取过程中可能出现的异常  
            e.printStackTrace();  
        }  
    }  
  
    // 辅助方法:根据单元格类型获取单元格的值  
    private static String getCellValue(Cell cell) {  
        DataFormatter formatter = new DataFormatter(); // 创建一个格式化对象,用于处理各种数据类型  
        return formatter.formatCellValue(cell); // 返回格式化后的单元格内容  
    }  
}

请注意,getCellValue方法使用DataFormatter类来确保无论单元格包含何种类型的数据(如数字、日期或文本),都能以合适的格式返回其字符串表示形式。

1.2 poi实现写入excel

当使用Apache POI写入.xlsx格式的Excel文件时,您需要创建一个XSSFWorkbook对象来表示整个工作簿,然后在其中创建XSSFSheet对象来表示工作表。接下来,您可以在工作表中创建行和单元格,并设置它们的值。最后,将工作簿写入到文件系统中。

import org.apache.poi.ss.usermodel.*;  
import org.apache.poi.xssf.usermodel.XSSFWorkbook;  
  
import java.io.FileOutputStream;  
import java.io.IOException;  
  
public class ExcelWriterExample {  
  
    public static void main(String[] args) {  
        // 创建一个新的工作簿  
        Workbook workbook = new XSSFWorkbook();  
  
        // 创建一个工作表(Sheet),命名为"MySheet"  
        Sheet sheet = workbook.createSheet("MySheet");  
  
        // 在工作表中创建行(从0开始计数)  
        Row row = sheet.createRow(0);  
  
        // 在行中创建单元格(从0开始计数),并设置值  
        Cell cell = row.createCell(0);  
        cell.setCellValue("Hello");  
  
        // 创建另一个单元格,并设置值  
        Cell cell2 = row.createCell(1);  
        cell2.setCellValue("World");  
  
        // 也可以链式地创建行和单元格  
        sheet.createRow(1).createCell(0).setCellValue("Apache");  
        sheet.getRow(1).createCell(1).setCellValue("POI");  
  
        // 写入到文件系统  
        try (FileOutputStream fos = new FileOutputStream("path/to/your/excel/file.xlsx")) {  
            workbook.write(fos);  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
  
        // 关闭工作簿(在这个例子中不需要,因为使用了try-with-resources)  
        // workbook.close();  
  
        System.out.println("Excel file written successfully.");  
    }  
}

二、easyExcel:轻量级且高效的Excel处理工具

  • easyExcel是阿里巴巴开源的一个轻量级且高效的Excel处理框架。它针对大型Excel文件的处理进行了优化,采用了流式处理的方式,允许开发者逐行读写数据,从而大大降低了内存消耗。在导入Excel文件时,easyExcel使用了基于事件驱动的模型。它不会将整个文件加载到内存中,而是逐行解析文件,通过回调函数将每行的数据传递给开发者进行处理。
  • EasyExcel 是在在POI的解析引擎基础上改进的,但并没有完全重写 Apache POI 的整个解析引擎,特别是对于 XLSX 文件格式(即 Excel 2007 及以上版本所使用的格式,POI 中对应的是 XSSF 实现),它仍然是基于 POI 的一些底层结构和功能。但是,EasyExcel 在 POI 的基础上进行了大量的优化和重构,以实现更高的性能和更低的内存消耗。

EasyExcel 的核心改进之一是在处理大型数据时采用了“读写分离”和“懒加载”的策略。具体来说,EasyExcel 做了以下几点优化:

  • 按需解析:EasyExcel 不会一次性将整个文件加载到内存中,而是按需读取和解析数据,通过滑动窗口的方式只处理当前需要的数据行,从而大大降低了内存占用。

  • 写入优化:在写入数据时,EasyExcel 同样采用了流式写入的策略,将数据分批次写入磁盘,避免了大数据量时的内存溢出问题。

  • 内存管理:EasyExcel 对内存的使用进行了精细化的管理,通过对象池、缓存优化等技术减少了内存分配和垃圾回收的频率,提升了处理速度。

  • 模型映射:通过注解和反射机制,EasyExcel 可以将 Excel 数据行直接映射为 Java 对象,简化了数据转换的过程。

  • 异常处理:EasyExcel 提供了更加友好的异常处理机制,帮助开发者快速定位和处理读写过程中可能出现的问题。

  • 扩展性:EasyExcel 设计了更加灵活和可扩展的架构,允许开发者通过实现特定的接口来定制和扩展功能。

在这里插入图片描述

尽管 EasyExcel 在 POI 的基础上进行了很多优化,但它仍然依赖于 POI 的一些核心组件来处理 XLSX 文件的底层细节。因此,在使用 EasyExcel 时,仍然可以看到 POI 的影子,尤其是在处理一些复杂的 Excel 特性时。不过,对于大多数常见的 Excel 读写需求,EasyExcel 提供了更加高效和简洁的解决方案。

2.1 easyExcel实现批量读取excel

将 easyExcel 的依赖添加到了你的项目中。如果使用 Maven,可以在 pom.xml 文件中添加如下依赖:

<dependency>  
    <groupId>com.alibaba</groupId>  
    <artifactId>easyexcel</artifactId>  
    <version>最新版本</version> <!-- 请替换为实际的最新版本号 -->  
</dependency>

使用easyExcel的读取API,并指定要读取的sheet索引(从0开始计数,第二个sheet的索引为1)。
实现一个监听器来处理读取到的数据行,并在这个监听器中将数据分批写入数据库。

import com.alibaba.excel.EasyExcel;  
import com.alibaba.excel.context.AnalysisContext;  
import com.alibaba.excel.event.AnalysisEventListener;  
import com.alibaba.excel.read.builder.ExcelReaderBuilder;  
import com.alibaba.excel.read.builder.ExcelReaderSheetBuilder;  
import com.alibaba.excel.read.metadata.ReadSheet;  
  
import java.util.ArrayList;  
import java.util.List;  
  
// 数据模型类  
class DataModel {  
    private String column1;  
    private String column2;  
    // ... 其他字段  
  
    // 省略getter和setter方法  
}  
  
// 读取Excel并写入数据库的类  
public class ExcelReaderToDB {  
  
    // 模拟的批量写入数据库方法  
    private void batchInsertToDB(List<DataModel> dataList) {  
        // 这里应该是将数据真正写入数据库的代码  
        // 这里仅做打印输出模拟  
        System.out.println("Inserting batch of " + dataList.size() + " rows to DB...");  
        for (DataModel data : dataList) {  
            System.out.println(data);  
        }  
    }  
  
    // 读取Excel文件的方法  
    public void readExcelFile(String filePath) {  
        // 第二个sheet的索引为1  
        int sheetIndex = 1;  
  
        // 读取Excel文件  
        ExcelReaderBuilder readerBuilder = EasyExcel.read(filePath);  
        ExcelReaderSheetBuilder sheetBuilder = readerBuilder.sheet(sheetIndex);  
  
        // 读取数据并注册监听器  
        sheetBuilder.registerReadListener(new AnalysisEventListener<DataModel>() {  
            // 用来缓存读取到的数据  
            private List<DataModel> cachedDataList = new ArrayList<>();  
  
            // 读取每行数据时会调用此方法  
            @Override  
            public void invoke(DataModel dataModel, AnalysisContext analysisContext) {  
                cachedDataList.add(dataModel);  
                // 当读取到一定数量的数据时,可以执行批量写入数据库的操作  
                // 这里假设我们每读取100行数据就写入一次数据库  
                if (cachedDataList.size() >= 100) {  
                    batchInsertToDB(cachedDataList);  
                    // 清空缓存  
                    cachedDataList.clear();  
                }  
            }  
  
            // 所有数据解析完成后会调用此方法  
            @Override  
            public void doAfterAllAnalysed(AnalysisContext analysisContext) {  
                // 将剩余的数据写入数据库  
                if (!cachedDataList.isEmpty()) {  
                    batchInsertToDB(cachedDataList);  
                    cachedDataList.clear();  
                }  
            }  
        });  
  
        // 开始读取  
        sheetBuilder.build();  
        readerBuilder.build().read();  
    }  
  
    public static void main(String[] args) {  
        String filePath = "path/to/your/excel/file.xlsx";  
        ExcelReaderToDB excelReader = new ExcelReaderToDB();  
        excelReader.readExcelFile(filePath);  
    }  
}

2.2 easyExcel实现写入excel

定义一个模型类来表示你要写入的数据。创建一个数据模型类来映射Excel表格中的数据列,并使用easyExcel的注解来标识表头和字段映射关系。
编写一个方法来创建Excel写入对象,并填充数据到Excel文件中.

import com.alibaba.excel.EasyExcel;  
import com.alibaba.excel.write.metadata.WriteSheet;  
import com.alibaba.excel.annotation.ExcelProperty;  
  
import java.util.ArrayList;  
import java.util.List;  
  
// 数据模型类,使用注解标识表头和字段映射关系  
public class DataModel {  
  
    // 表头名称与字段的映射  
    @ExcelProperty("姓名")  
    private String name;  
  
    @ExcelProperty("年龄")  
    private Integer age;  
  
    // 省略getter和setter方法  
  
    // 构造函数  
    public DataModel(String name, Integer age) {  
        this.name = name;  
        this.age = age;  
    }  
}  
  
// 导出数据到Excel的类  
public class ExcelExporter {  
  
    // 模拟数据  
    private List<DataModel> getData() {  
        List<DataModel> list = new ArrayList<>();  
        list.add(new DataModel("张三", 20));  
        list.add(new DataModel("李四", 22));  
        list.add(new DataModel("王五", 24));  
        return list;  
    }  
  
    // 导出数据到Excel文件  
    public void exportToExcel(String filePath) {  
        // 创建写入对象  
        EasyExcel.write(filePath, DataModel.class)  
                .sheet("Sheet1") // 设置sheet名称  
                .doWrite(getData()); // 写入数据  
    }  
  
    public static void main(String[] args) {  
        String filePath = "path/to/your/excel/file.xlsx";  
        ExcelExporter exporter = new ExcelExporter();  
        exporter.exportToExcel(filePath);  
    }  
}

三、API设计与易用性

Apache POI提供了丰富且灵活的API,允许开发者以多种方式操作Excel文件。然而,由于其功能全面且复杂,API的学习曲线相对较陡,对于初学者来说可能需要一些时间来熟悉。

相比之下,easyExcel的API设计更加简洁和直观。它提供了针对常见任务的简化方法,使得开发者能够更快速地完成任务。此外,easyExcel还支持自定义读写策略、异步处理、数据校验等高级特性,这些功能都通过简洁的API暴露给开发者,提高了易用性。

四、总结

Apache POI和easyExcel都是优秀的Java库,用于处理Excel文件。Apache POI以其全面性和灵活性著称,提供了对Excel文件的全面支持。然而,在处理大型文件时,它可能会遇到性能问题和内存消耗过高的情况。相比之下,easyExcel则针对大型文件的处理进行了优化,提供了更高的性能和更低的内存消耗。此外,easyExcel的API设计更加简洁和易用,使得开发者能够更高效地完成任务。

在选择使用哪个库时,开发者应根据项目需求和文件大小来决定。如果项目需要处理大型Excel文件,并且对性能和内存消耗有较高要求,那么easyExcel可能是一个更好的选择。而如果项目需要全面的Excel文件处理功能,并且对性能要求不高,那么Apache POI也是一个不错的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1431609.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【NTN 卫星通信】基于NTN的多3GPP连接应用场景

1 概述 同时聚合两条3GPP接入链路&#xff0c;其中一条为非地面网络&#xff0c;可以提供以下5G业务使能&#xff0c;尤其适用于带宽有限或接入链路不可靠的服务不足地区:   -扩展流动宽频   -超可靠的服务通信 如技术报告38.821所述&#xff0c;若干服务场景(例如在偏远地…

Spring AOP 常见错误(下)

上一章, 我们介绍了 Spring AOP 常遇到的几个问题&#xff0c;通过具体的源码解析&#xff0c;相信你对 Spring AOP 的基本原理已经有所了解了。不过&#xff0c;AOP 毕竟是 Spring 的核心功能之一&#xff0c;不可能规避那零散的两三个问题就一劳永逸了。所以这一章&#xff0…

OJ刷题:《剑指offer》之单身狗1、2 !(巧用位操作符,超详细讲解!)

目录 1.单身狗1 1.1 题目描述 1.2排序寻找 1.3巧用位操作符 2.单身狗2 1.1 题目描述 1.2排序寻找 1.3巧用位操作符 不是每个人都能做自己想做的事&#xff0c;成为自己想成为的人。 克心守己&#xff0c;律己则安&#xff01; 创作不易&#xff0c;宝子们&#xff01;如…

「悬浮捷径SoftCircle」安卓平台的hao123,一键打开万物

罗老师的onestep一步发布之前, 终端的打开形式还拘泥于桌面和负一屏 这种方式够简洁,但缺点明显: 1.入口单一性:只能在app首页和各种扫一扫之间选择和切换 2.操作复杂:入口切换需要频繁的进入退出桌面,步骤过于繁杂 以下是悬浮捷径SoftCircle的解决方式 1.入口的丰富性: 安卓平…

代码随想录算法训练营Day24 | 回溯理论基础、77.组合

回溯理论基础 回溯和递归是相辅相成的&#xff0c;只要有递归就有回溯&#xff08;执行完一次递归就自动回溯到上一层&#xff09; 回溯的效率 回溯不是一个高效的算法&#xff0c;而是一个纯暴力的过程 有些问题没有更好的解法&#xff0c;只能使用暴力搜索&#xff0c;这时…

okhttp 的 拦截器

拦截器有很多作用&#xff0c;实现就是责任链模式&#xff0c;细节&#xff0c;等我有时间补上。 后面有时间更新一下。 OkHttp最核心的工作是在 getResponseWithInterceptorChain() 中进行&#xff0c;在进入这个方法分析之前&#xff0c;我们先来了 解什么是责任链模式&…

基于Python的深度学习的身份证识别考勤系统,附源码

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)

原文&#xff1a;Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 附录 A&#xff1a;机器学习项目清单 此清单可以指导您完成机器学习项目。有八个主要步骤&#xff1a; 构建问题并全局看问题。 …

Java中Object类常用的12个方法

前言 Java 中的 Object 方法在面试中是一个非常高频的点&#xff0c;毕竟 Object 是所有类的“老祖宗”。Java 中所有的类都有一个共同的祖先 Object 类&#xff0c;子类都会继承所有 Object 类中的 public 方法。 先看下 Object 的类结构&#xff1a; 1. getClass 方法 pub…

Git快速入门+常用指令+提交规范

目录 Git创建本地仓库 IDEA集成Git Git和IDEA连接使用2 忽略文件 本地仓库常用命令 远程仓库常用命令 分支常用命令 标签操作 提交规范 Git创建本地仓库 1、创建一个文件夹&#xff0c;右键选择Git Bash Here 2、选择下列其中一个方法 方法一&#xff1a;创建初始化…

图片怎么快速转换格式?一个方法让你轻松转换

图片格式转换是在图像处理中不可缺少的一部分&#xff0c;不同的用途需要不同的图片格式。在特定的情况下&#xff0c;需要将一种图片格式转换成另一种图片格式。那么&#xff0c; 我们要怎么快速转换图片格式呢&#xff1f;通过使用图片格式转换器&#xff0c;无需下载软件轻松…

开普勒先行者vs特斯拉擎天柱,谁更胜一筹?

原创 | 文 BFT机器人 近日&#xff0c;中国的开普勒探索机器人公司推出其新产品——开普勒通用型转轮系列人形机器人。这系列机器人多才多艺、功能强大&#xff0c;集智能化与科技感于一身。 本文将为您介绍开普勒的功能和规格等&#xff0c;并将其与主要竞争对手特斯拉擎天柱…

C++ 动态规划 线性DP 最长共同子序列

给定两个长度分别为 N 和 M 的字符串 A 和 B &#xff0c;求既是 A 的子序列又是 B 的子序列的字符串长度最长是多少。 输入格式 第一行包含两个整数 N 和 M 。 第二行包含一个长度为 N 的字符串&#xff0c;表示字符串 A 。 第三行包含一个长度为 M 的字符串&#xff0c;表…

Matplotlib绘制炫酷散点图:从二维到三维,再到散点图矩阵的完整指南与实战【第58篇—python:Matplotlib绘制炫酷散点图】

文章目录 Matplotlib绘制炫酷散点图&#xff1a;二维、三维和散点图矩阵的参数说明与实战引言二维散点图三维散点图散点图矩阵二维散点图进阶&#xff1a;辅助线、注释和子图三维散点图进阶&#xff1a;动画效果和交互性散点图矩阵进阶&#xff1a;调整样式和添加密度图总结与展…

创建自己的Hexo博客

目录 一、Github新建仓库二、支持环境安装Git安装Node.js安装Hexo安装 三、博客本地运行本地hexo文件初始化本地启动Hexo服务 四、博客与Github绑定建立SSH密钥&#xff0c;并将公钥配置到github配置Hexo与Github的联系检查github链接访问hexo生成的博客 一、Github新建仓库 登…

Redis核心技术与实战【学习笔记】 - 21.Redis实现分布式锁

概述 在《20.Redis原子操作》我们提到了应对并发问题时&#xff0c;除了原子操作&#xff0c;还可以通过加锁的方式&#xff0c;来控制并发写操作对共享数据的修改&#xff0c;从而保证数据的正确性。 但是&#xff0c;Redis 属于分布式系统&#xff0c;当有多个客户端需要争…

vue3 之 组合式API—watch函数

watch函数 作用&#xff1a;侦听一个或者多个数据的变化&#xff0c;数据变化时执行回调函数 两个额外参数&#xff1a; 1.immediate&#xff08;立即执行&#xff09;2.deep&#xff08;深度侦听&#xff09; 场景&#xff1a;比如选择不同的内容请求后端不同数据时 如下图 …

[C++]:15.继承

继承 一.继承&#xff1a;1.继承的概念和基本操作&#xff1a;1.概念&#xff1a;2.基本操作&#xff1a; 2.继承格式和多种继承方法&#xff1a;1.基本继承格式&#xff1a;2.继承关系访问限定符 3.子类对象和父类对象之间的赋值&#xff1a;1.为什么存在赋值兼容转换&#xf…

基于Spring Boot的校友录管理系统

基于Spring Boot的校友录管理系统 1、绪论1.1 研究背景及意义1.2 研究内容 2、系统设计2.1 系统架构设计2.2 系统功能设计2.3 数据库设计2.3.1 系统实体类2.3.2 实体之间的联系 3、系统实现3.1 系统登录页3.2 系统首页3.3 校友信息实现3.3.1 校友批量上传 3.4 活动中心实现3.4.…

DS:经典算法OJ题(2)

创作不易&#xff0c;友友们给个三连吧&#xff01;&#xff01; 一、旋转数组&#xff08;力扣&#xff09; 经典算法OJ题&#xff1a;旋转数组 思路1&#xff1a;每次挪动1位&#xff0c;右旋k次 时间复杂度&#xff1a;o(N^2) 右旋最好情况&#xff1a;k是n的倍数…