【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

news2024/9/21 2:49:09

同为牛马,点个赞吧!

一、Excel文件样例

image-20240716153916656

二、工具类源码

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.ss.util.CellRangeAddress;
import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory;
import org.springframework.web.multipart.MultipartFile;

import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * 读取Excel并解析合并单元格,将结果转为Map集合
 */
public class ReadMergeCellExcelUtil {

    /**
     * 读取Excel数据
     *
     * @param file 上传的Excel文件
     * @return 解析后的数据列表
     */
    public static List<Map<String, String>> readExcelToObj(MultipartFile file) {
        List<Map<String, String>> result = new ArrayList<>();
        try (InputStream inputStream = file.getInputStream()) {
            Workbook workbook = XSSFWorkbookFactory.create(inputStream);
            result = readExcel(workbook, 0, 0, 0);
        } catch (IOException e) {
            e.printStackTrace();
        }
        return result;
    }

    /**
     * 读取Excel文件
     *
     * @param workbook      工作簿
     * @param sheetIndex    sheet页下标:从0开始
     * @param startReadLine 开始读取的行:从0开始
     * @param tailLine      去除最后读取的行
     * @return 解析后的数据列表
     */
    private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {
        Sheet sheet = workbook.getSheetAt(sheetIndex);
        FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();
        List<Map<String, String>> result = new ArrayList<>();
        for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {
            Row row = sheet.getRow(i);
            Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);
            result.add(rowData);
        }
        return result;
    }

    /**
     * 解析一行数据
     *
     * @param sheet           工作表
     * @param row             行对象
     * @param formulaEvaluator 公式评估器
     * @return 解析后的行数据
     */
    private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {
        Map<String, String> rowData = new HashMap<>();
        if (row != null) {
            int cellIndex = 0;
            for (Cell cell : row) {
                String cellValue = getCellValue(sheet, cell, formulaEvaluator);
                rowData.put("field" + cellIndex, cellValue);
                cellIndex++;
            }
        }
        return rowData;
    }

    /**
     * 获取单元格的值
     *
     * @param sheet           工作表
     * @param cell            单元格
     * @param formulaEvaluator 公式评估器
     * @return 单元格值
     */
    private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {
        if (cell == null) return "";
        return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())
                ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)
                : getCellStringValue(cell, formulaEvaluator);
    }

    /**
     * 获取合并单元格的值
     *
     * @param sheet           工作表
     * @param row             行号
     * @param column          列号
     * @param formulaEvaluator 公式评估器
     * @return 合并单元格值
     */
    private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {
        for (CellRangeAddress range : sheet.getMergedRegions()) {
            if (range.isInRange(row, column)) {
                Row firstRow = sheet.getRow(range.getFirstRow());
                Cell firstCell = firstRow.getCell(range.getFirstColumn());
                return getCellStringValue(firstCell, formulaEvaluator);
            }
        }
        return "";
    }

    /**
     * 判断单元格是否是合并单元格
     *
     * @param sheet  工作表
     * @param row    行下标
     * @param column 列下标
     * @return 是否是合并单元格
     */
    private static boolean isMergedRegion(Sheet sheet, int row, int column) {
        for (CellRangeAddress range : sheet.getMergedRegions()) {
            if (range.isInRange(row, column)) {
                return true;
            }
        }
        return false;
    }

    /**
     * 获取单元格的字符串值
     *
     * @param cell            单元格
     * @param formulaEvaluator 公式评估器
     * @return 单元格字符串值
     */
    private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {
        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return formulaEvaluator.evaluate(cell).formatAsString();
            case NUMERIC:
                return String.valueOf(cell.getNumericCellValue());
            default:
                return "";
        }
    }

}

三、解析结果

image-20240716154343627

以下内容基本为废话,大可直接忽略!

四、工具类详解及使用方法

在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为ReadMergeCellExcelUtil的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。


准备工作

在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。

Maven依赖:

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.0.0</version>
</dependency>

工具功能概述

ReadMergeCellExcelUtil工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。


代码详细解读
1. 读取Excel数据

方法:readExcelToObj

该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {
    List<Map<String, String>> result = new ArrayList<>();
    try (InputStream inputStream = file.getInputStream()) {
        Workbook workbook = XSSFWorkbookFactory.create(inputStream);
        result = readExcel(workbook, 0, 0, 0);
    } catch (IOException e) {
        e.printStackTrace();
    }
    return result;
}

使用try-with-resources确保输入流在使用后正确关闭。

2. 解析Excel文件

方法:readExcel

该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {
    Sheet sheet = workbook.getSheetAt(sheetIndex);
    FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();
    List<Map<String, String>> result = new ArrayList<>();
    for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {
        Row row = sheet.getRow(i);
        Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);
        result.add(rowData);
    }
    return result;
}
3. 解析一行数据

方法:parseRow

该方法遍历行中的单元格,并将其值存储到Map中。

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {
    Map<String, String> rowData = new HashMap<>();
    if (row != null) {
        int cellIndex = 0;
        for (Cell cell : row) {
            String cellValue = getCellValue(sheet, cell, formulaEvaluator);
            rowData.put("field" + cellIndex, cellValue);
            cellIndex++;
        }
    }
    return rowData;
}
4. 获取单元格值

方法:getCellValue

该方法根据单元格类型获取其值,并处理合并单元格。

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {
    if (cell == null) return "";
    return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())
            ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)
            : getCellStringValue(cell, formulaEvaluator);
}
5. 获取合并单元格值

方法:getMergedRegionValue

该方法查找并获取合并单元格的值。

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {
    for (CellRangeAddress range : sheet.getMergedRegions()) {
        if (range.isInRange(row, column)) {
            Row firstRow = sheet.getRow(range.getFirstRow());
            Cell firstCell = firstRow.getCell(range.getFirstColumn());
            return getCellStringValue(firstCell, formulaEvaluator);
        }
    }
    return "";
}
6. 判断单元格是否是合并单元格

方法:isMergedRegion

该方法检查指定单元格是否属于合并区域。

private static boolean isMergedRegion(Sheet sheet, int row, int column) {
    for (CellRangeAddress range : sheet.getMergedRegions()) {
        if (range.isInRange(row, column)) {
            return true;
        }
    }
    return false;
}
7. 获取单元格的字符串值

方法:getCellStringValue

该方法根据单元格类型获取字符串值,并评估公式单元格。

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {
    switch (cell.getCellType()) {
        case STRING:
            return cell.getStringCellValue();
        case BOOLEAN:
            return String.valueOf(cell.getBooleanCellValue());
        case FORMULA:
            return formulaEvaluator.evaluate(cell).formatAsString();
        case NUMERIC:
            return String.valueOf(cell.getNumericCellValue());
        default:
            return "";
    }
}

示例代码

以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil工具读取并解析Excel文件:

import org.springframework.web.multipart.MultipartFile;
import java.util.List;
import java.util.Map;

public class ExcelParserExample {

    public static void main(String[] args) {
        // 假设有一个MultipartFile类型的Excel文件对象file
        MultipartFile file = ...;

        // 使用工具类解析Excel文件
        List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file);

        // 打印解析结果
        for (Map<String, String> rowData : parsedData) {
            System.out.println(rowData);
        }
    }
}

运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。


常见问题与解决方案
  1. 空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。
  2. 大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。

结论

ReadMergeCellExcelUtil工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。

Over!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1930801.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【B树、B-树、B+、B*树】

目录 一、B-树&#xff08;即B树&#xff09;的定义及操作1.1、定义1.2、操作1.2.1、查找1.2.2、插入1.2.3、删除 二、B树的定义及操作2.1、定义2.2、操作2.2.1、查找2.2.2、插入2.2.3、删除 三、B*树 一、B-树&#xff08;即B树&#xff09;的定义及操作 1.1、定义 B-tree即…

解决vue3中el-input在form表单按下回车刷新页面

问题&#xff1a;在input框中点击回车之后不是调用我写的回车事件&#xff0c;而是刷新页面 原因&#xff1a; 如果表单中只有一个input 框则按下回车会直接关闭表单 所以导致刷新页面 解决方法 &#xff1a; 再写一个input 表单 &#xff0c;并设置style"display:none&…

【对顶堆 优先队列】2102. 序列顺序查询

本文涉及知识点 对顶堆 优先队列 LeetCode 2102. 序列顺序查询 一个观光景点由它的名字 name 和景点评分 score 组成&#xff0c;其中 name 是所有观光景点中 唯一 的字符串&#xff0c;score 是一个整数。景点按照最好到最坏排序。景点评分 越高 &#xff0c;这个景点越好。…

再谈有关JVM中的四种引用

1.强引用 强引用就是我们平时使用最多的那种引用&#xff0c;就比如以下的代码 //创建一个对象 Object obj new Object();//强引用 这个例子就是创建了一个对象并建立了强引用&#xff0c;强引用一般就是默认支持的当内存不足的时候&#xff0c;JVM开始垃圾回收&#xff0c…

【Java--数据结构】二叉树oj题(上)

前言 欢迎关注个人主页&#xff1a;逸狼 创造不易&#xff0c;可以点点赞吗~ 如有错误&#xff0c;欢迎指出~ 判断是否是相同的树 oj链接 要判断树是否一样&#xff0c;要满足3个条件 根的 结构 和 值 一样左子树的结构和值一样右子树的结构和值一样 所以就可以总结以下思路…

js补环境系列之剖析:原型、原型对象、实例对象三者互相转化(不讲废话、全是干货)

【作者主页】&#xff1a;小鱼神1024 【擅长领域】&#xff1a;JS逆向、小程序逆向、AST还原、验证码突防、Python开发、浏览器插件开发、React前端开发、NestJS后端开发等等 思考下&#xff1a;js补环境中&#xff0c;什么场景会用到原型、原型对象、实例对象&#xff1f; 举…

最大文件句柄数

优质博文&#xff1a;IT-BLOG-CN 灵感来源 一、什么是文件句柄 文件句柄File Handle是操作系统中用于访问文件的一种数据结构&#xff0c;通常是一个整数或指针。文件句柄用于标识打开的文件&#xff0c;每个打开的文件都有一个唯一的文件句柄。 它们是对文件、网络套接字或…

商业数据分析思维的培训PTT制作大纲分享

商业数据分析思维的培训PTT制作大纲: 基本步骤: 明确PPT的目的和主题 收集并整理相关内容资料 构思并确定PPT的框架大纲 编写PPT的内容文字 插入图片、图表等视觉元素 设计PPT的版式和模板 排练并修改PPT 输出并备份最终版本 目的:数据思维培养; 主题:商业数据分…

【TensorRT】Yolov5-DeepSORT 目标跟踪

Yolov5-DeepSORT-TensorRT 本项目是 Yolo-DeepSORT 的 C 实现&#xff0c;使用 TensorRT 进行推理 &#x1f680;&#x1f680;&#x1f680; 开源地址&#xff1a;Yolov5_DeepSORT_TensorRT&#xff0c;求 star⭐ ~ 引言 ⚡ 推理速度可达25-30FPS&#xff0c;可以落地部署&…

PriorityQueue 阅读记录

1、前言 1、优先队列&#xff0c;底层通过数组来构造树&#xff08;二叉树) 来实现的。 2、默认是最小堆&#xff08;取出来的是最小值)&#xff0c;可以通过传入一个比较器 comparator 来构造一个最大堆。 3、传入的参数不能为空&#xff0c;否则抛出NPE问题。 4、最大堆的…

git自动pull同步远程若干分支与本地若干分支

git自动pull同步远程若干分支与本地若干分支 假设远程代码仓库有100个分支&#xff0c;而本地只有10个本地分支与远程分支一一对应&#xff0c;现在要保持本地的这个10个分支与远程一致&#xff0c;最笨的方法是checkout到每个分支&#xff0c;然后一个一个的 git pull origin…

第11章 规划过程组(四)(11.4规划质量管理)

第11章 规划过程组&#xff08;四&#xff09;11.4规划质量管理&#xff0c;在第三版教材第412~414页&#xff1b; 文字图片音频方式 第一个知识点&#xff1a;工具与技术 1、数据分析&#xff08;重要知识点&#xff09; 成本效益分析 确定质量活动的可能成本与预期效益&a…

HTML2048小游戏

源代码在效果图后面 效果图 源代码 <!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>2048 Game&l…

Qt Creator的好用的功能

&#xff08;1&#xff09;ctrlf&#xff1a; 在当前文档进行查询操作 &#xff08;2&#xff09;f3: 找到后&#xff0c;按f3&#xff0c;查找下一个 &#xff08;3&#xff09;shiftf3: 查找上一个 右键菜单&#xff1a; (4)f4&#xff1a;在…

【海外云手机】静态住宅IP集成解决方案

航海大背景下&#xff0c;企业和个人用户对于网络隐私、稳定性以及跨国业务的需求日益增加。静态住宅IP与海外云手机的结合&#xff0c;提供了一种创新的集成解决方案&#xff0c;能够有效应对这些需求。 本篇文章分为三个部分&#xff1b;静态住宅优势、云手机优势、集成解决…

FPGA资源容量

Kintex™ 7 https://www.amd.com/zh-tw/products/adaptive-socs-and-fpgas/fpga/kintex-7.html#product-table AMD Zynq™ 7000 SoC https://www.amd.com/en/products/adaptive-socs-and-fpgas/soc/zynq-7000.html#product-table AMD Zynq™ UltraScale™ RFSoC 第一代 AMD Z…

对象存储解决方案:高性能分布式对象存储系统MinIO

文章目录 引言I 自动化数据管理界面1.1 图形用户界面:GUI1.2 命令行界面:MinIO CLI1.3 应用程序编程接口:MinIO APIII 部署集成2.1 静态端口分配2.2 将NGINX用作反向代理,配置负载。III 基础概念3.1 为什么是对象存储?3.2 MinIO支持哪些系统拓扑结构?3.3 时间同步3.4 存储…

react学习——28react-redux实现多组件共享数据(精简版)

1、目录结构 2、containers/Count/index.js import {createIncrementAction, createDecrementAction, createIncrementAsyncAction} from ../../redux/action/count //引入conect用于链接UI组件与redux import {connect} from react-redux import React, {Component} from &qu…

UML面向对象分析与设计

UML不是OOA/D&#xff0c;也不是方法&#xff0c;它仅仅只是一种图形表示法如果不掌握对象思想&#xff0c;那么UML或任何case工具(如ROSE)将毫无意义 我们需要一种用于〇OA/D的语言&#xff0c;这既是一种思考的工具&#xff0c;也是一种沟通的形式。因此&#xff0c;我们将在…

Python | Leetcode Python题解之第240题搜索二维矩阵II

题目&#xff1a; 题解&#xff1a; class Solution:def searchMatrix(self, matrix: List[List[int]], target: int) -> bool:m, n len(matrix), len(matrix[0])x, y 0, n - 1while x < m and y > 0:if matrix[x][y] target:return Trueif matrix[x][y] > tar…