Java读取损坏的xls表格
- 1. 损坏的文件
- 1.1 正常的xls文件用360解压后是这样↓
- 1.2 被损坏的xls文件用360解压后是这样↓
- 2. Java代码读取Excel文件分析
- 2.1 使用EasyExcel读取损坏的xls文件报错
- 2.2 使用POI读取损坏的xls文件报错
- 3. 损坏文件修复方案
- 4. 代码
由于不可抗原因在网站上下载下来xls文件被损坏了
1. 损坏的文件
1.1 正常的xls文件用360解压后是这样↓
1.2 被损坏的xls文件用360解压后是这样↓
2. Java代码读取Excel文件分析
Java 代码无论是使用EasyExcel,还是POI底层原理都是先把文件转为流
2.1 使用EasyExcel读取损坏的xls文件报错
Exception in thread "main" com.alibaba.excel.exception.ExcelAnalysisException: org.apache.poi.poifs.filesystem.NotOLE2FileException: Invalid header signature; read 0x0010000000080809, expected 0xE11AB1A1E011CFD0 - Your file appears not to be a valid OLE2 document
at com.alibaba.excel.analysis.ExcelAnalyserImpl.<init>(ExcelAnalyserImpl.java:61)
at com.alibaba.excel.ExcelReader.<init>(ExcelReader.java:30)
at com.alibaba.excel.read.builder.ExcelReaderBuilder.build(ExcelReaderBuilder.java:214)
at com.alibaba.excel.read.builder.ExcelReaderBuilder.sheet(ExcelReaderBuilder.java:251)
at com.alibaba.excel.read.builder.ExcelReaderBuilder.sheet(ExcelReaderBuilder.java:243)
at com.atomcloud.extservice.service.controller.TestController.main(TestController.java:62)
代码解释
该函数是一个构造函数,用于初始化一个POIFSFileSystem对象。它通过FileChannel和File对象来创建一个POIFSFileSystem对象,并且支持只读和错误时关闭通道的选项。以下是该构造函数的主要功能:
1.调用父类的构造函数进行初始化。
2.检查源文件的长度,如果长度为0,则抛出EmptyFileException异常。
3.根据源文件和只读标志创建FileBackedDataSource对象,并获取其通道。
4.如果源文件为空,则直接使用给定的FileChannel和只读标志创建FileBackedDataSource对象。
5.分配一个512字节的ByteBuffer对象,用于读取文件系统的头部信息。
6.从通道中读取完整的头部信息到ByteBuffer对象中。
7.创建HeaderBlock对象来解析头部信息。
8.调用readCoreContents方法读取文件系统的核心内容。
9.如果在读取过程中发生RuntimeException或IOException,则捕获异常。
10.如果设置了在错误时关闭通道,并且通道不为空,则关闭通道。
11.抛出捕获的异常。
注意:该构造函数只能通过FileChannel和File对象来创建POIFSFileSystem对象,并且支持只读和错误时关闭通道的选项。
2.2 使用POI读取损坏的xls文件报错
org.apache.poi.poifs.filesystem.NotOLE2FileException: Invalid header signature; read 0x0010000000080809, expected 0xE11AB1A1E011CFD0 - Your file appears not to be a valid OLE2 document
at org.apache.poi.poifs.storage.HeaderBlock.<init>(HeaderBlock.java:151)
at org.apache.poi.poifs.storage.HeaderBlock.<init>(HeaderBlock.java:117)
at org.apache.poi.poifs.filesystem.POIFSFileSystem.<init>(POIFSFileSystem.java:285)
at com.atomcloud.common.excel.handler.Excel2003Reader.process(Excel2003Reader.java:201)
at com.atomcloud.common.utils.ExcelUtil.readLargeExcelFiles(ExcelUtil.java:92)
at com.atomcloud.common.utils.ExcelUtil.readLargeExcelFile(ExcelUtil.java:66)
at com.atomcloud.common.utils.ExcelUtil.readLargeExcelFile(ExcelUtil.java:58)
at com.atomcloud.extservice.service.controller.TestController.main(TestController.java:65)
代码解释
该函数的作用是将输入流InputStream转换为POIFS文件系统对象。它主要执行以下操作:
1.初始化ReadableByteChannel通道和ByteBuffer缓冲区,用于读取输入流数据。
2.读取并解析文件头,创建HeaderBlock对象,并检查块计数的合理性。
3.计算最大文件大小,并抛出异常如果文件大小超过2GB。
4.分配足够的缓冲区读取整个文件内容。
5.从输入流读取数据到缓冲区,并使用ByteArrayBackedDataSource创建数据源。
6.关闭通道并在成功读取数据后关闭输入流。
7.最后,读取核心内容完成初始化。
这个函数处理了大量文件读取过程中的细节,确保能够安全有效地从输入流中读取文件数据。
3. 损坏文件修复方案
- 方案一:调用API修复文件,找了半天没找到(暂时放弃)
- 方案二:损坏的文件用wps打开能正常打开,wps既然能打开那他肯定有自己兼容功能,先用wps打开,保存,再看一下文件奇怪的恢复正常了,所以我们的解决方案就是搞个客户端,使用wps打开文件,保存文件,关闭wps,经典的大象放冰箱三步骤。
方案二进一步解读:三步骤看似简单想通过简单的命令实现并不简单,Java中提供了Runtime.getRuntime().exec(“命令”),执行外部命令或程序,打开,保存,关闭,3个命令放在一起执行没有达到想要的结果,分开三次执行exec命令也没达到效果。最终想了想还是分而治之各自采用不同的方案:
- 打开使用exec执行命令;
- 保存调用Robot 对象默认点击键盘快捷键Ctrl+S;
- 关闭使用taskkill是用来终止进程;
一些看似不太聪明的方案成功解决了问题!!!
4. 代码
/**
* 修复思想 使用windows自带工具 wps或者office
* 1.使用命令让input.xls文件用wps打开
* 2.操作保存
* 3.退出wps
*
* @param args
*/
public static void main(String[] args) {
try {
// 设置要修复的 XLS 文件路径
String inputFilePath = "C:\\Users\\84869\\Desktop\\20240731092917.xls";
Runtime runtime = Runtime.getRuntime();
String openCommand = "\"D:\\Program Files (x86)\\WPS\\WPS Office\\ksolaunch.exe\" \"" + inputFilePath + "\"";
Process openProcess = runtime.exec(openCommand);
int openExitCode = openProcess.waitFor();
Thread.sleep(3000);
try {
// 创建 Robot 对象
Robot robot = new Robot();
// 按下 Ctrl+S 键
robot.keyPress(KeyEvent.VK_CONTROL);
robot.keyPress(KeyEvent.VK_S);
robot.keyRelease(KeyEvent.VK_S);
robot.keyRelease(KeyEvent.VK_CONTROL);
// 延迟 1 秒,模拟用户操作
Thread.sleep(1000);
} catch (AWTException | InterruptedException e) {
log.info("erwaesr:", e);
}
String cmd = "taskkill /f /t /im wps.exe";
Process close = runtime.exec(cmd);
int closeExitCode = close.waitFor();
System.out.println("Excel file saved successfully.");
File file = new File("C:\\Users\\84869\\Desktop\\20240731092917.xls");
FileInputStream fileInputStream = new FileInputStream(file);
List<JSONObject> excelJsonArray = ExcelUtil.readLargeExcelFile(file.getName(), fileInputStream, null, -1, -1);
System.out.println();
} catch (Exception e) {
log.info("exception :", e);
}
}