Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外,
Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。
在某些情况下,您需要以编程方式将 Word DOCX 的内容导出到 JSON 文件。为此,本文提供了一个简单指南,说明如何在 Java 应用程序中将 DOCX 文档中的文本转换为 JSON 格式。您还将学习如何以编程方式将受保护的 DOCX 文档转换为 JSON。因此,让我们继续在 Java 中将 DOCX 转换为 JSON。
Aspose.Words 最新下载(qun:761297826)https://www.evget.com/product/564
如何在 Java 中将 DOCX 转换为 JSON
要将 DOCX 文档转换为 JSON 格式,我们需要执行以下步骤:
- 加载 DOCX 文档。
- 将其转换为 HTML 格式。
- 以 JSON 格式保存 HTML 文件。
让我们看看如何在 Java 中以编程方式执行这些步骤。为此,您需要安装下一节中提到的两个库。
将 DOCX 转换为 JSON 的 Java 库 - 免费下载
Aspose.Words for Java是一个强大的库,允许您创建和处理 MS Word 文档。我们将使用这个库将 DOCX 文件的内容导出为 HTML。然后,我们将使用Aspose.Cells for Java将 HTML 内容保存为 JSON 文件。您可以下载这两个库的 JAR 或使用 Maven 配置安装它们。
通过 Maven 安装
<dependencies> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-words</artifactId> <version>22.7</version> <classifier>jdk17</classifier> </dependency> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-cells</artifactId> <version>22.7</version> </dependency> </dependencies> <repositories> <repository> <id>AsposeJavaAPI</id> <name>Aspose Java API</name> <url>https://repository.aspose.com/repo/</url> </repository> </repositories>
在 Java 中将 DOCX 转换为 JSON
以下是在 Java 中将 DOCX 转换为 JSON 的步骤。
- 使用com.aspose.words.Document类加载 DOCX 文档。
- 使用Document.Save()方法将 DOCX 文档保存为 HTML 。
- 使用com.aspose.cells.Workbook类加载 HTML 文件。
- 使用Workbook.Save()方法将文档转换为 JSON 格式。
以下代码示例展示了如何将 DOCX 文档转换为 Java 中的 JSON。
// Load Word document using Aspose.Words Document doc = new Document("sample1.docx"); // Save as HTML doc.save("html_output.html", SaveFormat.HTML); // Load the saved HTML file using Aspose.Cells com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html"); // Save HTML as JSON book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
Java 将受保护的 DOCX 转换为 JSON
您还可以使用密码加载受保护的 DOCX 文档并将其转换为 JSON 格式。以下是将受保护的 DOCX 文档转换为 Java 中的 JSON 的步骤。
- 使用com.aspose.words.Document类加载 DOCX 文档。
- 使用com.aspose.words.LoadOptions类指定 DOCX 文档的密码。
- 使用Document.Save()方法将 DOCX 文档保存为 HTML 。
- 使用com.aspose.cells.Workbook类加载 HTML 文件。
- 使用Workbook.Save()方法将文档转换为 JSON 格式。
以下代码示例展示了如何将受保护的 DOCX 文档转换为 Java 中的 JSON。
// Load Word document using Aspose.Words Document doc = new Document("sample1.docx", new com.aspose.words.LoadOptions("MyPassword")); // Save as HTML doc.save("html_output.html", SaveFormat.HTML); // Load the saved HTML file using Aspose.Cells com.aspose.cells.Workbook book = new com.aspose.cells.Workbook("html_output.html"); // Save HTML as JSON book.save("word-to-json.json", com.aspose.cells.SaveFormat.JSON);
结论
在本文中,您学习了如何在 Java 中将 DOCX 转换为 JSON。此外,您还了解了如何以编程方式将受密码保护的 DOCX 文档转换为 JSON。此外,您可以访问Aspose.Words for Java和Aspose.Cells for Java的文档以探索其他功能。