为了将 Word 文档的内容嵌入到您的应用程序中,您可能需要执行转换。在这种情况下,最广泛选择的转换是 Word 到HTML或 Word 到图像。,Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。
本文介绍了如何使用 Java 将 Word DOCX或DOC文件转换为 HTML。此外,我们将讨论如何将资源文件保存在单独的文件夹中。
Aspose.Words 最新下载(qun:761297826)https://www.evget.com/product/564
用于 Word 到 HTML 转换的 Java API
对于 DOCX/DOC 到 HTML 的转换,我们将使用Aspose.Words for Java。它是一个强大的 API,用于在 Java 应用程序中实现文字处理功能。此外,API 提供了将 Word 文档高保真地转换为 HTML 和其他格式的功能。您可以下载API 或从Maven安装它。
<repository> <id>AsposeJavaAPI</id> <name>Aspose Java API</name> <url>https://repository.aspose.com/repo/</url> </repository> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-words</artifactId> <version>21.10</version> <type>pom</type> </dependency>
在 Java 中将 Word 文档转换为 HTML
要将 Word 文档转换为 HTML,您只需加载文档并将其保存为 HTML 文件。以下是使用 Java 将 Word DOCX 文件转换为 HTML 的步骤。
- 使用Document类加载 Word 文档。
- 使用Document.save(string, SaveFormat)方法将 Word 文档转换为 HTML 。
在 Word 到 HTML 转换中指定资源文件夹
您还可以配置 API 以将资源文件保存在单独的文件夹中。此外,您可以将字体和图像分别保存在不同的文件夹中。以下是指定资源文件夹的步骤。
- 使用Document类加载 Word 文档。
- 创建HtmlSaveOptions类的对象。
- 使用HtmlSaveOptions.setResourceFolder方法设置资源文件夹。
- 使用Document.save(string, HtmlSaveOptions)方法将 Word 文档转换为 HTML 。
结论
在本文中,您学习了如何使用 Java 以编程方式将 Word DOCX 或 DOC 文件转换为 HTML。除此之外,您还了解了如何在 Word 到 HTML 的转换中单独存储资源文件。此外,您可以使用文档了解更多关于 Aspose.Words for Java 的信息。