Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务。API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word。此外,
Aspose API支持流行文件格式处理,并允许将各类文档导出或转换为固定布局文件格式和最常用的图像/多媒体格式。
图像通常用于表示 Word DOC 文档中的重要信息。在文本旁边包含图像使内容更具吸引力。在某些情况下,您可能需要以编程方式提取 DOC 文档中嵌入的图像。为此,本文介绍了如何从 Java 中的 DOC 中提取图像。
Aspose.Words 最新下载(qun:761297826)https://www.evget.com/product/564
Java API 从 DOC 文件中提取图像
Aspose.Words for Java是一个功能强大且功能丰富的 API,用于创建、操作和转换 MS Word 文档。因此,我们将使用此 API 从 DOC 文档中提取图像。您可以使用以下 Maven 配置下载API 的 JAR 或将其安装到您的 Java 应用程序中。
<repository> <id>AsposeJavaAPI</id> <name>Aspose Java API</name> <url>https://repository.aspose.com/repo/</url> </repository> <dependency> <groupId>com.aspose</groupId> <artifactId>aspose-words</artifactId> <version>21.11</version> <type>pom</type> </dependency>
如何在 Java 中从 DOC 中提取图像
-
DOC 文档中的图像使用形状对象表示。因此,要检索图像,您必须处理文档中的每个形状。以下是从 Java 中的 DOC 文件中提取图像的步骤。
- 首先,使用Document类加载 DOC 文件。
- 然后,使用Document.getChildNodes(NodeType.SHAPE, Boolean)方法将所有形状放入NodeCollection对象中。
- 循环遍历检索到的形状。
- 在每次迭代中,使用Shape.hasImage()方法检查形状是否有图像。
- 最后,提取图像并使用Shape.getImageData().save(string)方法保存。
以下代码示例展示了如何从 Java 中的 DOC 文档中提取图像。
// Load Word document Document doc = new Document("Document.docx"); // Get all the shapes NodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true); int imageIndex = 0; // Loop through the shape collection for (Shape shape : shapes) { // Check if shape has image if (shape.hasImage()) { // Extract and save the image String imageFileName = String.format( "Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType())); shape.getImageData().save(dataDir + imageFileName); imageIndex++; } }
结论
在本文中,您学习了如何在 Java 中从 DOC 文档中提取图像。此外,代码示例还展示了如何从 DOC 文件中提取图像并将其保存到所需位置。此外,Aspose.Words for Java 提供了广泛的文档操作功能。