使用Python将Word文档转换为PNG图片

news2024/12/25 9:06:33

在这篇博客中,我将介绍一个使用Python编写的小工具,它能够将指定文件夹中的所有Word文档(.doc和.docx格式)转换为PNG图片。这个工具基于wxPython库构建图形用户界面,并结合了win32com和PyMuPDF库实现文档格式的转换。接下来,我将详细说明这个工具的功能及其实现。
D:\spiderdocs\wordtoscreenshot.py

全部代码

import os
import wx
from win32com import client as wc
import pythoncom
import sys
import traceback
import tempfile
import fitz  # PyMuPDF

def convert_word_to_pdf(word_path, pdf_path):
    pythoncom.CoInitialize()
    word = None
    doc = None
    try:
        word = wc.Dispatch("Word.Application")
        word.Visible = False
        doc = word.Documents.Open(word_path)
        doc.ExportAsFixedFormat(pdf_path, 17)  # 17 is wdExportFormatPDF
        print(f"Successfully exported {word_path} to {pdf_path}")
    except Exception as e:
        print(f"Error in convert_word_to_pdf: {str(e)}")
        print("Traceback:")
        traceback.print_exc()
        raise
    finally:
        if doc:
            doc.Close(SaveChanges=False)
        if word:
            word.Quit()
        pythoncom.CoUninitialize()

def convert_pdf_to_png(pdf_path, png_path):
    try:
        doc = fitz.open(pdf_path)
        page = doc.load_page(0)  # Load the first page
        pix = page.get_pixmap()
        pix.save(png_path)
        doc.close()
        print(f"Successfully converted {pdf_path} to {png_path}")
    except Exception as e:
        print(f"Error in convert_pdf_to_png: {str(e)}")
        print("Traceback:")
        traceback.print_exc()
        raise

class MyFrame(wx.Frame):
    def __init__(self):
        super().__init__(parent=None, title='Word to PNG Converter')
        panel = wx.Panel(self)
        
        self.folder_path = wx.TextCtrl(panel, pos=(5, 5), size=(350, 25))
        browse_button = wx.Button(panel, label='Browse', pos=(360, 5), size=(70, 25))
        browse_button.Bind(wx.EVT_BUTTON, self.on_browse)
        
        convert_button = wx.Button(panel, label='Convert', pos=(5, 35), size=(425, 25))
        convert_button.Bind(wx.EVT_BUTTON, self.on_convert)
        
        self.SetSize((450, 100))
        self.Show()

    def on_browse(self, event):
        dlg = wx.DirDialog(self, "Choose a directory:", style=wx.DD_DEFAULT_STYLE)
        if dlg.ShowModal() == wx.ID_OK:
            self.folder_path.SetValue(dlg.GetPath())
        dlg.Destroy()

    def on_convert(self, event):
        folder = self.folder_path.GetValue()
        if not folder:
            wx.MessageBox('Please select a folder first', 'Error', wx.OK | wx.ICON_ERROR)
            return
        
        log = []
        for filename in os.listdir(folder):
            if filename.endswith('.doc') or filename.endswith('.docx'):
                word_path = os.path.join(folder, filename)
                png_path = os.path.splitext(word_path)[0] + '.png'
                try:
                    with tempfile.NamedTemporaryFile(suffix='.pdf', delete=False) as tmp_pdf:
                        pdf_path = tmp_pdf.name
                    
                    convert_word_to_pdf(word_path, pdf_path)
                    convert_pdf_to_png(pdf_path, png_path)
                    
                    os.unlink(pdf_path)  # Remove the temporary PDF file
                    log.append(f'Converted {filename} to PNG')
                except Exception as e:
                    log.append(f'Error converting {filename}: {str(e)}')
        
        log_str = '\n'.join(log)
        with open('conversion_log.txt', 'w') as f:
            f.write(log_str)
        
        wx.MessageBox('Conversion completed. Check conversion_log.txt for details.', 'Info', wx.OK | wx.ICON_INFORMATION)

if __name__ == '__main__':
    app = wx.App()
    frame = MyFrame()
    app.MainLoop()

功能概述

这个工具的主要功能包括:

  1. 选择文件夹:用户可以通过GUI界面选择包含Word文档的文件夹。
  2. 转换文档:将选择的文件夹中的所有Word文档转换为PNG图片,并记录转换日志。
  3. 显示消息:在转换完成后,显示一个消息框提示用户检查转换日志。

代码实现

导入必要的库

首先,我们需要导入一些必要的Python库:

import os
import wx
from win32com import client as wc
import pythoncom
import sys
import traceback
import tempfile
import fitz  # PyMuPDF

Word到PDF的转换函数

使用win32com库中的Word应用程序接口,我们可以将Word文档转换为PDF格式:

def convert_word_to_pdf(word_path, pdf_path):
    pythoncom.CoInitialize()
    word = None
    doc = None
    try:
        word = wc.Dispatch("Word.Application")
        word.Visible = False
        doc = word.Documents.Open(word_path)
        doc.ExportAsFixedFormat(pdf_path, 17)  # 17 is wdExportFormatPDF
        print(f"Successfully exported {word_path} to {pdf_path}")
    except Exception as e:
        print(f"Error in convert_word_to_pdf: {str(e)}")
        print("Traceback:")
        traceback.print_exc()
        raise
    finally:
        if doc:
            doc.Close(SaveChanges=False)
        if word:
            word.Quit()
        pythoncom.CoUninitialize()

PDF到PNG的转换函数

接着,我们使用PyMuPDF库将PDF文件转换为PNG图片:

def convert_pdf_to_png(pdf_path, png_path):
    try:
        doc = fitz.open(pdf_path)
        page = doc.load_page(0)  # Load the first page
        pix = page.get_pixmap()
        pix.save(png_path)
        doc.close()
        print(f"Successfully converted {pdf_path} to {png_path}")
    except Exception as e:
        print(f"Error in convert_pdf_to_png: {str(e)}")
        print("Traceback:")
        traceback.print_exc()
        raise

图形用户界面(GUI)

我们使用wxPython库创建一个简单的GUI,允许用户选择文件夹并启动转换:

class MyFrame(wx.Frame):
    def __init__(self):
        super().__init__(parent=None, title='Word to PNG Converter')
        panel = wx.Panel(self)
        
        self.folder_path = wx.TextCtrl(panel, pos=(5, 5), size=(350, 25))
        browse_button = wx.Button(panel, label='Browse', pos=(360, 5), size=(70, 25))
        browse_button.Bind(wx.EVT_BUTTON, self.on_browse)
        
        convert_button = wx.Button(panel, label='Convert', pos=(5, 35), size=(425, 25))
        convert_button.Bind(wx.EVT_BUTTON, self.on_convert)
        
        self.SetSize((450, 100))
        self.Show()

    def on_browse(self, event):
        dlg = wx.DirDialog(self, "Choose a directory:", style=wx.DD_DEFAULT_STYLE)
        if dlg.ShowModal() == wx.ID_OK:
            self.folder_path.SetValue(dlg.GetPath())
        dlg.Destroy()

    def on_convert(self, event):
        folder = self.folder_path.GetValue()
        if not folder:
            wx.MessageBox('Please select a folder first', 'Error', wx.OK | wx.ICON_ERROR)
            return
        
        log = []
        for filename in os.listdir(folder):
            if filename.endswith('.doc') or filename.endswith('.docx'):
                word_path = os.path.join(folder, filename)
                png_path = os.path.splitext(word_path)[0] + '.png'
                try:
                    with tempfile.NamedTemporaryFile(suffix='.pdf', delete=False) as tmp_pdf:
                        pdf_path = tmp_pdf.name
                    
                    convert_word_to_pdf(word_path, pdf_path)
                    convert_pdf_to_png(pdf_path, png_path)
                    
                    os.unlink(pdf_path)  # Remove the temporary PDF file
                    log.append(f'Converted {filename} to PNG')
                except Exception as e:
                    log.append(f'Error converting {filename}: {str(e)}')
        
        log_str = '\n'.join(log)
        with open('conversion_log.txt', 'w') as f:
            f.write(log_str)
        
        wx.MessageBox('Conversion completed. Check conversion_log.txt for details.', 'Info', wx.OK | wx.ICON_INFORMATION)

if __name__ == '__main__':
    app = wx.App()
    frame = MyFrame()
    app.MainLoop()

代码解析

  1. 导入库:我们导入了os、wx、win32com、pythoncom、sys、traceback、tempfile和fitz库。这些库分别用于文件操作、创建GUI、与Word应用程序交互、处理异常、创建临时文件以及处理PDF文件。

  2. convert_word_to_pdf函数:这个函数使用win32com库将Word文档转换为PDF格式。它首先初始化COM库,然后创建一个Word应用程序实例,打开指定的Word文档,并将其导出为PDF格式。最后,它关闭文档并退出Word应用程序。

  3. convert_pdf_to_png函数:这个函数使用PyMuPDF库将PDF文件的第一页转换为PNG图片。它打开指定的PDF文件,加载第一页,生成图像并保存为PNG格式。

  4. MyFrame类:这是我们的GUI类,继承自wx.Frame。它包含一个文本框用于显示和输入文件夹路径,一个浏览按钮用于选择文件夹,以及一个转换按钮用于启动转换过程。on_browse方法用于处理浏览按钮点击事件,on_convert方法用于处理转换按钮点击事件。

  5. on_convert方法:这个方法首先获取用户选择的文件夹路径,然后遍历该文件夹中的所有Word文档,依次将其转换为PDF格式,再将PDF文件转换为PNG图片。转换过程中记录日志,并在转换完成后显示消息框。

  6. 主程序:在主程序中,我们创建一个wx.App实例,并创建MyFrame实例来显示GUI。

结果如下

在这里插入图片描述

总结

通过这篇博客,我们介绍了如何使用Python和wxPython库创建一个简单的GUI工具,将指定文件夹中的所有Word文档转换为PNG图片。这个工具使用了win32com库与Word应用程序交互,将Word文档导出为PDF格式,并使用PyMuPDF库将PDF文件转换为PNG图片。希望这篇博客对你有所帮助!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1988150.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JAVA WEB初步实验

Spring应用开发环境准备 安装配置Spring应用开发环境 熟悉IntelliJ IDEA开发工具 打开idea工具,创建普通Java工程 配置普通Java工程运行环境 得到基本的Java运行环境配置正常 修改pom.xml文件,搭建Spring IOC运行环境 更新pom文件 新建User、TestSpr…

部署Springboot + Vue 项目到远程服务器Windows10系统的详细配置

远程服务器操作系统为Windows系统,Java程序环境,Maven环境都安装有,Mysql ,Redis等都有的前提下 1. mysql数据库导入,非常简单很好操作,这里省略。。比如用HeidiSql 或者Navicat 工具导入数据库 2. 后端javaSpringb…

医疗器械注册资源宝库数屿医械官方平台!

医学影像设备市场作为医疗器械领域的佼佼者,技术门槛高且规模庞大,2021年全球规模达458亿美元,预计2022年逼近500亿美元,增长动力源自技术革新与临床需求攀升。中国市场亦不甘落后,受政策驱动与市场需求双重提振&#…

WPF学习(8)- Button按钮

1. 用法解析 Button因为继承了ButtonBase&#xff0c;而ButtonBase又继承了ContentControl&#xff0c;所以&#xff0c;Button可以通过设置Content属性来设置要显示的内容。例如 <Button Content"确定"/>我们使用Button的时机&#xff0c;通常是鼠标点击事件…

【IEEE出版 | 往届会后三个月检索】第五届大数据、人工智能与软件工程国际研讨会(ICBASE 2024)

【IEEE出版 | 往届会后三个月检索】 第五届大数据、人工智能与软件工程国际研讨会&#xff08;ICBASE 2024&#xff09; 2024 5th International Conference on Big Data & Artificial Intelligence & Software Engineering 2024年09月20-22日 | 中国温州 *会议官网…

【NeRF及其代码NeRF-Pytorch实现】

文章目录 模型输入和输出NeRF-Pytorch代码参考 在没有仔细学习过NeRF之前&#xff0c;对于NeRF的直观感受是&#xff0c;它是对某个场景三维模型的一个拟合&#xff0c;并且实现了一个渲染的效果&#xff0c;即输入相机位姿信息&#xff0c;输出对应位姿信息的渲染图像。NeRF训…

【IO】使用消息队列完成两个进程之间相互通信

目录 1、使用消息队列完成两个进程之间相互通信 2、共享内存实现两个进程之间的通信 3、思维导图 1、使用消息队列完成两个进程之间相互通信 //msgsnd.c #include <myhead.h>// 要发送的消息类型 struct msgbuf {long mtype;char mtext[1024]; };// 定义一个宏&#…

html5各行各业官网模板源码下载(3)

文章目录 1.来源2.源码模板2.1 HTML5好看的酷酷的个人简历、个人主页、个人网站源码2.2 html实现我的博客文章相册源码2.3 html实现好看的塔罗牌、十二星座运势网站源码 作者&#xff1a;xcLeigh 文章地址&#xff1a;https://blog.csdn.net/weixin_43151418/article/details/1…

语音转文字大盘点,Windows版Top3,你选对了吗?

现在的工作压力可不是盖的&#xff0c;老板们总希望我们能像超人一样&#xff0c;工作速度快得飞起。如果做不到&#xff0c;可能就得把位置让给别人了。不过别担心&#xff0c;有了语音转文字的软件&#xff0c;咱们的工作效率就能大大提升。那咱们应该选哪款免费的语音转文字…

免费【2024】springboot 房屋租赁系统的设计与实现

博主介绍&#xff1a;✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围&#xff1a;SpringBoot、Vue、SSM、HTML、Jsp、PHP、Nodejs、Python、爬虫、数据可视化…

如何通过【腾讯云 AI 代码助手】快速解决商城项目难题

文章目录 引言开发环境介绍从 IDE 插件市场安装 腾讯云AI代码助手实战问题一&#xff1a;如何使用RabbitMQ的死信队列来实现关闭订单的操作&#xff1f;并编写java代码问题二&#xff1a;在解决库存问题时&#xff0c;如何使用Redis的分布式锁来实现呢&#xff1f; 获得的帮助与…

【iOS】GCD详细总结

GCD详细总结 1. GCD简介2. GCD任务和队列任务队列 (dispatch是派遣的意思&#xff09;队列的创建方法和获取方法 3.我的总结&#xff1a;同步和异步函数&#xff0c;并行和并发队列同步异步函数串行并发队列是否开启新线程&#xff0c;串行还是并发执行任务&#xff0c;如何分析…

【网络技术】堆叠通用部署

相关文章推荐 点击查看&#xff1a; 华为交换机堆叠技术 华为交换机组建堆叠案例 【技术分享】堆叠交换机替换指导 交换机为什么要堆叠&#xff1f; 配置交换机1 <HUAWEI> system-view [HUAWEI] sysname Switch1 [Switch1] interface stack-port 0/1 [Switch1-stack…

一文读懂 服务器

你好,我是Qiuner. 为帮助别人少走弯路和记录自己编程学习过程而写博客 这是我的 github https://github.com/Qiuner ⭐️ ​ gitee https://gitee.com/Qiuner &#x1f339; 如果本篇文章帮到了你 不妨点个赞吧~ 我会很高兴的 &#x1f604; (^ ~ ^) 想看更多 那就点个关注吧 我…

分数取模怎么办

我们遇到负数的话要先加上 mod 再取模 那么遇到分数的话怎么办 分数则由分子乘以分母的逆元&#xff0c;然后再对积取模。 #define _CRT_SECURE_NO_WARNINGS #include<bits/stdc.h> using namespace std;// 如果用杨辉三角形做的话空间会爆炸 // 我是sb&#xff0c;只有三…

Find My充气宝|苹果Find My技术与充气宝结合,智能防丢,全球定位

随着人们生活水平的提高&#xff0c;汽车已经走进了千家万户&#xff0c;汽车的普及也导致了停车位资源的稀缺。很多新手司机在停车和行车时经常会碰到轮胎被扎或者气压不足的问题&#xff0c;最近的骑行文化盛行&#xff0c;很多的骑手也会带着自己的山地自行车开启一段骑行之…

[Git][分支设计规范]详细讲解

目录 0.概览1.master分支2.release分支3.develop分支4.feature分支5.hotfix分支 0.概览 以下是常用的分支和环境的搭配&#xff0c;可视情况而定不同的策略 分支名称适用环境master主分支生产环境release预发布分支预发布/测试环境develop开发分支开发环境feature需求开发分支本…

第6章>>实验8:PS(ARM)端Linux RT与PL端FPGA之间(通过FIFO队列进行通信和交互)-《LabVIEW ZYNQ FPGA宝典》

1、实验内容 上一节实验里面介绍的Memory存储器通道比较适合在PS端和PL端之间传递数组或者向量等数据&#xff0c;也就是多个相同类型的元素&#xff0c;如果要传递像ADC采集这样的连续数据流&#xff0c;Memory存储器通道就不是很合适了。 本节实验我们向大家讲解如何借助FIFO…

加速 Spring Boot 3.3 迁移

1. 关键要点 为什么你应该升级你的服务迁移到 Spring Boot 3.3 时需要更新的内容OpenRewrite 如何帮助使升级更轻松、更快捷 2. 前言 现在Spring Boot 已经到了3.3&#xff0c;但是你在哪里&#xff1f;在过去的 3.x 版本更新中&#xff0c;我们看到了许多新功能&#xff0c;…

SAP EPPM-CPM(商业项目管理)模块功能演示:创建主项目

今天跟大家展示一下如何通过SAP CPM维护商业项目以及计划结构。 CPM的主要操作界面是SAP之前推出的新一代UX Fiori&#xff0c;如果需要在CPM操作&#xff0c;可分配SAP提供的标准复合角色&#xff1a;SAP_BPR_CPD_USER_1。 因为在CPM模块的宗旨是构建一个项目的全局视角门户…