Python提取PowerPoint演示文稿表格保存到文本及Excel文件

news2024/10/7 10:15:14

PowerPoint作为广泛使用的演示工具,常被用于展示各类数据报告和分析结果,其中,表格以其直观性和结构性成为阐述数据关系的不二之选。然而,在数据分析、文档归档或跨平台分享的场景下,幻灯片中的表格功能难以满足需求,提取其中表格并写入其他文件是更好的处理方法。将表格内容转化为文本或Excel格式能够促进数据的快速流通与理解,同时也为自动化处理和进一步的数据挖掘提供了便利。而使用Python能够帮助我们更高效、精确地提取PowerPoint演示文稿中的表格,还可以实现表格提取的自动话进行。本文将介绍如何使用Python来提取PowerPoint幻灯片中的表格,并将表格数据写入文本文件以及Excel文件。

文章目录

    • 用Python提取PPT表格并写入文本文件
    • 用Python提取PPT表格并写入Excel工作表

本文所使用的表格提取方法基于Spire.Presentation for Python,PyPI:pip install Spire.Presentation

用Python提取PPT表格并写入文本文件

该库中的ITable类表示演示文稿中的表格。我们可以遍历演示文稿中的幻灯片,再遍历幻灯片中的所有内容对象(IShape实例),并判断其是否为ITable实例,从而获取演示文稿中的所有表格。获取到表格之后,再使用ITable.TableRow[].TextFrame.Value属性获取表格单元格的数据,即可实现表格的提取。以下是操作步骤:

  1. 导入所需模块。
  2. 创建Presentation实例,使用Presentation.LoadFromFile()方法载入PowerPoint文件。
  3. 遍历幻灯片,再遍历幻灯片中的内容对象,判断其是否为ITable实例。
  4. 遍历ITable实例中的行,以及行中的单元格,使用TableRow[].TextFrame.Value获取单元格数据。
  5. 使用单元格数据构建字符串,并写入文本文件。
  6. 释放资源。

代码示例

from spire.presentation import *
from spire.presentation.common import *

# 创建一个Presentation实例
presentation = Presentation()

# 加载PowerPoint文件
presentation.LoadFromFile("示例.pptx")

tables = []
# 遍历所有的幻灯片
for slide in presentation.Slides:
    # 遍历所有的形状
    for shape in slide.Shapes:
        # 检查形状是否为表格
        if isinstance(shape, ITable):
            tableData = ""
            # 遍历所有的行
            for row in shape.TableRows:
                rowData = ""
                # 遍历行中的所有单元格
                for i in range(0, row.Count):
                    # 获取单元格的值
                    cellValue = row[i].TextFrame.Text
                    rowData += (cellValue + "\t" if i < row.Count - 1 else cellValue)
                tableData += (rowData + "\n")
            tables.append(tableData)

# 将表格写入文本文件
for idx, table in enumerate(tables, start=1):
    fileName = f"output/Tables/Table-{idx}.txt"
    with open(fileName, "w") as f:
        f.write(table)

presentation.Dispose()

提取结果
Python提取PPT表格写入文本

用Python提取PPT表格并写入Excel工作表

除了将提取到的表格数据写入文本文件外,我们还可以使用Spire.XLS for Python(PyPI:pip install Spire.XLS)将提取到的数据写入到Excel工作表中,并进行其他格式设置及文件转换等操作。以下是操作步骤:

  1. 导入所需模块。
  2. 创建Presentation实例,使用Presentation.LoadFromFile()方法载入PowerPoint文件。
  3. 创建Workbook对象从而新建一个Excel工作簿,使用Workbook.Worksheets.Clear()方法清除工作簿中的默认工作表。
  4. 遍历幻灯片,再遍历幻灯片中的内容对象,判断其是否为ITable实例。将ITable实例添加到列表中。
  5. 遍历列表中的ITable实例,使用Workbook.Worksheets.Add()方法为每个ITable实例创建一个工作表。
  6. 遍历ITable实例中的行以及行中的单元格,使用TableRow[].TextFrame.Value获取单元格数据,再使用Worksheet.Range[].Value属性将数据写入到工作表中的对应单元格。
  7. 进行工作表格式设置。
  8. 保存Excel工作簿,或将其转换为其他格式的文件。
  9. 释放资源。

代码示例

from spire.presentation import *
from spire.presentation.common import *
from spire.xls import *
from spire.xls.common import *

# 创建一个Presentation实例
presentation = Presentation()

# 加载PowerPoint文件
presentation.LoadFromFile("示例.pptx")

# 创建一个Excel文件并清除默认工作表
workbook = Workbook()
workbook.Worksheets.Clear()

tables = []
# 遍历所有的幻灯片
for slide in presentation.Slides:
    # 遍历所有的形状
    for shape in slide.Shapes:
        # 检查形状是否为表格
        if isinstance(shape, ITable):
            tables.append(shape)

# 遍历所有的表格
for t in range(len(ttables)):
    table = tables[t]
    sheet = workbook.Worksheets.Add(f"Sheet-{t+1}")
    for i in range(0, table.TableRows.Count):
        row = table.TableRows[i]
        for j in range(0, row.Count):
            sheet.Range[i + 1, j + 1].Value = row[j].TextFrame.Text
    # 自动调整行和列的大小
    sheet.AllocatedRange.Style.Font.FontName = "HarmonyOS Sans SC"
    sheet.AllocatedRange.Style.Font.Size = 12.0
    sheet.AllocatedRange.AutoFitColumns()
    sheet.AllocatedRange.AutoFitRows()

# 保存Excel文件
workbook.SaveToFile("output/PresentationTables.xlsx", FileFormat.Version2016)

presentation.Dispose()
workbook.Dispose()

提取结果
Python提取PPT表格写入Excel文件

本文介绍了如何使用Python提取PowerPoint演示文稿中的表格数据,并写入文本文件或Excel工作簿。

更多PowerPoint演示文稿处理技巧请前往Spire.Presentation for Python教程查看。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1818942.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电脑桌面提醒做事的app 好用的桌面提醒app

在快节奏的现代生活中&#xff0c;我们每天都要通过电脑处理大量的工作事项。然而&#xff0c;繁忙的工作节奏有时会导致我们遗忘某些重要任务&#xff0c;从而带来不必要的损失。为了避免这种情况&#xff0c;选择一款好用的桌面提醒app显得尤为重要。 想象一下&#xff0c;你…

Java中的方法重写与重载

在Java编程语言中&#xff0c;方法重写&#xff08;Override&#xff09;和方法重载&#xff08;Overload&#xff09;是实现代码多态性的两种基本方式。它们允许程序员以多种方式使用相同的方法名&#xff0c;增加了程序的可读性和可重用性&#xff0c;但它们的应用场景和规则…

一文读懂Partisia Blockchain 的MOCCA方案:资产托管的最优解

Partisia Blockchain是一个兼具隐私、可互操以及高迸发特性的Layer1系统&#xff0c;其通过将区块链以及零知识计算&#xff08;包括MPC、零知识证明ZKP等&#xff09;以协作的方式结合起来&#xff0c;并通过分片方案、Bring Your Own Coin&#xff08;BYOC&#xff09;功能和…

文心一言 VS 讯飞星火 VS chatgpt (280)-- 算法导论20.4 1题

一、假设 CONNECTED-COMPONENTS 作用于一个无向图 G(V&#xff0c;E)&#xff0c;这里V{a&#xff0c;b&#xff0c;c&#xff0c;d&#xff0c;e&#xff0c;f&#xff0c;g&#xff0c;h&#xff0c;i&#xff0c;j&#xff0c;k}&#xff0c;且 E 中的边以如下的顺序处理:(d…

Leetcode 力扣117. 填充每个节点的下一个右侧节点指针 II (抖音号:708231408)

给定一个二叉树&#xff1a; struct Node {int val;Node *left;Node *right;Node *next; } 填充它的每个 next 指针&#xff0c;让这个指针指向其下一个右侧节点。如果找不到下一个右侧节点&#xff0c;则将 next 指针设置为 NULL 。 初始状态下&#xff0c;所有 next 指针都…

PCIE的吞吐量如何计算和记忆诀窍?

简介&#xff1a; PCIe标准中的性能参数有好几个&#xff0c;比如设备的带宽和吞吐量是多少&#xff1f;传输速率&#xff1f; 百度百科上&#xff0c;PCIE标准的传输速率与带宽对应表如下&#xff08;表中速率为单向速率&#xff09;。网上有些数据是双向的&#xff0c;性能数…

流程设计的基本步骤

背景 公司为什么要流程&#xff0c;已经有专门章节进行阐述&#xff1b; 什么是流程&#xff0c;已经有专门章节进行专门阐述&#xff1b; 那么接下来这个章节讨论&#xff0c;流程设计的基本步骤&#xff0c;那么谁来设计流程呢&#xff0c;让一个部门的员工来设计一份流程…

汽车行驶中是怎么保障轴瓦安全的?

汽车轴瓦是一种用于减少摩擦和支撑转动部件的关键零部件&#xff0c;通常用于发动机的曲轴、凸轮轴等转动部件上。主要作用是减少转动部件之间的摩擦&#xff0c;支撑和保护曲轴、凸轮轴等旋转部件&#xff0c;确保它们在高速旋转时的稳定性和耐用性。 在汽车轴瓦加工过程中&am…

HarmonyOS(36) DevEco Studio 配置debug和release

在android开发中可以在build.gradle来配置realease和debug,在HarmonyOS中可以通过build-profile.json5文件中通过buildModeSet配置&#xff1a; 在DevEco Studio 中可以通过下面来选择运行debug还是release&#xff1a; 我们可以通过BuildProfile.ets里面的静态变量获取当前…

企业中的绩效管理

背景 企业中为何需要绩效管理&#xff0c;企业绩效管理为何比较难&#xff0c;这在企业管理中是非常难&#xff0c;同样也是非常有价值的命题&#xff0c;那么首先应该对这个命题有清晰的认知&#xff0c;特别是要想明白为何企业需要绩效管理&#xff0c;应该先明白企业。 企…

C51学习归纳12 --- 外部中断、红外遥控

红外遥控是一个非常使用的技术&#xff0c;所以有必要单独讲一下。我们之前已经完成了电机调速的功能&#xff0c;现在我们讲红外控制和电机调速结合在一起&#xff0c;使用红外实现电机的调速。 为什么要采用外部中断&#xff0c;因为红外遥控的发送速率非常快&#xff0c;如果…

电商价格监测对于品牌渠道管控的重要性

当品牌开启经销渠道或涉足电商渠道时&#xff0c;必须着手进行线上线下价格监测。只有监控到电商价格&#xff0c;才能明晰出货后的商品历经多轮市场演绎后的实际价格&#xff0c;进而了解市场需求下的真实低价行为。借助力维网络开发的电商价格监测系统&#xff0c;品牌商能知…

【开发环境】PX4无人机实物使用视觉或运动捕捉系统进行位置估计

PX4无人机实物使用视觉或运动捕捉系统进行位置估计 PX4中关于外部位置信息的MAVLink话题参考坐标系EKF2调整配置参数调整EKF2_EV_DELAY参数 与ROS共同使用将OptiTrack MoCap系统提供的姿态数据导入ROSMotive MoCap软件的步骤将姿态数据导入ROS重新映射姿态数据 将姿态数据转发到…

【Three.js】知识梳理二十二:相机视角的平滑过渡与点击模型视角切换

在 Three.js 中&#xff0c;实现相机视角的平滑过渡和点击模型切换到查看模型视角是一个常见且有用的功能。这种效果不仅能提升用户体验&#xff0c;还能为场景互动添加更多的动态元素。本文将详细介绍如何在 Three.js 中实现这一功能。 1. 基本设置 首先&#xff0c;我们需要…

镜像拉取失败:[ERROR] Failed to pull docker image

问题描述 执行 bash docker/scripts/dev_start.sh 命令提示错误&#xff1a; permission denied while trying to connect to the Docker daemon socket at unix:///var/run/docker.sock: Post “http://%2Fvar%2Frun%2Fdocker.sock/v1.45/images/create?fromImageregistry.b…

DBeaverUE Mac版:数据库管理新纪元,一键掌控所有数据

DBeaverUE for Mac是一款卓越的数据库管理软件&#xff0c;专为Mac用户设计&#xff0c;提供了一套高效、稳定且全面的数据库解决方案。以下是关于这款插件的详细介绍&#xff1a; 1. 强大的数据库支持 DBeaverUE for Mac支持多种数据库系统&#xff0c;包括但不限于MySQL、Po…

警务反诈RPA的用途:提高反诈骗工作效率,保护公众财产安全

互联网时代&#xff0c;电信诈骗手段不断翻新&#xff0c;作案地域广&#xff0c;打击难度大&#xff0c;反诈工作迎来巨大的挑战。为了提升办案效率&#xff0c;精准打击犯罪&#xff0c;以科技赋能反诈工作、构建反诈新格局迫在眉睫。而RPA机器人由于能够快速、准确地处理大量…

使用大模型进行时间序列预测

今天想聊聊这周一篇关于使用语言模型进行时间序列预测的工作&#xff0c;这个工作的主要亮点有四个: 首先提出的Chronos框架将时间序列通过缩放和量化转换为token序列&#xff0c;从而可以直接使用语言模型架构(如T5, GPT-2等)来建模时间序列&#xff0c;不需要对模型架构做任…

早知 121私人导航升级新版本, 第一次使用原生dialog标签。

早知121项目介绍说明 早知121 - 一个快速创建私人导航网站。 用途&#xff1a; 创建个人的工作导航&#xff0c;收集常用网址&#xff0c;可贡献给同事。创建个人垂直领域导航 优点&#xff1a; - 不需懂技术&#xff0c;不用维护服务器&#xff0c;维护私人导航收藏站。 网…

全域推广和标准推广哪个更好。谁更容易获客?

随着全域概念的兴起&#xff0c;全域推广逐渐走进人们视野&#xff0c;并成为新的互联网热词。在此背景下&#xff0c;与全域推广相关的话题&#xff0c;如全域推广是什么及全域推广和标准推广的区别等成为了许多创业者讨论和搜索的对象。 所谓的全域推广&#xff0c;简单来说…