python实战三-提取Word数据到Excel

news2024/11/15 17:28:30

视频+源码:
链接:https://pan.quark.cn/s/83db5bb15383

一个文件夹下有大量会议通知文件,为word文件,文件格式都是一致的,现在要将文件中的一些字段提取出来汇总到Excel文件中。
会议通知文件格式如下:

要提取学习时间、学习内容、学习形式、主持人汇总到 会议汇总.xlsx 中,每新增一条记录序号加1

Excel表格式如下:

代码如下:

from docx import Document
from openpyxl import load_workbook
import glob

def 提取数据汇总(file_dir):
    tempfile = file_dir + r'\汇总模版.xlsx'
    workbook = load_workbook(tempfile)  # 打开模板文件
    sheet = workbook.active
    number = 1  # 计数

    docFiles = glob.glob(file_dir + r'\*.docx')  # 筛选出指定文件下所有.docx后缀文件
    for file in docFiles:
        print(file)
        doc = Document(file)
        contentList = []  # 学习内容
        studyTime = ''  # 学习时间
        studyType = ''  # 学习形式
        host = ''  # 主持人
        for paragraph in doc.paragraphs:
            if paragraph.text[2:7] == '学习时间:':
                studyTime = paragraph.text[7:]
            if paragraph.text[2:6] == '主持人:':
                host = paragraph.text[6:]
            if paragraph.text[2:7] == '学习形式:':
                studyType = paragraph.text[7:]
            if len(paragraph.text) >= 2:
                if paragraph.text[0].isdigit() and paragraph.text[1] == '、':
                    contentList.append(paragraph.text)
        content = ' '.join(contentList)  # 列表转化为字符串
        sheet.append([number, studyTime, content, studyType, host])
        number += 1

    workbook.save(file_dir + r'\会议汇总.xlsx')

if __name__ == '__main__':
    提取数据汇总(r'D:\自动化')

很简单自己创建 几个word试试吧:

关于党委理论学习中心组

2021 年第一次学习会的通知

公司党委领导班子成员:

定于3月1日组织公司党委理论学习中心组2021年第一次学习会,现将有

关事项通知如下:

一、学习时间:2021年3月10日下午4:00.

二、学习地点:5楼会议室,

三、参加人员:公司领导班子成员

四、主持人:李 XX。

五、学习形式:集中学习。I

六、学习内容:

                 1、2022谢谢小星星

                 2、生的点点滴滴

七、相关要求:

1.学习资料提前发给与会人员,请与会人员做好学习及发言准备;

2.请与会人员妥善安排工作,准时参加,学习时间如有变

运行结果: 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2093259.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Arthas线上诊断神器-如何安装?

文章目录 一、快速安装 ✅二、springboot-启动器 ✅ 一、快速安装 ✅ 第一种方式:通过下载arthas-boot.jar,然后用 java -jar 的方式启动~ 第一步、下载arthas-boot.jar curl -O https://arthas.aliyun.com/arthas-boot.jar如果下载速度比较…

Linux镜像文件调整分区大小

本文介绍Linux镜像文件调整分区大小。 嵌入式系统在安装完Linux系统,磁盘通常默认只划分了2个分区,一个启动分区(boot分区),一个根文件系统分区(rootfs分区)。有时,我们想划分一个独…

java打包混淆插件proguard

java代码混淆工具ProGuard混淆插件:https://blog.csdn.net/yinjl123/article/details/138922335 ProGuard Maven Plugin 使用指南:https://blog.csdn.net/gitblog_00427/article/details/141350545 ProGuard Maven Plugin 踩坑记 ProGuard代码混淆器如何…

火爆全网的扩散模型(Diffusion Model)到底是什么?只看这篇就够了!绝对通俗易懂!草履虫看完都要点头!| 附完整代码 + 详细注释

最近在做蛋白从头设计相关研究,看了超多文献(后面也想慢慢把它们分享出来嘿嘿嘿)!发现现在最新的模型其实多数都是基于扩散模型(Diffusion Model),既然如此,依据咱们要知道的尿性&am…

【Python进阶】学习Python必须要安装PyCharm。一篇文章带你总结一下安装PyCharm的注意事项,文末附带PyCharm激活码!!!

PyCharm激活码(文末附带精品籽料): K384HW36OB-eyJsaWNlbnNlSWQiOiJLMzg0SFczNk9CIiwibGljZW5zZWVOYW1lIjoibWFvIHplZG9uZyIsImxpY2Vuc2VlVHlwZSI6IlBFUlNPTkFMIiwiYXNzaWduZWVOYW1lIjoiIiwiYXNzaWduZWVFbWFpbCI6IiIsImxpY2Vuc2VSZXN0cmljdG…

ComfyUI的优势+安装+基础介绍,干货内容,建议收藏!!!

简介 ComfyUI是一个基于节点流程的稳定扩散操作界面,通过流程实现了更加精准的工作流定制和完善的可复现性。 ComfyUI 与Webui 的区别: 一,界面设计: Web UI提供了直观友好的图形界面,适合初学者和非技术人员使用。…

JSON数据的解析与生成:深入Python的实践与应用

目录 一、JSON基础 1.1 JSON简介 1.2 Python中的JSON处理 二、解析JSON字符串到Python字典 2.1 使用json.loads()函数 2.2 异常处理 三、将Python字典转换为JSON字符串 3.1 使用json.dumps()函数 3.2 格式化输出 3.3 将Python对象写入文件 四、将Python对象写入JSON…

P01-何谓Java方法

P01-何谓Java方法 一、System.out.println()分析 二、剖析方法 谈到方法,我就突然想到了c函数: 其实:Java 方法和 C 函数在许多方面确实有类似之处,但它们也存在一些显著的差异。下面是它们的一些共同点和不同点: 共同…

POS机的接口

联迪的POS机 读取付款方式 private void Form_MisPos_Load(object sender, EventArgs e) { List<Trans> list MisPos.GetTransList(); int col 0; int y 15; int colcount 3; Panel p panel3;…

vben:对话框组件

本文将介绍如何在vben admin vue 框架中&#xff0c;创建对话框组件&#xff0c;并成功应用的代码。代码即插即用。 结果如下图所示&#xff0c; 一、创建对话框组件 创建 myModal/index.vue <template><div><BasicModalregister"registerModal"v-…

探索《黑神话:悟空》背后的编程技术

《黑神话&#xff1a;悟空》作为一款备受期待的动作角色扮演游戏&#xff0c;以其卓越的视觉效果和流畅的游戏体验吸引了全球玩家的关注。这款游戏不仅在艺术设计和技术实现上展现了极高的水准&#xff0c;其背后的编程技术更是保证了游戏顺利运行和出色表现的关键因素。在这篇…

马铃薯叶片病害识别系统+Python+图像识别+人工智能+深度学习+卷积神经算法+计算机课设项目

一、介绍 马铃薯叶片病害识别系统。本项目使用Python作为主要开发语言&#xff0c;基于TensorFlow等深度学习框架搭建ResNet50卷积神经算法网络模型&#xff0c;通过对收集到的3种常见的马铃薯叶片病害数据集&#xff08;‘早疫病’, ‘健康’, ‘晚疫病’&#xff09;进行训练…

计算机毕业设计 基于SpringBoot框架的网上蛋糕销售系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

&#x1f34a;作者&#xff1a;计算机编程-吉哥 &#x1f34a;简介&#xff1a;专业从事JavaWeb程序开发&#xff0c;微信小程序开发&#xff0c;定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事&#xff0c;生活就是快乐的。 &#x1f34a;心愿&#xff1a;点…

‌IP地址为什么是8位数:‌深入解析IPv4地址的设计原理与应用

当我们谈论IP地址时&#xff0c;‌通常指的是IPv4地址&#xff0c;‌它由四段8位二进制数构成&#xff0c;‌每段通常转换为十进制数表示&#xff0c;‌范围从0到255。‌这种8位数的设计并非随意&#xff0c;‌而是基于一系列精心的考虑和权衡。‌本文将深入探讨IP地址为什么是…

心觉:颠覆学习,开启无限可能

很多人一天到晚地在学习 买课程&#xff0c;看书&#xff0c;看视频&#xff0c;看直播 网上查资料学习 总之不是在学习&#xff0c;就是在学习的路上 沉浸在学习中无法自拔 乐在其中&#xff0c;但是真正的收获呢&#xff0c;没有&#xff0c;或者说非常少 首先我们来讲…

ORACLE 统计信息的备份与恢复

备份 --需要先创建统计信息基础表 exec dbms_stats.create_stat_table(USER1,STAT_TIMESTAMP); --导出某个用户的所有统计信息 exec dbms_stats.export_schema_stats(USER1,STAT_TIMESTAMP);--测试(插入100条&#xff0c;更新统计信息&#xff0c;略) select num_rows,last_ana…

Python和C++(CUDA)及Arduino雅可比矩阵导图

&#x1f3af;要点 对比三种方式计算读取二维和三维三角形四边形和六面体网格运动学奇异点处理医学图像成像组学分析特征敏感度增强机械臂路径规划和手臂空间操作变换苹果手机物理稳定性中间轴定理 Python雅可比矩阵 多变量向量值函数的雅可比矩阵推广了多变量标量值函数的…

Renesa Version Board开发RT-Thread 之Client(WIFI)和上位机的数据传输

目录 概述 1 系统框架 1.1 模块介绍 1.1 Version-Board 开发板 1.1.1 Vision-Board简介 1.1.2 Vision-Board的资源 1.2 框架介绍 2 上位机App 2.1 UI设计 2.2 代码实现 3 功能测试 3.1 网络连接 3.2 功能测试 概述 本文主要Renesa Version Board开发RT-Thread 之…

MIX滤镜大师 v4.9.6.5 — 内置超过130款滤镜

MIX滤镜大师内置了超过 130 款高品质滤镜&#xff0c;涵盖多种照片风格&#xff0c;包括胶片时代的专业彩色反转片滤镜、自动识别人脸并磨皮增白的自拍滤镜、讲究线条和影调的单色滤镜以及追求夸张色彩的 LOMO 滤镜。此版本已解锁全部功能&#xff0c;去除广告&#xff0c;提供…