python—如何提取word中指定内容

news2025/2/21 0:18:32

假设有一个Word，该Word中存在 “联系人” 关键字，如何将该Word中的联系人所对应的内容提取出来呢？该Word内容如下所示：

要在给定的Word文档中提取出与"联系人"关键字对应的内容，可以使用Python的python-docx库。以下是一个示例：

import docx

# 加载Word文档
doc = docx.Document('your_document.docx')

# 存储提取的内容
contacts = []

# 遍历文档中的段落并提取联系人关键字对应的内容
for paragraph in doc.paragraphs:
    if '联系人' in paragraph.text:
        # 获取关键字后面的内容
        contact = paragraph.text.split('联系人', 1)[1]
        contacts.append(contact.strip())

# 显示提取的内容
for contact in contacts:
    print(contact)

在上面的代码中，将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

运行代码后，将会显示与"联系人"关键字对应的内容。请注意，在提取"联系人"关键字的内容时，假设该关键字后面的内容是需要提取的信息。如果情况不符合，可能需要根据具体的Word文档结构和需求进行调整。

确保已经安装了python-docx库。如果尚未安装，可以使用以下命令进行安装：

pip install python-docx
通过以上步骤，你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

运行上述代码得到运行结果为：

联系人：张三
联系人：李四
联系人：王五

若想同时获取联系人及对应的电话，则在遍历部分代码中添加 '电话' 关键字即可，如下所示：

# 遍历文档中的段落并提取指定内容
for paragraph in doc.paragraphs:
    if '联系人' in paragraph.text:
        target_content.append(paragraph.text)
    elif '电话' in paragraph.text:
        target_content.append(paragraph.text)

添加之后程序运行结果：

联系人：张三
电话：153***55899
联系人：李四
电话：139***08783
联系人：王五
电话：139***52328

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1066630.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

python—如何提取word中指定内容

相关文章

qt开发从入门到实战2

兽药经营小程序微信商城的作用是什么

淘宝大数据揭秘：购物狂欢节背后的秘密

[NISACTF 2022]babyserialize - 反序列化+waf绕过【*】

java Spring Boot整合jwt实现token生成

解决方案：AI赋能工业生产3.0，从工业“制造”到“智造”

CSS高手必会秘籍《混合模式》

6.canvas绘制基本图形——椭圆

6.绘制三角形

学生必备的笔记工具比较适合用哪个

查找文件夹下不同的图片名字

uni-app：引入echarts（使用renderjs）

【源码】hamcrest 源码阅读空对象模式、模板方法模式的应用

【芯片设计- RTL 数字逻辑设计入门 4 - 第一个 RTL Bug 分析之路】

谈谈你对 finalize 方法的理解，该怎样回答才能体现出高水平？浮于表面的答案永远不行！

ES6 class类的静态方法static有什么用

[PyTorch][chapter 56][GAN 代码实现]

vue3+elementPlus el-input的type=“number“时去除右边的上下箭头

超长表单分页校验,下一页和上一页功能

Flutter横屏实践