Word docx文件重命名为zip文件,解压后直接查看和编辑

news2024/11/28 12:32:21

一个不知道算不算冷的知识[doge]:

docx格式的文件本质上是一个ZIP文件

当把一个.docx文件重命名为.zip文件并解压后,你会发现里面包含了一些XML文件和媒体文件,它们共同构成了Word文档的内容和格式。

例如,word/document.xml文件包含了Word文档的大部分内容【*全体注意——!这个文件很可爱,熟悉xml结构后能在其中完成Word文档结构、格式相关的几乎所有操作,比用Word软件另存为xml之后得到的xml文件结构清晰很多】,而图片文件则保存在word/media文件夹。

因此可以把.docx文件重命名为.zip文件,解压后直接查看、编辑文档内部结构和内容。对其中文件进行修改后(这一步刚开始坑会比较多,需要一点点耐心和好奇..)重新压缩并重命名为.docx文件,又可以用word正常打开。

编辑.xml文件比较推荐用Notepad++,插件安装XML Tools,打开文件后点Pretty print会自动把xml文件树形展开

下面代码是我改document.xml文件看对word文档影响的时候写的,主要目的是节省体力(¦3[▓▓]

实现功能就是把解压后的文件夹重新压缩打包成docx文件并打开,然后就可以愉快地查看了

如果报错建议先撤回之前对xml文档的操作再看看,因为真的很容易手滑(躺

import zipfile  
import os 
import win32com.client as win32 
import random 
  
# 将指定文件夹压缩为ZIP文件  
def zip_folder(folder_path, zip_path):    
    with zipfile.ZipFile(zip_path, 'w', zipfile.ZIP_DEFLATED) as zipf:  # 使用'w'模式创建或覆盖ZIP文件,并使用DEFLATED方法压缩  
        for root, dirs, files in os.walk(folder_path): 
            for file in files:  
                file_path = os.path.join(root, file)  
                zipf.write(file_path, file_path[len(folder_path)+1:])  

# 定重命名文件,将文件扩展名从.zip更改为.docx  
def re_name(path):  
    old_name = path 
    new_name = path[:-4]+'.docx'    
    os.rename(old_name, new_name)  
    return new_name  

folder_path = r"D:\wordTest\1"  # 指定要压缩的文件夹路径,就是你解压docx文档之后获得的那个总文件夹 
m = str(random.random())  # 生成一个随机数【这个地方是我偷懒了一下直接用随机数命名,这样不用担心重复
zip_path = f"D:\wordTest\{m}.zip"  
zip_folder(folder_path, zip_path)  # 压缩文件夹  
new_docx = re_name(zip_path)  # 重命名压缩文件为.docx扩展名  
  
# 创建Word应用程序对象  
word = win32.gencache.EnsureDispatch('Word.Application')  # 确保Word应用程序对象存在,如果不存在则创建  
  
# 打开Word文档  
word.Documents.Open(new_docx)  
word.Visible = True  # 设置Word应用程序窗口为可见

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1450492.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

平时积累的FPGA知识点(8)

平时在FPGA群聊等积累的FPGA知识点,第八期: 21 FFT IP核 有遇到过FFT IP核测量频率不准确的问题吗?大部分情况下都是准的,偶尔偏差比较大,IP核输入的数据用matlab计算出的频率是对的。 解释:可能是采样点…

扶贫|精准扶贫管理系统|基于Springboot的精准扶贫管理系统设计与实现(源码+数据库+文档)

精准扶贫管理系统目录 目录 基于Springboot的精准扶贫管理系统设计与实现 一、前言 二、系统功能设计 三、系统实现 1、管理员模块的实现 (1)用户信息管理 (2)贫困户信息管理 (3)新闻类型管理 &a…

php基础学习之可变函数(web渗透测试关键字绕过rce于回调函数)

可变函数 看可变函数的知识点之前,蒟蒻博主建议你先去看看php的可变变量,会更加方便理解,在本篇博客中的第五块知识点->php基础学习之变量-CSDN博客 描述 当一个变量所保存的值刚好是一个函数的名字(由函数命名规则可知该值必…

2024年【T电梯修理】报名考试及T电梯修理考试报名

题库来源:安全生产模拟考试一点通公众号小程序 2024年【T电梯修理】报名考试及T电梯修理考试报名,包含T电梯修理报名考试答案和解析及T电梯修理考试报名练习。安全生产模拟考试一点通结合国家T电梯修理考试最新大纲及T电梯修理考试真题汇总,…

书生浦语大模型实战营-课程笔记(3)

本节课主要是跟着教程做的,操作的东西放到作业里记录了。 这里主要记录一些视频里讲的非操作性的东西。 RAG外挂知识库?优点是成本低,不用重新训练 RAG的一个整体流程。 涉及了文本相似度匹配,是不是和传统的问答系统&#xff0…

SpringCloud之Nacos用法笔记

SpringCloud之Nacos注册中心 Nacos注册中心nacos启动服务注册到Nacosnacos服务分级模型NacosRule负载均衡策略根据集群负载均衡加权负载均衡Nacos环境隔离-namespace Nacos与eureka的对比临时实例与非临时实例设置 Nacos配置管理统一配置管理微服务配置拉取配置自动刷新远端配置…

【白话前端】扫盲贴:Svg动画和Canvas动画区别

SVG动画和Canvas动画是两种不同的Web动画技术,它们的实现方式、适用场景和优缺点有所不同。 SVG动画是基于矢量图形的动画技术,使用XML描述图形,并在浏览器中渲染出来。SVG动画可以通过JavaScript或CSS来控制SVG元素的属性值变化,…

Activation of network connection failed(ubuntu连不上网)

ubuntu连不上网,看了好几个方法找到个有用的记录一下 1. 还原默认设置 2. 更改适配器:加上vmware bridge protocol

积分(二)——复化Simpson(C++)

前言 前言 simpson积分 simpson积分公式 ∫ a b f ( x ) d x ≈ b − a 6 [ f ( a ) f ( b ) 4 f ( a b 2 ) ] \int_{a}^{b}f(x)dx \approx \frac{b-a}{6}[f(a)f(b)4f(\frac{ab}{2})] ∫ab​f(x)dx≈6b−a​[f(a)f(b)4f(2ab​)] 与梯形积分类似,当区间[a,b]较…

文件上传漏洞:upload-labs靶场通关

目录 什么是文件上传漏洞? 第1关(客户端验证-前端) 第2关(文件类型校验-MIME校验 ) 第3关(文件名校验-黑名单绕过) 第4关(文件后缀校验-.htacess绕过) 第5关&#…

GPIO八种工作模式

目录 一、推挽输出 二、开漏输出 三、复用推挽输出 四、复用开漏输出 五、浮空输入 六、上拉输入 七、下拉输入 八、模拟输入 GPIO八种配置模式,原理和使用场景,硬件原理如下图: 一、推挽输出 1、 原理 当控制栅极为低电平时&#x…

随机过程及应用学习笔记(四) 马尔可夫过程

马尔可夫过程是理论上和实际应用中都十分重要的一类随机过程。 目录 前言 一、马尔可夫过程的概念 二、离散参数马氏链 1 定义 2 齐次马尔可夫链 3 齐次马尔可夫链的性质 三、齐次马尔可夫链状态的分类 四、有限马尔可夫链 五、状态的周期性 六、极限定理 七、生灭过…

找不到目标和方向,怎么办?

现代社会里,许多人常见的症状,就是「空心病」。 什么是空心病呢?类似这样: 我知道要有目标,但我就是不知道想做什么,感觉对一切事物都提不起兴趣,没有动力,怎么办? 这个…

Mysql第一关之常规用法

简介 介绍Mysql常规概念,用法。包括DDL、DCL、DML、DQL,关键字、分组、连表、函数、排序、分页等。 一、 SQL DCMQ,分别代表DDL、DCL、DML、DQL。 模糊简记为DCMQ,看起来像一个消息队列。 D:Definition 定义语句 M…

[UI5 常用控件] 09.IconTabBar,IconTabHeader,TabContainer

文章目录 前言1. IconTabBar1.1 简介1.2 基本结构1.3 用法1.3.1 颜色,拖放,溢出1.3.2 Icons Only , Inner Contents1.3.3 showAll,Count,key,IconTabSeparator 1.3.4 Only Text1.3.5 headerMode-Inline1.3.6 design,IconTabSeparator-icon1.3.7 DensityM…

当下时代,什么样的人赚钱最容易

如果你问,今天什么样的人赚钱最容易 答案是那些有大量粉丝、有个人IP的人 微信里面,要获取到流量,就必须有粉丝,而在抖音、快手里面,即使你没有任何粉丝 只要能输出平台和用户喜欢的优质内容,一样可以获取巨…

一条 SQL 查询语句是如何执行的

MySQL 的基本架构示意图 大体来说,MySQL 可以分为 Server 层和存储引擎层两部分 Server 层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等…

基于FPGA的ECG信号滤波与心率计算verilog实现,包含testbench

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1 ECG信号的特点与噪声 4.2 FPGA在ECG信号处理中的应用 4.3 ECG信号滤波原理 4.4 心率计算原理 4.5 FPGA在ECG信号处理中的优势 5.算法完整程序工程 1.算法运行效果图预览 其RTL结构如…

探索设计模式的魅力:创建型设计模式的比较与决策

设计模式专栏:http://t.csdnimg.cn/U54zu 目录 一、设计模式概览 1.1 创建型模式 二、比较创建型设计模式 1.1 适用场景典型用例 1.2 关键要素与差异对比 1.3 结构图 三、模式选择指南 3.1 场景分析 3.2 决策流程图 四、结语 4.1 优势 4.2 考量因素 一、…

【Java多线程】Thread类的基本用法

目录 Thread类 1、创建线程 1.1、继承 Thread,重写run 1.2、实现 Runnable,重写run 1.3、使用匿名内部类,继承 Thread,重写run 1.4、使用匿名内部类,实现 Runnable,重写run 1.5、使用 lambda 表达式…