【办公类-21-10】三级育婴师 视频转文字docx(等线小五单倍行距),批量改成“宋体小四、1.5倍行距、蓝色字体、去掉五分钟”

news2024/11/19 15:34:41

作品展示

背景需求

今天将最后3个育婴师操作视频做整理

第1步:视频MP4转MP3

【办公类-40-01】20240311 用Python将MP4转MP3提取音频 (家长会系列一)-CSDN博客文章浏览阅读393次,点赞9次,收藏6次。【办公类-40-01】20240311 用Python将MP4转MP3提取音频 (家长会系列一)https://blog.csdn.net/reasonsummer/article/details/136632973

第2步:音频导入网易云见外平台,导出doc文件

以下这篇实现了将“网易云见外平台”下载的doc文件转docx,并修改内部字体格式(蓝色字体)的需求。

【办公类-21-09】三级育婴师 视频转文字docx(等线小五单倍行距),批量改成“宋体小四、1.5倍行距、蓝色字体”-CSDN博客文章浏览阅读542次,点赞6次,收藏7次。【办公类-21-09】三级育婴师 视频转文字docx(等线小五单倍行距),批量改成“宋体小四、1.5倍行距、蓝色字体”https://blog.csdn.net/reasonsummer/article/details/136495196

生成蓝色文字的docx文件

但是我发现这些文件名后面都有一个5分钟的字样

因此我需要蓝色文字的文件名里没有(5分钟)字样

微调代码

1、原来样式——包含(5分钟)

2、现在样式——去掉包含(5分钟)

代码展示:


'''
目的:制作蓝色字体的育婴师操作步骤说明
1、育婴师三级,视频转音频,上传网易云见外
2、网易云见外下载的doc转docx,
2-1、提取的文件名里没有(5分钟)字样
3、docx批量转换成蓝色字体格式——宋体小四、1.5倍行距、蓝色字体
4、docx文件名不能有+,转为空格
作者:AI对话大师 、阿夏
时间:2024年3月26日
'''


import os,time
from docx import Document
from docx.shared import Pt
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
from docx.enum.text import WD_COLOR_INDEX
import win32com.client

print('---------第1步:doc 转 docx---------')

folder_path = r'C:\Users\jg2yXRZ\OneDrive\桌面\01'  # 替换为你的文件夹路径

# 遍历文件夹中的所有文件
for file_name in os.listdir(folder_path):
    if file_name.endswith(".doc"):
        file_path = os.path.join(folder_path, file_name)
        
        # 创建Word应用程序对象
        word_app = win32com.client.Dispatch("Word.Application")
        
        # 打开原始的.doc文件
        doc = word_app.Documents.Open(file_path)
        
        # 将文件另存为.docx格式
        docx_file_path = os.path.splitext(file_path)[0][:-5] + ".docx"
        doc.SaveAs(docx_file_path, 12)  # 使用参数12表示将文件另存为.docx格式
        
        # 关闭原始的.doc文件
        doc.Close()
        
        # 删除原始的.doc文件
        os.remove(file_path)
        
        # 退出Word应用程序
        word_app.Quit()


time.sleep(2)

print('---------第2步:黑色字体 转 蓝色字体---------')
import os
from docx import Document
from docx.shared import Pt
from docx.shared import RGBColor
from docx.oxml.ns import qn
from docx.oxml import OxmlElement

def set_run_font(run, font_name, font_size, font_color):
    r = run._element
    rPr = r.get_or_add_rPr()
    
    if font_name:
        rFonts = OxmlElement('w:rFonts')
        rFonts.set(qn('w:ascii'), font_name)
        rFonts.set(qn('w:eastAsia'), font_name)
        rPr.append(rFonts)
    
    if font_size:
        sz = OxmlElement('w:sz')
        sz.set(qn('w:val'), str(font_size * 2))
        rPr.append(sz)
    
    if font_color:
        color = OxmlElement('w:color')
        color.set(qn('w:val'), font_color)
        rPr.append(color)

# 一级文件夹路径
# folder_path = r'D:\04三级操作题\123'  # 替换为你的文件夹路径

# 遍历文件夹内的所有文件
for file_name in os.listdir(folder_path):
    if file_name.endswith('.docx'):
        # 打开 Word 文档
        doc_path = os.path.join(folder_path, file_name)
        doc = Document(doc_path)

        # 遍历文档中的段落和文字
        for para in doc.paragraphs:
            for run in para.runs:
                # 修改文字属性为宋体、小四、1.5倍行距、蓝色字体
                # set_run_font(run, '宋体', 12, '0000FF')
                set_run_font(run, '宋体', 12, '0070C0')
            para.paragraph_format.line_spacing = 1.5 
                # para.paragraph_format.line_spacing_rule = WD_LINE_SPACING.ONE_POINT_FIVE

        # 保存修改后的文档
        modified_doc_path = os.path.join(folder_path, file_name)
        doc.save(modified_doc_path)

        print(f'{file_name} 文档文字样式修改完成')

print('所有文档处理完成')

time.sleep(2)

print('---------第3步:文件名中的“+”改成“ ”---------')
import os

# folder_path = r'D:\04三级操作题\123'  # 替换为你的文件夹路径

# 遍历文件夹内的所有文件
for file_name in os.listdir(folder_path):
    if file_name.endswith('.docx'):
        new_file_name = file_name.replace('+', ' ')  # 将加号替换为空格
        os.rename(os.path.join(folder_path, file_name), os.path.join(folder_path, new_file_name))
        print(f'{file_name} 重命名为 {new_file_name}')

print('所有文件名替换完成')

把所有的内容分别归类到相应文件夹内

去掉(5分钟)的文字,显示这个文档是蓝色字体,最后可以被提取出来做合并。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1547730.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java网络原理(四)----tcp特性

一.滑动窗口 滑动窗口:可以提高传输效率,准确的来说是让tcp在可靠传输的前提下,效率不要太拉胯。使用滑动窗口不能使tcp变的比UDP块,但能减少差距。 前面谈过tcp的传输数据的时,会把数据进行编号,每次传固…

Go语言介绍以及如何在Go语言中操作MySQL数据库

人不走空 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌赋:斯是陋室,惟吾德馨 目录 🌈个人主页:人不走空 💖系列专栏:算法专题 ⏰诗词歌…

Oracle中实现根据条件对数据的增删改操作——Merge Into

一、需求描述 在我们进行项目开发的过程中,会遇到这样的场景,需要根据某个条件对数据进行增、删、改的操作;遇到这种情况我们有2种方法进行解决: 方法一:①查询指定条件;②根据查询出的指定条件结果在执行…

LeetCode146:LRU缓存

leetCode:146. LRU 缓存 题目描述 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存 int get(int key) 如果关键字 key 存在于缓存中&#x…

ZnO非线性电阻产品特征技术规范

ZnO非线性电阻是一种多组分的多晶陶瓷半导体。它以ZnO为主体,添加其它各种成分组成。不同厂家及研究机构的添加物成分不完全相同,当添加物含量超过0.001mol时开始呈现非线性,典型的ZnO非线性电阻的显微结构包括四部分: ① ZnO 主体:它是由电阻率为0.0010m~0.10m&…

八股 -- C#

面向对象 (三大特性) 三大特性目的是为了提供更好的代码组织、可维护性、扩展性和重用性 C#基础——面向对象 - 知乎 (zhihu.com) 封装 理解: 你不需要了解这个方法里面写了什么代码,你只需要了解这个方法能够给你返回什么数据&…

​Edge-TTS:微软推出的,免费、开源、支持多种中文语音语色的AI工具

Edge-TTS是由微软推出的文本转语音Python库,通过微软Azure Cognitive Services转化文本为自然语音。适合需要语音功能的开发者,GitHub上超3000星。作为国内付费TTS服务的替代品,Edge-TTS支持40多种语言和300种声音,提供优质的语音…

实例分割——细胞实例分割数据集

一、重要性及意义 细胞实例分割是单细胞空间研究的基石,有助于我们更深入地理解健康和疾病状态下的细胞相互作用 通过细胞实例分割,研究人员能够探索正常和病理条件下的细胞如何相互影响,进而增强对基本生物过程的理解。这种理解有助于我们揭…

Web API —— BOM 学习(完结)

目录 一、BOM 介绍 二、Window 对象 (一)基本介绍 (二)定时器 —— 延时函数 1.语法 2.清除时间函数 3.和 interval 间歇函数的区别 (三)JS 执行机制 1.介绍 2.同步任务 3.异步任务 4.执行过程…

FPGA之组合逻辑与时序逻辑

数字逻辑电路根据逻辑功能的不同,可以分成两大类:组合逻辑电路和时序逻辑电路,这两种电路结构是FPGA编程常用到的,掌握这两种电路结构是学习FPGA的基本要求。 1.组合逻辑电路 组合逻辑电路概念:任意时刻的输出仅仅取决…

微信小程序使用Vant组件库流程

目前 Vant 官方提供了 Vue 2 版本、Vue 3 版本和微信小程序版本,并由社区团队维护 React 版本和支付宝小程序版本。这样开发原生微信小程序的会方便很多。 官方网址:Vant Weapp - 轻量、可靠的小程序 UI 组件库 步骤一 通过 npm 安装 npm i vant/weap…

建立动态MGRE隧道的配置方法

目录 一、实验拓扑 1.1通用配置 1.1.1地址配置 1.1.2静态缺省指向R5,实现公网互通 1.1.3MGRE协议配置 1.1.4配置静态 二、Shortcut方式 三、Normal方式(非shortcut) 四、总结 一、实验拓扑 下面两种配置方法皆使用静态方式 1.1通用配…

C#进阶-反射的详解与应用

一、反射的概念 反射是.NET框架提供的一个功能强大的机制,它允许程序在运行时检查和操作对象的类型信息。通过使用反射,程序可以动态地创建对象、调用方法、访问字段和属性,无需在编译时显式知道类型信息。在.NET中,所有类型的信…

代码随想录训练营第58天 | LeetCode 739. 每日温度、​​​​​​LeetCode 496.下一个更大元素 I

目录 LeetCode 739. 每日温度 文章讲解:代码随想录(programmercarl.com) 视频讲解:单调栈,你该了解的,这里都讲了!LeetCode:739.每日温度_哔哩哔哩_bilibili 思路 ​​​​​​LeetCode 496.下一个更大元素 I 文…

【pytest、playwright】构建POM项目,以及解决登录问题,allure环境问题

目录 前言 1、文件目录 2、安装依赖 3、POM项目实战-案例:打开指定页面 目录结构: pages中的代码: cases中的代码: 4、解决登录问题 问题: 解决方案: 获取登录的用户信息(cookie&a…

静态住宅IP优缺点,究竟要怎么选?

在进行海外 IP 代理时,了解动态住宅 IP 和静态住宅 IP 的区别以及如何选择合适的类型非常重要。本文将介绍精态住宅 IP 特点和,并提供选择建议,帮助您根据需求做出明智的决策。 静态住宅 IP 的特点 静态住宅 IP 是指 IP 地址在一段时间内保…

[C++]内联函数(内联函数的概念,内联函数的特性,内联函数与宏的区别)

一、内联函数的概念 以inline修饰的的函数叫内联函数,编译时C编译器会在调用内联函数的位置将内联函数展开,内联函数没有调用函数参数压栈的开销,内联函数可以提高程序的运行效率。 例子: 没有使用内联函数 使用内联函数&#xff…

STM32技术打造:智能考勤打卡系统 | 刷卡式上下班签到自动化解决方案

文章目录 一、简易刷卡式打卡考勤系统(一)功能简介原理图设计程序设计 哔哩哔哩: https://www.bilibili.com/video/BV1NZ421Y79W/?spm_id_from333.999.0.0&vd_sourcee5082ef80535e952b2a4301746491be0 一、简易刷卡式打卡考勤系统 &…

UE4_旋转节点总结一

一、Roll、Pitch、Yaw Roll 围绕X轴旋转 飞机的翻滚角 Pitch 围绕Y轴旋转 飞机的俯仰角 Yaw 围绕Z轴旋转 飞机的航向角 二、Get Forward Vector理解 测试: 运行: 三、Get Actor Rotation理解 运行效果: 拆分旋转体测试一&a…

警惕垃圾邮件,伪造法院传真传播Sodinokibi勒索病毒

Sodinokibi勒索病毒在国内首次被发现于2019年4月份,2019年5月24日首次在意大利被发现,在意大利被发现使用RDP攻击的方式进行传播感染,这款病毒被称为GandCrab勒索病毒的接班人,在GandCrab勒索病毒运营团队停止更新之后&#xff0c…