对以下路径中的文件名批量修改。
一、读取指定路径中的文件名
#导入标准库
import os
#读取文件名
filesDir = "路径……"
fileNameList = os.listdir(filesDir)
#输出路径中的所有文件
for filename in fileNameList:
print(filename)
二、正则表达式提取需要保留的部分
1、介绍re库
这里需要导入re库,re库主要是Python的标准库,主要用于字符串匹配。
函数名称 | 作用 | 返回类型 |
re.findall() | 搜索并返回所有能匹配到的子串 | 列表类型 |
re.match() | 从字符串的开头进行匹配 | match对象 |
re.search() | 搜索匹配到的第一个位置 | match对象 |
re.split() | 将字符串按匹配结果进行分割 | 列表类型 |
re.finditer() | 搜索返回匹配结果的迭代类型 | match对象 |
re.sub() | 在字符串中替换所有匹配正则表达式的子串 ,返回替换后的字符串 | 字符串 |
2、re库中函数的用法
(1)re.findall() #最常用
第一个参数为匹配的正则表达式,第二个参数为要搜索的字符串。
import re
#搜索所有的五位数字
ls = re.findall(r'[1-9]\d{5}','BIT100081 TUS444567')
print(ls)
['100081', '444567']
(2)re.sub(pattern,repl,string,count)
参数 | 作用 |
pattern | 正则表达式 |
repl | 替换匹配字符串的字符串 |
string | 匹配字符串 |
count | 最大替换次数 |
re库的具体用法,读者自己探索,由于字符串的复杂程度不同,正则表达式的用法不同。详情可以仔细研究官网或者菜鸟教程:Python3 正则表达式 。
3、例子说明
-
以本例子说明,这几个文件名的相同部分,都有括号,所以先写匹配括号的正则表达式。
-
re库中compile方法 可以返回一个正则表达式的截取规则。其中(.*?)表示任意字符出现任意次。
# 正则表达式提取需要保留的部分,,,,主要匹配删除括号的内容
rules = re.compile(r'[(](.*?)[)]', re.S)
- 这样就把括号以及括号中的内容删除掉了。
- 要记住compile里传进去的一定是一个字符串,前面 r 是防止转义字符。测试一下是否匹配,避免出现错误。
# 正则表达式提取需要保留的部分,,,,主要匹配删除括号的内容
rules = re.compile(r'[(](.*?)[)]', re.S)
#开始数组循环更改文件名
for filename in fileNameList:
print("旧的名字是:\t"+filename)
print("开始截取!")
newFilename = re.sub(rules,'',str(filename))
#输出保留的内容
print("新名字是:\t"+newFilename)
print("\n\n")
三、正式更改文件名
1、用 os库里的rename方法
os.rename(os.path.join(filesDir, filename), os.path.join(filesDir, newFilename))
2、测试是否正确
注: 不同的文件名,有不同的使用正则表达式的方式,还是具体问题具体分析。
#开始数组循环更改文件名
for filename in fileNameList:
print("旧的名字是:\t"+filename)
print("开始截取!")
newFilename = re.sub(rules,'',str(filename))
#输出保留的内容
print("新名字是:\t"+newFilename)
print("开始改名。。。")
os.rename(os.path.join(filesDir, filename), os.path.join(filesDir, newFilename))
print("改名完毕!")
print("======================================================================================")
3、其他的匹配情况
(1)匹配文件名序号
#删除重复的文件名序号
rules = re.compile(r'^\d', re.S)
-
如果文件名有两个序号,并且重复,即可使用此功能,像此案例就不可以使用,因为两个序号不相同。
-
如果文件不超过0-9,运行一次即可;但是超过10-99,可以在运行一次;如果序号为三位,可以运行第三次。
-
\d 等价于 [0-9]。
(2)匹配特殊字符
#删除文件名前的特殊字符,如果是"."删除".",如果是"#"删除"#"
rules = re.compile(r'^\.', re.S)
- 注: 匹配的时候要注意,这个特殊符号所在的位置;如果在开头,要按添加 ^ 符号;如果在其他位置,则要注意,如果删除的是点 . ,后缀名中的点也要注意。这时就要一开始删除后缀名,在完成更改时再添加上指定的后缀名。
(3)删除字符串中的指定的部分
# 正则表达式删除指定的的部分
rules = re.compile(r'Swagger-[0-9][0-9]:', re.S)
- 注: 正则表达式里指定的部分,建议复制粘贴,避免中间空格。
(4)最后一步添加后缀名
# 可以为文件名添加后缀,,,本质为在最后匹配的字符串最后增加一个部分,可以为数字,也可以为文件后缀
newFilename = newFilename + ".mp4"
四、完整代码
import os
import re
#读取文件名
filesDir = "E:/学习整理/14 Video/30 万物皆可运维"
fileNameList = os.listdir(filesDir)
#输出路径中的所有文件
for filename in fileNameList:
print(filename)
# 正则表达式提取需要保留的部分,,,,主要匹配删除括号的内容
rules = re.compile(r'[(](.*?)[)]', re.S)
# 正则表达式删除指定的的部分
# rules = re.compile(r'Swagger-[0-9][0-9]:', re.S)
#删除重复的文件名序号
# rules = re.compile(r'^\d', re.S)
#删除文件名前的特殊字符,如果是"."删除".",如果是"#"删除"#"
# rules = re.compile(r'^\.', re.S)
#开始数组循环更改文件名
for filename in fileNameList:
print("旧的名字是:\t"+filename)
print("开始截取!")
newFilename = re.sub(rules,'',str(filename))
#输出保留的内容
print("新名字是:\t"+newFilename)
print("开始改名。。。")
# 可以为文件名添加后缀,,,本质为在最后匹配的字符串最后增加一个部分,可以为数字,也可以为文件后缀
# newFilename = newFilename + ".mp4"
os.rename(os.path.join(filesDir, filename), os.path.join(filesDir, newFilename))
print("改名完毕!")
print("======================================================================================")