前言
之前介绍Python的 pathlib 模块可以有效的路径及文件查找等方便操作,本篇介绍一个相对 readlines() 获取文件内容更高效的用法
fileinput模块
对一个或者多个文件的内容迭代遍历(类似文件操作的readlines()),但是返回的是
迭代对象
,而不是一次性返回所有的文件内容行记录。
1、用法介绍
fileinput.input(files=None, inplace=False, backup='', *, mode='r', openhook=None, encoding=None, errors=None)
- files 是要操作的文件列表,多文件格式为 [‘f1.txt’, ‘f2.txt’],
默认是标准输入
- inplace 是否将处理的结果
写回文件
,默认是不写回 - backup 是否开启备份,开启的时候,只需要
指定备份的扩展名即可
,如果备份已经存在则会覆盖 - mode 读写的模式,默认是只读
- encoding 文件编码
2、常用到的函数
- fileinput.input() 返回迭代对象,使用for循环读取。可以配合 with 使用
- fileinput.filename() 返回当前文件名称
- fileinput.lineno() 返回当前已经读取的
行的数量
注意和 filelineno的区别 - fileinput.filelineno() 返回单签读取的行的行号
- fileinput.isfirstline() 检查单签行是否是文件的第一行
- fileinput.isstdin() 判断
最后一行
是否从标准stdin中读取 - fileinput.close() 关闭文件,配置with使用的时候,不需要显著关闭
3、案例demo
3.1、 基于标准输入和命令行文件参数
#!/usr/bin/env python
# encoding: utf-8
#
import fileinput
def demo1():
"""演示基于标准输入"""
print("文件名| 文件行号|文件行内容")
for line in fileinput.input():
print(f"{fileinput.filename()}| {fileinput.filelineno()} | {line}")
print(f"文件共有 {fileinput.lineno()} 行")
if __name__ == '__main__':
demo1()
命令行不加任何参数,表示从标准输入 stdin 获取信息
命令行有参数(文件)则读取文件内容
3.2、修改多个文件,并回写
到源文件
def demo2():
"""
演示多文件操作,并原地修改(写回当前文件)
"""
# 直接传参
# for line in fileinput.input(['fi_1.txt', 'fi_2.txt'], inplace=1):
# 从命令行读取(标准输入)
for line in fileinput.input(inplace=1):
print(line.strip() + ' -> 我是回写')
3.3、文件内容替换,并备份原文件
def demo3():
"""实现源文件的内容替换,并实现备份"""
for line in fileinput.input('1209_demo.txt', backup=".bak", inplace=1):
print(line.rstrip().replace('Python', 'Django'))
执行脚本之后,发现 1209_demo.txt 文件中第一行的Python
变成了Django
# python demo_fileinput.py
# cat 1209_demo.txt
hello Django in line one
3.4、利用``fileinput + re` 实现邮箱提取
def demo4():
pattern = "[a-zA-Z0-9]{3,9}@126.com"
for line in fileinput.input("1209_demo.txt"):
if re.search(pattern, line):
print("Email: ", line)
执行脚本之后
# python demo_fileinput.py
Email: lkjdlafje@126.com
Email: ouiolj303@126.com
Demo演示就到这里,通过案例学习它的方法怎么用,然后具体结合自己业务就好。
有问题,欢迎交流 ~
原文地址 Python模块fileinput操作文件和目录操作总结