文件
概念
我们常见的txt,jpg,mp4等等都是文件,存储在硬盘中的内容,就是文件,而文件夹是一种特殊的文件——目录文件
路径
一层一层文件夹组成的字符串就是路径,每一个文件的路径都是唯一的,相当于身份证号,可以通过路径来找到一个文件在磁盘上的详细位置,进而就可以查看修改这个文件了
路径分为绝对路径和相对路径,绝对路径在win上以盘名开头,例如D:\qq\program\bin\qq.exe,而相对路径则是以其他文件所在的地址为开头,例如以bin为相对地址,那么qq.exe的相对路径就是.\qq.exe
打开文件
使用open()方法可以获取一个文件对象
打开方式有
- r 按照读的方式打开
- w 按照写的方式打开
- a 按照写的方式打开,把内容写到原有文件的末尾
f = open("路径","打开方式")
f = open("/Users/lixiao/Downloads/IMG_1637.jpg","r")
如果文件路径不对或者文件不存在,就会抛出异常
需要注意的是,文件打开操作后一定要进行关闭,否则会造成内存资源泄露
f.close()
因此,python为了防止这种情况,我们的文件打开的个数是有限的,在打开一定数量的文件后,系统将会报错。系统中也可以通过一些配置项来修改最大打开文件的个数
大家可以用下面这个代码来试试自己的电脑最多打开多少个文件
count = 0
flist = []
while True:
f = open("/Users/lixiao/Downloads/IMG_1637.jpg", "r")
flist.append(f)
count += 1
print(count)
如果我们没有把打开的文件放到列表中,那么事实上这个数字将会一直增大,这是因为我们的python为了防止有些程序员忘记释放文件,而有的垃圾回收机制——自动将不使用的变量释放
写文件
使用“w”方式打开文件,使用write方法进行写入
f = open("/Users/lixiao/test.txt", "w")
f.write("hello")
f.close()
而如果我们不想破坏文件中的内容,将写的内容追加到原文件的后面,就需要用到a方式打开
如果文件对象已经关闭,那么就不能对文件内容进行更改,否则会抛出异常
读文件
使用r方式打开文件,然后使用read()方法可以取出文件的内容,如果传参就代表读几个字节
f = open("/Users/lixiao/test.txt", "r")
print(f.read())
f.close()
由于有多个版本的编码方式,因此如果我们要读有中文的文件,那么就不能使用python默认的gdk编码,而是要用utf-8
在打开文件时,可以使用encoding来设置字符编码
f = open("/Users/lixiao/test.txt", "r", encoding='utf8')
print(f.read())
f.close()
可以使用for循环来读取文件中的每一行
f = open("/Users/lixiao/test.txt", "r", encoding="utf8")
print(f.read())
for line in f:
print(line)
f.close()
如果我们不想要print函数的结尾自动换行,那么可以设置end参数为“”
f = open("/Users/lixiao/test.txt", "r", encoding="utf8")
print(f.read())
for line in f:
print(line, end="")
f.close()
还可以使用readlines()来读取文件所有的内容,结果是一个列表,其元素是文件的每一行内容
f = open("/Users/lixiao/test.txt", "r", encoding="utf8")
flines = f.readlines()
print(flines)
f.close()
readlines相当于一次将文件内容全部读取,而for循环遍历则是一行一行的读取文件内容,因此只要不是特别大的文件,一般来说readlines要比for循环读文件更加高效
上下文管理器
上下文管理器是为了防止我们代码结构复杂而忘记关闭文件的
在java中,我们使用try(文件),可以实现文件的自动关闭
def func():
with open("/Users/lixiao/test.txt", "r", encoding="utf8") as f:
# 处理文件
return
func()
当with对应的代码块执行完毕后,就会自动的执行close了