【6.1】文件操作
一、文件的编码
问题:计算机只能识别0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中的呢?
答:使用编码技术(密码本)将内容翻译成0和1存入。
编码技术即翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别的内容。
计算机中有许多可用编码:
- UTF-8;
- GBK;
- Big5,等等。
不同的编码,将内容翻译成的二进制也是不同的。所以,文件是以什么编码写入,就应以什么编码读取。
UTF-8是目前全球通用的编码格式,除非有特殊需求,否则一律以UTF-8格式进行文件编码即可。
二、文件的读取
(一)文件操作的应用
内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U盘等设备。为了便于数据的管理和检索,引入了“文件”的概念。
一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。
和我们平时对文件的基本操作一样,大概可以分为三个步骤:
1.打开文件;
2.读写文件(这一步也可以不做);
3.关闭文件。
(二)文件的打开、读取、关闭操作
(1)open()打开函数
在Python中,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下:
# 语法
open(name, mode, encoding)
name:是要打开的目标文件名的字符串(文件所在路径);
mode:设置打开文件的模式(访问模式),如只读、写入、追加等;
encoding:编码格式(推荐使用UTF-8)。
# 示例
f = open("python.txt", "r", encoding="UTF-8")
# 注:encoding的参数位置实际上不是顺序的第三位,所以不能用位置参数,应使用关键字参数直接指定
注意:此时的f
是open
函数的文件对象。对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性
或对象.方法
对其进行访问。
(2)mode常用的三种基础访问模式
(3)读操作相关方法
1.read()方法
# 语法
文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
示例:
f = open("python.txt", "r", encoding="UTF-8")
print(f"读取10个字节的结果是:\n{f.read(10)}")
print("------")
print(f"读取全部内容的结果是:\n{f.read()}")
输入结果如下:
读取10个字节的结果是:
床前明月光,
疑是地
------
读取全部内容的结果是:
上霜。
举头望明月,
低头思故乡。
注意:如果连续调用多次read
,那么下一个read函数会在上一个read函数读取的结尾处接着进行读取,而不是每次都从文件开头读取。对于readlines
、readline
函数也是相同的机制。
2.readlines()方法
f = open("python.txt", "r", encoding="UTF-8")
content = f.readlines()
print(content) # ['床前明月光,\n', '疑是地上霜。\n', '举头望明月,\n', '低头思故乡。']
f.close() # 关闭文件
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。
3.readline()方法
f = open("python.txt", "r", encoding="UTF-8")
content = f.readline()
print(f"第一行:{content}")
content = f.readline()
print(f"第二行:{content}")
f.close()
4.for循环读取文件行
for line in open("python.txt", "r", encoding="UTF-8"):
print(line)
(4)close()关闭文件对象
f = open("python.txt", "r", encoding="UTF-8")
f.close()
最后通过close关闭文件对象,也就是关闭对文件的占用。如果不调用close,并且程序没有停止运行,那么这个文件将一直被这个Python程序占用。(文件没有关闭,也就是文件一直处于打开状态,那么再对文件进行例如重命名、删除等操作就不能顺利进行了)
(5)with open()语法
with open("python.txt", "r", encoding="UTF-8") as f:
f.readlines()
通过在with open
的语句块中对文件进行操作。
可以在操作完成后自动close关闭文件,避免忘记手动close。
三、文件的写入
# 1.打开文件
f = open("python.txt", "w", encoding="UTF-8")
# 2.文件写入
f.write("hello world")
# 3.内容刷新
f.flush()
# 4.文件关闭
f.close()
注意:
1.调用write后,内容还尚未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区;
2.当调用flush后,内容才会真正写入文件;
3.采用缓冲区这样的机制,即攒一堆、一次性写入,是为了避免频繁的写入硬盘、导致效率下降。
4.close自带刷新功能。write之后不调用flush而直接close,也是可以将内容真正写入的。即,close方法自带flush的功能。
5.对于"w"
模式,若文件不存在,则会创建新文件;若文件存在,则会清空文件原有内容、重新写。
四、文件的追加
# 1.打开文件,使用a模式打开即可
f = open("python.txt", "a")
# 2.文件写入
f.write("hello world")
# 3.内容刷新
f.flush()
注意:
1.a模式,文件不存在,会创建文件;
2.a模式,文件存在,会在最后追加写入文件内容。