python学习之旅(六)
👍基础语法部分笔记(一)
👍条件判断部分笔记(二)
👍循环语句部分笔记(三)
👍函数使用部分笔记(四)
👍数据容器部分笔记(五)
👍文件操作部分笔记(六)
一.文件编码
编码就是一种规则集合,记录了内容和二进制间进行相互转换的逻辑。
-
思考:计算机只能识别0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中呢?
-
答案:使用编码技术(密码本)将内容翻译成0和1存入。
-
计算机中有许多可用编码:
UTF-8
,GBK
,Big5
等不同的编码,将内容翻译成二进制也是不同的 -
对内容的编码与解码必须使用同一套编码,否则会导致错误的结果
- UTF-8是目前全球通用的编码格式,除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。
二.文件操作
在日常生活中,文件操作主要包括打开、关闭、读、写等操作
(1) 文件的打开
(1.1) 基本格式
- 在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件
- 基本语法:
open(name, mode, encoding)
# name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
# mode:设置打开文件的模式(访问模式):只读、写入、追加等。
# encoding:编码格式(推荐使用UTF-8)
- 示例代码:
f = open("C:/code/bill.txt", "r", encoding="UTF-8")
# encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定
# f是open函数的文件对象,可以使用对象.属性或对象.方法对其进行访问
(1.2) 打开模式
-
文件常用的三种基础访问模式,可通过mode指定。
-
r
->read
(读取),w
->write
(写入),a
->append
(追加)
模式 | 描述 |
---|---|
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。如果该文件不存在,创建新文件。 |
a | 打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。 如果该文件不存在,创建新文件进行写入。 |
(2) 文件的读取
操作 | 功能 |
---|---|
文件对象.read(num) | 读取指定长度字节 不指定num读取文件全部 |
文件对象.readline() | 读取一行 |
文件对象.readlines() | 读取全部行,返回列表 |
for line in 文件对象 | for循环文件行,一次循环得到一行数据 |
文件对象.close() | 关闭文件对象 |
with open() as f | 通过with open语法打开文件,可以自动关闭 |
- 每次读取会从上一次读取结束的位置开始
- 每次open()中的内容只能被读取一次
(2.1) read方法
-
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
-
语法:
文件对象.read(num)
-
使用示例:
f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.read() # 不传入num,读取文件中所有的数据。
print(content)
# 打印
# 观止
# study
f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.read(2) # 传入num,读取2字节长度数据。
print(content)
# 打印
# 观止
(2.2) readline()方法
-
一次读取一行内容
-
语法:
文件对象.readline()
-
使用示例:
f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.readline()
print(f"第一行内容:{content}") # 打印 第一行内容:观止
content = f.readline()
print(f"第二行内容:{content}") # 打印 第二行内容:study
(2.3) readlines方法
-
按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。
-
语法:
文件对象.readlines()
-
使用示例:
f = open("C:/code/test.txt", "r", encoding="UTF-8")
content = f.readlines()
print(content) # 打印 ['观止\n', 'study']
print(type(content)) # 打印 <class 'list'>
(2.4) for循环读取
- for循环读取每一行数据
- 使用示例:
# 每一个line临时变量,就记录了文件的一行数据
for line in open("C:/code/test.txt", "r", encoding="UTF-8"):
print(line)
# 打印
# 观止
#
# study
(2.5) close关闭文件对象
-
如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用,无法操作
-
使用示例:
f = open("C:/code/test.txt", "r", encoding="UTF-8")
# 需要执行代码
f.close()
- 代码中不关闭文件对象,且python程序未停止运行,无法对文件删除重命名等操作:
(2.6) 自动close
- 通过在with open的语句块中对文件进行操作,可以在操作完成后自动关闭close文件
- 语法:
with open() as f
- 使用示例:
with open("C:/code/test.txt", "r", encoding="UTF-8") as f:
f.readlines()
(3) 文件的写入
- 使用示例:
f = open("C:/code/test.txt", "w")
# 文件如果不存在,使用”w”模式,会创建新文件
# 文件如果存在,使用”w”模式,会将原有内容清空
# 2.文件写入
f.write('hello world')
# 3. 内容刷新
f.flush()
- 直接调用
write
,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区 - 当调用
flush
的时候,内容会真正写入文件- close()方法,附带flush()方法的功能
- 这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
(4) 文件的追加
-
使用
w
模式,每次写入会将原有内容清空,写入新内容 -
使用
a
模式,文件不存在会创建文件,文件存在会在最后追加内容写入文件 -
使用示例:
f = open("C:/code/test.txt", "a")
# 2.文件写入
f.write('study')
# 3. 内容刷新
f.flush()