Python学习从0到1 day16 Python文件操作

2024新年快乐！！！今天是大年初三，祝大家万事胜意，一切都会好的，休息了一段时间，从今天开始继续学习~

——24.2.12

一、文件的编码

计算机只能识别0和1，那么我们丰富的文本文件是如何被计算机识别，并存储在硬盘中呢？

使用编码技术（密码本）将内容翻译成0和1存入

编码技术即：翻译的规则（密码本），记录了如何将内容翻译成二进制，以及如何将二进制翻译回可识别内容

计算机中有许多可用编码：

UTF-8

GBK

Big5等

不同的编码，将内容翻译成的二进制也是不同的

查看文件编码

我们可以使用Windows系统自带的记事本，打开文件后，即可看出文件的编码是什么

UTF-8是目前全球通用的编码格式

除非有特殊需求，否则，一律以UTF-8格式进行文件编码即可

总结

① 什么是编码？

编码就是一种规则集合，记录了内容和二进制之间进行相互转换的逻辑

编码有许多种，我们最常用的是UTF-8编码

②为什么需要使用编码？

计算机只认识0和1，所以需要将内容翻译成0和1才能保存在计算机中，

同时也需要编码，将计算机保存的0和1，反向翻译回可以识别的内容

什么是文件？

一篇文章、一段视频、一个可执行程序，都可以被保存为一个文件，并赋予一个文件名，操作系统以文件为单位管理磁盘中的数据，一般来说，文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别

文件操作包含哪些内容？

在日常生活中，文件操作主要包括打开、关闭、读、写等操作

文件操作三步走：

① 打开文件

② 读写文件

③ 关闭文件

注意：可以只打开和关闭文件，不进行任何读写

二、文件的读取

1.open()打开函数

在python中，使用open函数，可以打开一个已经存在的文件，或者创建一个新的文件，语法如下：

open(name,mode,encoding)

name：是要打开的目标文件名的字符串（可以包含文件所在的具体路径）

mode：设置打开文件的模式（访问模式）：只读、写入、追加等

encoding：编码格式（推荐使用UTF-8）

示例：

f = open('python.txt','r',encoding = "UTF-8")

注意：此时的'f'是'open'函数的文件对象，对象是python中一种特殊的数据类型、拥有属性和方法，可以使用对象，属性或对象，方法对其进行访问。

2.文件的三种常用基础访问模式

r：以只读方式打开文件，文件的指针将会放在文件的开头，这是默认模式

w：打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，原有内容会被删除，如果该文件不存在，创建新文件

a：打开一个文件用于追加，如果该文件已存在，新的内容将会被写入到已有内容之后，如果该文件不存在，创建新文件进行写入

3.读操作相关方法：

①read()方法：

文件对象.read(num)

num表示要从文件中读取的数据的长度（单位是字节），如果没有传入num，那么就表示读取文件中所有的数据

②readlines()方法：

readlines可以按照行的方式把整个文件中的内容进行一次性读取，并且返回的是一个列表，其中每一行的数据为一个元素

f = open('python.txt')

content = f.readlines()        #['hello world\n','abcdefg\n','aaa\n','bbb\n','ccc']

print(content)

f.close()        #关闭文件

③readline()方法：一次读取一行内容

f = open("python,txt","r")

content = f.readline()

print(f"第一行:{content}")

content = f.readline()

print(f"第二行:{content}")

content = f.readline()

print(f"第三行:{content}")

④for循环读取文件每一行

for line in f:

print(f"每一行：{line}")

⑤文件名.close()：关闭文件对象

f = open("python,txt","r")

f.close()

# 最后通过close，关闭文件对象，也就是关闭对文件的占用

# 如果不调用close，同时程序没有停止运行，那么这个文件将一直被python程序占用

⑥with open语法

with open("python.txt","r") as f:

f.readlines()

# 通过在with open的语句块中对文件进行操作

# 可以在操作完成后自动关闭close文件，避免遗忘掉close方法

代码展示

# 演示对文件的读取

# 打开文件
f = open("E:/test.txt","r",encoding='utf-8')
print(type(f))  # <class '_io.TextIOWrapper'>   文件对象

# 读取文件 - read()
# print(f"读取3个字节的结果：{f.read(3)}")
# print(f"读取全部内容的结果是:{f.read()}")
print("——————————————————————————————————")

# 读取文件 - readLines()
# 在打开文件后，都会从前一次文件操作的后续而存在读取
# lines = f.readlines()   #读取文件的全部行，封装到列表中
# print(f"lines对象的类型：{type(lines)}")
# print(f"lines对象的内容是:{lines}")

# 读取文件 - readLine()
# line1 = f.readline()
# line2 = f.readline()
# line3 = f.readline()
# print(f"第一行数据是:{line1}")
# print(f"第二行数据是:{line2}")
# print(f"第三行数据是:{line3}")

# for循环读取文件行    此方法最简单
# for line in f:
#     print(f"每一行数据是：{line}")
#
# 文件的关闭
f.close()

# with open 语法操作文件
with open("E:/test.txt","r",encoding='utf-8') as f:
    for line in f:
        print(f"每一行数据是:{line}")

因为文件操作会对下一次文件操作产生影响，所以在每次操作完后，我们都将这部分代码进行注释，以免影响后面的操作

4.操作汇总

5.课后练习：单词计数

通过Windows的文本编辑器软件，将如下内容，复制并保存到：word.txt，文件可以存储在任意位置

My favorite color is red.Many young people don’t like this color,because they think it is so obvious.Red makes me feel the vitality,when I dress in red,I look in good state.Every time when I see the red color,I will be attracted.My mother tells me that red color fits me a lot,she likes me in red

通过文件读取操作，读取此文件，统计red单词出现的次数

方式1：

# 打开文件，以读取模式打开
f = open("E:/word.txt","r",encoding="utf-8")

# 方式1：读取全部内容，通过字符串count方法统计itheima单词数量
content = f.read()
count = content.count("red")
print(f"这篇文档中有red单词：{count}个")



#关闭文件
f.close()

方式2：

# 打开文件，以读取模式打开
f = open("E:/word.txt","r",encoding="utf-8")

# 方式2：读取内容，一行一行读取

count = 0   #使用count变量来累计单词出现的次数
for line in f:
    # 去除开头和结尾的空格以及换行符
    line = line.strip()
    # 每个单词以空格分开
    words = line.split(" ")
    for word in words:
        if word == "red":
            count += 1

# 判断单词出现次数并累积
print(f"red单词出现的次数是:{count}")

#关闭文件
f.close()

注意：文件的读取会进行存储，下次打开文件会直接跳转到上次程序运行后的部分执行

三、文件的写入

案例演示：

# 1.打开文件

f = open('python.txt','w')

# 2.文件写入

f.write('hello world')

# 3.内容刷新

f.flush()

注意：

①直接调用write，内容并未真正写入文件，而是会积攒在程序的内存中，称之为缓冲区

②当调用flush的时候，内容会真正写入文件

③这样做是避免频繁的操作硬盘，导致效率下降（攒一堆，一次性写入磁盘）

# 演示文件的写入
import time

# 打开文件，不存在的文件，r,w,a
f = open("E:/FileOperation.txt","w",encoding="utf-8")

# write写入
f.write("hello world")  #文件不存在时，w方式会帮我们创建文件

# flush刷新
f.flush()

# close关闭
f.close()   # close方法，内置了flush函数，如果不

print("————————————————————————————————————")

# 打开一个存在的文件
f = open("E:/FileOperation.txt","w",encoding="utf-8")

# write写入、flush刷新
f.write("一切都会好的")
f.write("我一直相信")
f.flush()

#close关闭
f.close()

总结

1.写入文件使用open函数的“w”模式进行写入

2.写入的方法有：

write(),写入内容

flush(),刷新内容到磁盘中

3.注意事项：

w模式，文件不存在，会创建新文件

w模式，文件存在，会清空原有内容

close()方法，带有flush()方法的功能

四、文件的追加

案例演示：

# 1.打开文件

f = open('python.txt','a')

# 2.文件写入

f.write('hello world')

# 3.内容刷新

f.flush()

注意：

a模式，文件不存在会创建文件

a模式，文件存在会在最后，追加写入文件

# 演示文件的写入

# 打开文件，不存在的文件
f = open("E:/tst.txt","a",encoding="utf-8")

# write写入
f.write("苦难是花开的伏笔")

# flush刷新
f.write("\n一切都会好的")
f.flush()

# close关闭
f.close()

# 打开一个存在的文件
f = open("E:/tst.txt","a",encoding="utf-8")

# write写入、flush刷新
f.write("\n")
f.write("万事胜意，未来可期")
f.flush()

# close关闭
f.close()

总结

1.追加写入文件使用open函数的"a"模式进行写入

2.追加写入的方法有：

write()，写入内容

flush()，刷新内容到硬盘中

3.注意事项：

a模式，文件不存在，会创建新文件

a模式，文件存在，会在原有内容后面继续写入

可以使用"\n"来写出换行符

五、综合案例

需求：有一份账单文件，记录了消费收入的具体记录，内容如下：

name, date, money, type, remarks
周杰轮,2022-01-01,100000,消费,正式
周杰轮,2022-01-02,300000,收入,正式
周杰轮,2022-01-03,100000,消费,测试
林俊节,2022-01-01,300000,收入,正式
林俊节,2022-01-02,100000,消费,测试
林俊节,2022-01-03,100000,消费,正式
林俊节,2022-01-04,100000,消费,测试
林俊节,2022-01-05,500000,收入,正式
张学油,2022-01-01,100000,消费,正式
张学油,2022-01-02,500000,收入,正式
张学油,2022-01-03,900000,收入,测试
王力鸿,2022-01-01,500000,消费,正式
王力鸿,2022-01-02,300000,消费,测试
王力鸿,2022-01-03,950000,收入,正式
刘德滑,2022-01-01,300000,消费,测试
刘德滑,2022-01-02,100000,消费,正式
刘德滑,2022-01-03,300000,消费,正式

要求：

读取文件

将文件写出到bill.txt.bak文件作为备份

同时，将文件内标记为测试的数据行丢弃

实现思路：

①open和r模式打开一个文件对象，并读取文件

②open和w模式打开另一个文件对象，用于文件写出

③for循环内容，判断是否是测试，不是测试就write写出，是测试就continue跳过

④将2个文件对象都关闭close()

tips：

# 演示文件操作综合案例，文件备份

# 打开文件得到文件对象，准备读取
fr = open("E:/bill.txt","r",encoding="utf-8")

# 打开文件得到文件对象，准备写入
fw = open("E:/bill.txt.bak","w",encoding="utf-8")

# for循环读取文件
for line in fr:
    # 消除换行符
    line = line.strip()
    # 判断内容，将满足的内容写出
    if line.split(",")[4] == "测试":
        continue    # continue进入下一次循环，这一次后面的内容就跳过了
    # 将内容写出去
    fw.write(line)
    #由于前面对内容进行了strip()的操作，所以要手动的写出换行符
    fw.write("\n")

# close两个文件对象
fr.close()
fw.close()  # 写出文件调用close()会自动flush()