2024新年快乐!!! 今天是大年初三,祝大家万事胜意,一切都会好的,休息了一段时间,从今天开始继续学习~
——24.2.12
一、文件的编码
计算机只能识别0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中呢?
使用编码技术(密码本)将内容翻译成0和1存入
编码技术即:翻译的规则(密码本),记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容
计算机中有许多可用编码:
UTF-8
GBK
Big5等
不同的编码,将内容翻译成的二进制也是不同的
查看文件编码
我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么
UTF-8是目前全球通用的编码格式
除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可
总结
① 什么是编码?
编码就是一种规则集合,记录了内容和二进制之间进行相互转换的逻辑
编码有许多种,我们最常用的是UTF-8编码
②为什么需要使用编码?
计算机只认识0和1,所以需要将内容翻译成0和1才能保存在计算机中,
同时也需要编码,将计算机保存的0和1,反向翻译回可以识别的内容
什么是文件?
一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名,操作系统以文件为单位管理磁盘中的数据,一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别
文件操作包含哪些内容?
在日常生活中,文件操作主要包括打开、关闭、读、写等操作
文件操作三步走:
① 打开文件
② 读写文件
③ 关闭文件
注意:可以只打开和关闭文件,不进行任何读写
二、文件的读取
1.open()打开函数
在python中,使用open函数,可以打开一个已经存在的文件,或者创建一个新的文件,语法如下:
open(name,mode,encoding)
name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)
mode:设置打开文件的模式(访问模式):只读、写入、追加等
encoding:编码格式(推荐使用UTF-8)
示例:
f = open('python.txt','r',encoding = "UTF-8")
注意:此时的'f'是'open'函数的文件对象,对象是python中一种特殊的数据类型、拥有属性和方法,可以使用对象,属性或对象,方法对其进行访问。
2.文件的三种常用基础访问模式
r:以只读方式打开文件,文件的指针将会放在文件的开头,这是默认模式
w:打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除,如果该文件不存在,创建新文件
a:打开一个文件用于追加,如果该文件已存在,新的内容将会被写入到已有内容之后,如果该文件不存在,创建新文件进行写入
3.读操作相关方法:
①read()方法:
文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据
②readlines()方法:
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素
f = open('python.txt')
content = f.readlines() #['hello world\n','abcdefg\n','aaa\n','bbb\n','ccc']
print(content)
f.close() #关闭文件
③readline()方法:一次读取一行内容
f = open("python,txt","r")
content = f.readline()
print(f"第一行:{content}")
content = f.readline()
print(f"第二行:{content}")
content = f.readline()
print(f"第三行:{content}")
④for循环读取文件每一行
for line in f:
print(f"每一行:{line}")
⑤文件名.close():关闭文件对象
f = open("python,txt","r")
f.close()
# 最后通过close,关闭文件对象,也就是关闭对文件的占用
# 如果不调用close,同时程序没有停止运行,那么这个文件将一直被python程序占用
⑥with open语法
with open("python.txt","r") as f:
f.readlines()
# 通过在with open的语句块中对文件进行操作
# 可以在操作完成后自动关闭close文件,避免遗忘掉close方法
代码展示
# 演示对文件的读取
# 打开文件
f = open("E:/test.txt","r",encoding='utf-8')
print(type(f)) # <class '_io.TextIOWrapper'> 文件对象
# 读取文件 - read()
# print(f"读取3个字节的结果:{f.read(3)}")
# print(f"读取全部内容的结果是:{f.read()}")
print("——————————————————————————————————")
# 读取文件 - readLines()
# 在打开文件后,都会从前一次文件操作的后续而存在读取
# lines = f.readlines() #读取文件的全部行,封装到列表中
# print(f"lines对象的类型:{type(lines)}")
# print(f"lines对象的内容是:{lines}")
# 读取文件 - readLine()
# line1 = f.readline()
# line2 = f.readline()
# line3 = f.readline()
# print(f"第一行数据是:{line1}")
# print(f"第二行数据是:{line2}")
# print(f"第三行数据是:{line3}")
# for循环读取文件行 此方法最简单
# for line in f:
# print(f"每一行数据是:{line}")
#
# 文件的关闭
f.close()
# with open 语法操作文件
with open("E:/test.txt","r",encoding='utf-8') as f:
for line in f:
print(f"每一行数据是:{line}")
因为文件操作会对下一次文件操作产生影响,所以在每次操作完后,我们都将这部分代码进行注释,以免影响后面的操作
4.操作汇总
5.课后练习:单词计数
通过Windows的文本编辑器软件,将如下内容,复制并保存到:word.txt,文件可以存储在任意位置
My favorite color is red.Many young people don’t like this color,because they think it is so obvious.Red makes me feel the vitality,when I dress in red,I look in good state.Every time when I see the red color,I will be attracted.My mother tells me that red color fits me a lot,she likes me in red
通过文件读取操作,读取此文件,统计red单词出现的次数
方式1:
# 打开文件,以读取模式打开
f = open("E:/word.txt","r",encoding="utf-8")
# 方式1:读取全部内容,通过字符串count方法统计itheima单词数量
content = f.read()
count = content.count("red")
print(f"这篇文档中有red单词:{count}个")
#关闭文件
f.close()
方式2:
# 打开文件,以读取模式打开
f = open("E:/word.txt","r",encoding="utf-8")
# 方式2:读取内容,一行一行读取
count = 0 #使用count变量来累计单词出现的次数
for line in f:
# 去除开头和结尾的空格以及换行符
line = line.strip()
# 每个单词以空格分开
words = line.split(" ")
for word in words:
if word == "red":
count += 1
# 判断单词出现次数并累积
print(f"red单词出现的次数是:{count}")
#关闭文件
f.close()
注意:文件的读取会进行存储,下次打开文件会直接跳转到上次程序运行后的部分执行
三、文件的写入
案例演示:
# 1.打开文件
f = open('python.txt','w')
# 2.文件写入
f.write('hello world')
# 3.内容刷新
f.flush()
注意:
①直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
②当调用flush的时候,内容会真正写入文件
③这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写入磁盘)
# 演示文件的写入
import time
# 打开文件,不存在的文件,r,w,a
f = open("E:/FileOperation.txt","w",encoding="utf-8")
# write写入
f.write("hello world") #文件不存在时,w方式会帮我们创建文件
# flush刷新
f.flush()
# close关闭
f.close() # close方法,内置了flush函数,如果不
print("————————————————————————————————————")
# 打开一个存在的文件
f = open("E:/FileOperation.txt","w",encoding="utf-8")
# write写入、flush刷新
f.write("一切都会好的")
f.write("我一直相信")
f.flush()
#close关闭
f.close()
总结
1.写入文件使用open函数的“w”模式进行写入
2.写入的方法有:
write(),写入内容
flush(),刷新内容到磁盘中
3.注意事项:
w模式,文件不存在,会创建新文件
w模式,文件存在,会清空原有内容
close()方法,带有flush()方法的功能
四、文件的追加
案例演示:
# 1.打开文件
f = open('python.txt','a')
# 2.文件写入
f.write('hello world')
# 3.内容刷新
f.flush()
注意:
a模式,文件不存在会创建文件
a模式,文件存在会在最后,追加写入文件
# 演示文件的写入
# 打开文件,不存在的文件
f = open("E:/tst.txt","a",encoding="utf-8")
# write写入
f.write("苦难是花开的伏笔")
# flush刷新
f.write("\n一切都会好的")
f.flush()
# close关闭
f.close()
# 打开一个存在的文件
f = open("E:/tst.txt","a",encoding="utf-8")
# write写入、flush刷新
f.write("\n")
f.write("万事胜意,未来可期")
f.flush()
# close关闭
f.close()
总结
1.追加写入文件使用open函数的"a"模式进行写入
2.追加写入的方法有:
write(),写入内容
flush(),刷新内容到硬盘中
3.注意事项:
a模式,文件不存在,会创建新文件
a模式,文件存在,会在原有内容后面继续写入
可以使用"\n"来写出换行符
五、综合案例
需求:有一份账单文件,记录了消费收入的具体记录,内容如下:
name, date, money, type, remarks
周杰轮,2022-01-01,100000,消费,正式
周杰轮,2022-01-02,300000,收入,正式
周杰轮,2022-01-03,100000,消费,测试
林俊节,2022-01-01,300000,收入,正式
林俊节,2022-01-02,100000,消费,测试
林俊节,2022-01-03,100000,消费,正式
林俊节,2022-01-04,100000,消费,测试
林俊节,2022-01-05,500000,收入,正式
张学油,2022-01-01,100000,消费,正式
张学油,2022-01-02,500000,收入,正式
张学油,2022-01-03,900000,收入,测试
王力鸿,2022-01-01,500000,消费,正式
王力鸿,2022-01-02,300000,消费,测试
王力鸿,2022-01-03,950000,收入,正式
刘德滑,2022-01-01,300000,消费,测试
刘德滑,2022-01-02,100000,消费,正式
刘德滑,2022-01-03,300000,消费,正式
要求:
读取文件
将文件写出到bill.txt.bak文件作为备份
同时,将文件内标记为测试的数据行丢弃
实现思路:
①open和r模式打开一个文件对象,并读取文件
②open和w模式打开另一个文件对象,用于文件写出
③for循环内容,判断是否是测试,不是测试就write写出,是测试就continue跳过
④将2个文件对象都关闭close()
tips:
# 演示文件操作综合案例,文件备份
# 打开文件得到文件对象,准备读取
fr = open("E:/bill.txt","r",encoding="utf-8")
# 打开文件得到文件对象,准备写入
fw = open("E:/bill.txt.bak","w",encoding="utf-8")
# for循环读取文件
for line in fr:
# 消除换行符
line = line.strip()
# 判断内容,将满足的内容写出
if line.split(",")[4] == "测试":
continue # continue进入下一次循环,这一次后面的内容就跳过了
# 将内容写出去
fw.write(line)
#由于前面对内容进行了strip()的操作,所以要手动的写出换行符
fw.write("\n")
# close两个文件对象
fr.close()
fw.close() # 写出文件调用close()会自动flush()