Python基础教程:第八章_Python文件操作

news2024/11/17 3:51:17

文件的编码

学习目标  

  • 掌握文件编码的概念和常见编码

思考:计算机只能识别:0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中呢?

答案:使用编码技术(密码本)将内容翻译成0和1存入。

举个例子,假设我们有一句话“我喜欢你”,计算机无法直接理解其含义。为了让计算机处理这句话,我们需要使用编码技术,也就是把每个字符转换成对应的二进制编码。例如,我对应的二进制编码是1011,喜对应1101,欢对应1111,你对应1001。因此,我们可以使用这些二进制编码来直接翻译出完整的句子。

编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。

计算机中有许多可用编码:

  • UTF-8

  • GBK

  • Big5

每种编码技术都有自己的“密码本”,即将字符映射为对应的二进制编码的规则。例如,在UTF-8编码中,“我”对应的二进制编码可能是1011,但如果使用Big5编码,它可能会变成1101。因此,在不同的编码技术中,字符的二进制编码规则也是不同的。

编码有许多,所以要使用正确的编码,才能对文件进行正确的读写操作。

 

 

如上,如果你给喜欢的女孩发送文件,使用编码A进行编码(内容转二进制)。

女孩使用编码B打开文件进行解码(二进制反转回内容) 自求多福吧。

查看文件编码

我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么:

 

UTF-8是目前全球通用的编码格式,事实上,现如今电脑默认使用UTF-8进行操作,因此我们通常不需要过多关注编码问题。只有在我们需要主动选择或确认编码时才需要考虑这个问题。通常99.999%的情况下,我们都可以使用UTF-8编码。

文件的读取

学习目标

  • 了解文件操作的作用

  • 掌握文件的打开、读取、关闭操作

什么是文件

内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U 盘等设备。为了便于数据的管理和检索,引入了“文件”的概念。

一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。

那么,当我们在电脑上打开文件管理器时,我们会看到许多的文件,除了文件夹以外,几乎所有的内容都是文件。文件的概念相对简单,但如果我们想要对文件进行操作,我们需要了解一些基本的操作内容。

文件操作包含哪些内容呢?

在我们平时操作电脑时,我们通常会双击鼠标左键打开文件,或者点击文件窗口右上角的关闭按钮关闭文件。同时,我们还需要读取文件的内容、查看文件的信息,或者编辑并保存修改后的文件。

在日常生活中,文件操作主要包括打开、关闭、读、写等操作。

 

 

 

文件的操作步骤

如果我们想用Python操作文件,大概可以分为三个步骤(简称文件操作三步走):

①打开文件

②读写文件  

③关闭文件

注意:可以只打开和关闭文件,不进行任何读写

open()打开函数

首先,我们需要使用Python内置的open函数来打开文件,无论是打开已经存在的文件还是创建一个新文件。这个函数的语法相对简单,主要需要传入3个参数:文件名、模式和编码方式。

语法如下

 
 

open(name, mode, encoding)

name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。

mode:设置打开文件的模式(访问模式):只读、写入、追加等。

encoding:编码格式(推荐使用UTF-8) 示例代码:

 
 

f = open('python.txt', 'r', encoding=”UTF-8)
# encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定

注意:此时的f是open函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问,后续面向对象课程会给大家进行详细的介绍。

因此,我们现在暂且不需要深究这个返回值f具体表示的是什么,我们只需要知道这个f变量中包含了各种我们可以使用的方法即可。就和前面我们学习数据容器的时候,list中有append、extend等许多可用的方法一样,这个文件对象也会包含大量可供使用的方法。

mode常用的三种基础访问模式

模式

描述

r

以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

w

打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。
如果该文件不存在,创建新文件。

a

打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。
如果该文件不存在,创建新文件进行写入。

好,那关于 w 和 a 模式,我们在后边进行详细的讲解,在当前视频我们主要研究 r 模式,也就是文件的读取操作。

读操作相关方法

read()方法:

 
 

文件对象.read(num)

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

readlines()方法:

readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。

 
 

f = open('python.txt')
content = f.readlines()
# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)
# 关闭文件
f.close()

readline()方法:

一次读取一行内容,每次调用该函数,它便会读取一行;连续调用该函数,则会依次读取下一行。

 
 

f = open('python.txt')
content = f.readline()
print(f'第一行:{content}')
content = f.readline()
print(f'第二行:{content}')
# 关闭文件
f.close()

for循环读取文件行:

每一次循环就可以得到一个 line 的临时变量,那这个临时变量就记录了文件中的每一行数据。

 
 

for line in open("python.txt", "r"):
print(line)
# 每一个line临时变量,就记录了文件的一行数据

close() 关闭文件对象

关闭文件的操作也很简单。我们只需调用文件对象的 close() 方法即可将其关闭。为什么我们需要关闭文件呢?因为如果我们的程序没有关闭文件,那么它就会一直占用该文件,导致其无法被其他程序使用。因此,在 Python 程序运行期间,一定要记得关闭文件。

 
 

f = open("python.txt", "r")
f.close()
# 最后通过close,关闭文件对象,也就是关闭对文件的占用
# 如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用。

with open 语法

通过这种写法,我们可以帮助我们自动的完成对文件的close

 
 

with open("python.txt", "r") as f:
f.readlines()
# 通过在with open的语句块中对文件进行操作
# 可以在操作完成后自动关闭close文件,避免遗忘掉close方法

操作汇总

操作

功能

文件对象 = open(file, mode, encoding)

打开文件获得文件对象

文件对象.read(num)

读取指定长度字节不指定num读取文件全部

文件对象.readline()

读取一行

文件对象.readlines()

读取全部行,得到列表

for line in 文件对象

for循环文件行,一次循环得到一行数据

文件对象.close()

关闭文件对象

with open() as f

通过with open语法打开文件,可以自动关闭

课后练习:单词计数

通过Windows的文本编辑器软件,将如下内容,复制并保存到:word.txt,文件可以存储在任意位置

itheima itcast python

itheima python itcast

beijing shanghai itheima

shenzhen guangzhou itheima

wuhan hangzhou itheima

zhengzhou bigdata itheima

通过文件读取操作,读取此文件,统计itheima单词出现的次数

 
 

with open('word.txt', 'r', encoding='utf-8') as f:
content = f.read()

words = content.split() # 将文本根据空格分割成单词列表

count = 0
for word in words:
if word == 'itheima':
count += 1

print(f'itheima出现的次数为:{count}')

文件的写入

在前面的学习中,我们已经掌握了文件的打开和关闭方法,以及文件的读取操作。现在,我们只需要了解如何调用写入方法,将内容写入到文件中即可。这个写入操作非常简单,我们只需要使用一个方法:write()。

通过调用 write() 方法并指定我们想要写入的内容,就可以将我们的内容写入到文件中去。

案例演示:

 
 

# 1. 打开文件
f = open('python.txt', 'w')
# 2.文件写入
f.write('hello world')
# 3. 内容刷新
f.flush()

注意:

  • 直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区

  • 当调用flush的时候,内容会真正写入文件

  • 这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)

通过这两个方法的搭配使用,我们就可以完成写入操作。

需要注意的是,在 "w" 模式下,如果文件不存在,Python 会自动创建文件。如果文件已经存在,则会清空文件中原有的内容。请注意这个功能,确保在使用 "w" 模式时了解这一点。

最后,我们需要记得使用 close() 方法关闭文件。有时候,关闭文件后它会自动执行 flush() 方法,因此你不需要手动执行。

文件的追加

追加写入操作快速入门

今天我们将学习关于文件追加的操作。其实,文件追加操作和文件写入操作非常类似。我们只需要将文件的打开模式从 “w” 模式改为 “a” 模式即可。其他的操作方法,如 write() 方法、flush() 方法和 close() 方法都是相同的,我们不需要做出任何改变。案例演示:

 
 

# 1. 打开文件,通过a模式打开即可
f = open('python.txt', 'a')
# 2.文件写入
f.write('hello world')
# 3. 内容刷新
f.flush()

需要注意的是,在 “a” 模式下,如果文件不存在,Python 也会自动创建文件。如果文件已经存在,Python 将会在文件的末尾进行追加。这是和 “w” 模式最大的不同点。

文件操作综合案例

学习目标

  • 完成文件备份案例

需求分析

需求:有一份账单文件,记录了消费收入的具体记录,内容如下:

name,date,money,type,remarks

周杰轮,2022-01-01,100000,消费,正式

周杰轮,2022-01-02,300000,收入,正式

周杰轮,2022-01-03,100000,消费,测试

林俊节,2022-01-01,300000,收入,正式

林俊节,2022-01-02,100000,消费,测试

林俊节,2022-01-03,100000,消费,正式

林俊节,2022-01-04,100000,消费,测试

林俊节,2022-01-05,500000,收入,正式

张学油,2022-01-01,100000,消费,正式

张学油,2022-01-02,500000,收入,正式

张学油,2022-01-03,900000,收入,测试

王力鸿,2022-01-01,500000,消费,正式

王力鸿,2022-01-02,300000,消费,测试

王力鸿,2022-01-03,950000,收入,正式

刘德滑,2022-01-01,300000,消费,测试

刘德滑,2022-01-02,100000,消费,正式

刘德滑,2022-01-03,300000,消费,正式

同学们可以将内容复制并保存为 bill.txt文件

实现步骤:我们现在要做的就是:

  • 读取文件

  • 将文件写出到bill.txt.bak文件作为备份

  • 同时,将文件内标记为测试的数据行丢弃

实现思路:

  • open和r模式打开一个文件对象,并读取文件

  • open和w模式打开另一个文件对象,用于文件写出

  • for循环内容,判断是否是测试不是测试就write写出,是测试就continue跳过

  • 将2个文件对象均close()

参考代码:

 
 

"""
演示文件操作综合案例:文件备份
"""

# 打开文件得到文件对象,准备读取
fr = open("D:/bill.txt", "r", encoding="UTF-8")
# 打开文件得到文件对象,准备写入
fw = open("D:/bill.txt.bak", "w", encoding="UTF-8")
# for循环读取文件
for line in fr:
line = line.strip()
# 判断内容,将满足的内容写出
if line.split(",")[4] == "测试":
continue # continue进入下一次循环,这一次后面的内容就跳过了
# 将内容写出去
fw.write(line)
# 由于前面对内容进行了strip()的操作,所以要手动的写出换行符
fw.write("\n")

# close2个文件对象
fr.close()
fw.close() # 写出文件调用close()会自动flush()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/563811.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STM32WB55_NUCLEO开发(12)----FUS 更新

概述 在 STM32WB 微控制器中,FUS(Firmware Upgrade Services)是用于固件升级的一种服务。这项服务可以让你更新设备上的无线栈固件(如蓝牙、Zigbee或 Thread 栈),以及无线 MCU (microcontroller unit) 的系…

day5 - 利用阈值勾勒

阈值处理在计算机视觉技术中占有十分重要的位置,他是很多高级算法的底层逻辑之一。本实验将练习使用图像阈值处理技术来处理不同的情况的图像,并获得图像轮廓。 完成本期内容,你可以: 了解图像阈值处理技术的定义和作用 掌握各阈…

PyQt5 使用 pyinstaller打包文件(speed)

编写界面 import sys,math from PyQt5.QtWidgets import * from PyQt5.QtCore import Qt from PyQt5.QtGui import *class RightBottomButton(QWidget) :def __init__(self):super(RightBottomButton,self).__init__()self.setWindowTitle("界面One")self.resize(400…

1.8G专网工业路由器促进4G智能电力建设,赋能配电站远程监控管理

TD-LTE已是当下成熟的4G通信技术,应用无线专网的场景也越来越多,4G技术在电力物联网中也得到了广泛应用。依托传统的人工监管方式,效率低、成本高、维护难,为促进4G智能电力建设迫切需要方便快捷的在线监控方式来及时发现电力配网…

xss跨站,订单,shell箱子反杀记

打开一个常见的订单靶场,老师自己搭建的 这个是可以进行xss漏洞的测试,凡是有这种数据交互的地方,前端有一个数据的接受,后端是数据的显示,这个过程就符合漏洞产生的前提条件,将输入的数据进行个显示&#…

BUUCTF-Basic部分(4道)

目录 Linux Labs BUU LFI COURSE 1 BUU BRUTE 1 BUU SQL COURSE 1 Linux Labs 第一个界面,给出了SSH ssh 用户名:root 密码:123456 地址和端口为动态分配的 以及映射地址和端口(这个地址端口是随机的) node4.buuoj.c…

R语言实践——使用 rWCVP 生成自定义清单

使用 rWCVP 生成自定义清单 介绍1. 特有物种清单2. 近特有物种清单2.1 在塞拉利昂和另一地区出现的物种2.2 在塞拉利昂和相邻地区出现的物种 3. 生成自定义报告 介绍 除了允许用户从世界维管植物名录(WCVP)创建清单外,rWCVP还提供了修改清单…

在小公司“混”了2年,我只认真做了5件事,如今顺利拿到字节 Offer

前言 是的,我一家小公司工作了整整两年时间,在入职这家公司前,也就是两年前,我就开始规划了我自己的人生,所以在两年时间里,我并未懈怠。 现如今,我已经跳槽到了字节,入职字节测试…

傅里叶级数 傅里叶变换 及应用

傅里叶级数和傅立叶变换是傅里叶分析的两个主要工具,它们之间有密切的关系。 什么是傅里叶级数 傅里叶级数是将一个周期函数分解为一系列正弦和余弦函数的和。它适用于周期性信号,可以将周期函数表示为一组振幅和相位不同的谐波分量的和。傅里叶级数展…

Netty编解码机制(二)

1.Netty入站和出站机制 1.1.基本介绍 1>.netty的组件设计: Netty的主要组件有Channel、EventLoop、ChannelFuture、ChannelHandler、ChannelPipe等; 2>.ChannelHandler充当了处理入站和出站数据的应用程序逻辑的容器.例如,实现ChannelInboundHandler接口(或ChannelInb…

Unity之如何接入google cardboard-xr-plugin实现android手机VR

前言 我们提到VR,总是会想到Oculus,HTC Vive,Pico等头戴VR设备,但是别忘了,最早Google就通过再手机端实现VR了,而且还推出过Cardboard手机盒子,让我们可以用最低的成本体验到VR效果。 插件下载 先说明一下,Unity在1028版本之前,支持过GoogleVR,但是后来因为统一…

Chapter8 :Physical Constraints(ug903)

8.1About Physical Constraints(关于物理约束) XilinxVivado集成设计环境(IDE)允许通过设置对象属性值对设计对象进行物理约束。示例包括: •I/O约束,如位置和I/O标准 •布局约束&…

惨败字节,苦心备战两个月斩获阿里offer,这份“258页软件测试面试宝典”也太顶了

测试三年有余,很多新学到的技术不能再项目中得到实践,同时薪资的涨幅很低,于是萌生了跳槽大厂的想法。 但大厂不是那么容易进的,前面惨败字节,为此我辛苦准备了两个月,又从小公司开始面试了半个月有余&…

k8s pv pvc的介绍|动态存储|静态存储

k8s pv pvc的介绍|动态存储|静态存储 1 emptyDir存储卷2 hostPath存储卷3 nfs共享存储卷4 PVC 和 PVNFS使用PV和PVC 4 搭建 StorageClass NFS,实现 NFS 的动态 PV 创建 1 emptyDir存储卷 当Pod被分配给节点时,首先创建emptyDir卷,并且只要该…

FPGA—可乐机拓展训练题(状态机)

题目:以可乐机为背景,一瓶可乐的价格还是 2.5 元。用按键控制投币(加入按键消抖功能),可以投 0.5 元硬币和 1 元硬币,投入 0.5 元后亮一个灯,投入 1 元后亮 2 个灯,投入 1.5 元后亮 …

【统计模型】学生课程类型选择影响因素分析

目录 学生课程类型选择影响因素分析 一、研究目的 二、数据来源和相关说明 三、描述性分析 3.1 样本描述 3.2 样本可视化 3.2.1 直方图 3.2.2 列联表 3.2.3 箱线图与折线图 3.2.4 相关性热力图 四、数学建模 4.1 无序多分类logistic回归模型 4.1.1 无序多分类logist…

STM32F030C8T6最小系统板和流水灯(原理图和PCB)

STM32F030C8T6最小系统板和流水灯。 嵌入式课的课程设计,要做个流水灯,我就顺便画个最小系统板,开源出来了,各位大佬指点指点,有哪里需要优化改进的。 那个WS2812的RGB灯用错引脚了,所以没法用PWM来控制&…

MQTT GUI 客户端 可视化管理工具

MQTT GUI 客户端 可视化管理工具 介绍 多标签页管理,同时打开多个连接提供原生性能,并且比使用 Electron 等 Web 技术开发的同等应用程序消耗的资源少得多支持 MQTT v5.0 以及 MQTT v3.1.1 协议,支持通过 WebSocket 连接至 MQTT 服务器以树…

数字信号处理7

昨天着重就是离散时间系统的复习,包括离散时间系统的分类有哪些,是根据什么进行分类的,要搞清楚,LTI系统是一个什么样的系统,以及卷积的操作,因果LTI等,回顾完这些之后,就开始了今天…

Python面向对象编程详细解析(都带举例说明!)

前言 Python面向对象编程(Object-Oriented Programming,简称OOP)是一种编程范式,它将数据和操作数据的方法封装在一起,形成一个对象。 Python中的面向对象编程包括以下内容: 目录点击对应章节可直接跳转…