Python学习笔记--文件操作

news2024/12/23 12:01:11

(一) 文件的编码


1. 编码


编码是一种规则集合,记录了内容和二进制间进行相互转换的逻辑
编码有许多种,最常用的是utf-8


2. 使用编码的原因


计算机只能识别二进制数,因此要将文件的内容翻译为二进制数,才能保存进计算机内
同时也需要编码,将计算机保存的二进制数,反向编译回可识别的内容


(二) 文件的读取


1. 文件的基本操作步骤

打开文件
读写文件
关闭文件
! 可以只读,不写

2. 文件的基本操作函数
 

编号关键字使用方法作用
1open文件对象 = open(file,mode,encoding)打开文件获得指定文件对象
2read文件对象.read(num)

读取指定长度字节

不指定num读取文件全部

3readline文件对象.readline()读取一行
4readlines文件对象.readline()读取全部行,得到列表
5forfor line in 文件对象for循环文件行,一次循环得到一行数据
6close文件对象.close()关闭文件对象
7with openwith open() as f通过with open语法打开文件,可以自动关闭

! 读取文件后,要用进行关闭,否则文件一直被占用

完整的语法格式为:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

参数说明:

  • file: 必需,文件路径(相对或者绝对路径)。
  • mode: 可选,文件打开模式
  • buffering: 设置缓冲
  • encoding: 一般使用utf8
  • errors: 报错级别
  • newline: 区分换行符
  • closefd: 传入的file参数类型
  • opener: 设置自定义开启器,开启器的返回值必须是一个打开的文件描述符。

****注意:mode 参数有:

模式描述
t文本模式 (默认)。
x写模式,新建一个文件,如果该文件已存在则会报错。
b二进制模式。
+打开一个文件进行更新(可读可写)。
U通用换行模式(Python 3 不支持)。
r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+打开一个文件用于读写。文件指针将会放在文件的开头。
rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
w+打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

默认为文本模式,如果要以二进制模式打开,加上 b 。

file 对象

file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:

序号方法及描述
1

file.close()

关闭文件。关闭后文件不能再进行读写操作。

2

file.flush()

刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。

3

file.fileno()

返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。

4

file.isatty()

如果文件连接到一个终端设备返回 True,否则返回 False。

5

file.next()

Python 3 中的 File 对象不支持 next() 方法。

返回文件下一行。

6

file.read([size])

从文件读取指定的字节数,如果未给定或为负则读取所有。

7

file.readline([size])

读取整行,包括 "\n" 字符。

8

file.readlines([sizeint])

读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。

9

file.seek(offset[, whence])

移动文件读取指针到指定位置

10

file.tell()

返回文件当前位置。

11

file.truncate([size])

从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。

12

file.write(str)

将字符串写入文件,返回的是写入的字符长度。

13

file.writelines(sequence)

向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

练习:word.txt文本内容

"""                                                                                                                           
演示对文件的读取                                                                                                                      
"""                                                                                                                           
# 打开文件                                                                                                                        
import time                                                                                                                   
                                                                                                                              
f=open("C:/Users/cs/Desktop/work.txt","r",encoding="UTF-8")   #这里我犯了一个错误,直接复制了文本的路径,发现不对,原因是斜杠的方向不一样                          
print(type(f))                                                                                                                
                                                                                                                              
# 读取文件 - read()                                                                                                               
print(f"读取第3个字节的结果:{f.read(3)}")                                                                                              
print(f"read方法读取全部内容的结果是:{f.read()}")    #当出现多个read语句时,会发现f.read()不会读取全部内容,只会读取没有被read使用过的内容,原因是文件操作会续接前的命令操作,读者不懂可以将这两个输出语句全部输出或者注释掉一个,只输出一个语句就能懂了                                 
                                                                                                                              
# 读取文件 - readLines()                                                                                                          
lines=f.readlines()     #读取文件的全部行,封装到列表里                                                                                      
print(f"lines对象的类型:{type(lines)}")                                                                                            
print(f"lines对象的内容是:{lines}")   #输出为空,原因是文件前面的9 10行读取文件 ,就像指针一样,第9行指针在第3个字后面,执行第10行后,之后在最后了,所以对象内容为空的                         

# 打开文件                                         
import time                                    
                                               
f=open("C:/Users/cs/Desktop/work.txt","r",encoding="YTF-8")
line1=f.readline()                             
line2=f.readline()                             
line3=f.readline()                             
print(f"第一行数据是:{line1}")                       
print(f"第二行数据是:{line2}")                       
print(f"第三行数据是:{line3}")                       
                                               
# for循环读取文件行                                   
for line in f:                                 
    print(f"每一行数据是:{line}")                    
# 文件的关闭                                        
f.close()                                      
time.sleep(500000) #程序暂停执行50万秒         l       

 

"""
演示对文件的读取
"""
# 打开文件
import time

# with open 语法操作文件  自带关闭功能
with open("C:/Users/cs/Desktop/work.txt","r",encoding="UTF-8")  as f:
    for line in f:
        print(f"每一行的数据是:{line}")  #for 循环这两行代码运行完自动关闭了
time.sleep(500000)

对于同一个文件的操作,每一行的命令都会续接上面的代码 ,所以就出现了代码中注释的那几条解释

实例:读取文本内容的次数

文本内容为:

离离原上草,
一岁一枯荣。
野火烧不尽,
春风吹又生。
远芳侵古道,
晴翠接荒城。
又送王孙去,
萋萋满别情。
一二一

方法1:

"""
练习读取文件内容的次数
"""
# 打开文件
f=open("C:/Users/cs/Desktop/work.txt","r",encoding="UTF-8")
# 方法1:读取全部内容,同字符串count方法统计一这个字的数量
content=f.read()
count=content.count("一")
print(f"一 在文件中出现的次数为{count}")
#关闭文件
f.close()

 方法2:

# 方法2:读取内容,一行一行读取
count=0  # 变量来增加次数
for line in f:
    line =line.strip()  #去除开头和结尾的空格以及\n换行符
    words=line.split(" ")
    for word in words:
        if word == "一":
            count+=1
print(f"一 出现的次数为:{count}")

#关闭文件
f.close()

(三) 文件的写入

1. 写操作快速入门:

(1) 使用open的“w”模式进行写入

(2) 文件写入:f.write()

(3) 内容刷新:f.flush()

! 直接调用write,内容并未真正写入文件,而是积攒在程序的内存中,称为缓冲区

! 当调用flush时,文件才会真正写入文件

! 这样避免频繁的操作硬盘,导致效率下降

     这里是写入不存在的文件

"""
演示文件的写入
"""
# 打开文件,不存在的文件
import time

f=open("C:/Users/cs/Desktop/text.txt","w",encoding="UTF-8")
# write写入
f.write("HelloWorld") #内容写到了内存中,需要调入flush写入硬盘
# flush刷新
f.flush()
time.sleep(60000)
#close关闭
f.close()   # close方法,内置了flush的功能,也就是说  哪怕你没调用flush,但是调用了close,依旧可以写入内存

这里演示写入已经存在的文件中,会自动清除原有文本中的内容,重新写入新值

"""
演示文件的写入
"""

# 打开一个存在的文件
f=open("C:/Users/cs/Desktop/text.txt","w",encoding="UTF-8")
#write写入,flush刷新
f.write("heima")
# f.flush()
time.sleep(60000)
# close关闭
f.close()

2. 注意事项:

w模式,文件不存在,会创建新文件
w模式,文件存在,会清空原有内容
close方法,具有flush方法的作用


(四) 文件的追加


1. 追加写入操作的快速入门

(1) 使用open的“a”模式进行写入

(2) 文件写入:f.write()

(3) 内容刷新:f.flush()

2. 注意事项

  • a模式,文件不存在,不会创建文件
  • a模式,文件存在,会在最后追加写入文件
    # 打开一个存在的文件
    f=open("C:/Users/cs/Desktop/text.txt","a",encoding="UTF-8")
    #write写入,flush刷新
    f.write("baima")
    # f.flush()
    time.sleep(60000)
    # close关闭
    f.close()

    因为追加功能和写入功能是一样的,因此就写了一个文件存在,追加写入文件的例子

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/422487.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【K8S系列】深入解析有状态服务

目录 序言 1 基本介绍 2 使用介绍 2.1 Headless Service 2.2 PersistentVolume 2.3 StatefulSet 2.4 Init Containers 3 问题 4 投票 序言 在你想要放弃的时候,想想是什么让你当初坚持走到了这里。 Kubernetes (k8s) 是一个容器编排平台,允许在…

RISC-V Linux 编译设备树

RISC-V Linux 编译设备树 flyfish 设备树是一种描述硬件资源的数据结构 引入设备树的主要目的 曾经 Linux内核中夹杂着大量的设备信息,影响Linux驱动开发效率,因为外部设备发生任何改动,需要重新编写和编译驱动代码。 现在 设备驱动程…

VSCode使用Remote SSH远程连接Linux服务器【远程开发】

文章目录前言视频教程1、安装OpenSSH2、vscode配置ssh3. 局域网测试连接远程服务器4. 公网远程连接4.1 ubuntu安装cpolar4.2 创建隧道映射4.3 测试公网远程连接5. 配置固定TCP端口地址5.1 保留一个固定TCP端口地址5.2 配置固定TCP端口地址5.3 测试固定公网地址远程转发自CSDN远…

shell一些操作

文章目录【检查脚本目录】示例【时间和时区】修改时间修改时区修改时区查看时区脚本从服务器同步client主动同步client被动同步docker-compose 时区设置kubernetes设置时区【按时间备份】实例date命令【历史命令和快捷键】历史命令快捷键【重定向】相关符号脚本输出到黑洞cat输…

android studio 页面布局(1)

<?xml version"1.0" encoding"utf-8"?> <LinearLayout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:app"http://schemas.android.com/apk/res-auto"xmlns:tools"http://schemas.android.com/too…

论文阅读 - ANEMONE: Graph Anomaly Detection with Multi-Scale Contrastive Learning

目录 摘要 1 简介 2 问题陈述 3 PROPOSED ANEMONE FRAMEWORK 3.1 多尺度对比学习模型 3.1.1 增强的自我网络生成 3.1.2 补丁级对比网络 3.1.3 上下文级对比网络 3.1.4 联合训练 3.2 统计异常估计器 4 EXPERIMENTS 4.1 Experimental Setup 4.1.1 Datasets 4.1.2 …

Ethercat学习-QT添加SOEM主站

文章目录简介环境搭建1.QT安装2.VS安装3.Win10 Debuggers4.QT配置SOEM移植&#xff11;.lib库生成2.文件移植1.文件整理2.添加文件至QT工程测试简介 QT版本5.14.2 VS版本2017 系统Win10 环境搭建 环境搭建很简单&#xff0c;就是安装几个软件就好了&#xff0c;没有特殊的…

快速排序及优化

快速排序及优化 概要 关于快速排序的原理不赘述&#xff0c;可以查看912. 排序数组 - 力扣&#xff08;Leetcode&#xff09; 本篇文章旨在提供快速排序的C#实现&#xff0c;并通过随机pivot&#xff0c;三数取中&#xff0c;小区间使用插入排序&#xff0c;栈实现&#xff…

Makefile学习

什么是Makefile 使用 GCC 编译器在 Linux 进行 C 语言编译&#xff0c;通过在终端执行 gcc 命 令来完成 C 文件的编译&#xff0c;如果我们的工程只有一两个 C 文件还好&#xff0c;需要输入的命令不多&#xff0c;当文件有几十、上百甚至上万个的时候用终端输入 GCC 命令的方…

NIFI大数据进阶_实时同步MySql的数据到Hive中去_可增量同步_实时监控MySql数据库变化_操作方法说明_01---大数据之Nifi工作笔记0033

然后我们来看如何把mysql数据实时同步到hive中去 可以看到,其实就是使用 CaptureChangeMySql来获取mysql中变化的数据,具体就是增删改数据 然后再用RouteOnAttribute通过属性,也就是根据是增删改的话,根据这个属性进行路由 把数据路由到不同的位置 然后再用EvaluateJsonPa…

创客匠人人物访谈:客户,如何反推创业发展? |

古语有云&#xff1a;“君者&#xff0c;舟也&#xff1b;庶人者&#xff0c;水也&#xff1b;水则载舟&#xff0c;水则覆舟”。 从创业的角度来看&#xff0c;客户&#xff0c;就是创业这艘小船在市场的海洋里能够安稳航行的必要条件。 在创业的过程中&#xff0c;一定是先有…

STC89C52串口通信当中的UART

1.串口介绍 串口是一种应用十分广泛的通讯接口&#xff0c;串口成本低、容易使用、通信线路简单&#xff0c;可实现两个设备的互相通信。 单片机的串口可以使单片机与单片机、单片机与电脑、单片机与各式各样的模块互相通信&#xff0c;极大的扩展了单片机的应用范围&#xf…

Vue 也能复用模板了

文章目录Vue 也能复用模板了1. 怎么用1.1 基本使用1.2 传递参数2. 怎么实现的3. 注意事项4. 未来发展Vue 也能复用模板了 相信很多使用 Vue 的同学会遇到这样一个问题&#xff1a; “组件里有几个部分的模板&#xff08;html 结构&#xff09;是相同的&#xff0c;要想复用的…

使用线性回归构建波士顿房价预测模型

使用线性回归构建波士顿房价预测模型 描述 波士顿房价数据集统计了波士顿地区506套房屋的特征以及它们的成交价格&#xff0c;这些特征包括周边犯罪率、房间数量、房屋是否靠河、交通便利性、空气质量、房产税率、社区师生比例&#xff08;即教育水平&#xff09;、周边低收入…

前馈PID控制(热交换器/反应釜温度控制)

如何利用PID进行温度控制请参看下面博客文章: 博途PID 1200/1500PLC PID_Compact比例作用权重b微分作用权重c解读(PI-D控制器 I-PD控制器)_RXXW_Dor的博客-CSDN博客很多人会问PLC自带的PID指令和我们自己设计的PID有什么区别,这个问题要看你和什么PID控制器作对比,PID负反…

python真的如此好吗?

作为一名合格的&#xff08;准&#xff09;程序员&#xff0c;必做的一件事是关注编程语言的热度&#xff0c;编程榜代表了编程语言的市场占比变化&#xff0c;它的变化更预示着未来的科技风向和机会&#xff01; Python霸占榜首 只因它真的很强 Python&#xff0c;年龄可能比…

2023年的深度学习入门指南(5) - HuggingFace Transformers库

2023年的深度学习入门指南(5) - HuggingFace Transformers库 这一节我们来学习下预训练模型的封装库&#xff0c;Hugging Face的Transformers库的使用。Hugging Face的库非常活跃&#xff0c;比如支持LLaDA大规型的类&#xff0c;是在本文开始写作的前一天发布的。 库新到这种…

JavaWeb——锁策略, cas和synchronized优化过程

目录 一、锁策略 1、悲观锁和乐观锁 2、轻量级锁和重量级锁 3、自旋锁和挂起等待锁 4、互斥锁和读写锁 5、可重入锁和不可重入锁 6、公平锁和非公平锁 二、cas和synchronized 优化过程 1、CAS&#xff08;compare and swap&#xff09; &#xff08;1&#xff09;、原…

企业网站架构部署与优化

系列文章目录 文章目录系列文章目录一、LAMP概述与简介1.LAMP2.各组件的主要作用如下&#xff1a;二、1.编译安装Apache http服务2.编译安装 Mysql 服务3.编译安装 PHP 解析环境总结一、LAMP概述与简介 1.LAMP LAMP架构是目前成熟的企业网站应用模式之一&#xff0c;指的是协…

如何高效建立知识库?

建立知识库是为了更好地管理和传承知识&#xff0c;提高团队的效率和成果。在建立知识库的过程中&#xff0c;需要注意一些关键点&#xff0c;以确保知识库的高效性和可持续性。本文将介绍如何高效建立知识库以及需要注意的事项。 一、建立知识库的步骤 1.明确知识库的目的和…