Python学习笔记——文件操作

news2024/10/5 13:32:04

输入和输出

Python两种输出值的方式: 表达式语句和 print() 函数。第三种方式是使用文件对象的 write() 方法,标准输出文件可以用 sys.stdout 引用。

如果你希望输出的形式更加多样,可以使用 str.format() 函数来格式化输出值。

如果你希望将输出的值转成字符串,可以使用 repr() 或 str() 函数来实现。

  • str(): 函数返回一个用户易读的表达形式。

  • repr(): 产生一个解释器易读的表达形式。

读取键盘输入

Python 提供了 input() 内置函数从标准输入读入一行文本,默认的标准输入是键盘。
str = input("请输入:");
print ("你输入的内容是: ", str)

读和写文件

open() 将会返回一个 file 对象,基本语法格式如:open(filename, mode)

filename:包含了你要访问的文件名称的字符串值。

mode:决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。

不同模式打开文件的完全列表:

模式

描述

r

以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

rb

以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。

r+

打开一个文件用于读写。文件指针将会放在文件的开头。

rb+

以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。

w

打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

wb

以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

w+

打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

wb+

以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

a

打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

ab

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

a+

打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。

ab+

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

# 打开一个文件
f = open("/tmp/foo.txt", "w")

f.write( "Python 是一个非常好的语言。\n是的,的确非常好!!\n" )

# 关闭打开的文件
f.close()

文件对象的方法

f.read():为了读取一个文件的内容,调用 f.read(size), 这将读取一定数目的数据, 然后作为字符串或字节对象返回。

size 是一个可选的数字类型的参数。 当 size 被忽略了或者为负, 那么该文件的所有内容都将被读取并且返回。

f.readline() 会从文件中读取单独的一行。换行符为 '\n'。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。

f.readlines():将返回该文件中包含的所有行。

如果设置可选参数 sizehint, 则读取指定长度的字节, 并且将这些字节按行分割。

f.write():f.write(string) 将 string 写入到文件中, 然后返回写入的字符数。

f.tell(): 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。

f.seek():如果要改变文件指针当前的位置, 可以使用 f.seek(offset, from_what) 函数。

from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:

  • seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符

  • seek(x,1) : 表示从当前位置往后移动x个字符

  • seek(-x,2):表示从文件的结尾往前移动x个字符

f.close():在文本文件中 (那些打开文件的模式下没有 b 的), 只会相对于文件起始位置进行定位。

当你处理完一个文件后, 调用 f.close() 来关闭文件并释放系统的资源,如果尝试再调用该文件,则会抛出异常。

pickle 模块

python的pickle模块实现了基本的数据序列和反序列化。
通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储。
通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。

文件操作

文件的基本操作

文件的操作有很多种, 例如:创建、删除、修改权限、写入、读取等。

  • 删除、修改权限:作用于文件本身, 属于系统级操作。

  • 写入、读取:文件最常用的操作, 作用于文件的内容, 属于应用级操作。

文的系统级操作功能单一, 容易实现。编码时, 可以导入Python中的专用模块Cos、sys等), 并调用模块中的指定函数来实行。

读写文件的一般步骤

一个文件, 必须在打开之后才可以对其进行操作, 井在操作结束之后将其关闭。

(1)打开文件:用open函数, 返回的是一个文件对象。

(2)具体读写:使用该文件对象的read、write等方法。

(3)关闭文件:用该文件对象的close方法。

打开文件:open()

函数open的返回值是一个文件对象。该对象中封装了文件的各种操作。

open(文件名, mode)

函数中有两个参数:

  • 文件名:属于字符串类型。使用时要注意转义问题, 尽可能使用源字符串(以r开头的字符串)。

  • Mode:是指打开文件的方式, 包括只读、只写、读写、二进制等。如果不指定mode参数, 文件将默认以“只读模式打开”。

1、open中的模式介绍

在open函数中, 参数mode起主要作用。它决定了文件的打开模式。具体如下:

  • r:只读。文件必须存在。

  • w:只写。如果文件己存在, 则将其覆盖。如果该文件不存在, 则创建新文件。

  • +:读写(不能单独使用〉。

  • a:以只写的方式打开文件, 用于在文件后追加内容。如果文件不存在, 则创建新文件。

  • b:以二进制模式打开(不能单独使用〉。

mode值可以组合使用, 即同时使用多种模式来操作文件。调用open函数时, 传入mode的常用值有r、w、r+、w+、rb、wb,rb+、wb+、a、a+、ab、ab+。

注意:r十、w+、a+都是可读写的意思。三者的区别是:

  • r+:读写。文件必须存在。当写入时, 会清空原内容。

  • w+:读写。如果该文件不存在, 则创建新文件。如果文件已存在, 则清空原有内容。

  • a+:读写。如果文件不存在, 则创建新文件。如果文件已存在, 则在文件后面追加内容。

2、文件读取模式

通常情况下, 文件都是以文本模式(textmode)打开的。即, 从文件中读写的是以一种特定的编码格式(默认的是UTF-8)进行编码的字符串。如果文件以二进制模式(binarymode)打开, 则数据将以宇节对象的形式进行读写。

  • 在Windows系统中,文本模式下行末标识符为\r\n,读取时会转换成\n,写入时,会转换成\r\n,以二进制模式打开会有问题

  • 在Unix/Linux中,行末标识符为\n,文本模式与二进制模式无区别。

3、函数open返回的对象

函数open的返回值是由打开模式决定的, 具体如下:

  • 文本模式:返回TextlOWrapper对象。

  • 读取二进制模式:即“r+b模式, 返回BufferedReader对象。

  • 写入和追加二进制模式:即“w+b“a+b模式, 返回BufferedWriter对象。

  • 读/写模式:即含有符号“+的打开模式, 返回BufferedRandom对象。

读写文件

通过调用文件对象的read方法可获得文件的内容;调用对象的write方法可以将字符串写入文件。

注意:如果文件是以二进制形式打开的, 则只能以二进制形式写入, 否则会报错。例如:

f=open('a.txt','wb+')                #以二进制形式打开一个文件
f.write('字符串')                     #以文本形式向该文件写入数据, 会报错

关闭文件

直接使用文件对象的close方法可关闭文件。文件在打开并操作完事之后, 需要及时关闭, 否则会给程序带来好多无法预知的错误。

文件对象的方法

file.close():关闭文件。关闭后文件不能再进行读写操作。

file.flush():刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。

file.fileno():返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。

file.isatty():如果文件连接到一个终端设备返回 True,否则返回 False。

file.next():返回文件下一行。Python3 中的 File 对象不支持 next() 方法。

file.read([size]):从文件读取指定的字节数,如果未给定或为负则读取所有。

file.readline([size]):读取整行,包括 "\n" 字符。

file.readlines([sizeint]):读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。

file.seek(offset[, whence]):移动文件读取指针到指定位置

file.tell():返回文件当前位置。

file.truncate([size]):从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。

file.write(str):将字符串写入文件,返回的是写入的字符长度。

file.writelines(sequence):向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

with语句

with语句可以让文件对象使用后正常关闭。

语法格式:with 表达式 as 变量 其中, 表达式就是open函数, as后面的变量就是open返回的文件类型。

在Python中, 支持with语法的对象必须有一个enter方法和一个exit一方法。

在with语法执行过程中, 紧跟with后面的语句被求值后, 返回对象的enter方法被调用, 这个方法的返回值将被赋值给as后面的变量。当with后面的代码块全部被执行完后, 将调用前面返回对象的exit方法。

with open('a.tx t', 'wb+') as f:            #以二进制模式打开文件
    try:
        f.write ('I  like  Python ! ')       #以文本格式写入二进制文件会报错
    except Exception  as  e:                 #捕获错误
        print(e)    
        f.write(b' I like  Python !')        #以bytes对象的形式读写

with open('a.t xt ','r+') as f:             #打开文件
    for line in f:                          #打印文件内容
        print(line)

注意:with语句也是有作用域的, 作用域的代码同样通过缩进的方式来表示当WI仕1作用域内的语句执行完毕后, 就会自动调用f的close方法将文件关闭。

字符串与二进制数相互转换

二进制数比字符串占用更少的空间

1、字符串转二进制数bytes函数

bytes(字符串,编码格式)

使用bytes函数时,必须提供一种编码格式

b1=b'I like Python'                    #在字符串前加b, 将其转为二进制
b2=bytes('I like Python', 'UTF-8')     #使用bytes将其转为二进制
print(b1, b2, sep=';')              #将结采打印出来, 输出:b’I like Python’;b’I like Python’

2、二进制数转换字符串

调用二进制对象的decode方法并传入指定的解码格式,可将二进制数转化为字符串

b = bytes('I like Python ', 'UTF-8')
print(b ,  b.decode() , sep=';')                #decode没有转入解码格式,默认UTF-8
print(b ,  b.decode('UTF-8') , sep=';')

在linux平台下, 生成的文件默认是UTF-8格式, 所以需指定解码格式为UTF-8。

在Windows平台下, 生成的文件默认是GB2312、GBK等格式, 所以需将其指定为对应的解码格式才可以正地显示字符串。

对象序列化

Python中有个序列化过程叫作pickle。它能够实现任意对象与文本之间的相互转化, 也可以将任意对象与二进制之间的相互转化。即, 可以透明地实现Python对象的存储及恢复。

用Python的pickle操作, 可以将对象序列化成字符串、磁盘上的文件等类似于文件的任何对象;也可以将这些字符串、文件或任何类似于文件的对象unpickle原来的对象。

dumps:

将Python中的对象序列化成二进制对象, 并返回。

dumps(obj , protocol=None, *, fix_imports=True)

参数说明如下:

  • obj:要转换的Python对象。protocol:pickle的码协议, 取值为0、1、2、3、4。0为ASCII码表示;2为旧版本的二进制协议;3为新的二进制协议;4为更新的二制协议。未指定情况下, 默认为。

  • 其他参数:是为了兼容以前Python2版本而保留的参, 可以不管。。

loads:

从给定的pickle数据中读取并返回对象,即将二进制对象转换为Python对象

load s (data, *, fix_ imports=True, encoding ='ASCII', errors ='strict')

参数说明如下:

  • data:要转换的二进制对象。

  • 其他参数:是为了兼容以前Python2版本而保留的参数, 可以不管。

在将二进制对象反序列化成Python对象时, 会自动识别转码协议, 所以不需要将转码协议当作参数传入。当待转换的二进制对象的字节数超过pickle的Python对象时, 多余的字节将被忽略。

dump:

将Python中的对象序列化成二进制对象, 井写入文件。

dump ( obj, file, protocol =None, *, fix_imports=True)

参数说明如下:

  • obj:要转换的Python对象。

  • file:文件必须有write方法, 并且支持写入二进制数据。

  • protocol:pickle的转码协议, 取值为0、1、2、3、4。其中, 0为ASCII码表示:2为旧版本的二进制协议:3为新的二进制协议:4为更新的二进制协议。未指定情况下, 默认为3。

  • 其他参数:是为了兼容以前Python2版本而保留的参数, 可以不管。

load:

读取指定的序列化数据文件, 并返回对象。

load(file, *, fix_imports=True, encoding ='ASCII', errors ='strict')

参数说如下:

  • File:对象必须有两个方法——read()和readline。

  • 其他参数:是为了兼容以前Python2版本而保留的参数, 可以不管。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/172925.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

H3C路由器带宽保证(命令行)配置方法

1 配置需求或说明 1.1适用产品系列 本案例适用于如MSR810、MSR93X系列的路由器。 1.2配置需求及实现的效果 某企业路由器接入业务有语音业务、管理部门业务和普通业务。要求当网络出现拥塞时,语音业务加速转发,管理部门业务确保转发,剩余或…

小满OKKICRM与金蝶云星空对接集成客户档案

小满OKKICRM与金蝶云星空对接集成客户列表查询(更新列表)&客户新增(小满客户对接金蝶客户-P)数据源平台:小满OKKICRM小满科技成立于2013年,是阿里巴巴集团战略投资的高新技术企业。小满科技以“人工智能大数据”为核心驱动力,为外贸企业提供智能CRM解…

合并所有重叠的区间

Python-合并区间 题目 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间 示例 1: 输入:interva…

【Ajax】模板引擎

一、模板引擎的基本概念渲染UI结构时遇到的问题var rows [] //遍历空数组 $.each(res.data, function (i, item) { // 循环拼接字符串rows.push(<li class"list-group-item"> item.content <span class"badge cmt-date">评论时间&#xff1a;…

87.序列到序列学习(seq2seq)以及代码实现

1. 机器翻译 2. Seq2Seq 双向RNN可以做encoder&#xff0c;但不能做decoder。 3. 编码器-解码器细节 4. 训练 5. 衡量生成序列的好坏的BLEU 上面的公式既加入了段序列的惩罚项&#xff0c;又加入了更难出现的长序列的高权重。 6. 总结&#xff1a; Seq2seq从一个句子生成另一…

【网络通信】【电信运营商实战工程师】思科设备篇-网络工程师必备基础知识

电信运营商实战工程师系列文章. 思科设备篇-网络工程师必备基础知识. 文章目录1. 电信运营商网络设备机房2. 认识并管理运营商网络设备3. GNS3 安装与配置4. IPv4地址及子网划分 VLSM-CIDR 详解5. OSI 七层参考模型及进制转换技巧1. 电信运营商网络设备机房 知识点&#xff1a;…

win-bat批处理命令

基本知识 cmd 与 powershel 命令和关键字不区分大小写&#xff0c;变量名区分大小写 DOS 是磁盘操作系统&#xff1b;命令提示符是 DOS 系统的界面中输入 DOS 命令的提示位置&#xff1b;cmd 是系统运行其自带 DOS 的命令 PID 是 processid&#xff08;进程号&#xff09;&am…

36-剑指 Offer 38. 字符串的排列

题目 输入一个字符串&#xff0c;打印出该字符串中字符的所有排列。 你可以以任意顺序返回这个字符串数组&#xff0c;但里面不能有重复元素。 示例: 输入&#xff1a;s "abc" 输出&#xff1a;["abc","acb","bac","bca&quo…

二维前缀和数组二维差分数组

二维前缀和数组&二维差分数组 一维前缀和 用途&#xff1a;快速求出数组中nums[i,j]nums[i,j]nums[i,j]元素之和 定义&#xff1a;sums[i1]sums[i1]sums[i1]为nums数组前iii个元素之和 sums[i1]∑j0inums[j]sums[i 1] \sum _{j0} ^{i}nums[j] sums[i1]j0∑i​nums[j] …

神经网络——day67:Residual Network

Deep Residual Learning for Image RecognitionDeep Residual Learning for Image Recognition1. Introduction2. Related WorkResidual Representations(剩余表示).Shortcut Connections(快捷连接).3. Deep Residual Learning3.1. Residual Learning3.2. Identity Mapping by …

Java项目:学生管理系统

Java项目&#xff1a;学生管理系统一、学生管理系统基础版需求1. 初始菜单2. 学生类&#xff1a;3. 添加功能&#xff1a;4. 删除功能&#xff1a;5. 修改功能&#xff1a;6. 查询功能&#xff1a;代码1. 学生类2. 测试类输出结果a. 添加b. 删除c. 修改d. 查询e. 退出二、学生管…

前端监控 二三事

有必要针对 JS 错误做监控吗&#xff1f; 我们可以先假设不对 JS 错误做监控&#xff0c;试想会出现什么问题&#xff1f; JS 错误可能会导致渲染出错、用户操作意外终止&#xff0c;如果没有 JS 错误监控&#xff0c;开发者完全感知不到线上这些异常情况。特别是像电商、支付…

【2-神经网络优化】北京大学TensorFlow2.0

课程地址&#xff1a;【北京大学】Tensorflow2.0_哔哩哔哩_bilibiliPython3.7和TensorFlow2.1六讲&#xff1a;神经网络计算&#xff1a;神经网络的计算过程&#xff0c;搭建第一个神经网络模型神经网络优化&#xff1a;神经网络的优化方法&#xff0c;掌握学习率、激活函数、损…

7. 字符串str的详细讲解

python3字符串str的使用 (1) 基本使用 [a]. Python 中单引号 和双引号 " 使用完全相同&#xff1b; [b]. 使用三引号(单或双)可以指定一个多行字符串&#xff1b; # 长字符串 print( jkl fsf fs fs )[c]. 反斜杠可以用来转义&#xff0c;使用r(raw)可以让反斜杠…

【LeetCode高频100题-3】冲冲冲(持续更新23.1.19)

文章目录62. 不同路径题意解法1 排列组合解法2 动态规划62. 不同路径 题意 一道数学题&#xff0c;排列组合/小学奥赛题。动态规划不是一般来解决最值问题的吗&#xff0c;这道题为什么会想到dp&#xff1f; 解法1 排列组合 从左上角到右下角&#xff0c;一共要走mn-2步&am…

DEJA_VU3D - Cesium功能集 -完整地图标绘及编辑功能系列预告

前言编写这个专栏主要目的是对工作之中基于Cesium实现过的功能进行整合&#xff0c;有自己琢磨实现的&#xff0c;也有参考其他大神后整理实现的&#xff0c;初步算了算现在有差不多实现小140个左右的功能&#xff0c;后续也会不断的追加&#xff0c;所以暂时打算一周2-3更的样…

【算法】克鲁斯卡尔 (Kruskal) 算法

目录1.概述2.代码实现2.1.并查集2.2.邻接矩阵存储图2.3.邻接表存储图2.4.测试代码3.应用本文参考&#xff1a; 《数据结构教程》第 5 版 李春葆 主编 1.概述 &#xff08;1&#xff09;在一给定的无向图 G (V, E) 中&#xff0c;(u, v) 代表连接顶点 u 与顶点 v 的边&#xf…

【6s965-fall2022】剪枝✂pruningⅠ

模型剪枝的介绍 修剪&#xff0c;消除不必要的知识。DNN的知识可以理解为存在于其权重中。 事实证明&#xff0c;许多 DNN 模型可以被分解为权重张量&#xff0c;而权重张量经常包含统计冗余&#xff08;稀疏性&#xff09;。因此&#xff0c;你可以压缩 DNN 的权重张量&…

[从零开始]用python制作识图翻译器·五

测试 通过以上步骤我们终于实现了系统&#xff0c;现在到了紧张刺激的测试环节。直接运行run.py文件: python run.py ::注意需要进入conda环境稍作等等&#xff0c;我们的系统就运行啦&#xff08;啵唧啵唧&#xff09;。 在使用之前&#xff0c;我们还需要在设置中输入自己的…

使用vscode进行C++代码开发(linux平台)

使用vscode进行C代码开发(linux平台一、插件安装二、常用快捷键三、重要配置文件四、实际例子1. 编译并运行一个含有多个文件夹和文件的代码工程2. 编译并运行一个依赖第三方库的代码工程参考资料一、插件安装 执行 ctrl shift x打开插件窗口&#xff0c;然后搜索c插件&…