python学习之【文件读写】

news2025/2/26 5:06:34

前言

上一篇文章​ ​ python学习——【第十四弹】 ​​​中学习了python中的包与内置模块,这篇文章接着学习python中的文件读写。

编码方式

在学习文件读写之前,我们先了解下python当中的编码方式:
在这里插入图片描述

字节(Byte)是计量单位,表示数据量多少,是计算机信息技术用于计量存储容量的一种计量单位,通常情况下一字节等于八位。
字符(Character)计算机中使用的字母、数字、字和符号,比如'A'、'B'、'$'、'&'等。
一般在英文状态下一个字母或字符占用一个字节,一个汉字用两个字节表示。


ASCII 码中,一个英文字母(不分大小写)为一个字节,一个中文汉字为两个字节。
UTF-8 编码中,一个英文字为一个字节,一个中文为三个字节。
Unicode 编码中,一个英文为一个字节,一个中文为两个字节。
符号:英文标点为一个字节,中文标点为两个字节。例如:英文句号 . 占1个字节的大小,中文句号 。占2个字节的大小。
UTF-16 编码中,一个英文字母字符或一个汉字字符存储都需要 2 个字节(Unicode 扩展区的一些汉字存储需要 4 个字节)。
UTF-32 编码中,世界上任何字符的存储都需要 4 个字节。

python的解释器使用的Unicode(内存),python文件(.py)在磁盘上使用的是UTF-8(外存)。

python3中默认使用的是UTF-8的编码;

我们可以使用sys模块中的getdefaultencoding()获取默认的编码格式

import sys
print(sys.getdefaultencoding())
# utf-8

在计算机内存中,统一使用的是Unicode编码,当需要保存在硬盘或者是需要传输的时候,就会转换为UTF-8编码:

当我们用记事本进行编辑的时候,从文件读取的UTF-8字符被转换为Unicode字符到内存里;编辑完成后进行保存,会再将Unicode转换为UTF-8保存到文件中。

在这里插入图片描述
我们看用python文件用记事本打开,然后另存时默认的编码类型:

在这里插入图片描述
而记事本的保存的默认编码格式是ANSI,(准确说,并不存在哪种具体的编码方式叫做ANSI,它只是一个Windows操作系统上的别称而已。在中文简体Windows操作系统上,ANSI就是GBK),如果我们直接用python去新建一个txt文本文档的文件,由于编码格式的不兼容,因此会发生乱码:

在这里插入图片描述
在这里插入图片描述
为了避免编码格式不兼容的问题,我们可以在代码中进行修改写入数据的编码格式为UTF-8:

f = open("编码.txt", "w",encoding='UTF-8')#将输入数据的编码格式改为UTF-8
f.write("你好!世界!")
f.close()

在这里插入图片描述
想要对编码格式多加了解的伙伴,可以参考这篇文章:​ ​点击查看​​​。​

常见的文件打开模式

按照文件数据的组织形式,文件分为以下两个大类:

 文本文件:存储的是普通“字符”文本,默认为Unicode字符集,可以使用记事本程序打开

   二进制文件: 把数据内容用“字节”进行存储,无法用记事本打开,必须使用专用的软件打开,如图片文件(.png  .jpeg等)以及  .doc文档等。 常见的打开模式:

  r  以只读的模式打开文件,文件的指针将会放在文件的开头

  w   以只写的模式打开文件  如果文件不存在就创建,如果文件存在就覆盖文件的原有内容,文件指针在文件的开头

  a   以追加的模式打开文件,如果文件不存在就创建,文件指针在文件开头;如果文件存在,则在文件末尾追加内容,文件指针在源文件末尾

  b 以二进制的方式打开文件  不能单独使用,需要与共它模式一起使用 如 rb(只读的方式打开二进制文件)或者wb(只写的方式打开二进制文件)

  + 以读写的方式打开文件,不能单独使用,需要和其他模式一起使用 比如 a+

需要注意的是:我们在进行对文件的读写操作时,代码最后要对文件进行close()关闭操作:close()操作把缓冲区的内容写入文件,同时关闭文件,释放文件对象相关资源。
r 只读

以只读的模式打开该文件

file_r=open('a.txt','r')
print(file_r.read())#读取文件内容
file_r.close() #关闭文件 只要我们打开了文件,在代码结束时就要写上关闭文件的代码,以释放资源。

说到只读,这里有文件对象的几种常用方法,我们可以用只读的方式来查看各个方法的功能:

read([size]) 从文件中读取size个字节或者是字符的内容的返回,如果省略[size]的话,就会从文件的开头一次性读取到文件的末尾;

readline()  从文本文件中读取第一行内容;

readlines()  把文本文件中每一行都作为独立的字符串对象,并将这些对象放入列表中返回;

seek(offest,[whence])  把文件指针移动到新的位置,offset表示相对于whence的位置;

tell()    返回文件指针的当前位置;

flush()  把缓冲区的内容写入到文件中,但是不关闭文件​

我们先读取a.py中的全部内容:

在这里插入图片描述
然后用读取文件对象的常用方法读取a.txt :

# read([size])   从文件中读取size个字节或者是字符的内容的返回,如果省略[size]的话,就会从文件的开头一次性读取到文件的末尾
file_r=open('a.txt','r')
print(file_r.read(5)) #返回5个字节
file_r.close()

print('------------------------\n')

# readline()  读取文本中的第一行内容
file_rl=open('a.txt')
print(file_rl.readline())
file_rl.close()

print('------------------------\n')

# readlines()   把文本文件中每一行都作为独立的字符串对象,并将这些对象放入列表中返回
file_rls=open('a.txt','r')
print(file_rls.readlines())
file_rls.close()

在这里插入图片描述

seek()

seek()的括号中输入字节数,文件的指针就会从文件开头往后移动几个字节

file_seek=open('a.txt','r')
file_seek.seek(2)
print((file_seek.read()))
file_seek.close()  #llo world

a.txt:
在这里插入图片描述
需要注意:如果我们需要读取的字节数必须是正确的字节数;比如在读取汉字时,如果是输入2,而UTF-8的编码中一个汉字是3个字节,会导致程序报错。

tell()

返回文件指针的当前位置

file=open('a.txt','r')
file.seek(2)
print(file.read())
print(file.tell()) #返回指针当前所在的位置
file.close()

在这里插入图片描述

flush()

把缓冲区的内容写入到文件中,但是不关闭文件

file=open('b.txt','a')#采用追加的方式打开文件
file.write('hello')
file.flush()  #把缓冲区的内容写入到文件中,但是不关闭文件
file.write('world')
file.close()

但是我们将flush()和close()区分开来,flush()不会关闭该文件,也就是说可以在flush()代码执行之后可以继续往文件里写入数据;但是close()执行后就不能再往文件中写入数据了,否则会报错。

在这里插入图片描述

w 只写

以只写的模式打开文件 ,如果文件不存在就创建,如果文件存在就覆盖文件的原有内容,文件指针在文件的开头:
在这里插入图片描述
在这里插入图片描述
只读的模式打开a.txt,我们发现a.txt文件中的原有内容被覆盖。

这里我们用到了文件对象的写入方法 : write(str) 将字符串str内容写入文件

还有一种常用的文件对象的写入方法:

writelines(s_list) 将字符串列表s_list写入文本文件,并且不添加换行符

s_lis1=['hello','world','hello','python']
file_wl=open('a.txt','w')
file_wl.writelines(s_lis1)
file_wl.close()

在这里插入图片描述
使用该方法需要注意的是写入的必须是字符串列表,如果不是字符串列表会报类型错误:
在这里插入图片描述

a 以追加的模式打开文件

以追加的模式打开文件,如果文件不存在就创建,文件指针在文件开头;如果文件存在,则在文件末尾追加内容,文件指针在源文件末尾。

file_a=open('a.txt',"a")
file_a.write('python') #写入'python'
file_a.close()

在这里插入图片描述
在这里插入图片描述

b 打开二进制的文件

二进制文件: 把数据内容用“字节”进行存储,无法用记事本打开,必须使用专用的软件打开,如图片文件(.png .jpeg等)以及 .doc文档等。

b 不能单独使用,需要与共它模式一起使用: 如rb或者wb

# 打开读取源文件
src_file=open('befor.png','rb')
# 打开写入目标文件
target_file=open('after.png','wb')
# 将从源文件中读取的文件写入目标文件
target_file.write(src_file.read())
# 将目标文件和源文件关闭
target_file.close()
src_file.close()

在这里插入图片描述

每篇一语

不要在夕阳西下时幻想,要在旭日东升时努力。

如有不足,感谢指正!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1027454.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[BJDCTF2020]Cookie is so stable 模板注入SSTI

这个题目已经在提示我们了 然后我们去hint看看 让我们看看cookie 那我们肯定直接抓包啊 cookie中存在 回显值 但是我觉得一眼看上去就不是sql注入 因为是我们提交东西 而且没有查询的东西 所以我们可以想到是不是其他注入 于是就思考到是不是模板注入 模板注入 模板注入 主要…

matlab读写json文件

Background 通常,在matlab中使用mat文件进行数据存储。MAT文件是MATLAB中用来存储数据的二进制文件格式。MAT文件可以包含各种数据类型,包括数字、矩阵、向量、结构体、字符和函数等。但是,当和其他语言有交互时,mat文件会不太方便…

Stm32标准库_1

代码: #include "stm32f10x.h" // Device headerGPIO_InitTypeDef GPIO_InitStructure;//定义变量结构体int main(void){/*使用RCC开启GPIO的时钟*/RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOA, ENABLE);//开启PA端口时钟/*使用GPIO_…

Java高级-反射

反射 1.介绍2.获取Class对象的三种方法3.获取类的构造器4.获取类的成员变量5.获取类的成员方法6.反射的作用和应用场景 1.介绍 反射 加载类,并允许以编程的方式解剖类的各种成分(成员变量、方法、构造器等) 反射步骤 1.加载类,获取类的字节码&#x…

Hiding Images within Images[精读]

Hiding Images within Images 第一次阅读时间:2023/9/15-2023/9/20 这里写目录标题 Hiding Images within Images1 背景介绍2 论文摘要3 相关工作3.1 隐藏信息的目的3.2 隐藏信息面临的挑战3.3 常见的隐藏技术3.4 和隐写术(steganography)的区别 4 提出方法4.1 学…

Nginx多出口IP解决代理端口数量限制,CentOS安装Nginx并开启https2.0

Nginx多出口IP解决代理端口数量限制,CentOS安装Nginx并开启https2.0。 配置文件如下: http {...upstream test {server www.test.com;}server {listen 80 default_server;server_name _;location / {proxy_pass http://test;proxy_bind $split_ip

BD就业复习第一天

hive 1.分区分桶 在Hive中,分区(Partition)和分桶(Bucketing)都是用于数据管理和查询性能优化的技术。它们有不同的用途和特点。 分区(Partition): 定义:分区是将数据…

【UE 粒子练习】03——创建一个GPU粒子

目的 为了实现创建非常多的粒子的需求,我们就需要使用到GPU 效果 步骤 1. 复制一份上篇博文中创建的粒子,这里重命名为“P_Sparks_GPU” 打开“P_Sparks_GPU”,将生成的粒子数量改为2000,可以看到发射器最多只能生成1000个粒子…

【Java 基础篇】Java 生产者-消费者模式详解

Java 生产者-消费者模式是多线程编程中常见的一种模式,它用于解决生产者和消费者之间的协作问题。生产者负责生成数据,消费者负责处理数据,通过合理的协作,可以实现高效的数据处理。本文将详细介绍 Java 生产者-消费者模式&#x…

使用 WSLg 的 vGPU 硬件加速新特性创建重度混合生产环境

使用 WSLg 的 vGPU 硬件加速新特性创建重度混合生产环境 本文首发于:白泽阁-使用 WSLg 的 vGPU 硬件加速新特性创建重度混合生产环境 一、不同版本的WSL Windows Subsystem for Linux(简称WSL)是一个在 Windows 10\11 上能够运行原生Linux…

c语言练习64:calloc和realloc

calloc和realloc C语⾔还提供了⼀个函数叫 calloc &#xff0c; calloc 函数也⽤来动态内存分配 和realloc是有区别的 练习使用calloc和realloc realloc在c语言练习63中有所应用&#xff0c;realloc是为了扩大内存空间 下面为calloc和recalloc的例子代码: #include<stdio…

肖sir___环境的讲解__001

环境的讲解 一、搭建环境 此测试环境主要用于功能测试、寻找bug、编写后台测试点、熟悉环境的架构&#xff0c;搭建流程 二、搭建多有米前后台所需要的工具包 1、虚拟机&#xff08;centos6.5&#xff09; 2、数据库 3、代码包 4、服务器 5、数据库脚本 6、jdk 三、搭建测试…

【简洁】【皮肤美化】博客园页面美化 主文章加宽

效果&#xff1a; 选择&#xff1a;Bluesky皮肤 再加入的css: #home {background-color: #e6e6e6; } #top_nav{ background-color: #e6e6e6; } #navigator, #under_post_card1, #ad_t2 , #nav_right, #nav_left, #cnblogs_c1, #under_post_card2, #HistoryToday, #green_chann…

持续集成Jenkins安装部署

Jenkins是一个在DevOps领域中、支持CI/CD&#xff08;持续集成/持续交付&#xff09;过程域的开源项目&#xff0c;其提供可扩展插件的支持&#xff0c;以自动化的机制对项目工程执行打包、编译、构建、测试以及最终发布到目的地服务器并成功部署运行&#xff0c;本文主要描述J…

HR对职业发展进行思考

如果你还没有职业发展方面的思考&#xff0c;请不要怪自己&#xff0c;这很正常。没有谁是一开始就会如此清晰理性地对职业发展进行思考。 笔者对职业发展有关话题进行系统性的思考&#xff0c;得益于两本书&#xff1a; 第一本是哈佛大学泰勒本-沙哈尔教授的《幸福的方法》&…

Git(10)——Git多人协同开发之邀请成员

一、简介 本篇文章接着第九章介绍Git多人协同开发如何邀请成员 二、创建dev分支 前面已经提到master只用于上线正式代码&#xff0c;因此需要创建一个专门用于开发的dev分支 ①使用如下命令创建dev分支并切换到dev分支 git checkout -b dev ②将dev分支上传至远端仓库&…

Redis分布式锁及其常见问题解决方案

Redis 是一种内存中的数据结构存储系统&#xff0c;它可以用作数据库、缓存和消息代理。由于其高性能和灵活的数据结构&#xff0c;Redis 被广泛应用在各种场景中&#xff0c;包括实现分布式锁。 分布式锁是一种在分布式系统中实现互斥访问的技术。在许多实际应用场景中&#x…

MyBatis基础之执行SQL

文章目录 执行 SQL 语句1. 增删改操作insert 元素insert 过程中的主键回填delete 元素 和 update 元素 2. getMapper 方法3. 查操作select 元素select 与 聚合函数 4. 传递多个参数使用 Map 传递多参数使用 JavaBean 传递多参使用注解方式传递多参数 执行 SQL 语句 Mapper 是 …

1999-2018年地级市一般公共预算收入、支出(教育事业费、科技支出)

1999-2018年地级市一般公共预算收入、支出&#xff08;教育事业费、科技支出&#xff09; 1、时间&#xff1a;1999-2018年 2、来源&#xff1a;城市年鉴 3、指标&#xff1a;行政区划代码、城市、年份、地方一般公共预算收入_市辖区_万元、地方一般公共预算支出_市辖区_万元…

云效+主机部署解决方案(需求->开发->测试->发布->运维->运营)

文章目录 引言I Maven相关1.1 阿里云私有仓库-迁移本地仓库至私有仓库II 代码管理2.1 初始化仓库脚本2.2 分支模式:分支开发、主干发布“的模式III 集成3.1 开启分支模式IV 创建阿里云子账号(RAM)V 安全组端口访问规则配置IV 阿里云的日志服务 SLSsee also引言 Flow语言专项…