文件介绍
数据存放的容器
文件的作用
持久性的存储数据内容
文件组成
文件名
如果是同级目录下, 不允许同名文件存在
扩展名
.jpg
.avi
.doc
.xls
.html
...
注意
一般不同的扩展名, 对应着不同的文件格式
不同的文件格式, 有着不同的存储约定, 方便程序处理
文件内容
文本文件
txt
doc
xls
...
二进制文件
图片
视频
音乐
...
文件的使用流程
打开
open("文件","模式")
文件
指定文件路径
模式
控制操作模式
模式
r
以只读方式打开文件
这是默认模式
文件的指针将会放在文件的开头
注意:
文件不存在, 会报错
w
以只写方式打开文件
文件的指针将会放在文件的开头
所以, 写入的新内容, 会覆盖旧的内容
注意
文件不存在, 会自动创建一个新文件
a
以追加方式(只写)打开文件
文件的指针将会放在文件结尾
所以, 写入的内容, 会新增到文件末尾
注意
文件不存在, 会自动创建一个新文件
# 1. 打开文件
# 相对路径, 相对于哪一个目录下面的指定文件
f = open("a.txt", "r")
# 2. 读写操作
content = f.read()
print(content)
f.write("88888")# 会报错,因为当前f为只读模式
# # 3. 关闭文件
# f.close()
增加b
rb
wb
ab
以二进制格式进行操作文件读写
如果文件是二进制文件, 则选择此项
例如
图片
视频
音频
...
# 1. 打开xx.jpg文件, 取出内容, 获取内容的前面半部分
# 1.1 打开文件
fromFile = open("xx.jpg", "rb")
# 1.2 读取文件内容
fromContent = fromFile.read()
print(fromContent)
# 1.3 关闭文件
fromFile.close()
# 2. 打开另外一个文件xx2.jpg, 然后, 把取出的半部分内容, 写入到xx2.jpg文件里面去
# 2.1 打开目标文件
toFile = open("xx2.jpg", "wb")
# 2.2 写入操作
content = fromContent[0: len(fromContent) // 2]
toFile.write(content)
# 2.3 关闭文件
toFile.close()
增加+
r+
1.与 r的区别
2. 与 写 和 w的区别
w+
a+
rb+
rw+
ra+
代表都是以 "读写模式" 进行打开
其他特性基本和 + 前面的模式一致
但是关于部分操作, 有细节区别
作业:
自己做测试, 验证区别
读写
定位
f.seek(偏移量,[0,1,2])
0
表示开头位置【默认】
1
表示当前位置
2
表示文件末尾位置
注意
文本文件的操作模式下(不带b)
只能写0
如果想要写1、2, 必须在二进制文件操作模式下(带b)
f.tell()
查看当前位置
f = open("a.txt", "r")
print(f.tell())
f.seek(2)
f.seek(-2,2) # 文件末尾位置,前移两个偏移量
print(f.tell())
print(f.read())
print(f.tell())
f.close()
读
f.read(字节数)
字节数默认是文件内容长度
下标会自动后移
f.readline([limit])
读取一行数据
limit
限制的最大字节数
f.readlines()
会自动的将文件按换行符进行处理
将处理好的每一行组成一个列表返回
for in
可以直接遍历 f 本身
也可以遍历行列表
判定是否可读
.readable()
注意
一般文件特别大的时候, 可以使用readline方法
按行加载, 可节省内存
但相比于其他两个读取方法, 性能较低
其他两个方法, 一次性读取文件所有内容
虽然占用内存
但处理性能比较高
#f.read(字节数)
# 字节数默认是文件内容长度
# 下标会自动后移e
f.seek(2)
content = f.read(2)
print(f.tell())
print(content)
# f.readline([limit])
# 读取一行数据
# limit
# 限制的最大字节数
print("----", f.tell())
content = f.readline()
print(content, end="")
print("----", f.tell())
content = f.readline()
print(content, end="")
print("----", f.tell())
content = f.readline()
print(content, end="")
print("----", f.tell())
# f.readlines()
# 会自动的将文件按换行符进行处理
# 将处理好的每一行组成一个列表返回
content = f.readlines()
print(content)
f.close()
import collections
# for in
# 可以直接遍历 f 本身
# 也可以遍历行列表
f = open("a.txt", "r")
print(isinstance(f, collections.Iterator)) # 判定是否是迭代器
# 可以遍历自身
for i in f:
print(i, end="")
## 判定是否可读
## .readable()
if f.readable():
# 可以遍历行列表
content = f.readlines()
for i in content:
print(i, end="")
f.close()
写
f.write("内容")
返回值是写入的字节长度
判定是否可写
.writeable()
f = open("a.txt", "w")
if f.writable():
print(f.write("123"))
关闭
f.close()
关闭文件
为什么需要关闭?
打开状态, 会占用系统资源
会把缓冲区内容清空到磁盘文件中
补充
f.flush()
清空缓冲区内容到磁盘文件中
f = open("a.txt", "w")
if f.writable():
print(f.write("123"))
f.flush()
f.close()
文件的相关操作
模块
import os
信息获取操作
.closed
返回true如果文件已被关闭,否则返回false
.name
返回文件的名称
其他操作
重命名
os.rename(‘old_name’, 'new_name')
删除
删除文件
os.remove('文件名')
文件不存在会报错
删除目录
os.rmdir(path)
不能递归删除目录
如果文件夹非空,会报错
os.removedirs(path)
可以递归的删除目录,即删除该路径上的所有文件夹
如果文件夹非空会报错
创建文件夹
os.mkdir("文件夹名称"[,mode])
不能递归创建【即不多多级创建】
数字模式权限
文件拥有者
读
r
4
写
w
2
可执行
x
1
同组用户
读
r
4
写
w
2
可执行
x
1
其他用户
读
r
4
写
w
2
可执行
x
1
获取当前目录
os.getcwd()
改变默认目录
os.chdir("目标目录")
获取目录列表
os.listdir("./")
import os
# 重命名
os.rename("b.txt", "bb.txt")
os.rename("first", "one")
os.rename("one/one.txt", "two/two.txt")
os.renames("one/one.txt", "two/two.txt") #会一级一级向上修改文件名称
# 删除
## 删除文件
os.remove("xx2.jpg")
## 删除文件夹
os.rmdir("one/one2") # 会报错
os.removedirs("one/one2") # 可以递归的删除目录,即删除该路径上的所有文件夹
# 创建文件夹
os.mkdir("a")
os.mkdir("b/c/d") # 会报错,只能创建一级目录,不能创建多级目录
# 创建文件夹并设置权限
os.mkdir("b", 0o777)
# 切换文件目录
os.chdir("a")
open("dd.txt", "w")
# 获取当前目录
os.getcwd()
print(os.getcwd())
# 改变默认目录
os.chdir("目标目录")
# 获取目录内容列表
# 列举当前a目录下的所有文件,结果是列表
print(os.listdir("a"))
# 列举当前所在目录下的一级内容。文件、文件夹等,注意:不包含文件夹下的深层内容
print(os.listdir("./"))
# 列举当前所在目录的上一级目录下的内容。文件、文件夹等,注意:不包含文件夹下的深层内容
print(os.listdir("../"))
案例
文件的复制
import os
os.chdir("files") # 切换目录
#1. 只读模式, 打开要复制的文件
# # 追加模式, 打开副本文件
source_file = open("d.txt", "r", encoding="utf-8")
dst_file = open("d_bat.txt", "a", encoding="utf-8")
# # 2. 从源文件中读取内容
# # 写入到目标文件中
# content = source_file.read()
# dst_file.write(content)
## 大文件处理
while True:
content = source_file.read(1024)
if len(content) == 0:
break
dst_file.write(content)
#3. 关闭源文件和目标文件
source_file.close()
dst_file.close()
批量重命名
文件分类,并生成文件清单
给定一批不同格式的文件;按照文件夹后缀名,划分到不同的文件夹;生成 .txt 格式的文件清单,清单标明不同的格式分别有那些文件
# 文件分类
# 0, 获取所有的文件名称列表
import os
import shutil
path = "files"
if not os.path.exists(path):
exit()
os.chdir(path)
file_list = os.listdir("./")
# print(file_list)
# 1. 遍历所有的文件(名称)
for file_name in file_list:
# print(file_name)
# 2. 分解文件的后缀名
# 2.1 获取最后一个.的索引位置 xx.oo.txt
index = file_name.rfind(".")
if index == -1:
continue
# print(index)
# 2.2 根据这个索引位置, 当做起始位置, 来截取后续的所有字符串内容
extension = file_name[index + 1:]
print(extension)
# 3. 查看一下, 是否存在同名的目录
# 4. 如果不存在这样的目录 -> 直接创建一个这样名称的目录
if not os.path.exists(extension):
os.mkdir(extension)
shutil.move(file_name, extension)
# 5, 目录存在 -> 移动过去
# 生成文件清单
# 通过给定的文件夹, 列举出这个文件夹当中, 所有的文件,以及文件夹, 子文件夹当中的所有文件
def listFilesToTxt(dir, file):
# 1. 列举出, 当前给定的文件夹, 下的所有子文件夹, 以及子文件
file_list = os.listdir(dir)
# print(file_list)
# 2. 针对于, 列举的列表, 进行遍历
for file_name in file_list:
new_fileName = dir + "/" + file_name
# 判定, 是否是目录, listFiles
if os.path.isdir(new_fileName):
# print(new_fileName)
file.write(new_fileName + "\n")
listFilesToTxt(new_fileName, file)
else:
# 打印下, 文件名称
# print("\t" + file_name)
file.write("\t" + file_name + "\n")
# print("")
file.write("\n")
f = open("list.txt", "a")
listFilesToTxt("files", f)
补充-数字模式权限
如何在Python中读取文件的权限模式?
在 Python 中,你可以使用 os 模块来读取文件的权限模式。os 模块提供了一些函数来获取文件和目录的信息,包括权限模式。
import os
# 替换为你要读取权限的文件路径
file_path = "your_file_path"
# 使用 os.stat() 函数获取文件的状态信息
file_stat = os.stat(file_path)
# 获取权限模式
mode = file_stat.st_mode
# 打印权限模式
print("权限模式:", oct(mode))
在上面的示例中,首先指定要读取权限的文件路径。然后,使用 os.stat() 函数获取文件的状态信息,并将其存储在 file_stat 变量中。file_stat 对象包含了文件的各种信息,包括权限模式。
通过访问 file_stat.st_mode 属性,可以获取到文件的权限模式。最后,使用 oct() 函数将权限模式转换为八进制表示,并打印出来。
请注意,权限模式的八进制表示通常以 "0o" 开头,表示这是一个八进制数。每个数字位对应着不同的权限,例如前三位表示所有者的权限,接下来三位表示组的权限,最后三位表示其他用户的权限。
通过这种方式,你可以在 Python 中读取文件的权限模式,并根据需要进行进一步的处理或分析。
数字如何表示权限
首先,我们规定 数字 4 、2 和 1表示读、写、执行权限(具体原因可见下节权限详解内容),即 r=4,w=2,x=1 。此时其他的权限组合也可以用其他的八进制数字表示出来,
如:
rwx = 4 + 2 + 1 = 7
rw = 4 + 2 = 6
rx = 4 +1 = 5
即
若要同时设置 rwx (可读写运行) 权限则将该权限位 设置 为 4 + 2 + 1 = 7
若要同时设置 rw- (可读写不可运行)权限则将该权限位 设置 为 4 + 2 = 6
若要同时设置 r-x (可读可运行不可写)权限则将该权限位 设置 为 4 +1 = 5
上面我们提到,每个文件都可以针对三个粒度,设置不同的rwx(读写执行)权限。即我们可以用三个8进制数字分别表示 拥有者 、群组 、其它组( u、 g 、o)的权限详情,并用chmod直接加三个8进制数字的方式直接改变文件权限。
Linux上通常使用chmod命令对文件的权限进行设置和更改
chmod [可选项] <mode> <file…>
参数说明:
[可选项]
-c, --changes like verbose but report only when a change is made (若该档案权限确实已经更改,才显示其更改动作)
-f, --silent, --quiet suppress most error messages (若该档案权限无法被更改也不要显示错误讯息)
-v, --verbose output a diagnostic for every file processed(显示权限变更的详细资料)
--no-preserve-root do not treat '/' specially (the default)
--preserve-root fail to operate recursively on '/'
--reference=RFILE use RFILE's mode instead of MODE values
-R, --recursive change files and directories recursively (以递归的方式对目前目录下的所有档案与子目录进行相同的权限变更)
--help 显示此帮助信息
--version 显示版本信息
[mode]
权限设定字串,详细格式如下 :
[ugoa...][[+-=][rwxX]...][,...],
其中
[ugoa...]
u 表示该档案的拥有者,g 表示与该档案的拥有者属于同一个群体(group)者,o 表示其他以外的人,a 表示所有(包含上面三者)。
[+-=]
+ 表示增加权限,- 表示取消权限,= 表示唯一设定权限。
[rwxX]
r 表示可读取,w 表示可写入,x 表示可执行,X 表示只有当该档案是个子目录或者该档案已经被设定过为可执行。
[file...]
文件列表(单个或者多个文件、文件夹)
示例
1、设置所有用户可读取文件 a.conf
chmod ugo+r a.conf
或
chmod a+r a.conf
2、设置 c.sh 只有 拥有者可以读写及执行
chmod u+rwx c.sh
3、设置文件 a.conf 与 b.xml 权限为拥有者与其所属同一个群组 可读写,其它组可读不可写
chmod a+r,ug+w,o-w a.conf b.xml
4、设置当前目录下的所有档案与子目录皆设为任何人可读写
chmod -R a+rw *