Python入门(8):文件

news2025/4/5 12:36:20

1. 文件基本概念

文件:存储在计算机上的数据集合,Python 通过文件对象来操作文件。

文件类型

  • 文本文件:由字符组成,如 .txt, .py

  • 二进制文件:由字节组成,如 .jpg, .mp3

2. 文件打开与关闭

2.1 open() 函数

# 打开文件的基本语法
file = open('example.txt', 'r')  # 'r'表示读取模式
file.close()  # 关闭文件

2.2 文件打开模式

模式描述
'r'只读(默认)
'w'写入(会覆盖)
'a'追加
'x'创建新文件
'b'二进制模式
't'文本模式(默认)
'+'读写模式
# 使用 with 语句自动管理文件(推荐)
with open('example.txt', 'r') as file:
    content = file.read()  # 读取文件内容
# 离开 with 块后文件自动关闭

3. 文件读取方法

3.1 读取整个文件

with open('example.txt', 'r') as file:
    content = file.read()  # 读取全部内容为字符串
    print(content)

3.2 逐行读取

# 方法1:使用 readline()
with open('example.txt', 'r') as file:
    line = file.readline()  # 读取一行
    while line:
        print(line.strip())  # strip() 去除换行符
        line = file.readline()

# 方法2:使用 readlines()
with open('example.txt', 'r') as file:
    lines = file.readlines()  # 读取所有行到列表
    for line in lines:
        print(line.strip())

# 方法3:直接迭代文件对象(推荐)
with open('example.txt', 'r') as file:
    for line in file:  # 逐行迭代
        print(line.strip())

4. 文件写入方法

4.1 写入字符串

# 写入模式(会覆盖原文件)
with open('output.txt', 'w') as file:
    file.write("Hello, World!\n")  # 写入字符串
    file.write("This is a new line.\n")

# 追加模式
with open('output.txt', 'a') as file:
    file.write("This line will be appended.\n")

4.2 写入多行

lines = ["First line\n", "Second line\n", "Third line\n"]
with open('output.txt', 'w') as file:
    file.writelines(lines)  # 写入多行

5. 文件位置操作

with open('example.txt', 'rb') as file:  # 二进制模式才能使用 seek()
    print(file.tell())  # 获取当前文件位置(字节偏移量)
    content = file.read(10)  # 读取10个字节
    print(content)
    file.seek(5)  # 移动到第5个字节
    print(file.read(5))  # 读取接下来的5个字节

6. 二进制文件操作

# 读取二进制文件
with open('image.jpg', 'rb') as file:
    data = file.read()  # 读取二进制数据

# 写入二进制文件
with open('copy.jpg', 'wb') as file:
    file.write(data)  # 写入二进制数据

7. 文件与目录操作(os 模块)

import os

# 检查文件/目录是否存在
print(os.path.exists('example.txt'))  # True/False

# 获取文件大小
print(os.path.getsize('example.txt'))  # 字节数

# 重命名文件
os.rename('old.txt', 'new.txt')

# 删除文件
os.remove('file_to_delete.txt')

# 目录操作
os.mkdir('new_dir')  # 创建目录
os.rmdir('empty_dir')  # 删除空目录

8. 文件路径操作(os.path 模块)

import os.path

# 获取绝对路径
print(os.path.abspath('example.txt'))

# 检查是否为文件/目录
print(os.path.isfile('example.txt'))  # True
print(os.path.isdir('example.txt'))  # False

# 路径拼接
print(os.path.join('folder', 'subfolder', 'file.txt'))

# 获取文件名和扩展名
print(os.path.basename('/path/to/file.txt'))  # 'file.txt'
print(os.path.splitext('file.txt'))  # ('file', '.txt')

9. 临时文件(tempfile 模块)

import tempfile

# 创建临时文件
with tempfile.NamedTemporaryFile(delete=False) as temp_file:
    temp_file.write(b"Temporary data")  # 写入临时数据
    temp_path = temp_file.name  # 获取临时文件路径
    print(f"临时文件路径: {temp_path}")

# 临时文件会在关闭后自动删除(除非设置 delete=False)

10. 文件编码处理

# 指定编码方式(推荐)
with open('example.txt', 'r', encoding='utf-8') as file:
    content = file.read()

# 处理编码错误
try:
    with open('example.txt', 'r', encoding='utf-8') as file:
        content = file.read()
except UnicodeDecodeError:
    print("文件编码不匹配!")

# 写入时指定编码
with open('output.txt', 'w', encoding='utf-8') as file:
    file.write("包含中文的内容")

11. CSV 文件处理

import csv

# 读取CSV文件
with open('data.csv', 'r', encoding='utf-8') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)  # 每行是一个列表

# 写入CSV文件
data = [['Name', 'Age'], ['Alice', 25], ['Bob', 30]]
with open('output.csv', 'w', encoding='utf-8', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)  # 写入多行

12. JSON 文件处理

import json

# 写入JSON文件
data = {'name': 'Alice', 'age': 25, 'skills': ['Python', 'Java']}
with open('data.json', 'w', encoding='utf-8') as file:
    json.dump(data, file, indent=4)  # indent参数美化输出

# 读取JSON文件
with open('data.json', 'r', encoding='utf-8') as file:
    loaded_data = json.load(file)
    print(loaded_data['name'])  # Alice

13. 文件操作最佳实践

  1. 始终使用 with 语句管理文件资源

  2. 明确指定文件编码(特别是处理文本时)

  3. 处理大文件时使用迭代方式而非一次性读取

  4. 检查文件/目录是否存在再进行操作

  5. 合理处理文件操作可能引发的异常

  6. 使用 os.path 进行路径操作而非字符串拼接

  7. 敏感操作前对数据做好备份

14. 常见文件操作异常处理

try:
    with open('nonexistent.txt', 'r') as file:
        content = file.read()
except FileNotFoundError:
    print("文件不存在!")
except PermissionError:
    print("没有文件访问权限!")
except IOError as e:
    print(f"文件操作错误: {e}")
finally:
    print("操作结束")

如果您觉得本文章对您有帮助,别忘了点赞、收藏加关注,更多干货内容将持续发布,您的支持就是作者更新最大的动力。本专栏将持续更新,有任何问题都可以在评论区讨论

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2327819.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎么让一台云IPPBX实现多家酒店相同分机号码一起使用

下面用到的IPPBX是我们二次开发后的成品,支持各种云服务器一键安装,已经写好了一键安装包,自动识别系统环境,安装教程这里就不再陈述了! 前言需求 今天又遇到了一个客户咨询,关于部署一台云IPPBX&#xf…

蓝桥杯2024JavaB组的一道真题的解析

文章目录 1.问题描述2.问题描述3.思路分析4.代码分析 1.问题描述 这个是我很久之前写的一个题目,当时研究了这个题目好久,发布了一篇题解,后来很多人点赞,我都没有意识到这个问题的严重性,我甚至都在怀疑自己&#xf…

计算机视觉算法实战——基于YOLOv8的行人流量统计系统

✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连✨ ​​​ ​​​​​​​​​ ​​ 引言:智能客流分析的市场需求 在零售、交通、安防等领域,准确的行人流量统计对于商业决策、公共安全管理…

机器学习ML极简指南

机器学习是现代AI的核心,从推荐系统到自动驾驶,无处不在。但每个智能应用背后,都离不开那些奠基性的模型。本文用最简练的方式拆解核心机器学习模型,助你面试时对答如流,稳如老G。 线性回归 线性回归试图通过"最…

flux绘画模型介绍

一、Flux绘画模型的核心定义与背景 Flux绘画模型是由Black Forest Labs开发的先进AI图像生成模型,其核心团队源自Stable Diffusion的创始成员(如Robin Rombach),结合了Stability AI的技术积累与创新突破。该模型于2024年8月首次发…

LLM驱动的智能体:基于GPT的对话智能体开发指南

前言 大语言模型(LLM, Large Language Model)正在彻底改变智能体(Agent)的设计和实现方式。从简单的聊天机器人到复杂的自动化助手,基于GPT等LLM的对话智能体已经在客服、教育、办公自动化、编程助手等领域得到了广泛…

项目之Boost搜索引擎

目录 搜索引擎项目背景 搜索引擎的宏观原理 搜索引擎技术栈和项目环境 搜索引擎具体原理(正排索引和倒排索引) 正排索引 倒排索引 编写数据去标签与数据清洗的模块 Parser 从boost官网导入HTML网页数据 去标签 构建 Parser 模块 递归式获取 HTML 文件的带文件名称…

MyBatis 动态SQL 详解!

目录 一、 什么是动态 SQL?二、 为什么需要动态 SQL?三、 MyBatis 动态 SQL 标签四、 标签详解及示例1、 if 标签2、 choose、when、otherwise 标签3、 where 标签4、 set 标签5、 foreach 标签6、 sql、include 标签 五、 总结 🌟我的其他文…

【Linux学习笔记】开发工具git和gbd和cgbd的介绍和使用

【Linux学习笔记】开发工具git和gbd和cgbd的介绍和使用 🔥个人主页:大白的编程日记 🔥专栏:Linux学习笔记 文章目录 【Linux学习笔记】开发工具git和gbd和cgbd的介绍和使用前言一. 版本控制器Git1.1版本控制器1.2 git 简史1.3 安…

php的高速缓存

部署方法 在我们安装的nginx中默认不支持memc和srcache功能,需要借助第三方模块来让nginx支持此功能。 tar zxf srcache-nginx-module-0.33.tar.gz tar zxf memc-nginx-module-0.20.tar.gz 下载这俩个模块,然后编译安装的时候加进去 编译安装完成之后…

Real-Time Anomaly Detection of Network Traffic Basedon CNN

1知识点补充 边缘计算模型 成为一种新的分布式数据处理方式,通过靠近数据侧,及时响应用户的计算请求,降低数据传输的网络延迟。 边缘节点是边缘计算架构中最基础的物理或逻辑单元,指位于网络边缘(靠近数据源或用户&a…

RHCSA LINUX系统文件管理

一.7种文件类型 注意:Linux系统文件名的后缀只是为了方便用户识别文件类型 Linux系统设计哲学:一切皆文件 1.使用 “ls -l” 命令查看到的第一个字符,对应不同文件类型及说明如下: ①“-”:普通文件,类…

AQUA爱克泳池设备入驻济南校园,以品质筑牢游泳教育安全防线

在推进校园体育教育高质量发展的时代背景下,游泳作为一项兼具运动价值与生存技能的重要课程,正被越来越多的学校纳入教学体系。泳池作为开展游泳教学与运动的关键设施,其配套泳池设备的先进性与安全性愈发受到重视。作为泳池水处理设备行业的…

基于CNN实现电力负荷多变量时序预测(PyTorch版)

前言 系列专栏:【深度学习:算法项目实战】✨︎ 涉及医疗健康、财经金融、商业零售、食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记…

网络空间安全(50)JavaScript基础语法

一、变量声明 ①var: 早期的变量声明方式,函数作用域。 ②let: 块级作用域,推荐在现代 JavaScript 中使用。 ③const: 块级作用域,用于声明常量,值不可变。 var name "Alice"; let age 30; const PI 3.14159; 二、数…

深入理解二叉树、B树与B+树:原理、应用与实现

文章目录 引言一、二叉树:基础而强大的结构基本概念特性分析Java实现应用场景 二、B树:适合外存的多路平衡树基本概念关键特性查询流程示例Java简化实现典型应用 三、B树:数据库索引的首选核心改进优势分析范围查询示例Java简化实现实际应用 …

mysql对表,数据,索引的操作sql

对表的操作 新建表 创建一个名为rwh_test的表,id为主键自增 -- 新建表 CREATE TABLE rwh_test(id int NOT NULL auto_increment PRIMARY KEY COMMENT 主键id,username VARCHAR(20) DEFAULT NULL COMMENT 用户名,age int DEFAULT NULL COMMENT 年龄,create_date d…

verl单机多卡与多机多卡使用经验总结

文章目录 I. 前言II. SFT2.1 单机多卡2.2 多机多卡 III. RL (GRPO)3.1 单机多卡3.2 多机多卡2.3 模型转换 I. 前言 在上一篇文章verl:一个集SFT与RL于一体的灵活大模型post-training框架 (快速入门) 中,初步探讨了verl框架的基础使用方法。在实际工业级…

胶铁一体化产品介绍

•一体化结构特点介绍 胶框/铁框一体化技术最早在韩国采用,07年以来由于要求背光越做越薄。在采用0.4mm及以下厚度的LGP时,胶框及背光就会变得异常软,胶框不易组装,铁框松动等问题。 由于胶框和铁框是紧紧粘合在一起的,这正可以解…

蓝桥杯刷题记录【并查集001】(2024)

主要内容:并查集 并查集 并查集的题目感觉大部分都是模板题,上板子!! class UnionFind:def __init__(self, n):self.pa list(range(n))self.size [1]*n self.cnt ndef find(self, x):if self.pa[x] ! x:self.pa[x] self.fi…