史上最全文件类型读写库大盘点!什么?还包括音频、视频?

news2024/11/26 23:17:59

介绍史上最全PYTHON文件类型读写库大盘点!包含常用和不常用的大量文件格式!文本、音频、视频应有尽有!废话不多说!走起来!

先给大家快捷总结:

文件格式Python库
文本文件内置open函数
CSV文件csv
JSON文件json
XML文件xml.etree.ElementTree
二进制文件内置open函数
图片文件PIL (Python Imaging Library)
Word文件python-docx
XLSX文件openpyxl
PDF文件PyPDF2
SQLite数据库文件sqlite3
音频文件pydub
视频文件moviepy
HTML文件BeautifulSoup
YAML文件pyyaml
ZIP文件zipfile

正文开始!

1. 文本文件

在Python中,处理文本文件是最基础的文件操作,我们使用内置的open函数打开一个文件,然后使用文件对象的read或write方法进行读写操作。

# 写入文本文件
with open('example.txt', 'w') as f:
    f.write('Hello, Python!')

# 读取文本文件
with open('example.txt', 'r') as f:
    print(f.read())

在这里,open函数的第一个参数是文件名,第二个参数是文件模式,其中'r'代表读模式,'w'代表写模式。使用'with'语句可以确保文件在操作完成后被正确关闭。这是一个标准的文件操作模式,也适用于其他类型的文件。

2. CSV文件

CSV(Comma-Separated Values)文件是一种常用的数据交换格式,每行表示一条记录,各字段之间由逗号分隔。Python的csv模块提供了用于读写CSV文件的工具。

import csv

# 写入CSV文件
with open('example.csv', 'w', newline='') as f:
    writer = csv.writer(f)
    writer.writerow(['name', 'age'])
    writer.writerow(['Alice', 20])
    writer.writerow(['Bob', 25])

# 读取CSV文件
with open('example.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

这里,csv.writer和csv.reader函数分别返回一个写入器和读取器对象,我们可以使用这些对象进行CSV文件的读写操作。

3. JSON文件

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于阅读和编写,同时也易于机器解析和生成。Python的json模块提供了用于读写JSON文件的工具。

import json

# 写入JSON文件
data = {
    'name': 'Alice',
    'age': 20,
}
with open('example.json', 'w') as f:
    json.dump(data, f)

# 读取JSON文件
with open('example.json', 'r') as f:
    data = json.load(f)
    print(data)

在这里,json.dump和json.load函数分别用于将Python对象转换为JSON格式并写入文件,以及从文件中读取JSON数据并转换为Python对象。

4. XML文件

XML(eXtensible Markup Language)是一种标记语言,可以用来描述数据的结构。Python的xml模块提供了用于读写XML文件的工具。

from xml.etree import ElementTree as ET

# 写入XML文件
root = ET.Element('root')
child = ET.Element('child')
child.text = 'Hello, Python!'
root.append(child)
tree = ET.ElementTree(root)
tree.write('example.xml')

# 读取XML文件
tree = ET.parse('example.xml')
root = tree.getroot()
for child in root:
    print(child.text)

在这里,我们使用xml.etree.ElementTree模块创建一个XML文件的树形结构,然后使用ElementTree对象的write方法将其写入文件。读取XML一个ElementTree对象,然后通过遍历这个对象来读取XML数据。

5.二进制文件

二进制文件是直接包含二进制数据的文件,例如图像文件、音频文件等。Python使用'b'模式打开二进制文件,然后使用文件对象的read或write方法进行读写操作。

# 写入二进制文件
data = b'Hello, Python!'
with open('example.bin', 'wb') as f:
    f.write(data)

# 读取二进制文件
with open('example.bin', 'rb') as f:
    data = f.read()
    print(data)

在这里,'wb'和'rb'分别代表二进制写模式和二进制读模式。注意我们使用bytes类型的数据进行二进制写操作。

6. 图片文件

处理图片文件一般需要借助第三方库,如PIL(Python Imaging Library)。

from PIL import Image

# 读取图片文件
img = Image.open('example.jpg')

# 修改图片
img = img.rotate(45)  # 旋转45度

# 写入图片文件
img.save('example_rotated.jpg')

这里,Image.open和Image.save函数分别用于读取和保存图片文件。PIL库提供了丰富的图像处理功能,例如旋转、裁剪、缩放等。

7. Word文件

处理Word文件,我们可以使用python-docx库,这是一个创建、修改和提取Microsoft Word文件的Python库。

from docx import Document

# 创建新的Word文件

doc = Document()

doc.add_paragraph('Hello, Python!')

doc.save('example.docx')

# 读取Word文件

doc = Document('example.docx')

for para in doc.paragraphs:

    print(para.text)

在这里,我们首先创建一个Document对象,然后使用add_paragraph方法添加段落,最后使用save方法保存文档。读取Word文件时,我们遍历Document对象的paragraphs属性,打印出每个段落的文本。

8. XLSX文件

处理Excel文件,我们可以使用openpyxl库,这是一个读写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。

from openpyxl import Workbook, load_workbook

# 创建新的Excel文件
wb = Workbook()
ws = wb.active
ws['A1'] = 'Hello,'
ws['B1'] = 'Python!'
wb.save('example.xlsx')

# 读取Excel文件
wb = load_workbook('example.xlsx')
ws = wb.active
print(ws['A1'].value, ws['B1'].value)

在这里,我们首先创建一个Workbook对象和Worksheet对象,然后使用字典方式访问单元格并赋值,最后使用save方法保存工作簿。读取Excel文件时,我们使用load_workbook函数加载工作簿,然后访问激活的工作表的单元格。

9. PDF文件

PDF是一种常见的文件格式,我们可以使用Python的PyPDF2库来处理PDF文件。

import PyPDF2

# 读取PDF文件
with open('example.pdf', 'rb') as f:
    reader = PyPDF2.PdfFileReader(f)
    page = reader.getPage(0)
    print(page.extractText())

# 注意:PyPDF2不能直接创建PDF文件,但可以合并、裁剪和旋转PDF文件

在这里,我们使用PdfFileReader对象读取PDF文件,然后使用getPage方法获取某一页,最后使用extractText方法提取文本。注意PyPDF2不能直接创建PDF文件,但可以合并、裁剪和旋转PDF文件。

10. SQLite数据库文件

SQLite是一种嵌入式数据库,它的数据库全都保存在一个单独的文件中。Python的sqlite3模块提供了对SQLite数据库的支持。

import sqlite3

# 创建并写入SQLite数据库
conn = sqlite3.connect('example.db')
c = conn.cursor()
c.execute("CREATE TABLE test (name text, age integer)")
c.execute("INSERT INTO test VALUES ('Alice', 20)")
conn.commit()
conn.close()

# 读取SQLite数据库
conn = sqlite3.connect('example.db')
c = conn.cursor()
for row in c.execute("SELECT * FROM test"):
    print(row)
conn.close()

在这里,我们首先创建一个数据库连接和游标对象,然后使用execute方法执行SQL语句,最后使用commit方法提交事务。读取SQLite数据库时,我们遍历execute方法的结果,打印出每一行。

11. 音频文件

处理音频文件,我们可以使用pydub库,这是一个处理音频的Python库。

from pydub import AudioSegment

# 读取音频文件
audio = AudioSegment.from_file('example.mp3')

# 修改音频
audio = audio.reverse()  # 反转音频

# 保存音频文件
audio.export('example_reversed.mp3', format='mp3')

在这里,AudioSegment.from_file函数用于读取音频文件。pydub库提供了丰富的音频处理功能,例如反转、裁剪、合并等。最后使用export方法保存音频文件。

12. 视频文件

处理视频文件,我们可以使用moviepy库,这是一个用于视频编辑的Python库。

from moviepy.editor import VideoFileClip

# 读取视频文件
clip = VideoFileClip('example.mp4')

# 修改视频
clip = clip.subclip(10, 20)  # 截取第10秒到第20秒的片段

# 保存视频文件
clip.write_videofile('example_subclip.mp4')

在这里,VideoFileClip函数用于读取视频文件。moviepy库提供了丰富的视频处理功能,例如裁剪、拼接、添加音频等。最后使用write_videofile方法保存视频文件。

13. HTML文件

HTML是网页的主要构成元素。我们可以使用Python的beautifulsoup库解析HTML文件。

from bs4 import BeautifulSoup

# 读取HTML文件
with open('example.html', 'r') as f:
    soup = BeautifulSoup(f, 'html.parser')

# 解析HTML
print(soup.title.text)  # 打印标题

# 注意:BeautifulSoup不能直接创建HTML文件,但可以修改HTML文件

在这里,我们使用BeautifulSoup对象解析HTML文件,然后通过标签名访问HTML元素。

14. YAML文件

YAML(YAML Ain't Markup Language)是一种直观的数据序列化格式,常用于配置文件。Python的pyyaml库提供了用于读写YAML文件的工具。

import yaml

# 写入YAML文件
data = {'name': 'Alice', 'age': 20}
with open('example.yaml', 'w') as f:
    yaml.dump(data, f)

# 读取YAML文件
with open('example.yaml', 'r') as f:
    data = yaml.load(f, Loader=yaml.FullLoader)
    print(data)

在这里,yaml.dump和yaml.load函数分别用于将Python对象转换为YAML格式并写入文件,以及从文件中读取YAML数据并转换为Python对象。

15. ZIP文件

ZIP是一种常用的压缩文件格式。Python的zipfile模块提供了用于读写ZIP文件的工具。

from zipfile import ZipFile

# 创建ZIP文件
with ZipFile('example.zip', 'w') as zf:
    zf.write('example.txt')

# 读取ZIP文件
with ZipFile('example.zip', 'r') as zf:
    print(zf.namelist())

在这里,我们使用ZipFile对象创建一个ZIP文件,然后使用write方法添加文件。读取ZIP文件时,我们使用namelist方法列出所有文件。

One More Thing

在处理文件时,一个常被忽视但又极其有用的技巧是使用Python的pathlib模块来处理文件路径。pathlib模块提供了一种面向对象的方式来处理文件和目录路径,使得路径的处理变得更加直观和简洁。 

from pathlib import Path

# 创建Path对象
p = Path('example.txt')

# 检查文件是否存在
if p.exists():
    print('File exists.')

# 获取文件的后缀名
print(p.suffix)

在这个例子中,我们使用Path对象表示一个文件路径,然后使用Path对象的方法和属性来进行各种操作,例如检查文件是否存在,获取文件的后缀名等。这是一个非常强大且易用的模块,可以极大地提高我们处理文件路径的效率。

以上就是Python全文件格式输入输出的介绍。希望通过本文,你能够对Python的文件操作有更深入的理解,并能够在实际编程中灵活运用。如果你有任何问题或想法,欢迎在评论区留言分享。

 

感谢每一个认真阅读我文章的人,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

 资料获取方式:
这份文档和视频资料,对于想从事【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴我走过了最艰难的路程,希望也能帮助到你!以上均可以分享,关注公众号:一个心态巨好的朋友  扣1即可自行领取。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/651171.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

信号量实现线程同步代码

信号量&实现线程同步代码 信号量线程同步示例代码 信号量 信号量(Semaphore)是一种用于多线程编程中的同步工具,用于管理对共享资源的访问。它可以控制同时访问某个资源的线程数量,并提供了对共享资源的互斥访问。 信号量通…

一个支持WinForms换肤的开源组件

博主介绍: 🌈一个10年开发经验.Net老程序员,微软MVP、博客专家、CSDN/阿里云 .Net领域优质创作者,专注于.Net领域知识、开源项目分享!🌈 🛕文末获取,加入交流群🛕 &#…

java数组(Array)

文章目录 一维数组的使用数组的长度数组元素的引用一维数组的遍历一维数组内存分析 数组元素的默认值多维数组的使用静态初始化动态初始化数组的长度和角标二维数组的遍历内存解析 Arrays工具类的使用 一维数组的使用 int[] arr; int arr1[]; double[] arr2; String[] arr3; …

网工内推 | 1-3年经验,思科、华为、华三厂商认证均可

01 地球村股份有限公司 招聘岗位:网络工程师 职责描述: 1、提供技术支持服务,提供设备的告警信息的分析处理及与故障问题定位服务; 2、及时响应在服务时限内完成处理设备故障,包括用户有线无线接入故障、系统故障处理…

数据库第四章(数据库安全性)

1.数据库安全性概述 disiz行 不安全因素: 1.非授权的用户对数据的恶意存取和破坏 2.数据库重要信息泄露 3.数据库环境的脆弱性 如何实现安全控制? 1.用户身份鉴别 口令鉴别 生物鉴别 2.存取控制 3.自主存取控制方法 4.授权与收回 grant and revok…

Map容器(Java)

文章目录 1.容器介绍1.1 容器接口结构1.2 简单解析 2. 容器创建(Member functions)3. 访问操作(Element access)3.1 keySet()3.2 entrySet() 4. 修改操作(Modifiers)4.1 put()4.2 remove()4.3 clear() 5. 容量操作(Member functions)5.1 size()5.2 isEmpety() 6. 其他操作(Othe…

用Swagger生成接口,pom中少了一个library参数,排查了几个小时

前言: 我们一般都会使用swagger生成restful接口,这样可以省不少时间,将更多的精力专注于写业务上。但接口也不是经常写,所以,swagger用的也不熟练。尤其是我喜欢拿之前的接口copy一份,然后在此基础上进行修…

1、springcloud环境搭建

目录 1、创建一个父项目 ​编辑 2、创建子项目 2.1创建订单系统-order ​编辑 2.2创建库存系统-stock 3、创建rest服务 3.1添加web依赖 3.2编写controller 3.3订单中需要调用库存中的扣减库存的接口 通过idea开发工具进行搭建 1、创建一个父项目 通过spring initializr…

QT day4 (time/tcp/draw)

如图所示设计一个闹钟 1、头文件 #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QColor> #include <QDebug> #include <QMessageBox> #include <QTimer> //定时器类的头文件 #include <QTime> …

搞定剑桥面试数学题番外篇2:使用多线程并发“加强版”

0. 概览 我们在之前三篇博文中已经介绍了如何用多种语言&#xff08;ruby、swift、c、x64 汇编和 ARM64 汇编&#xff09;实现一道“超超超难”的剑桥数学面试题&#xff1a; 有趣的小实验&#xff1a;四种语言搞定“超超超难”剑桥面试数学题 搞定“超超超难”剑桥面试数学…

【每日挠头算法题(7)】对称的二叉树|二叉树的所有路径

欢迎&#xff01; 前言一、对称的二叉树思路&#xff1a;递归法具体代码如下&#xff1a; 二、二叉树的所有路径思路&#xff1a;递归法具体代码如下&#xff1a; 总结 前言 提示&#xff1a;这里可以添加本文要记录的大概内容&#xff1a; 例如&#xff1a;随着人工智能的不…

如何快速选择合适的会计软件?这些推荐值得尝试!

现今&#xff0c;许多公司都在使用会计软件来管理它们的财务&#xff0c;提高工作效率。因此选择一个适合自己公司的会计软件是相当重要的。但是&#xff0c;对于许多小型企业而言&#xff0c;如何选择最适合自己的会计软件并不容易。那么&#xff0c;该如何选择合适的会计软件…

开启跨平台之旅:学习Flutter,掌握移动应用开发的未来

Flutter是一种开源的移动应用开发框架&#xff0c;由Google开发和维护。它使用Dart语言进行编写&#xff0c;并提供了丰富的UI组件和工具&#xff0c;用于构建高性能、跨平台的移动应用程序。 优势 跨平台开发&#xff1a;Flutter是一种跨平台的移动应用开发框架&#xff0c;…

管理类联考——英语——技巧篇——时态表

一般现在时 1.概念&#xff1a;经常、反复发生的动作或行为及现在的某种状况。 2.基本结构&#xff1a;①is/am/are;②do/does否定形式&#xff1a;①am/is/are not;②此时态的谓语动词若为行为动词&#xff0c;则在其前加don‘t&#xff0c;如主语为第三人称单数&#xff0c…

资深测试总结,性能测试-业务量/吞吐量/存量数据设计关联(详细)

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 业务量 是不带时…

HTML | html文档中html和body标签的默认尺寸是多少?

新建一个空白的html文件&#xff0c;如下&#xff1a; <!DOCTYPE html> <html lang"en"><head><title></title><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-sc…

day56|动态规划16-编辑距离问题

583. 两个字符串的删除操作 明确dp数组的含义&#xff1a; dp[i][j] 以i-1为结尾的word1和以j-1为结尾的word2&#xff0c;为相同的最小操作次数递归函数&#xff1a; if word1[i-1] word1[j-1]: dp[i][j] dp[i-1][j-1] # 不需要删除&#xff0c;只看上一层的字符串即可 else…

阿里云如何帮助企业进行数据迁移和数据同步?有哪些应用案例?

阿里云如何帮助企业进行数据迁移和数据同步&#xff1f;有哪些应用案例&#xff1f; [本文由阿里云代理商[聚搜云www.4526.cn]撰写] 阿里云数据迁移与数据同步解决方案 阿里云为企业提供了一系列高效、安全并应对不同场景需求的数据迁移与同步服务。这些服务旨在最大范围减少企…

Seata学习 @GlobalTransactional注解的作用

Seata学习 GlobalTransactional注解的作用 1.自动配置类 SeataAutoConfiguration 引入 seata与SpringBoot的整合包后&#xff0c;基于SpringBoot的自动配置&#xff0c;会往Spring容器中自动添加 SeataAutoConfiguration 而 SeataAutoConfiguration 配置类又会往容器中添加be…

基于Java汽车客运站管理系统设计实现(源码+lw+部署文档+讲解等)

博主介绍&#xff1a; ✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战 ✌ &#x1f345; 文末获取源码联系 &#x1f345; &#x1f447;&#x1f3fb; 精…