利用python将Excel文件拆分为多个CSV

news2026/1/15 20:50:35

一、准备工作

二、拆分Excel文件为多个CSV

1、读取Excel文件：

2、确定要拆分的列：

3、创建空的字典来存储CSV文件：

4、循环遍历数据并根据类别拆分：

5、打印或返回CSV文件名字典：

6、保存CSV到特定目录：

7、检查并清理临时文件：

总结与优化

使用Python拆分Excel文件是一项常见的任务，尤其当我们需要处理大型Excel文件时。拆分文件可以方便我们更好地管理数据，并提高处理速度。下面，将详细介绍如何使用Python轻松拆分Excel为多个CSV文件。

一、准备工作

在开始之前，需要确保已经安装了以下Python库：

pandas
openpyxl（用于读取Excel文件）
csv（用于写入CSV文件）

可以使用以下命令安装这些库：
pip install pandas openpyxl csv

二、拆分Excel文件为多个CSV

首先，导入必要的库：
import pandas as pd
假设我们有一个名为"large_excel_file.xlsx"的Excel文件，并且我们想根据某个列（例如"category"列）的值来拆分数据。我们可以按照以下步骤进行：

1、读取Excel文件：

file_path = "large_excel_file.xlsx"  
excel_file = pd.read_excel(file_path, engine='openpyxl')

2、确定要拆分的列：

假设我们要根据"category"列的值来拆分数据。

3、创建空的字典来存储CSV文件：

我们将使用字典来存储每个类别对应的CSV文件。
csv_files = {}

4、循环遍历数据并根据类别拆分：

对于每个唯一的类别值，我们将创建一个新的CSV文件，并将该类别下的所有行写入该文件。

for category in set(excel_file["category"]):  
    mask = excel_file["category"] == category  
    df = excel_file[mask]  
    csv_filename = f"{category}.csv"  
    with open(csv_filename, 'w', newline='', encoding='utf-8') as file:  
        df.to_csv(file, index=False, header=True)  
    csv_files[category] = csv_filename

5、打印或返回CSV文件名字典：

现在，我们拥有一个字典，其中键是类别，值是相应的CSV文件名。我们可以打印或返回这个字典。

6、保存CSV到特定目录：

如果希望将生成的CSV文件保存到特定目录（例如"output_folder"），可以使用os库中的os.path.join函数来构建完整的路径。

7、检查并清理临时文件：

在完成工作后，记得删除这些临时创建的CSV文件。这可以通过调用os.remove()函数来实现，它需要提供要删除的文件的路径作为参数。例如：
os.remove('path/to/your/file.csv') 。可以在循环中添加这些删除命令来删除所有临时创建的CSV文件。

如果想在删除前检查文件是否存在，可以使用os.path.exists()函数。例如： if os.path.exists('path/to/your/file.csv'): os.remove('path/to/your/file.csv') 。请注意，需要将'path/to/your/file.csv'替换想要检查和删除的文件的实际路径。

这是一个通用的方法，用于在Python中检查和删除文件。记住在使用此方法时要小心，以免意外删除重要的文件。最好先进行一些测试，确保正确地指定了文件的路径，并且只有在确定要删除该文件时才进行删除操作。