利用Python处理excel表格,pandas分割表格、拆分表格

news2024/9/23 23:24:24

前言

记录一下,在使用pandas处理excel表格表格时候,关于分割(切分)表格这一块儿的操作。
这个系列会有三篇左右文章,这是第一篇,excel表格切割

我们常说的 excel文件

  • 在广义上,是指以 xlsxlsx 为后缀的文件。(xlsxlsx分别为新旧版本的excel生成的文件格式
  • 在狭义上,是指Microsoft公司编写的一款电子表格软件。

不论如何,这些知识知道了总不会有坏处。


关于excel的分割这一块儿,像wps软件,做的是非常优秀的,一键即可根据内容sheet表进行分割。

在这里插入图片描述

既然它已经这么优秀了,那为啥还写这篇文章呢?对啊!为什么呢?为什么你还会查阅这篇文章呢!!!

解决问题🐓🐓

使用pythonexcel表格进行分割然后保存,分别为

  • 单个sheet,根据内容分割(保存为多sheet或多excel文件

  • 多个sheet,根据sheet分割(保存为多excel文件

  • 带格式的excel切割,看这篇文章:【Python】openpyxl 复制带格式的Excel 表格

安装模块

pip install openpyxl
pip install pandas

知识点📖📖

pandas

类型链接
文档官方文档:https://pandas.pydata.org
视频视频总结:https://www.bilibili.com/video/BV1PZ4y1U7Y7
项目地址项目地址:https://github.com/Frica01/BlogCode/tree/main/excel-operation

代码

这里给出伪代码,可以运行。如需配套练习的excel文件,可从这里获取 excel-operation

单sheet execl表格

一般在根据内容作为分割时候,是指定excel表中某一列的值去做分割。

分割为多个sheet

def split_single_sheet_to_multi_sheet(file_path, column, sheet_name=0):
    """
    单个sheet的excel文件切分成多个sheet的excel文件

    Args:
        file_path(str): excel文件路径
        column(str): 指定分割的列
        sheet_name(int|str): sheet的名称

    Returns: None

    """
    # 处理文件导出路径
    output_file_path = f'./output/{os.path.basename(file_path)}'
    if not os.path.exists('./output'):
        os.makedirs(name='./output')
    # 打开excel文件
    df = read_excel(io=file_path, sheet_name=sheet_name)
    # 写入多个sheet倒excel文件中
    with ExcelWriter(path=output_file_path) as writer:
        # 指定列
        for group in df.groupby(by=column):
            column_name, group_df = group
            column_name: str
            group_df: DataFrame
            group_df.to_excel(excel_writer=writer, sheet_name=column_name, index_label=False)

分割为多个excel文件

def split_single_sheet_to_multi_excel(file_path, column, sheet_name=0):
    """
    单个sheet的excel文件切分为多个excel文件

    Args:
        file_path(str): excel文件路径
        column(str): 指定分割的列
        sheet_name(int|str): sheet的名称

    Returns: None

    """
    # 处理文件导出路径
    if not os.path.exists('./output'):
        os.makedirs(name='./output')
    # 打开excel文件
    df = read_excel(io=file_path, sheet_name=sheet_name)
    # 指定列
    for group in df.groupby(by=column):
        column_name, group_df = group
        column_name: str
        group_df: DataFrame
        group_df.to_excel(excel_writer=f'./output/{column_name}.xlsx', sheet_name=column_name, index=False)

多sheet execl表格

分割为多个excel文件

def split_multi_sheet_to_multi_excel(file_path, sheet_name=0):
    """
    多个sheet的excel文件切分为多个excel文件

    Args:
        sheet_name(int|str): sheet的名称
        file_path(str):

    Returns: None

    """
    # 处理文件导出路径
    if not os.path.exists('./output'):
        os.makedirs(name='./output')
    # 打开文件
    df = read_excel(io=file_path, sheet_name=sheet_name)
    # 循环操作当前的所有sheet
    for sheet_name in list(df.keys()):
        sub_df = df[sheet_name]
        sub_df.to_excel(excel_writer=f'./output/{sheet_name}.xlsx', sheet_name=sheet_name, index=False)

带格式的 excel文件

值得注意是,以上的表格切割,只针对数据,数据的格式是无法体现在分割后的excel文件上的。
所以,如果你需要带格式的excel切割,参照下面文章,当然,也是俺写的。

看此文章:https://frica.blog.csdn.net/article/details/124144987

后话

本次分享到此结束,如有疑问请自行解决。
see you~🐱‍🏍🐱‍🏍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/57178.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Compose 动画艺术探索之灵动岛

本文为稀土掘金技术社区首发签约文章,14天内禁止转载,14天后未获授权禁止转载,侵权必究! 本篇文章是此专栏的第五篇文章,本篇文章应该是此专栏中最后一篇直接关于动画的文章了,之后文章中可能会提到&#…

SpringBoot @InitBinder注解实现Bean国际化校验

参考资料 参考: 妥当性チェックのエラーメッセージ出力方法 (需翻墙)springMVC之InitBinder的用法1springMVC之InitBinder的用法2springMVC之InitBinder 和 ValidatorSpring MVCにおけるフォームバリデーションの適用事例【後編】 目录一. 前期准备1.1 自定义校验注…

【spark】第一章——Spark简介及环境配置

文章目录1. Spark 概述1.1 Spark 是什么1.2 Spark and Hadoop1.3 Spark or Hadoop1.4 Spark 核心模块2. Spark 快速上手2.1 创建 Maven 项目2.1.1 增加 Scala 插件2.1.2 增加依赖关系2.1.3 WordCount2.1.4 异常处理3. Spark 运行环境3.1 Local 模式3.1.1 解压缩文件3.1.2 启动 …

MATLAB源码-GRABIT从图像文件中提取数据点。

源码链接: https://download.csdn.net/download/tgs2033/87238015https://download.csdn.net/download/tgs2033/87238015 GRABIT从图像文件中提取数据点。 GRABIT启动用于从图像文件中提取数据的GUI程序。它能够读取BMP、JPG、TIF、GIF和PNG文件(IMREAD…

12月3日:thinkphp模型与数据库相同的部分

定义 定义一个模型类 <?phpnamespace app\index\model; use think\Model;//定义一个User模型类 class User extends Model{//默认主键为自动识别&#xff0c;如果需要指定&#xff0c;可以设置属性//protected $pk uid; //$pk代表主键&#xff0c;primary key的缩写 } …

[附源码]Python计算机毕业设计Django基于JAVA技术的旅游信息交互系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

[附源码]Python计算机毕业设计Django基于Java酒店管理系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

特征解耦,torch.cumprod(),np.random.seed(),plt.scatter

1.infoGAN 通常&#xff0c;我们学到的特征是混杂在一起的&#xff0c;如上图所示&#xff0c;这些特征在数据空间中以一种复杂的无序的方式进行编码&#xff0c;但是如果这些特征是可分解的&#xff0c;那么这些特征将具有更强的可解释性&#xff0c;我们将更容易的利用这些特…

BI-SQL丨MEGRE

MEGRE MEGRE语句&#xff0c;在SQL的生态圈中&#xff0c;一直都隶属于一个比较重要的位置。 要知道&#xff0c;在实际的项目应用中&#xff0c;我们经常需要从上游数据源&#xff0c;进行原始数据的抽取、清洗、存储、分析等操作&#xff0c;特别是在存储这一环节&#xff…

SpringCloud Ribbon / Feign

文章目录什么是Ribbon&#xff1f;Ribbon的作用&#xff1f;什么是Feign&#xff1f;Feign的作用&#xff1f;什么是Ribbon&#xff1f; Spring Cloud Ribbon 是基于Netflix Ribbon实现的一套客户端负载均衡的工具. Ribbon是Netflix发布的开源项目&#xff0c;主要功能是提供…

介绍HTTP

介绍 HTTP HTTP 协议用于客户端和服务器端之间的通信。请求访问资源的一端被称为客户端&#xff0c; 而提供资源响应的一端被称为服务器端。 HTTP 是一种不保存状态的协议&#xff0c;即无状态&#xff08;stateless&#xff09; 协议&#xff0c;它不对之前发生过的请求和响…

Kotlin高仿微信-第54篇-扫一扫

Kotlin高仿微信-项目实践58篇详细讲解了各个功能点&#xff0c;包括&#xff1a;注册、登录、主页、单聊(文本、表情、语音、图片、小视频、视频通话、语音通话、红包、转账)、群聊、个人信息、朋友圈、支付服务、扫一扫、搜索好友、添加好友、开通VIP等众多功能。 Kotlin高仿…

安卓APP源码和报告——音乐播放器

课 程 设 计 报 告 院 系&#xff1a;专 业&#xff1a;题 目&#xff1a;科 目&#xff1a;学 生&#xff1a;指导教师&#xff1a;完成时间&#xff1a;目 录 1. 引言1 1.1 目的1 1.2 背景1 2. 需求分析1 3. 系统设计1 3.1总体设计1 3.2功能设计1 4. 系统开发2 4.1…

秋招经验分享:最终我还是选择了百度

点击进入—>3D视觉工坊学习交流群自我介绍感谢工坊的邀请&#xff0c;来做这次秋招经验的分享。本科和研究生都是自动化专业&#xff0c;研究生期间做移动机器人的定位方向&#xff0c;现在是百度的一名算法工程师&#xff0c;很喜欢现在的工作环境和氛围&#xff0c;强烈推…

【LeetCode每日一题】——72.编辑距离

文章目录一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【解题思路】七【题目提示】八【时间频度】九【代码实现】十【提交结果】一【题目类别】 字符串 二【题目难度】 困难 三【题目编号】 72.编辑距离 四【题目描述】 给你两个单词 word…

【Linux】常用的Linux命令(初学者必读)

一、学习Linux的原因 开源&#xff0c;免费系统迭代更新系统性能稳定安全性高多任务&#xff0c;多用户耗资源少内核小应用领域广泛使用及入门容易 二、Linux常用的命令 我使用的Linux环境是在 腾讯云服务器上的Centos 7和 Xshell。 下面我把常用的一些命令分成了几个部分&am…

VPS8505 微功率隔离电源专用芯片2.3-6VIN/24V/1A 功率管 替代金升阳模块

文章目录 前言一、是什么&#xff1f;二、特点三、应用领域四、简化应用五、引脚及功能六、参数测试电路 总结前言 隔离电源市场&#xff0c;一直被塑封模块产品占领&#xff0c;之前国内无专业 做隔离芯片的厂家&#xff0c;市场以模块厂进口芯片方案为主&#xff1b;…

深入 Java 线程池:从设计思想到源码解读

为什么需要线程池 我们知道创建线程的常用方式就是 new Thread() &#xff0c;而每一次 new Thread() 都会重新创建一个线程&#xff0c;而线程的创建和销毁都需要耗时的&#xff0c;不仅会消耗系统资源&#xff0c;还会降低系统的稳定性。在 jdk1.5 的 JUC 包中有一个 Execut…

从实用角度浅析前端全链路质量监控中台技术方案

大厂技术 高级前端 Node进阶点击上方 程序员成长指北&#xff0c;关注公众号回复1&#xff0c;加入高级Node交流群感谢作者陈煮酒的投稿。前言无论是纯前端业务还是服务端业务&#xff0c;线上质量的保障都是我们的底线要求&#xff0c;也是我们日常需要花费很多精力关注的环…

【大数据入门核心技术-Zookeeper】(五)ZooKeeper集群搭建

目录 一、准备工作 1、集群分布 2、创建数据目录 3、下载安装包 二、解压安装 1、解压 2、修改配置文件zoo.cfg 3、添加myid配置 4、分发zk文件夹和分别新建myid 5、配置环境变量 6、三台机器分别启动zookeeper服务 一、准备工作 1、集群分布 服务器IP主机名myid的…