看不懂可以跟着视频学一下,关于基础课程项目也可以私聊我!
视频+源码:
链接:https://pan.quark.cn/s/2055653f735b
之前我们已经学习了如何读取和写入Execl数据,今天我们来用一个实例来进行表格的合并。如下是
2021年4个季度的销售数据明细。我们把它放在了D盘2021年销售明细的文件夹下。
每一个季度销售数据里又包含三个月的具体明细,每个月的销售记录都有1000多条,现在需要批量合
并4个工作簿,共计12张表,使用Ctrl+C、Ctrl+V功能已经不能很好的解决这里的问题,这里我们就可以用
代码解决。
上代码:
import time
from openpyxl import Workbook, load_workbook
import os
def 合并表格(file_dir, save_dir):
files_name = os.listdir(file_dir)
# 创建新表格
new_wb = Workbook()
new_ws = new_wb.active
header = ['销售日期', '员工工号', '销售员', '货号', '销售单号', '销量', '销售额']
new_ws.append(header)
# 向新的表格写入数据
for file_name in files_name:
wb = load_workbook(file_dir + "\\" + file_name)
for sheet in wb.sheetnames:
ws = wb[sheet]
# 设置values_only=True 则可以直接得到单元格中的值
for row in ws.iter_rows(min_row=2, values_only=True):
new_ws.append(row)
print('全年销售数据为 %s 行' % (new_ws.max_row - 1)) # 去除第一行标题剩下的则为全年销
售数据总行数
# 数据保存
if not os.path.exists(save_dir):
os.makedirs(save_dir)
new_wb.save(save_dir + "\\" + "全年数据.xlsx")
if __name__ == '__main__':
开始时间 = time.time()
合并表格(r"D:\2021年销售明细", r"D:\2021年销售分析")
print('合并完成耗时:', time.time() - 开始时间, "秒")
运行结果:
全年销售数据为 13065 行
合并完成耗时: 6.565231084823608 秒
代码很简单,首先使用os库,循环遍历D:\2021年销售明细 目录下所有文件,然后再使用openpyxl库循环遍历单元格中的数据,并且导入,合并结果保存到【全年数据,xsx】文档下。从结果可以看出总共合并了13065行数据,只花了不到7秒钟。
我们打开看下【全年数据.xlsx】可以看到行数计数是跟代码统计的行数相吻合的。
自我演示如下:
import time #导入 time 模块,以便使用时间相关的功能,比如测量程序运行时间。
from openpyxl import Workbook, load_workbook #从 openpyxl 库导入 Workbook 和 load_workbook 类。这两个类用于创建和加载 Excel 工作簿。
import os #导入 os 模块,用于处理文件和目录路径等操作。
def 合并表格(file_dir, save_dir): #定义一个名为 合并表格 的函数,它接受两个参数:file_dir(包含要合并的 Excel 文件的目录路径)和 save_dir(保存合并结果的目录路径)。
files_name = os.listdir(file_dir) #使用 os.listdir 函数列出 file_dir 目录下的所有文件和目录的名称,并将这些名称存储在 files_name 列表中。
print(files_name) #打印 files_name 列表的内容,这样你可以看到 file_dir 目录中的所有文件和目录名称。
new_wb = Workbook() #这里新建一个工作铺,相当新建一个文件夹
new_ws = new_wb.active #新建一个Excel表格
header = ['销售日期', '员工工号', '销售员', '货号', '销售单号', '销量', '销售额'] #表格的头部
new_ws.append(header) #将表格的头部加入到新建的表格中去
for file_name in files_name: #利用for循环遍历将几个旧表格内容添加到新表格中
if file_name.endswith('.xlsx'): #检查文件名是否以 .xlsx 结尾,以确定它是否是一个 Excel 文件。
file_path = os.path.join(file_dir, file_name)#构建 Excel 文件的完整路径,file_dir 是文件夹路径,file_name 是文件名。
wb = load_workbook(file_path)#使用 openpyxl 库的 load_workbook 函数加载 Excel 文件,以便在代码中进一步处理这个工作簿。
for sheet in wb.sheetnames: #遍历工作簿中的所有工作表名称。
ws = wb[sheet] #获取当前工作表对象 ws。
for row in ws.iter_rows(min_row=2, values_only=True): #遍历当前工作表中的所有数据行,从第二行开始(跳过表头),并且只获取单元格的值,不包括单元格格式。
new_ws.append(row) #将遍历到的数据行 row 添加到新工作表 new_ws 中
if not os.path.exists(save_dir): #检查保存目录 save_dir 是否存在。如果不存在,则创建这个目录。
os.makedirs(save_dir) #创建最终保存文件的完整路径,save_dir 是保存目录,"全年数据.xlsx" 是文件名。
save_path = os.path.join(save_dir, "全年数据.xlsx") #创建最终保存文件的完整路径,save_dir 是保存目录,"全年数据.xlsx" 是文件名。
new_wb.save(save_path) #将新创建的工作簿 new_wb 保存到上述路径。
if __name__ == '__main__': #确保只有在脚本被直接运行时,才会执行以下代码块。
开始时间 = time.time() #记录脚本开始运行的时间。
合并表格(r"D:\2021年销售明细", r"D:\2021年销售汇总") #调用 合并表格 函数,传入输入和输出目录。
print('合并完成耗时:', time.time() - 开始时间, "秒") #打印合并过程的耗时。
以上是我演示有什么不懂的地方可以私信我!谢谢阅读!可以技术交流!