data文件夹内,有多个xls文件。每个xls文件格式一致, 表头占两行,表位汇总数据占一行。
表头两行,拼接前第二行设置为表头,且删除第二行。
在python读入的dataframe中,游轮成本表是表头,第一行是产品名称。在dataframe里面设置第0行(产品行)为表头之后,删除第0行(产品行)。
表位一行,拼接前删除。
import pandas as pd
import os
"连接文件夹内多个xls表格"
data_list = []
path = "./"
data_dir = os.path.join(path, 'yy_data')
for filename in os.listdir(data_dir):
name_dir = os.path.join(data_dir, filename)
// print(filename.split(".")[-1])
if filename.endswith((".xls","xlsx")):
df = pd.read_excel(name_dir)
df.drop([len(df) - 1], inplace=True) # 删除最后一行
c_list = df.values.tolist()[0] # 得到想要设置为列索引【表头】的某一行提取出来
df.columns = c_list # 设置列索引【表头】
df.drop(index=[0], inplace=True) #删除设置为表头的 第一行
data_list.append(df)
# concat合并Pandas数据
data_all =pd.concat(data_list)
# 将 DataFrame 保存为 excel 文件
data_all.to_excel("总和.xlsx",index=False)
# 查看 DataFrame 的行数和列数。
rows = data_all.shape
print("查看行数与列数:", rows)
print("恭喜你,合并完成!")