需求:统计每日用餐人数与销售额
分析:目前存在两张订单信息表,
1.读取两张表数据 (利用pandas库中的函数读取)
2.合并两张表数据(读取后数据是DataFrame对象)
3.筛选出日期、人数、金额字段
4.根据日期分组、聚合
5.数据可视化
# 统计每日用餐人数与销售额
#分析: 用餐日期 每日用餐人数 每日金额
import pandas as pd
#读取8月份订单表数据
order_info=pd.read_csv("C:/Users/Administrator/Desktop/data/meal_order_info.csv",encoding = "utf-8")
#读取1~7月份订单表数据
before_info=pd.read_csv("C:/Users/Administrator/Desktop/data/info_new.csv",encoding = "utf-8")
#合并为1~8月份订单数据
info_all = pd.concat([before_info,order_info])
# 筛选info_all表中 order_status 列的 值为1的数据
info = info_all[info_all['order_status'].isin([1])]
#info=info_all[info_all['order_status']==1]
# 索引重排列
info=info.reset_index(drop=True)
for i,k in enumerate(info['use_start_time']):
y = k.split()
y = pd.to_datetime(y[0])
info.loc[i,'use_start_time'] = y
# 筛选 用餐日期 具体时间用餐人数 具体时间用餐金额 三列 根据日期(每天)进项分组,获取分组对象
groupby=info[['use_start_time','number_consumers','accounts_payable']].groupby(by='use_start_time')
# 根据分组 进行聚合 求出每日用餐人数总和 每日销售额 总和
sale_day=groupby.sum()
# 修改列名
sale_day.columns=['人数','销售额']
# 绘制折线图
import matplotlib.pyplot as plt
# 解决中文显示问题
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("2016年1~8月份每日用餐人数折线图")
plt.xlabel('日期')
plt.ylabel('用餐人数')
plt.plot(sale_day['人数'])
plt.show()
# 解决中文显示问题
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("2016年1~8月份每日用餐销售额折线图")
plt.xlabel('日期')
plt.ylabel('销售额')
plt.plot(sale_day['销售额'])
plt.show()
# 解决中文显示问题
plt.rcParams['font.sans-serif']=['SimHei']
plt.title("2016年1~8月份每日用餐人数与销售额折线图")
plt.xlabel('日期')
# 绘制每日人数折线图
plt.ylabel("人数", color="g")
plt.tick_params(axis="y", labelcolor="g")
plt.plot(sale_day['人数'], "g-", linewidth=2)
# 绘制每日销售额折线图
plt.twinx()
plt.ylabel("销售额", color="r")
plt.tick_params(axis="y", labelcolor="r")
plt.plot(sale_day['销售额'], "r-", linewidth=2)
# 展示
plt.show()