连锁店销量预测

news2025/7/14 12:09:04

任务

利用深度学习、强化学习等机器学习手段为某连锁商店预测每个商店未来12周的销售额进行估计，以便对商店的经营更好掌握和对库存调拨更好管理。

数据解读及简单探索

所有数据包含store.csv，train.csv 和 test.csv一共3个csv文件，其中store.csv主要是介绍每个商店的情况，具体表格包含的字段如下

字段名称	描述
商店ID	商店的唯一标识符
商店模式	有四种：a,b,c,d
商店级别	有三种：a,b,c。注：a = 基本，b = 额外，c = 扩展
竞争者最近距离	商店的竞争者中距离该商店的最近距离

从store表可以看到一共有1115个门店，每个店的经营模式是直营，特许经营，管理合同还是战略联盟，每个店的级别高低是属于基本，额外还是扩展，以及通过与竞争者的距离可以大致判断该店的竞争激烈程度，一般来说，距离越远竞争压力越小，距离越近竞争压力会越大，这种竞争对于直营的低级别模式的店铺显得尤为明显。

train.csv 和 test.csv分别用于模型的训练和估计值的生成，包含的字段如下

字段名称	描述
商店ID	商店的唯一标识符
年	所处年份
周	所处年份的第几周
营业天数	该周开门营业天数
打折天数	该周有打折活动的天数
非节日	该周无节日的天数
节日A	该周拥有节日类型为A的天数
节日B	该周拥有节日类型为B的天数
节日C	该周拥有节日类型为C的天数
Sales	该周销售额（即：真实标签值）

通过train和test表可以看到不同商店在不同时期的实际销量走势情况，可以分析出打折等营销手段对销量的影响，可以分析节假日对销量的影响。

解决思路

销量预测作为供应链域的核心算法，算法设计应该围绕准确率高，响应快，运行稳健三个方面进行，既然是要为所有商店未来12周的销售额进行预测，而且商店数量算中等，从生成预测值的数据量来说至少有1115*12约13000左右，这种多主体多期的预测常规的时间序列会显得很吃力，宜采用传统的机器学习方法和深度学习方法。

传统机器学习方法

对于这种结构化的数据，传统机器学习方法还是很巴适的，只是稍微要多做一些特征工程，对于类别型变量可以适当分多类别和少类别。

代码

# -*- encoding: utf-8 -*-
'''
@Project :   sales_train
@Desc    :   连锁店销量预测
@Time    :   2023/02/02 15:19:28
@Author  :   帅帅de三叔,zengbowengood@163.com
'''
import math
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['Simhei'] 
plt.rcParams['axes.unicode_minus']=False
from sklearn.model_selection import train_test_split,GridSearchCV
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder, OrdinalEncoder, StandardScaler
from sklearn.impute import SimpleImputer
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.metrics import mean_absolute_percentage_error
import pickle

store = pd.read_csv(r"D:\项目\商简智能\回归预测题目\store.csv")
train = pd.read_csv(r"D:\项目\商简智能\回归预测题目\train.csv")
train_df = pd.merge(left=train, right=store, left_on='商店ID', right_on='商店ID', how='left')

train_df = train_df.query("周销量>0")
train_df['商店ID'] = train_df['商店ID'].astype('str')
train_df['年'] = train_df['年'].astype('str')
train_df['周'] = train_df['周'].astype('str')
train_df['节日A'] = train_df['节日A'].astype('bool')
train_df['节日B'] = train_df['节日B'].astype('bool')
train_df['节日C'] = train_df['节日C'].astype('bool')
print(train_df.info)
X, y =  train_df.drop(['周销量'], axis=1), train_df.周销量 #特征和目标
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, shuffle=True, random_state=0) #划分训练测试集
less_cat_col = [col_name for col_name in X_train.columns if X_train[col_name].dtype=='object' and X_train[col_name].nunique()<10] #少类别型变量
more_cat_col = [col_name for col_name in X_train.columns if X_train[col_name].dtype=='object' and X_train[col_name].nunique()>=10] #多类别型变量
num_col = [col_name for col_name in X_train.columns if X_train[col_name].dtype in ['int64', 'float64']] #数值型特征
print(less_cat_col, more_cat_col, num_col)
print(train_df.corr())
# sns.heatmap(train_df.corr())
# plt.show()

less_cat_transform = Pipeline(steps = [('imputer', SimpleImputer(strategy='most_frequent')),
                                ('encoder', OneHotEncoder(handle_unknown='ignore'))]
                        ) #类别型变量先用众数填充再独热编码
more_cat_transform = Pipeline(steps = [('imputer', SimpleImputer(strategy='most_frequent')),
                                ('encoder', OrdinalEncoder(handle_unknown='use_encoded_value', unknown_value=-1))]
                        ) #类别型变量先用众数填充再普通编码

num_transform = Pipeline(steps = [('imputer', SimpleImputer(strategy='mean')),
                            ('scaler', StandardScaler())]
                    ) #数值型变量采用均值填充和标准化
preprocessor = ColumnTransformer(transformers = [('less_cat', less_cat_transform, less_cat_col),
                                        ('more_cat', more_cat_transform, more_cat_col),
                                    ('num', num_transform, num_col)]
                            ) #不同的预处理步骤打包到一起
model = GradientBoostingRegressor(n_estimators = 500, learning_rate = 0.05, max_depth = 9,  min_samples_leaf= 3, random_state=0) # 模型初始化
pipe = Pipeline(steps=[('preprocessing', preprocessor),
                ('model', model)]
            )
pipe.fit(X_train, y_train)
y_pred = pipe.predict(X_test)

RMSPE = math.sqrt(sum([((x - y)/x) ** 2 for x, y in zip(y_test, y_pred)]) / len(y_test)) #均方根百分比误差
score = pipe.score(X_test, y_test)
print("Root Mean Square Percentage Error: {}, and model score: {}".format(RMSPE, score))
with open(r"D:\项目\商简智能\回归预测题目\sales_predict.pickle", "wb") as model_file: #保存model/
    pickle.dump(pipe, model_file)

# model = GradientBoostingRegressor(random_state=0) #
# pipe = Pipeline(steps=[('preprocessing', preprocessor),
#                 ('model', model)]
#             )
# params = {
#     'model__n_estimators':[100, 200, 300],
#     'model__learning_rate':[0.01, 0.05, 0.1, 0.2],
#     'model__max_depth': [3, 5, 7, 9,],
#     'model__max_features':[9, 11, 14],
#     'model__min_samples_leaf': [1, 2, 3]
# }
# gs = GridSearchCV(pipe, param_grid = params)
# gs.fit(X_train, y_train)
# print(gs.best_params_)
# y_pred = gs.best_estimator_.predict(X_test)
# RMSPE = math.sqrt(sum([((x - y)/x) ** 2 for x, y in zip(y_test, y_pred)]) / len(y_test)) #均方根百分比误差
# score = gs.score(X_test, y_test)
# print("Root Mean Square Percentage Error: {}, and model score: {}".format(RMSPE, score))

评估

按照以往的业务经验，采用均方根百分比误差 (Root Mean Square Percentage Error, RMSPE) 指标作为评价标准会比较好，公式如下：
$E=\sqrt{\frac{1}{n} \sum_{i=1}^n\left(\frac{y_i-\hat{y}_i}{y_i}\right)^2}$

其中 $y_i$ 代表门店当天的真实销售额， $\hat{y}_i$ 代表相对应的预测销售额， $n$ 代表样本的数量。
如果真实销售额为 0 ，计算误差时可忽略该条数据。
$RMSPE$ 值越小代表误差就越小，评分越高。

本案例在测试集上的模型得分和均方根百分比误差如下

Root Mean Square Percentage Error: 0.10308496736657641, and model score: 0.9485827177221499

深度学习方法

后续有机会再补上

代码

评估

建议

参考文献

1，https://blog.csdn.net/hba646333407/article/details/128529557
2，https://mp.weixin.qq.com/s/Zdx3gcgEoT_VyfPdrNKAGw

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/196791.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

连锁店销量预测

目录

任务

数据解读及简单探索

解决思路

传统机器学习方法

代码

评估

深度学习方法

代码

评估

建议

参考文献

相关文章

(十二) Docker-compose容器编排

3.SQL

【JavaGuide面试总结】Spring篇·中

企业数字化转型的五大关键要素

软测（概念） · 开发模型 · 软件的生命周期 · 瀑布模型 · 螺线模型 · 增量模型 · 迭代模型 · 敏捷模型 · scrum

daz ue和maya插件配置

进程间通信之共享内存（简单介绍消息队列和信号量）

vue v-model的详细介绍

Power BI中如何实现移动平均功能

利用GPAC生成MP4文件

哈工大机器学习复习笔记（二）

JVM结构类加载

【GPLT 二阶题目集】L2-007 家庭房产

Java创建线程的七种方法，全网最全面总结~

末端工具重力辨识

Docker安装MySQL8数据库

为什么要拒绝嵌套代码？

ABBYY15免费照片识别文字识别软件

线性代数篇

cannot redeclare block-scoped variable