作者:白静 金凯瑞 马玺渊 钟子俊
编者按
本次解读的文章为“Data-Driven Dynamic Pricing and Ordering with Perishable Inventory in a Changing Environment”,于2022年发表在期刊 Management Science, 作者 N. Bora Keskin, Yuexing Li, Jing-Sheng Song. (https://doi.org/10.1287/mnsc.2021.4011)
问题背景
得益于数字营销、电子货架标签和物品级射频识别传感等技术的发展,动态定价策略在诸多行业受到关注,尤其是食品杂货零售业。动态定价的好处对于易腐烂的库存,如新鲜产品,显而易见;从销售的角度而言,动态定价可以刺激需求,使之与供应更好地匹配,进而提高利润率;管理层面上,动态定价助于减少食品杂货的浪费和随之而来的废物管理成本。
然而,优化易腐烂产品的定价和订购决策仍然极具挑战性,尤其在缺失需求-价格关系或产品易腐率方面完备的信息时。因此,零售商需要通过历史数据来了解需求-价格关系和易腐率。但产品需求的特性(如潜在的市场规模和价格敏感性)会因外部因素(如COVID-19、天气变化、技术的快速进步等)的影响随时间发生不可预测的变化——这使得在需求转变之前收集的信息在转变之后过时。
为应对这些挑战,文章为不断变化的需求环境和产品的易损性构建模型。通过探索一家大型连锁超市的真实数据集,文章概括出此类零售商所面临的挑战:即零售商在以下方面没有完善的信息, 其中包括
(1) 需求-价格关系,
(2) 需求噪音 (demand shock/noise) 分布(参数性或非参数性),
(3) 库存易损率,以及
(4) 需求-价格关系如何随时间变化。
在有限的时间范围 T 内,模型针对单一易腐货品 (single perishable product)、定期审查 (perodic review)、采用销售损失的库存系统 (lost-sale inventory system), 提出了数据驱动的动态库存和定价(data-driven pricing and ordering,DDPO)政策,以权衡通过对未知情况的学习来增加未来利润 以及 赚取直接利润 (immediate profit) 二者间的关系,并回答了在可能面临有销售损失的情况下,在有限时间范围内,如何做出最优联合定价和库存订购的决策。
模型构建
DDPO 算法
算法步骤
数值实验
主要结论
- 较以往已知需求的研究,文章研究了多期易腐产品库存系统的联合定价和订购决策。该政策考虑零售商未知的(非平稳)需求-价格关系、需求噪音分布和产品损耗率。
- 文章所提出的模型考虑到了一个变化的动态需求-价格关系,而非在以往研究中常见的已知概率的马尔可夫环境,因此,根据过去的信息获得的知识在需求环境发生变化后均不可使用,这使得问题复杂化。
- 针对非参数性和指数分布族的需求噪声分布,文章提出了两种数据驱动的定价和订购策略DDPO-N和DDPO-E,并建立并证明了 T 期损失最优(直到对数项)的上限值。数值研究表明,实施所提出的两类政策,以全信息政策所获利润为基准,较历史数据有明显优化。
- 文章将两类定价和订购策略扩展,将依赖年龄的易腐性和需求删失纳入模型并比较所提升的利润比例。