亚洲唯一!京东荣获2024年度Gartner供应链技术创新奖背后的创新探索

news2024/9/30 11:27:44

序言:

序言:2月14日晚间,Gartner公布了2024年度Garter Power of the Profession供应链大奖,京东集团荣获供应链技术创新奖,成为获得该奖项的唯一亚洲企业。Gartner Power of the Profession供应链奖项已经举办十年,是衡量企业供应链创新能力的国际权威奖项。入围决赛的共有5家企业,另外4家分别是谷歌、思科、MTN集团、Allina Health。京东智能供应链Y业务部研发的“基于概率分布预测以及解释性AI的弹性计划技术”,在激烈的竞争中获得冠军,历年的冠军包括微软、辉瑞、壳牌等。此外,几个月前,京东还凭借端到端库存管理等技术入围了2023年弗兰兹厄德曼奖(Franz Edelman Award)总决赛,这是一项由美国运筹学与管理科学学会(INFORMS)设立的管理科学界的最高奖项,被誉为工业工程领域的“诺贝尔奖”,旨在表彰运用运筹学和管理科学在实际应用中产生巨大价值的工作。

过去一年,京东零售技术团队持续探索创新。在供应链方向,通过提出并应用端到端库存管理技术和可解释AI技术,实现了更快的库存周转和更高效的供应链决策、协同。这是2023京东零售技术年度盘点深度文章系列的第三篇,希望能为技术同学们带来一些启发或帮助。



一、供应链决策中的超级难题:如何在保证可解释性的情况下提升预测精度?

销量预测是供应链决策的关键组成部分,其准确性直接影响库存控制、资金安排、生产计划和市场策略。销量预测在传统上依赖于基于统计方法的时间序列模型,但是随着计算能力的提升和数据采集技术的进步,预测方法逐渐演变为更为复杂的机器学习算法,能够处理更多维度的数据并捕捉更深层次的非线性关系。

总体来看,销量预测的发展经历了三个阶段:传统统计方法、机器学习方法以及混合算法。传统的统计方法如ETS、ARIMA等,具有清晰的数学结构,但只能处理简单的时间序列数据,无法捕获外生变量的影响,很难进一步提高预测精度。随着电商规模快速发展,商品规模越来越大,传统方法在复杂场景的效果劣势则逐渐显现出来,而机器学习算法由于其强大的拟合能力开始备受追捧,如 xgboost、LSTM、Transformer等。

然而,目前的机器学习算法普遍是黑盒化的,可解释性的缺乏已经成为这些算法在供应链实践中的一个关键障碍。针对传统方法及机器学习方法的劣势,混合算法逐渐走进大众的视野。混合算法通过将统计模型与黑盒 ML 算法相结合以提高预测准确性和可解释性,如N-BEATS 和 NBEATSx 。但是这些混合算法存在明显的问题:一方面,现有的混合算法与供应链场景匹配度低,仅仅考虑趋势、季节等固有的时序因素,无法量化营销、促销等特有因素的影响,因此在供应链场景下无法保证可解释性;另一方面,现有的混合算法通常依赖于具有统计假设的理论模型,只关注各成分的准确性,不考虑全局信息,导致准确性的下降。

而对于京东供应链来说,商品补货的决策直接影响生产,所以对于算法的要求不仅仅是准确率,而需要有高度的可解释性,才能获取业务的信任。尤其是针对头部商品,会有补货不足的风险,造成缺货,影响采销的销售计划达成,所以业务需要知道预测结果是如何得到的,比如预测考虑了哪些因素,每种因素带来的影响有多大等等,提升业务的可控度及信赖度。京东智能供应链团队致力于打造一套针对供应链场景下全新的可解释预测算法,其中如何保证可解释性的情况下提升预测精度是最主要的挑战,关键要解决两个技术难点:

(1)高可解释性约束下现有的算法准确性较差

在时间序列预测中,基于时序分解的算法将时序分解为不同的成分,可解释性较强,因此被广泛使用,但是基于传统统计的时序分解算法由于其无法考虑多序列预测及对于复杂场景的拟合能力较差,所以准确性较差。采用这些方法会造成大量的低质量的备货及库存冗余,增加仓储成本。因此如何保证可解释性的情况下提升预测准确率是最大的技术难点。

(2)现有的混合算法全局拟合能力差,与供应链场景匹配度低

为了提高预测精度,最近的可解释算法通常将机器学习方法(ML)与分解相结合,但是现有的混合算法通常依赖于具有统计假设的理论模型,只关注各成分的准确性,不考虑全局信息,而供应链场景下各成分的因素相互依赖,采用统计假设的理论模型难以拟合,这种方式脱离了实际的业务场景,从而导致系统使用率较低,补货不及时等,缺货导致用户买不到自己想要买的商品,影响商品的销售额。

由此,智能供应链团队提出了一种新的可解释预测技术,这是一种新的混合算法,构建了通用的可解释算法框架保证高扩展性,在不同的复杂场景下可解释性及准确性均大幅的提升,主要创新包括:

1.预测流程及结果可解释,大幅提升用户的信任

新的可解释预测技术输出给下游的预测不再是一个最终预测值,预测输出由多个需求因素组成,如基线、促销、营销等,并且基于京东大规模的订单销售、促销等数据,通过因果推断的方式实现数据到模型输入及过程的因果逻辑,既提升了复杂场景的拟合能力,同时让业务了解整个预测流程的流转。比如促销场景下,通过因果算法刻画促销预测量的上升是由于输入的促销数据中业务提报的秒杀促销引起,从而让业务了解整个预测流程的流转,最终通过可解释性的预测指导用户做出准确的补货决策,大幅提升用户的信任。

2.提出了一种通用的结合分解和ML的可解释预测算法

智能供应链团队提出了一种通用的结合分解和ML的可解释预测算法(W-R算法),W-R算法构建了一种通过加权变体的加法组合函数形成的可解释加法模型,既通过分解的范式保证时序的可解释性,又通过深度的权重及残差网络考虑全局信息提升预测准确性,提升了模型全局化拟合能力,解决了现有时序分解算法准确性较差问题。W-R算法整体分成两个阶段,第一阶段是初始分解模块,通过自定义的分解模块去估计分解的成分,保证预测的可解释性,如在自营场景下:预测 = 基线+促销+营销 。第二阶段为ML调整模块,通过构建加权变体加法组合函数去拟合初始分解成分的全局参数,提升预测准确性,自营场景下:预测 = 基线权重*基线+促销权重*促销+营销权重*营销 +残差,根据权重及残差网络估计相应的权重及残差,最终输出加权的加法组合预测,总体来看既保证可解释性,也保证了准确性。

未来来看,可解释的预测将是供应链领域的重点方向之一,后续智能供应链团队将从全流程可解释、自动诊断归因、计划可解释等多个方向迭代优化可解释预测技术,从而更好的服务下游决策,提升供应链效率。

二、端到端库存管理的策略和模型设计

库存管理是供应链管理中重要的一环,决策者需要根据用户需求、销售计划和供应商能力等信息,安排合理的补货和销售计划。实践中,诸多因素导致库存管理是一项复杂的难题。例如用户需求具有高度的不确定性,商品的种类和数量十分庞大,供应链中间环节较多,供应商送货时间和送货量也有波动性。另一方面,如果库存管理的决策失准,造成的影响也是巨大的。如果对消费者需求预估不足,导致补货数量偏低,会造成频繁的缺货现象,从而影响消费者购物体验,也给平台造成销售损失。如果过高估计了消费者需求,造成补货数量偏高,会导致大量的冗余库存,产生过高的存储费用,同时也占用大量现金流,造成资金浪费。因此,如何应对库存管理这一既重要又有挑战的任务,成为供应链管理中的首要任务。

传统的库存补货方法大多先基于历史数据来预估未来需求,再结合供应商补货提前期(VLT,从向供应商订货到收货完成的时间)等信息,来确定合适的补货策略。这种方式被称为“先预测再优化”框架(Predict-then-optimize, PTO)。然而,PTO框架将整个补货过程拆分为了预测和优化两个阶段,而输入数据经过第一阶段处理后往往会造成信息损失,因此在后续的优化阶段中无法充分利用原始数据,导致决策偏差。而对于京东场景而言,庞大的商品种类和数量,用户需求的高度随机性,各类意外事件(例如恶劣天气、疫情等)对供应链的影响和冲击,均会进一步提升需求预测中的误差,最终导致供应链成本增加,消费者满意度下降。

为解决上述问题,京东智能供应链团队提出端到端(End-to-end)库存管理技术,基于多分位数循环神经网络(MQRNN)算法,利用商品历史销量、历史采购节奏、供应商履约等数据,直接通过模型来决策最佳补货量。

该模型先使用历史采购数据、销量数据、库存数据,采用基于动态规划框架提出的最优补货量决策模型,确定历史各个下单时间的最优补货量;再基于历史销量信息、送货提前期信息、下单周期、初始库存以及最优补货量构建特征库并生成学习样本;随后设计基于多分位数循环神经网络的深度自学习模块,针对学习样本进行训练优化;最后基于学习后的深度自学习模块进行预测销量、送货提前期以及下单量,实现端到端补货方法。

如图所示,端到端模型的输入项包含5类,分别是需求预测相关特征、商品基础特征(例如品类、品牌、仓库信息等)、供应商送货时长特征、库存盘点周期特征和初始库存水位信息。这些输入信息经处理后进入隐藏层,包括需求预测子模块、送货时长模块和优化决策模块。模型最终输出项包括3类,第一项是最终的补货决策,是模型的主要输出,第二、三项是同时生成的需求预测结果和供应商送货时长预测结果。由于缩短了决策流程,减少了中间环节预测误差累积对决策效果的影响,端到端模型提升了补货精准度,有效降低成本。

图 端到端补货模型示意

这两项技术上线以来,供应链预测准确度提升7%,现货率提升2%,库存周转优化接近2天,带来数亿元的持货成本节约。以这两项技术为基础的自动补货系统,已实现超过85%的自动化率。

目前,京东作为中国最大的零售商,为近6亿活跃用户提供超过1000万种自营商品。京东自建的覆盖全国的完善物流体系,管理着超过1600个库房,运营着超大规模的物流车队。京东如此庞大的零售和物流业务,背后离不开卓越的供应链管理技术,包括库存管理、库房运营、配送履约等。得益于完善的供应链设施和先进的数智化技术,超过95%的京东自营订单可以实现当日达或次日达,平均库存周转天接近30天,现货率高于97%,达到了行业领先水平。未来,京东将继续通过数智化技术持续优化成本、效率、体验,致力于创造更大的产业价值和社会价值。

本文相关的具体技术细节,可分别参考论文:

https://doi.org/10.1287/mnsc.2022.4564

https://arxiv.org/abs/2212.06620

作者:京东零售智能供应链Y

来源:京东零售技术 转载请注明来源

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1472768.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软考46-上午题-【数据库】-数据查询语言DQL1

一、SQL数据查询功能 SELECT语句的语法如下: 【注意】: 使用DISTINCT选项可以去重; form子句中出现多个基本表或视图时,系统首先执行笛卡尔积操作。 下面的查询示例均以这些表为基础 1-1、投影查询-SELECT 【回顾】:…

数字化运维与AIOps

干掉传统运维的不是devops,不是容器化,而是AI。随着未来基础设施的膨胀和复杂度急剧提升,人类运维能力已经显得力不从心。运维最终的归宿一定是人类决策,AI汇报与执行。 什么是数字化运维 数字化运维是一种基于信息技术手段数字化…

边缘计算网关与边缘计算的融合之道-天拓四方

随着物联网、大数据和人工智能的飞速发展,数据处理和分析的需求呈现出爆炸式增长。传统的中心化数据处理模式已难以满足实时性、低延迟和高带宽的需求,边缘计算应运而生,成为解决这一难题的关键技术。而边缘计算网关,作为连接边缘…

HarmonyOS—低代码开发中使用业务组件

开发者在DevEco Studio低代码可以通过拖拽组件栏提供的业务组件,快速开发包含华为帐号登录、华为支付场景的应用。低代码的登录、支付业务组件都是通过集成AGC提供的SDK实现,低代码简化了手动集成SDK、调用SDK接口的工作。 NOTE 该功能在DevEco Studio 3…

9.网络游戏逆向分析与漏洞攻防-游戏网络架构逆向分析-接管游戏连接服务器的操作

内容参考于:易道云信息技术研究院VIP课 上一个内容:游戏底层功能对接类GameProc的实现 码云地址(master 分支):https://gitee.com/dye_your_fingers/titan 码云版本号:44c54d30370d3621c1e9ec3d7fa1e2a0…

激发想象,连接未来:Sora AI视频模型探索之旅

随着人工智能技术的飞速发展,AI视频模型已成为科技领域的新热点。而在这个浪潮中,OpenAI推出的首个AI视频模型Sora,以其卓越的性能和前瞻性的技术,引领着AI视频领域的创新发展。 技术解析:AI的魔法在视频中的展现 在探…

ClickHouse 指南(三)最佳实践 -- 主键稀疏索引

在ClickHouse主索引的实用介绍 ClickHouse release 24.1, 2024-01-30 1、简介 在本指南中,我们将深入研究ClickHouse索引。我们将详细说明和讨论: ClickHouse中的索引与传统的关系数据库管理系统有何不同ClickHouse是如何构建和使用表的稀疏主索引的什么是在Clic…

ETL是什么

一、ETL概念 ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库&#xff…

CCF-CSP: 因子化简(100分)

第一次提交的时候90分,显示的超时,第一反应是难道有死循环? 检查一遍发现并没有,那就是真的超时了,然后翻阅blog,发现不需要去做判断是否是素数这一步,原因是任意一个非素数都是素数乘积构成,比如说&#…

华为---RSTP(三)---P/A机制及RSTP的生成树形成过程

目录 1. P/A机制简介 1.1 P/A机制的作用 1.2 P/A协商的前提条件 1.3 RSTP选举思路 2. P/A协商过程 3. 举例说明RSTP的生成树形成过程 3.1 示例环境要求 3.2 RSTP的生成树形成过程 3.2.1 SW和SW1之间链路上抓包分析 3.2.2 SW和SW2之间链路上抓包分析 3.2.3 SW1和SW2之…

数据库系统概论(超详解!!!) 第一节 绪论

1.四个基本概念 1.数据(Data) 数据(Data)是数据库中存储的基本对象 数据的定义:描述事物的符号记录 数据的种类:数字、文字、图形、图像、音频、视频、学生的档案记录等 数据的含义称为数据的语义&…

基于Java+SSM+Jsp宿舍管理系统(源码+演示视频+包运行成功)

您好,我是码农小波(wei158888),感谢您阅读本文,欢迎一键三连哦。 ❤️ 1. 毕业设计专栏,毕业季咱们不慌,上千款毕业设计等你来选。 目录 1、项目背景 2、项目演示 3、使用技术 4、系统设计 …

Three.js-05坐标轴AxesHelper

1.构建对象 说明:参数一表示坐标轴的长度。红色代表 X 轴. 绿色代表 Y 轴. 蓝色代表 Z 轴. const axesHelper new THREE.AxesHelper( 1 ); 2.设置位置 axesHelper.position.y1 axesHelper.position.x1 axesHelper.position.z1 3. 网格 说明:立方体…

计网Lesson15 - TCP可靠传输

文章目录 1. 停止等待ARQ协议2. 连续ARQ协议与滑动窗口协议 1. 停止等待ARQ协议 ARQ(Automatic Repeat–reQuest)自动重传请求 几种重传情况 发送端丢失 发送方过久没有接收到接收方的确认报,这种情况会触发超时重传机制,发送方…

php伪协议 [SWPUCTF 2022 新生赛]ez_ez_php(revenge)

打开题目 题目源代码如下 <?php error_reporting(0); if (isset($_GET[file])) {if ( substr($_GET["file"], 0, 3) "php" ) {echo "Nice!!!";include($_GET["file"]);} else {echo "Hacker!!";} }else {highlight_fi…

Springboot应用执行器Actuator源码分析

文章目录 一、认识Actuator1、回顾Actuator2、Actuator重要端点 二、源码分析1、Endpoint自动装配&#xff08;1&#xff09;自动配置入口&#xff08;2&#xff09;普通Endpoint自动装配&#xff08;3&#xff09;配置Web - Endpoint&#xff08;4&#xff09;注册Endpoint为M…

java面试题之nginx篇

1. 什么是Nginx&#xff1f; Nginx是一个 轻量级/高性能的反向代理Web服务器&#xff0c;他实现非常高效的反向代理、负载平衡&#xff0c;他可以处理2-3万并发连接数&#xff0c;官方监测能支持5万并发&#xff0c;现在中国使用nginx网站用户有很多&#xff0c;例如&#xff…

从零实现一套低代码(保姆级教程)【后端服务】 --- 【23】实现数据库表新增数据以及页面展示

摘要 在上一篇中&#xff0c;我们实现了可视化创建数据库表。并没说怎么对表中的数据进行操作。OK&#xff0c;现在我们来实现相关的内容。 如果说&#xff0c;对于新增数据我们无非有两种入口&#xff1a; 在AppBuilder中&#xff0c;可以通过可视化操作数据在XinBuilder中&…

通过Power automate上传文件到SharePoint

上传文件到SharePoint 背景过程Apps开发准备Flow开发SharePoint数据库测试 背景 我们通常都可以通过一些form表单直接上传文件&#xff0c;但是有些时候我们需要对文件名字等信息做一些处理。这个时候我们就需要将文件的内容json流化&#xff0c;然后在流中还原回来。 过程 …

2-24算法习题总结

贪心算法 409. 最长回文串 题目: 给定一个包含大写字母和小写字母的字符串 s &#xff0c;返回 通过这些字母构造成的 最长的回文串 。 在构造过程中&#xff0c;请注意 区分大小写 。比如 “Aa” 不能当做一个回文字符串。 示例 1: 输入 s "abccccdd"输出 7…