论文笔记:LaDe: The First Comprehensive Last-mile Delivery Dataset from Industry

news2024/11/24 12:56:47

2023 KDD

1 intro

1.1 背景

  • 随着城市化进程的加快和电子商务的发展,最后一公里配送已成为一个关键的研究领域
    • 最后一公里配送,如图1所示,是指连接配送中心和客户的包裹运输过程,包括包裹的取件和配送
    • 除了对客户满意度至关重要外,最后一公里配送还是整个运输过程中最昂贵和最耗时的部分
      • 路线规划
      • 预计到达时间(ETA)预测
      • 路线预测
  • 这些研究的一个关键前提是高质量、大规模数据集的可用性。
    • 然而,在最后一公里配送研究领域,虽然已经开发了大量算法,但仍缺乏广泛认可的、公开可用的数据集
    • 因此,这一领域的研究主要集中在少数工业研究实验室中,限制了透明度并阻碍了研究进展。

1.2 论文思路

  • 提出了LaDe,这是由菜鸟收集的首个综合性最后一公里配送数据集
    • 包含了包裹的取件和配送数据
    • Cainiao-AI/LaDe · Datasets at Hugging Face
  • LaDe具有以下几个优点:
    • (1) 大规模,涵盖了21,000名快递员在6个月内配送的10,677k个包裹
      • 这是目前最大规模的公开数据集
    • (2) 全面,提供了有关包裹、位置、任务事件和快递员的详细信息
    • (3) 多样性,收集了来自不同城市的取件和配送过程的数据
    • ——>凭借这些优势,LaDe可以用于评估与最后一公里相关的广泛任务
  • 论文通过三个任务来研究其特性,包括路线预测、预计到达时间预测和时空图预测

2 相关工作

2.1 数据集视角

  • 目前没有公开可用的最后一公里配送数据集同时包含包裹取件和配送数据
  • 最接近的相关工作来自亚马逊[21](本文称为AmazonData)
    • 这是一个由亚马逊提出的快递员执行的序列数据集,旨在为亚马逊主办的最后一公里路线研究挑战提供数据支持
    • 包含了2018年亚马逊快递员在美国五个大都市区执行的9,184条历史路线
    • D. Merchán, J. Arora, J. Pachon, K. Konduri, M. Winkenbach, S. Parks, and J. Noszek, “2021 amazon last mile routing research challenge: Data set,” Transportation Science, 2022.
    • 存在三个局限性:
      • 1) 没有取件数据,仅包含包裹配送过程中的数据;
      • 2) 在时空范围和轨迹数量方面规模较小;
      • 3) 缺乏与快递员及任务事件相关的信息,无法惠及有不同研究兴趣的更广泛研究群体

2.2 应用视角

  • 广义上,最后一公里物流有四个分支
    • 1) 新兴趋势和技术,重点研究最后一公里物流中的技术解决方案和创新
      • 快递员路线及到达时间预测
        • A deep learning method for route and time prediction in food delivery service
        • Graph2route: A dynamic spatial-temporal graph neural network for pick-up and delivery route prediction
      • 自助技术
        • What’s in the parcel locker? exploring customer value in e-commerce last mile delivery
      • 无人机辅助配送
        • What’s in the parcel locker? exploring customer value in e-commerce last mile delivery
    • 2) 与最后一公里相关的数据挖掘,旨在从现实世界运营产生的数据中挖掘潜在的知识模式,以改进物流管理
      • “Discovering actual delivery locations from mis-annotated couriers’ trajectories
    • 3) 运营优化,主要关注优化最后一公里运营并做出更好的运营决策
      • 车辆路径问题
        • Last-mile delivery made practical: An efficient route planning framework with theoretical guarantees
        • Appointment scheduling and routing optimization of attended home delivery system with random customer behavior
      • 配送调度
        • “Last-mile delivery made practical: An efficient route planning framework with theoretical guarantees
      • 设施选址选择
        • “Solution of two-echelon facility location problems by approximation methods
        • “Locating collection and delivery points for goods’ last-mile travel: A case study in new zealand
    • 4) 供应链结构,关注为最后一公里物流设计结构,例如网络设计[30]
      • “Locating collection and delivery points for goods’ last-mile travel: A case study in new zealand

3 数据

3.1 数据收集

3.1.1 包裹运输流程

  • 该数据集由菜鸟网络收集.包裹运输的典型过程包括以下步骤:
    • 1,客户(发件人)通过在线平台下单取件。
    • 2,平台将订单分派给合适的快递员。
    • 3,快递员在指定时间窗口内取件并返回配送站(这构成了包裹的取件过程)。
    • 4,包裹从配送站出发,通过物流网络运输至目标配送站。
    • 5,在目标配送站,配送快递员取出包裹并送达收件人(称为包裹配送过程)。
    • 在这些步骤中,第3步和第5步被称为最后一公里配送,快递员从/向客户取件/送件。

3.1.2 取件和配送场景异同 & LaDe的两个子数据集

  • 取件和配送场景之间存在显著差异。
    • 在包裹配送过程中,分配给某快递员的包裹在快递员离开配送站前就已确定
    • 而在取件过程中,分配给快递员的包裹并不是一开始就确定的,而是随着时间推移逐步揭示的,因为客户可以随时请求取件。
      • 取件过程的动态性给研究领域带来了巨大挑战。

3.1.3 LaDe数据集

——>LaDe包含了两个子数据集,分别针对取件和配送场景,命名为LaDe-P和LaDe-D

  • 收集了在中国不同城市中产生的数百万条取件/配送数据,数据涵盖6个月的时间

  • 一个城市包含不同的区域,每个区域由多个AOI(感兴趣区域)组成,供物流管理使用
    •  快递员负责在若干指定AOI内取件或送件
    • 为了收集每个城市的数据,论文首先随机选择该城市中的30个区域。
    • 随后,论文在每个区域中随机抽取快递员,并收集所有选定快递员在6个月内的取件/配送包裹数据

3.2 数据集详情

  • 每条记录包含与取件或配送包裹相关的信息,主要涉及“谁、何地、何时”等方面。
    • 具体来说,记录中说明了哪位快递员取件或送件、包裹的位置及相应的时间。
    • 记录的信息大致可分为四类:
      • 包裹信息,记录包裹ID及时间窗口要求
      • 站点信息,如坐标、AOIID和AOI类型;
      • 快递员信息,记录快递员的ID,每位快递员都配备了个人数字助理(PDA),该设备会持续向平台报告快递员的状态(例如GPS);
      • 任务事件信息,记录包裹接受、取件或配送事件的特征,包括事件发生时间和快递员的位置信息。

3.3 数据集统计

  • a——快递员工作时间
  • b,c——包裹空间分布
  • d——数据中前五大AOI类型的分布
  • e——随机选择的10位快递员的实际到达时间
  • f——数据集中两位快递员的工作概况

3.4 数据集特征与挑战

3.4.1 大规模

  • LaDe数据集总共包含10,667k个包裹和619k条轨迹,这些轨迹由21,000名快递员生成,涵盖16,755k个GPS定位点,覆盖5个城市,跨越6个月的时间。
  • 单次取件和配送场景中,快递员一次最多可处理的包裹数分别达到95个和121个
  • 如此大规模的数据给最后一公里配送算法带来了显著挑战。

3.4.2 全面性

  • LaDe旨在提供与最后一公里配送相关的丰富信息,涵盖了各种数据类型
    • 详细的包裹信息
    • 任务事件日志
    • 快递员轨迹详细信息
    • 上下文特征
  • 如何有效利用这些综合特征来改进现有任务或启发新任务,仍然是不同领域研究人员面临的一个开放性问题。

3.4.3 多样性

  • 场景多样性——我们通过收集代表取件和配送两个场景的子数据集引入场景多样性。
  • 任务动态性(仅针对LaDe-P)。与LaDe-D不同,LaDe-P中的快递员任务在一天的开始时并未确定,而是随着取件过程的进行逐步揭示,因为客户可以随时下单。
    • 这种快递员任务的动态性在多个研究领域中带来了显著的技术挑战,动态路线优化便是一个典型例子

4 任务

4.1 路线预测

4.2 ETA

4.3  时空图 (STG) 预测

计算出特定区域在一定时间段内的包裹数量

4.4 其他应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2223870.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《等保测评新视角:安全与发展的双赢之道》

在数字化转型的浪潮中,企业面临的不仅是技术革新的挑战,更有信息安全的严峻考验。等保测评,作为国家网络安全等级保护的一项重要措施,不仅为企业的安全护航,更成为推动企业高质量发展的新引擎。本文将从全新的视角&…

如何用 Spring AI + Ollama 构建生成式 AI 应用

为了构建生成式AI应用,需要完成两个部分: • AI大模型服务:有两种方式实现,可以使用大厂的API,也可以自己部署,本文将采用ollama来构建• 应用构建:调用AI大模型的能力实现业务逻辑,…

mfc之tab标签控件的使用--附TabSheet源码

TabSheet源码 TabSheet.h #if !defined(AFX_TABSHEET_H__42EE262D_D15F_46D5_8F26_28FD049E99F4__INCLUDED_) #define AFX_TABSHEET_H__42EE262D_D15F_46D5_8F26_28FD049E99F4__INCLUDED_#if _MSC_VER > 1000 #pragma once #endif // _MSC_VER > 1000 // TabSheet.h : …

es实现桶聚合

目录 聚合 聚合的分类 DSL实现桶聚合 dsl语句 结果 聚合结果排序 限定聚合范围 总结 聚合必须的三要素: 聚合可配置的属性 DSL实现metric聚合 例如:我们需要获取每个品牌的用户评分的min,max,avg等值 只求socre的max 利用RestHighLevelClien…

【Multisim14.0正弦波>方波>三角波】2022-6-8

缘由有没有人会做啊Multisim14.0-其他-CSDN问答参考方波、三角波、正弦波信号产生 - 豆丁网

arcgis中dem转模型导入3dmax

文末分享素材 效果 1、准备数据 (1)DEM (2)DOM 2、打开arcscene软件 3、加载DEM、DOM数据 4、设置DOM的高度为DEM

【虚幻引擎UE】UE5 音频共振特效制作

UE5 音频共振特效制作 一、基础准备1.插件准备2.音源准备 二、创建共感NRT解析器和设置1.解析器选择依据2. 创建解析器3. 创建解析器设置(和2匹配)4.共感NRT解析器设置参数调整5.为共感NRT解析器关联要解析的音频和相应设置 三、蓝图控制1.创建Actor及静…

Openlayers高级交互(8/20):选取feature,平移feature

本示例介绍如何在vue+openlayers中使用Translate,选取feature,平移feature。选择的时候需要按住shift。Translate 功能通常是指在地图上平移某个矢量对象的位置。在 OpenLayers 中,可以通过修改矢量对象的几何位置来实现这一功能。 效果图 配置方式 1)查看基础设置:http…

AnaTraf | 全面掌握网络健康状态:全流量的分布式网络性能监测系统

AnaTraf 网络性能监控系统NPM | 全流量回溯分析 | 网络故障排除工具AnaTraf网络流量分析仪是一款基于全流量,能够实时监控网络流量和历史流量回溯分析的网络性能监控与诊断系统(NPMD)。通过对网络各个关键节点的监测,收集网络性能…

麒麟v10 arm64 部署 kubesphere 3.4 修改记录

arm64环境&#xff0c;默认安装 kubesphere 3.4 &#xff0c;需要修改几个地方的镜像&#xff0c;并且会出现日志无法显示 1 fluentbit:v1.9.4 报错 <jemalloc>: Unsupported system page size Error in GnuTLS initialization: ASN1 parser: Element was not found. &…

2.3 机器学习--朴素贝叶斯(分类)

本章我们来学习朴素贝叶斯算法&#xff0c;贝叶斯分类是一类分类算法的总称&#xff0c;这类算法均以贝叶斯定理为基础&#xff0c;故统称为贝叶斯分类。而朴素贝叶斯分类是贝叶斯分类中最简单&#xff0c;也是常见的一种分类方法。 我们常常遇到这样的场景。与友人聊天时&…

合合信息亮相2024中国模式识别与计算机视觉大会,用AI构建图像内容安全防线

近日&#xff0c;第七届中国模式识别与计算机视觉大会&#xff08;简称“PRCV 2024”&#xff09;在乌鲁木齐举办。大会由中国自动化学会&#xff08;CAA&#xff09;、中国图象图形学学会&#xff08;CSIG&#xff09;、中国人工智能学会&#xff08;CAAI&#xff09;和中国计…

分享几个办公类常用的AI工具

办公类 WPS AI讯飞智文iSlideProcessOn亿图脑图ChatPPT WPS AI 金山办公推出的协同办公 AI 应用&#xff0c;具有文本生成、多轮对话、润色改写等多种功能&#xff0c;可以辅助用户进行文档编辑、表格处理、演示文稿制作等办公操作。 https://ai.wps.cn/ 讯飞智文 科大讯飞推…

我谈Canny算子

在Canny算子的论文中&#xff0c;提出了好的边缘检测算子应满足三点&#xff1a;①检测错误率低——尽可能多地查找出图像中的实际边缘&#xff0c;边缘的误检率&#xff08;将边缘识别为非边缘&#xff09;低&#xff0c;且避免噪声产生虚假边缘&#xff08;将非边缘识别为边缘…

高效文本编辑与导航:Vim中的三种基本模式及粘滞位的深度解析

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

有色行业测温取样机器人 - SNK施努卡

SNK施努卡有色行业熔炼车间机器人测温取样 在有色行业&#xff0c;测温取样机器人专门设计用于自动化处理高温熔体的温度监测和样品采集任务。这类机器人在铜、铝、锌等金属冶炼过程中扮演着关键角色&#xff0c;以提高生产效率、确保产品质量并增强工作安全性。 主要工作项 …

ABAP ALV

目录 一、基本概念 1、ALV概览 2、基本概念 二、属性更改 1、FIELDCAT 2、宏 3、LAYOUT 4、升序降序SORT 5、FILTER 三、交互 1、实现自己的按钮 一、基本概念 1、ALV概览 ALV&#xff1a;SAP List View,是SAP提供的一个强大的数据报表显示工具 ALV实际上是一个…

前端零基础入门到上班:【Day3】从零开始构建网页骨架HTML

HTML 基础入门&#xff1a;从零开始构建网页骨架 目录 1. 什么是 HTML&#xff1f;HTML 的核心作用 2. HTML 基本结构2.1 DOCTYPE 声明2.2 <html> 标签2.3 <head> 标签2.4 <body> 标签 3. HTML 常用标签详解3.1 标题标签3.2 段落和文本标签3.3 链接标签3.4 图…

CRLF、UTF-8这些编辑器右下角的选项的意思

经常使用编辑器的小伙伴应该经常能看到右下角会有这么两个选项&#xff0c;下图是VScode中的示例&#xff0c;那么这两个到底是啥作用呢&#xff1f; 目录 字符编码ASCII 字符集GBK 字符集Unicode 字符集UTF-8 编码 换行 字符编码 此部分参考博文 在计算机中&#xff0c;所有…

网络搜索引擎Shodan(1)

声明&#xff1a;学习视频来自b站up主 泷羽sec&#xff0c;如涉及侵权马上删除文章 感谢泷羽sec 团队的教学 视频地址&#xff1a;shodan(1)_哔哩哔哩_bilibili 本文主要讲解网络搜索引擎Shodan的一些用法&#xff08;host和search这两个命令&#xff09;。 Shodan 是一个网络…