数据挖掘顶会ICDM 2024论文分享┆MetaSTC:一种基于聚类和元学习的时空预测框架

news2025/1/16 1:49:38

第24届IEEE国际数据挖掘会议(IEEE International Conference on Data Mining,ICDM)将于2024年12月9日至12日在阿拉伯联合酋长国首都阿布扎比隆重举行。ICDM是世界数据挖掘研究顶级会议,创办于2001年,每年举办一届,会议主题涵盖了有关数据挖掘的算法和智能系统等。ICDM为中国人工智能学会(CAAI)B类会议,中国计算机学会(CCF)B类会议。

本推文详细介绍了上海交通大学先进网络实验室(Advanced Network Laboratory,ANL)的最新论文成果《MetaSTC: A Backbone Agnostic Spatio-Temporal Framework for Traffic Forecasting》,该论文已被第24届IEEE国际数据挖掘会议接收,论文的作者包括:上海交通大学先进网络实验室的学生许可欣、高宇岑、余哲梦,老师高晓沨教授、陈贵海教授;滴滴国际的方君、张凇健。论文提出了一种轻量流量预测框架MetaSTC。针对交通数据集周期性特点和地理特征,MetaSTC设计了基于门控机制的时空表征。并且结合了聚类、元学习等技术,轻量化时空预测模型。通过在交通流量大规模公开数据集LargeST以及滴滴公司的真实路网数据集上的实验比较,验证了MetaSTC能够更加准确的预测交通流量,并且在时间效率上大幅提升。

1.研究背景及主要贡献

交通流预测问题是交通管理与控制领域的一项重要任务。交通流预测能够帮助交通管理部门提前掌握交通流运行情况,从而提前制定管控措施。对于驾驶者和乘客来说,准确的交通流量预测可以提供更可靠的出行建议,帮助他们避开拥堵路段,减少行程时间,提高出行的舒适度和满意度。多年来,交通流量预测领域的研究一直是研究热点,涵盖了统计方法、传统机器学习技术和深度学习模型等多种方法。

由于交通预测问题与现实场景之间密不可分的关系,考虑模型设计应用于真实场景大规模数据集的可行性和有效性十分关键。深度学习具有复杂的网络结构,在实际应用时往往受到有限计算资源的约束。同时,模型对于分布差异的数据中趋向预测数据的平均值,这使得模型的性能随着数据量的增加而降低。模型如何应对大规模交通流量数据复杂的时间依赖性,空间差异性,同时降低预测的成本开销成为非常关键的挑战。针对大规模数据集的场景,论文提出了一种轻量化时空预测框架MetaSTC。论文的贡献可以概括为:

(1)论文提出一种轻量级时空预测框架,该框架由时空聚类模块和元学习模块组成。论文在真实世界的交通流数据集上进行了大量实验,MetaSTC 模型显示出很高的准确性和计算效率。

(2)论文提出了一种新的编码方法来提取时空特征,基于时空特征聚类拆分大规模数据集。

(3)引入了一种基于时空聚类的元学习器,可实现更准确、更高效的预测。

(4)论文提出的轻量化交通预测框架展现了深度学习模型在实际交通场景的可能性,该框架能够为城市规划者提供未来交通需求的预测,对于城市交通的规划具有重要意义。

2.方法

图1 MetaSTC的整体架构

MetaSTC的整体架构如图1所示。在主干框架由时空表征聚类和元学习两部分组成。其中,时空表征模块由时间编码、空间编码、门控机制和聚类组成。为了有效提取交通数据中丰富的特征,该模块分别对其道路的时序规律(流量)和非时序特征(宽度、长度、车道数等)设计编码器,并利门控机制调整时间空间的特征权重。通过K-means++算法,将大规模数据集中相似时空特征的道路进行聚类。在元学习模块中,MetaSTC沿用聚类得到的结果,将具有相似时空特征的数据分在同一个元任务下进行训练。元学习的设计使得模型可以迅速在子任务上收敛,从而达到更高的准确性和效率。

3.实验

(1)实施细节

实验运行在48GB内存的A40上。实验使用Adam优化器,设置初始学习率为 0.001,训练轮数为 1000。参数选择上,实验批次大小设为 64,表示维度设置为 12,K-means++算法的距离函数设为欧氏函数,元学习的网络层数设置为 3。

(2)实验结果

论文使用来自滴滴全球的两个不同城市的真实交通数据集和两个公共数据集PeMS04和LargeST进行实验,实验数据按照 8:2的比例划分训练集和测试集。论文将MetaSTC与最新最先进的时空预测模型进行比较,其中包括FiLM,TimesNet和DLinear等,使用的指标包括平均绝对误差(Mean Absolute Error,简称MAE)和平均平方误差(Mean Squared Error,简称MSE)。如表1所示,在预测准确性方面,MetaSTC 模型在与先进的深度学习模型 FiLM 结合使用时取得了最佳性能。

表1 MetaSTC与最先进的流量预测模型的比较

如表2所示,论文对完整的 MetaSTC 模型和两个消融版本进行了比较。基于聚类的模型优于直接预测模型,其 MAE 误差降低了 48.2%。元学习的加入同样对模型的性能产生了显著的积极影响,使 MAE 误差降低了 32.9%。

​​​​​​​2 MetaSTC主要模块消融实验

4.总结与展望

交通流量预测是提供便捷高效的城市交通服务的重要任务之一。论文分析了以往方法在预测准确性和运行效率方面无法达到原大规模数据集效果的缺点,提出了一种基于聚类和元学习的时空框架MetaSTC,能够快速训练并提高预测精度。该模型在包含数千条道路的真实世界数据集上进行了实验,结果优于基线模型。消融实验证明了框架两个主要模块聚类模块和元学习模块的重要性,它们能带来巨大的性能提升。论文提出的MetaSTC框架为加速和轻量级流量预测模型提供了一个有效而强大的接口。通过快速预测交通流量变化, MetaSTC框架能够帮助帮助相关部门及时调整交通管理策略,对于公共交通的规划和交通基础设施的建设都具有重要的意义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2121553.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

会计凭证IDOC有关增强

记录一下: 项目上某需求是会计凭证动态数据同步档案系统,某开发用的BTE的1150事件,上线后发现漏掉了一部分凭证。事实证明BTE并不适用于所有的会计凭证场景。在未经过充分测试情况下,慎用BTE。 DEBUG找了两个比较靠谱的增强点&…

行政组织理论-第十三章:行政组织变革

章节章节汇总第一章:绪论第二章:行政组织的演变第三章:科层制行政组织理论第四章:人本主义组织理论第五章:网络型组织理论第六章:行政组织目标第七章:行政组织结构第八章:行政组织体…

上海宝钢阿赛洛屋顶光伏发电项目案例分享

摘要:随着“双碳”目标的提出,可再生能源的开发利用已成为必然趋势。新能源发电作为能源利用的重要形式,已经吸引了越来越多的关注。相较于大规模、高电压、长距离传输的集中式发电模式,分布式光伏因其容量小、电压低、便于就地消…

使用SVM在数字验证码识别中的应用研究课程报告

第1章 概要设计 1.1 设计目的 支持向量机作为一类强大的监督学习模型,以其出色的泛化能力,在手写数字识别、面部检测、图像分类等多个领域展现出了其优越性。其在处理小样本、非线性及高维模式识别任务中表现尤为突出。SVM通过构造最优超平面&#xff…

WMS仓储管理系统中条码打印管理

1. 条码打印管理概述 1.1WMS系统中条码的作用 在WMS系统中,条码作为一种自动识别技术,对于提高仓库管理效率和准确性起着至关重要的作用。 - 物料追踪:通过为每个物料分配唯一的条码,可以实现对物料从入库到出库的全程追踪。 …

第三天旅游线路预览——从禾木景区入口到景区换乘中心

第三天:从贾登峪到禾木风景区,晚上住宿贾登峪; 从禾木景区入口到景区换乘中心: 进入禾木景区后乘坐景区摆渡车至景区换乘中心,路程约60公里,耗时100分钟; 将上面的的行程安排进行动态展示&am…

终于搞懂TS中的泛型啦! | typescript 入门指南 04

大家好,我是王天~ 今天分享的是《ts入门指南》系列中第四篇,主要讲解ts中的泛型应用 泛型在ts中是比较重要的概念,我花挺长时间才搞明白,整理输出这篇文章,希望能帮助到大家 ~ 《ts入门指南》系列,点击下…

鸿蒙轻内核A核源码分析系列五 虚实映射(7)虚实映射Flag属性

往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 轻内核A核源码分析系列一 数据结构-双向循环链表 轻内核A核源码分析系列二 数据结构-位图操作 轻内核A核源码分析系列三 物理内存(1&#xff0…

如果 Android 手机出现数据丢失,如何在Android上恢复丢失的数据

当您的 Android 手机发生数据丢失时,您可能需要检索丢失的文件。为了帮助您完成此过程,以下是执行 Android 数据恢复的一些有效方法: 如何在Android上检索数据 如果您的 Android 手机出现数据丢失,您可能需要检索丢失的文件。为了…

Python批量发邮件:如何批量发个性化邮件?

Python批量发邮件的实用技巧?如何利用Python发邮件? 无论是营销推广、客户关怀,还是内部通知,个性化邮件都能显著提升沟通效果。那么,Python批量发邮件如何实现个性化呢?本文将详细介绍如何使用Python批量…

ESP32 UDP 05

1.在上一文章基础上修改,文章网址 ESP32-Ethernet-04-CSDN博客 2.基本代码 /* Ethernet Basic ExampleThis example code is in the Public Domain (or CC0 licensed, at your option.)Unless required by applicable law or agreed to in writing, thissoftware…

再见Java 8,请掌握最新LTS

简介 在Java开发中,Java 8曾经是无可争议的主流,凭借其稳定性和广泛的社区支持,陪伴了无数开发者走过多年辉煌时刻。然而,随着时间的推移,技术不断革新,企业和开发者们逐渐把目光投向了更新的LTS&#xff0…

LLM时代的transformer参数量、计算量、激活值的分析

导读:本文可以看作是对分析transformer模型的参数量、计算量、中间激活、KV cache的详细说明 定性分析 GPU上都存了哪些东西 首先我们来从全局整体的角度看一看,在训练阶段GPU显存上都有哪些内容: Model States:模型训练过程中…

使用 nuxi upgrade 升级现有nuxt项目版本

title: 使用 nuxi upgrade 升级现有nuxt项目版本 date: 2024/9/10 updated: 2024/9/10 author: cmdragon excerpt: 摘要:本文介绍了如何使用nuxi upgrade命令升级Nuxt 3项目,包括打开终端、运行升级命令、使用选项、测试项目等步骤,以及升级前的注意事项,如备份代码、检…

shader 案例学习笔记之绘制圆

环境搭建:参考glsl vscode环境搭建 先上代码 #ifdef GL_ES precision mediump float; #endifuniform vec2 u_resolution;void main(){vec2 st gl_FragCoord.xy/u_resolution.xy;st - 0.5;st.x * u_resolution.x/u_resolution.y;float r length(st);float d ste…

【面试分享】面试题——网络题目_网络面试题

🤟 基于入门网络安全/黑客打造的:👉黑客&网络安全入门&进阶学习资源包 一、题目 1、网关、网桥、路由器、中继器作用、实现以及对应的osi层? 2、MAC地址是什么? 3、webSocket是什么? 4、常见的协议有哪些? 5、什么…

交换机vlan配置实现

交换机配置 1. 配置交换机速度 进入交换机相应端口。 speed数值: 单位为Mbits;可选10,100,auto duplex参数:参数可选full全双工,half半双工,auto自适应 配置交换机管理IP地址: 在全局模式下: interf…

Qt使用UDP进行单波通信

Qt使用UDP进行单波通信 我们一般学习完基础的一些编程之后就会开始接触网络编程,我们熟悉的网络编程一般会涉及到两个协议一个时TCP,一个是UDP。TCP一般是point to point,UDP一般有单播和广播两种方式,那么我们今天就来学习一下单…

ECRS软件作业分析:提升工厂生产效率的钥匙

在竞争日益激烈的现代工业环境中,如何提升生产效率、降低资源消耗、增加产品价值,成为了每一家制造企业必须面对的重要课题。作业分析,作为一种科学的管理工具,正逐步成为企业优化生产流程、提升竞争力的关键手段。本文旨在深入探…

Unity SRP 可编程渲染管线的基本用法

可编程渲染管线使用教程 SRP 可以处理Canvas为Screen Space - Overlay的渲染 安装插件 首先进入package manager,下载Core RP Lib组件 创建渲染管线 编写渲染管线逻辑脚本 新建脚本取名为MPipeLine,该脚本用于实现渲染管线的处理逻辑 using Unity…