目录
- 整理流量预测数据集
- (1)Telecom Italia 意大利电信 2015
- (2)City Cellular Traffic Map (C2TM) 2015
- (3)、LTE Network Traffic Data_kaggle
- (4)、Cellular Traffic Analysis Data 2019
- (5)、China Unicom One Cell Data
- (6)、Shanghai Telecom dataset 2020
- (7)、The AIIA data
- 流量预测模型
- 统计模型 statistical models
- (1)ARIMA : Auto-Regressive Integrated Moving Average自回归移动平均模型
- (2)HW:Holt–Winters三次指数平滑模型
- 机器学习模型 machine learning models
- (1)RF:random forest 随机森林
- (2)LightGBM
- (3)GPR:Gaussian progress regression
- (4)MLR:multiple linear regression
- (5)Prohet
- 深度学习模型 deep learning models
- (1)FFNNs:feed-forward neural networks前馈神经网络
- (2)CNN
- (3)RNN
- (4)LSTM
- (5)GRU
- (6)ConvLSTM
- (7)LSTM+attention
- (8)CNN+RNN
- 整理流量预测的代码
- paper with code
- 搜索词条:**cellular traffic prediction**
- 搜素词条:**cellular traffic forecasting**
- kaggle
- medium
整理流量预测数据集
(1)Telecom Italia 意大利电信 2015
链接指路
- 数据集介绍:
- This dataset was collected in the city of Milan, Italy, from November 1, 2013, to January 1, 2014.
- 空域被分为100x100的网格,每个网格是235x235平方米
- 通过分析call detail record(CDR)每十分钟每个网格提取不同的信息(SMSs, calls, and Internet usage data)
- 这个数据集可以用于单变量、多变量的时空预测流量问题
(2)City Cellular Traffic Map (C2TM) 2015
链接:https://github.com/caesar0301/city-cellular-traffic-map
- 数据集介绍:
- 13,269 base stations in a medium-sized city in China from August 19, 2012, to August 26, 2012.
- Each data record contains the base station id(基站id), a timestamp(时间戳), number of mobile users(用户数), number of transferred packets(传输包的数量), and number of transferred bytes(传输字节数) every hour. base station location(基站位置)
(3)、LTE Network Traffic Data_kaggle
click on this link:https://www.kaggle.com/naebolo/predict-traffic-of-lte-network(sos没有了)
- 数据集介绍:
- 4G data usage within 57 cells in 24 h for one year, from October 23, 2017, to October 22, 2018
- the locations of these 57 cells are not available->temporal type
(4)、Cellular Traffic Analysis Data 2019
https://github.com/AminAzari/cellular-traffic-analysis
- 数据集介绍:
- the traffic packets captured from the user side on several Android devices by using virtual private network tunneling
- packet arrival/departure time, source/destination IP addresses, communication protocol (e.g., UDP, TCP, SSL), and encrypted payload
(5)、China Unicom One Cell Data
链接:https://github.com/JinScientist/traffic-data-5min/blob/master/traffic_one_cell.csv
- 数据集介绍:
- 2016年1月1日至2017年5月1日17个月
- time steps: 5 min
- 对中国移动的4G网络的CDR data进行统计
- 只有一个基站
- 适用于单变量时间预测问题
(6)、Shanghai Telecom dataset 2020
链接:http://sguangwang.com/TelecomDataset.html
- 数据集介绍:
- 2014年6月1日至11月30日在中国上海收集了3233个基站和9481部手机
- 这个数据集提功力每个用户会话的开始时间和结束时间以及对应基站的位置
- 这个数据集本来适用于边缘计算的,但是也可以用于流量预测
(7)、The AIIA data
link: https://github.com/Phil-Shawn/DMNN
- 数据集介绍:
- 2017年1月1日至2018年11月15日三个匿名区域的小时流量数据
- 预测问题属于时间类型
流量预测模型
统计模型 statistical models
(1)ARIMA : Auto-Regressive Integrated Moving Average自回归移动平均模型
- 单变量时间序列模型
- 基于三种分量的加权线性组合:自回归分量(AR)、差分分量(I)、移动平均分量(MA)
(2)HW:Holt–Winters三次指数平滑模型
- 单变量时间序列模型
- 基于三种分量的组合:simple exponential smoothing, Holt’s ES, Winter’s ES
机器学习模型 machine learning models
(1)RF:random forest 随机森林
(2)LightGBM
(3)GPR:Gaussian progress regression
(4)MLR:multiple linear regression
(5)Prohet
深度学习模型 deep learning models
(1)FFNNs:feed-forward neural networks前馈神经网络
(2)CNN
(3)RNN
(4)LSTM
(5)GRU
(6)ConvLSTM
(7)LSTM+attention
(8)CNN+RNN
整理流量预测的代码
paper with code
搜索词条:cellular traffic prediction
- Towards Energy-Aware Federated Traffic Prediction for Cellular Networks_2022
链接:link here
描述:我们通过提出一种新的可持续性指标来评估ML模型的可行性,从而解决了联邦学习中准确性和能耗之间的权衡。然后,我们使用来自 Barcelona, Spain地区基站(BS)站点的实际测量数据,在联邦场景中全面评估了最先进的深度学习(DL)架构。
github链接:link here
论文:Federated Learning for 5G Base Station Traffic Forecasting
大赛:Federated Traffic Prediction for 5G and Beyond Challenge link
代码说明:该代码可以作为联邦时间序列预测的基准。我们专注于原始LTE数据,并使用三个不同基站在不同时间间隔上的测量来训练一个全局联合模型。具体来说,我们在具有分布、数量和时间倾斜的非id设置上实现了6种不同的模型架构(MLP、RNN、LSTM、GRU、CNN、双注意力LSTM自动编码器)和9种不同的联邦聚合算法(SimpleAvg、MedianAvg、FedAvg、FedProx、FedAvgM、FedNova、FedAdagrad、FedYogi、FedAdam)。
代码:pytorch python3.8 - Adaptive(适应的) Hybrid(混合的) Spatial-Temporal Graph Neural Network for Cellular Traffic Prediction_2023
链接:link here
描述:蜂窝通信量预测是智能通信网的重要组成部分。然而,由于频繁的用户移动性和复杂的网络调度机制,蜂窝流量通常继承复杂的时空模式,这使得预测非常具有挑战性。尽管最近提出了一些先进的算法,如基于图的预测方法,但它们经常基于静态或动态图来建模空间依赖性,而忽略了由交通生成引起的共存的多个空间相关性。同时,一些研究缺乏对蜂窝通信模式多样性的考虑,导致预测结果不够理想。在本文中,我们提出了一种新的深度学习网络架构,自适应混合时空图神经网络(AHSTGNN),以解决蜂窝流量预测问题。首先,我们应用自适应混合图学习来学习信号塔之间的复合空间相关性。其次,我们实现了一个具有多周期时间数据输入的时间卷积模块,以捕获非线性时间依赖性。此外,我们还引入了一个额外的时空自适应模块来克服信号塔的异质性。我们在两个真实蜂窝流量数据集上的实验表明,AHSTGNN的性能明显优于最先进的技术,这说明了我们的方法在时空蜂窝流量预测方面具有优越的可扩展性。
论文:Adaptive Hybrid Spatial-Temporal Graph Neural Network for Cellular Traffic Prediction
数据集:米兰数据集(公开的)
代码:AHSTGNN
Requirements:
python 3.9
numpy == 1.20.3
scipy == 1.7.3
pandas == 1.5.3
torch == 1.11.0 - Dual Attention-Based Federated Learning for Wireless Traffic Prediction
链接:link here
描述:巴拉巴拉流量预测很重要,现有的流量预测方法大多使用集中式训练结构,需要大量的流量数据,这样就有隐私问题的隐患,提出了一个流量预测架构叫做:Dual Attention-Based Federated Learning(FedDA),这个高质量的预测模型是由多个边缘客户端协同训练的。为了同时捕获各种无线通信模式并将原始数据保存在本地,FedDA首先使用一个小型增强数据集将客户端分组到不同的集群中。然后,训练准全局模型并作为先验知识在客户端之间共享,旨在解决联邦学习面临的统计异质性挑战。为了构建全局模型,我们进一步提出了一种dual attention方案,即通过聚集簇内和簇间模型来代替简单地平均局部模型的权重。我们在两个真实世界的无线流量数据集上进行了广泛的实验,结果表明FedDA优于最先进的方法。这两个数据集的平均均方误差性能增益分别高达10%和30%。
论文:Dual Attention-Based Federated Learning for Wireless Traffic Prediction
数据集:First one Milano and second one Trentino
github代码:link here - Long term 5G network traffic forecasting via modeling non-stationarity(非平稳) with deep learning_2023
链接:添加链接描述
描述:流量的增长超过了网络的扩张,这种不匹配可能会降低网络质量并导致严重的性能问题。为了降低风险,运营商需要长期流量预测,以便提前几个月实施网络扩展计划。然而,长期预测水平暴露了序列数据的非平稳性,从而降低了现有方法的性能。我们通过开发深度学习模型Diviner来解决这个问题,Diviner将平稳过程整合到一个设计良好的分层结构中,并对具有多尺度稳定特征的非平稳时间序列进行建模。我们展示了Diviner在5G网络流量预测方面的显著性能改进,对具有复杂流量模式的大型端口进行了详细的月级预测。大量的实验进一步证明了它在不需要任何修改的情况下对各种预测场景的适用性,显示了解决更广泛的工程问题的潜力。
论文:Long term 5G network traffic forecasting via modeling non-stationarity with deep learning
数据集给出了
github代码:link here
Requirements
Python 3.6+
numpy == 1.21.6
pandas == 1.3.5
scikit_learn == 1.0.2
torch == 1.12.0+cu113
搜素词条:cellular traffic forecasting
- FC-GAGA: Fully Connected Gated Graph Architecture for Spatio-Temporal Traffic Forecasting_2020
链接:link here
描述:多元时间序列预测是交通管理、蜂窝网络配置和定量金融等领域的重要问题。当存在捕获时间序列之间关系的可用图表时,就会出现这种问题的特殊情况。在本文中,我们提出了一种新的学习架构,可以在不需要图知识的情况下实现与现有最佳算法竞争或更好的性能。我们提出的体系结构的关键要素是可学习的全连接硬图门控机制,它可以在交通预测应用中使用最先进的、计算效率最高的全连接时间序列预测体系结构。两个公共交通网络数据集的实验结果说明了我们的方法的价值,消融研究证实了架构中每个元素的重要性。
github代码:link here
kaggle
- Forecasting Mobile Network Traffic RNN
链接:link here
数据集:Telecommunications - SMS, Call, Internet - MI
- github:
- 一个好像没有写完的demo:LSTM
链接:link here - Spatio-Temporal-mobile-traffic-forecasting_2020
链接:link here
硕士毕业论文,看起来还不错 - LTE Cell Traffic Grow and Congestion Forecasting
没有给数据集,但是代码写的很好,之后可以看看
内容:实施的方法改编自Chmieliauskas和Guršnys(2019)提出的解决方案,分为两部分。首先需要预测小区数据流量,然后通过PRB(物理资源块)的使用预测小区拥塞。
medium
- Cellular Traffic Prediction using Deep Neural Network(LSTM)
链接:link here
目前只找到这么多了,之后可以继续找😕