3_流量预测综述阅读_Cellular traffic prediction with machine learning: A survey

news2024/11/24 12:27:12

为了方便学习英语书写,总结的一些话用英语书写

♥目录♥

    • 0、文献来源and摘要
    • 1、introduction
    • 2、prediction problems and datasets
      • 2.1 prediction problems
      • 2.2 dataset
        • (1)Telecom Italia 意大利电信 2015
        • (2)City Cellular Traffic Map (C2TM) 2015
        • (3)、LTE Network Traffic Data_kaggle
        • (4)、Cellular Traffic Analysis Data 2019
        • (5)、China Unicom One Cell Data
        • (6)、Shanghai Telecom dataset 2020
        • (7)、The AIIA data
    • 3、数据预处理和预测模型
      • 3.1 data preprocessing
        • 3.1.1 直接预测 direct-prediction
        • 3.1.2 先分类然后预测
        • 3.1.3 先分解然后预测
      • 3.3 预测模型
        • 3.3.1 统计模型 statistical models
          • (1)ARIMA : Auto-Regressive Integrated Moving Average自回归移动平均模型
          • (2)HW:Holt–Winters三次指数平滑模型
        • 3.3.2 机器学习模型 machine learning models
          • (1)RF:random forest 随机森林
          • (2)LightGBM
          • (3)GPR:Gaussian progress regression
          • (4)MLR:multiple linear regression
          • (5)Prohet
        • 3.3.3 深度学习模型 deep learning models
          • (1)FFNNs:feed-forward neural networks前馈神经网络
          • (2)CNN
          • (3)RNN
          • (4)LSTM
          • (5)GRU
          • (6)ConvLSTM
          • (7)LSTM+attention
          • (8)CNN+RNN

0、文献来源and摘要

在这里插入图片描述

  • 摘要:
    • review the relevant studies on cellular traffic prediction
    • classify the prediction problems as the temporal(时间的)and spatiotemporal prediction problems
    • 人工智能的预测模型分为:statistical, machine learning, deep learning

1、introduction

流量预测的challenge:

  • complex internal(内部的)patterns hidden in the historical traffic data
  • pratical deployment(实际部署):a gap between high-preformance prediction model and real-world systems
    这篇综述的贡献性:
  • classification of cellular prediction problems to four workflows and three model
    • workflow : direct-prediction, classification-then-prediction, decomposition-then-prediction, and clustering-then-
      prediction
    • model : statistical, machine learning, and deep learning
  • a comprehensive(广泛的) collection of eight open datasets
  • evaluation metrics 评估指标
  • potential applications and directions

2、prediction problems and datasets

2.1 prediction problems

  • temporal prediction problem:
    -
    在这种最简单的类型中,只使用历史流量数据中的时间依赖性
  • spatiotemporal prediction problem:
    • the connected users have moved and connected from one base station to another base station, with the process of handover(切换)
      在这里插入图片描述
      在多个基站或多个区域内的流量,除了时间依赖关系,还考虑了它们的空间依赖关系
      the objective is to predict the entire traffic distribution in a given area or only at the hotspots(热点地区)
  • 这两种问题都可以看做监督学习:moving windows
    • 收集到的流量数据被视为univariate单变量时间序列,对未来的时间步(time steps)的流量预测基于固定长度的历史数据
      在这里插入图片描述
  • 衡量流量:
    • SMS/call service/internet usage service
    • physical resource block utilization (利用率)
    • number of connected users
  • 流量数据通过基站收集,然后通过cellular network operator 将不同时间粒度的数据进行聚合
    • 流量需求是由网关上布置的专用探头来监控GPRS隧道协议?(这是啥?
    • 一般的假设流量数据只在一个基站内使用(没有传输)或者传输到一个central server中央服务器中(需要足够的计算资源
    • 小的改进: 流量数据不再是全部传输到中央服务器中,而是按照数据对预测精度的贡献性先对数据进行排序,然后再从基站传输到中央服务器中
    • 少数情况下,流量数据是由用户端收集的
    • 大多数时间粒度是5min到1h
  • 流量预测问题的分类:
    在这里插入图片描述
    • univariate temporal prediction 单变量时域预测
      • N N N个时间步的历史数据: X = { x 1 , x 2 , . . . , x N } \mathcal{X}=\{x_1,x_2,...,x_N\} X={x1,x2,...,xN}
      • 预测第 N + 1 N+1 N+1个时间步的 x N + 1 x_{N+1} xN+1
      • y = f ( X ) y=f(\mathcal{X}) y=f(X)
    • univariate spatiotemporal prediction 单变量时空预测
      • 流量数据从标量 x i x_i xi变成矢量 x i ⃗ \vec{x_i} xi
      • x i ⃗ \vec{x_i} xi :不同基站的数据使用率
    • multivariate temporal prediction 多变量时域预测
      • x i ⃗ \vec{x_i} xi :SMS, call, and data usages from the same base station
    • multivariate spatiotemporal prediction 多变量时空预测
      • 里面的元素是 x i ⃗ \vec{x_i} xi : 不同空间区域的不同变量
      • 把整个的矩阵变成向量:当不同的空间区域存在于一个规则的网格中时,可以将流量格式化为具有相同网格大小的矩阵

2.2 dataset

(1)Telecom Italia 意大利电信 2015

链接指路

  • 数据集介绍:
    • This dataset was collected in the city of Milan, Italy, from November 1, 2013, to January 1, 2014.
    • 空域被分为100x100的网格,每个网格是235x235平方米
    • 通过分析call detail record(CDR)每十分钟每个网格提取不同的信息(SMSs, calls, and Internet usage data)
    • 这个数据集可以用于单变量、多变量的时空预测流量问题
(2)City Cellular Traffic Map (C2TM) 2015

链接:https://github.com/caesar0301/city-cellular-traffic-map

  • 数据集介绍:
    • 13,269 base stations in a medium-sized city in China from August 19, 2012, to August 26, 2012.
    • Each data record contains the base station id(基站id), a timestamp(时间戳), number of mobile users(用户数), number of transferred packets(传输包的数量), and number of transferred bytes(传输字节数) every hour. base station location(基站位置)
(3)、LTE Network Traffic Data_kaggle

click on this link:https://www.kaggle.com/naebolo/predict-traffic-of-lte-network(sos没有了)

  • 数据集介绍:
    • 4G data usage within 57 cells in 24 h for one year, from October 23, 2017, to October 22, 2018
    • the locations of these 57 cells are not available->temporal type
(4)、Cellular Traffic Analysis Data 2019

https://github.com/AminAzari/cellular-traffic-analysis

  • 数据集介绍:
    • the traffic packets captured from the user side on several Android devices by using virtual private network tunneling
    • packet arrival/departure time, source/destination IP addresses, communication protocol (e.g., UDP, TCP, SSL), and encrypted payload
(5)、China Unicom One Cell Data

链接:https://github.com/JinScientist/traffic-data-5min/blob/master/traffic_one_cell.csv

  • 数据集介绍:
    • 2016年1月1日至2017年5月1日17个月
    • time steps: 5 min
    • 对中国移动的4G网络的CDR data进行统计
    • 只有一个基站
    • 适用于单变量时间预测问题
(6)、Shanghai Telecom dataset 2020

链接:http://sguangwang.com/TelecomDataset.html

  • 数据集介绍:
    • 2014年6月1日至11月30日在中国上海收集了3233个基站和9481部手机
    • 这个数据集提功力每个用户会话的开始时间和结束时间以及对应基站的位置
    • 这个数据集本来适用于边缘计算的,但是也可以用于流量预测
(7)、The AIIA data

link: https://github.com/Phil-Shawn/DMNN

  • 数据集介绍:
    • 2017年1月1日至2018年11月15日三个匿名区域的小时流量数据
    • 预测问题属于时间类型

3、数据预处理和预测模型

3.1 data preprocessing

4种workflows:direct-prediction, classification-then-prediction, decomposition-then-prediction, and clustering-then-prediction
需要不同的数据预处理方式

3.1.1 直接预测 direct-prediction

在大多研究中输入的histical data and prediction target已经是正确的格式了(time series or input vectors
只需要通用的数据预处理:

  • 数据归一化:data scaling through data standardization or min-max normalization
  • 数据缺失问题:data imputation
    • forward filling
    • moving average
    • bayesian gaussian tensor decomposition 贝叶斯高斯张量分解
      在这里插入图片描述
3.1.2 先分类然后预测

the raw data packets: 从一个基站或者一个用户端收集到的不同应用或者服务的流量数据
流量分类的基础:deep packet inspection(检测) techniques
绕后使用ML或者DL将数据包分为:Email, text message, video streaming, audio chat, or video call
然后分别对每一种业务进行聚类
使用不同的预测模型来预测不同应用数据的未来流量
在这里插入图片描述
先分类然后预测的好处:

  • 在后续的预测过程中,单个应用的流量预测比或者流量预测更加稳定,更容易达到好的效果
  • 通过对不同应用的数据使用率的观察可以设计相应的管理措施:当更重要的应用需要额外的传输带宽时,可以降低视频流的质量
    另一种分类方式:判断单个小区的流量数据是可预测还是不可预测的(通过朴素贝叶斯分类器)就是用过预测误差实现的
    只有预测误差小的贾占数据才能在之后的预测中使用,减少了训练成本
3.1.3 先分解然后预测

将单个变量的输入流量时间序列分解为多个组件
分别预测每个不同的组件
最终预测的结果是组件的输出的叠加
和先分类在预测不同,组件本身是没有物理意义的

在这里插入图片描述

3.3 预测模型

3.3.1 统计模型 statistical models
(1)ARIMA : Auto-Regressive Integrated Moving Average自回归移动平均模型
  • 单变量时间序列模型
  • 基于三种分量的加权线性组合:自回归分量(AR)、差分分量(I)、移动平均分量(MA)
(2)HW:Holt–Winters三次指数平滑模型
  • 单变量时间序列模型
  • 基于三种分量的组合:simple exponential smoothing, Holt’s ES, Winter’s ES

在这里插入图片描述

3.3.2 机器学习模型 machine learning models
(1)RF:random forest 随机森林
(2)LightGBM
(3)GPR:Gaussian progress regression
(4)MLR:multiple linear regression
(5)Prohet

在这里插入图片描述

3.3.3 深度学习模型 deep learning models
(1)FFNNs:feed-forward neural networks前馈神经网络
(2)CNN
(3)RNN
(4)LSTM
(5)GRU
(6)ConvLSTM
(7)LSTM+attention
(8)CNN+RNN

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1304337.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入理解RBAC权限系统

最近,一位朋友在面试中被问及如何设计一个权限系统。我们注意到目前许多后台管理系统(包括一些热门的如若依快速开发平台)都采用了RBAC访问控制策略。该策略通过将权限授予角色,然后将角色分配给用户,从而实现对系统资…

仿短视频风格的自适应苹果CMS模板源码

这是一款仿短视频风格的自适应苹果CMS模板源码,设计简洁,适合用于搭建个人视频网站或者短视频分享平台。模板支持响应式布局,演示地 址 runruncode.com/yingshimanhau/19650.html 适配各种屏幕尺寸,功能丰富,用户体验良…

在vue3的js中将一组数据赋值的问题

代码: if (res.data) { myPrizeList.value res.data console.log(myPrizeList.value,myPrizeList.value) const giftList ref() console.log(JSON.parse(JSON.stringify(myPrizeList.val…

【VTK】VTK中的宏定义

很高兴在雪易的CSDN遇见你 【vtkWidgetRepresentation】第九期 vtk中的仿射变换 前言 本文分享VTK中的宏定义,希望对各位小伙伴有所帮助! 感谢各位小伙伴的点赞关注,小易会继续努力分享,一起进步! 你的点赞就是我的…

家用儿童床欧盟CE认证EN716标准

一、标准适用范围 该标准规定了内部长度大于900mm但不超过1400mm的家用童床的安全要求。该安全要求适用于完全组装完毕待用的童床。可以转换成其它产品的童床(如:可变产品、游戏床)转换后应该符合相关欧洲标准。该标准不适用于提篮、婴儿床和…

Kafka-客户端使用

理解Kafka正确使用方式 Kafka提供了两套客户端API,HighLevel API和LowLevel API。 HighLevel API封装了kafka的运行细节,使用起来比较简单,是企业开发过程中最常用的客户端API。 LowLevel API则需要客户端自己管理Kafka的运行细节&#xf…

快宝技术:连接无代码开发,API集成提升电商营销和用户运营效率

无代码开发:创新的启航 快宝技术自2012年成立至今,一直是无代码开发领域的佼佼者。通过无代码开发平台,快宝技术旨在降低技术门槛,并使非技术人员能够轻松创建和部署应用程序。这不仅使得快递末端软件开发变得高效和便捷&#xf…

用Sketch for Mac轻松创作无限可能的矢量绘图

在如今的数码时代,矢量绘图软件成为了许多设计师和创意爱好者的必备工具。而在众多的矢量绘图软件中,Sketch for Mac无疑是最受欢迎的一款。它以其简洁易用的界面和强大的功能,让用户能够轻松创作出无限可能的矢量图形。 首先,Sk…

Qt Desktop Widgets 控件绘图原理逐步分析拆解

Qt 是目前C语言首选的框架库。之所以称为框架库而不单单是GUI库,是因为Qt提供了远远超过GUI的功能封装,即使不使用GUI的后台服务,也可以用Qt大大提高跨平台的能力。 仅就界面来说,Qt 保持各个平台绘图等效果的统一,并…

QX320F28346,TI的TMS320F28346定制的DSP吗?为什么没有模拟外设ADC、DAC等?

QX320F28346,TI的TMS320F28346定制的DSP吗?为什么没有模拟外设ADC、DAC等?

基于Java+vue的音乐网站设计与实现(源码+文档+数据库)

摘 要 在此基础上,提出了一种基于javavue的在线音乐排行榜系统的设计与实现方法。本系统分为两个大的功能,即:前端显示、后端管理。而在前台,则是播放不同的歌曲,让人可以在上面观看不同的歌曲,也可以观看…

Vue--第八天

Vue3 1.优点&#xff1a; 2.创建&#xff1a; 3.文件&#xff1a; 换运行插件&#xff1a; 4.运行&#xff1a; setup函数&#xff1a; setup函数中获取不到this&#xff08;this 在定义的时候是Undefined) reactive()和ref(): 代码&#xff1a; <script setup> // …

springboot listener、filter登录实战

转载自&#xff1a; www.javaman.cn 博客系统访问&#xff1a; http://175.24.198.63:9090/front/index 登录功能 1、前端页面 采用的是layui-admin框架&#xff0c;文中的验证码内容&#xff0c;请参考作者之前的验证码功能 <!DOCTYPE html> <html lang"zh…

如何通过VNC实现公网远程控制macOS设备

&#x1f337;&#x1f341; 博主猫头虎&#xff08;&#x1f405;&#x1f43e;&#xff09;带您 Go to New World✨&#x1f341; &#x1f984; 博客首页——&#x1f405;&#x1f43e;猫头虎的博客&#x1f390; &#x1f433; 《面试题大全专栏》 &#x1f995; 文章图文…

Pinia无废话,快速上手

Pinia无废话&#xff0c;快速上手 Vue3 状态管理 - Pinia 1. 什么是Pinia Pinia 是 Vue 的专属的最新状态管理库 &#xff0c;是 Vuex 状态管理工具的替代品 2. 手动添加Pinia到Vue项目 后面在实际开发项目的时候&#xff0c;Pinia可以在项目创建时自动添加&#xff0c;现…

PDI/Kettle-9.4.0.0-343源码下载及编译

目录 &#x1f351;一、概要&#x1f34a;最新版本10.x&#xff08;2023-11-30&#xff09; &#x1f351;二、下载&#x1f351;三、编译&#x1f34a;3.1、导入开发工具&#x1f34a;3.2、开始编译&#x1f34a;3.3、编译报错&#x1f34a;3.4、报错原因&#xff1a;jdk版本低…

if - else 实现点击展开 / 折叠

在前端开发过程中&#xff0c;我们经常需要使用到点击展开/折叠的按钮。 此案例是一个数组嵌套数组的效果展示&#xff0c;使用的是v-if else 来实现的展开效果。 一、实现方法 if...else&#xff1a;当指定条件为真&#xff0c;if 语句会执行一段语句。如果条件为假&#x…

2023/12/11 作业

1.思维导图 2.作业 成果&#xff1a; 第一个头文件 #ifndef TEST3GET_H #define TEST3GET_H #include <QWidget> #include<QMessageBox> QT_BEGIN_NAMESPACE namespace Ui { class test3get; } QT_END_NAMESPACE class test3get : public QWidget { Q_OBJE…

用docker创建jmeter容器,如何实现性能测试?

用 docker 创建 jmeter 容器, 实现性能测试 我们都知道&#xff0c;jmeter可以做接口测试&#xff0c;也可以用于性能测试&#xff0c;现在企业中性能测试也大多使用jmeter。docker是最近这些年流行起来的容器部署工具&#xff0c;可以创建一个容器&#xff0c;然后把项目放到…

chrome浏览器使用flash player

今天用chrome打开学校校园网&#xff0c;显示不出来成绩单提示如下&#xff1a; 结果下了也没用。 Chrome浏览器在2020年12月已经停止支持Flash Player插件&#xff0c;所以无法在Chrome浏览器上使用Flash Player。 使用其他浏览器 如果之前安装了Flash Player插件的小伙伴&…