读论文:Real-Time Encrypted Traffic Classification via Lightweight Neural Networks

news2024/11/22 5:29:43

基于轻量级神经网络的实时加密流量分类

0、摘要

提出一种轻量级模型,设计原则“maximize the reuse of thin modules”,thin modules采用多头注意和一维卷积网络。由于所有数据包的一步交互和多头注意力机制的并行计算,所提出的模型的优势是参数的数量和运行时间显著减少。因为一个流只需要连续的三个数据包,所以该模型可以很好地实时工作。

关键词:加密流量分类,多头注意机制,一维卷积网络

1、介绍

·提出一种新的轻量级实时流量分类模型。多头注意允许每个数据包在一步中与所有其他数据包交互,并且并行学习不同子空间中的不同交互,大大较少了参数的数量,缩短运行时间

·模型自动提取高阶流级和包级特征。通过叠加多头注意块来探索全局水平上的高阶相互作用。此外,将1D-CNN应用于当数据包的特征提取。

2、相关工作

A.加密流量分类方法

1)基于流特征:分类器必须观察整个流或流中的大部分数据包才能获得这些特征,这些特征更适合离线分类。在本文中,仅以前几个数据包作为输入,所提出的模型可以满足实时性要求。

2)基于包特征的方法:基于包特征的方法直接使用包字节,包括包头和有效载荷字段。在本文中,模型有效地收集了编码器的流级和包级特征

B.CNN深度学习方法

纯CNN在表达交互信息方面的不足导致其与RNN的普遍应用,而RNN中各单元之间的依赖关系使得其耗时。在本文中,所有数据包的交互都是直接实现的。

C.高阶互动学习

Shi et al. 证明了多头注意模块可以用于CTR预测中的轻量级交互学习。本文提出的模型将multi-head attention modules 和transformer创新性的结合在一起

3、准备

模型将加密流量分类到特定的应用程序中

通常使用两种粒度类型:包和流

在这里使用流粒度–流指具有五元组(即传输层协议、源IP、源端口、目的IP、目的端口)相同值的所有数据包

数据包交互:通过数据包之间的高阶交互可以更有效地提取全局信息

4、轻量级模型

在这里插入图片描述
模型的输入是在路由器上捕获的在线或离线流量轨迹
预处理后,捕获流中国的前N个数据包;然后,提取每个数据包的初始特征并将其映射到连接以表示流的几个向量。使用编码器提取局部和全局特征,然后使用softmax函数输出每一类应用的概率。

a. 预处理

我们根据流的五元组将流量分成流,跳过TCP连接中的三次握手,因为其对流分类有用的信息较少。提取流中的前N个原始数据包作为模型的输入

b.体系结构

1)嵌入
2)注意力编码器attention Encoder

在这里插入图片描述
the attention encoder is designed to extract local and global information at a deeper level.
(a)Multi-head attention多头注意力
通过multi-head attention,每个数据包可以与所有其他数据包在一步中交互,大大减少参数数量,缩短运行时间;
一个数据包被投射到多个子空间中,因此multi-head attention可以捕获不同子空间中的不同特征交互
通过用multi-head attention堆叠模块,我们能够对不同顺序的特征交互进行建模。
(b)Add&Norm
该层能够防止网络退化和加速模型的训练。add&norm层包括ResNet和归一化层。其中ResNet块可以用很少的参数来防止网络退化,在multi-head attention以及feed forward模块后加入ResNet层可以保存从模型中获得原始和先前学习的信息。
此外,层归一化是一种对中间层分布进行归一化的技术,可以实现smoother gradients,faster training, and better generalization accuracy.
©Feed Forward Layer
在这里插入图片描述
在feed forward层中,因为1D-CNN侧重于单个数据包,所以其能够有助于提取包级特征。
因此,使用kernel size为1的1D-CNN能够提取包级特征,对于每个包,每个内核的内积构成了包的更深层次表示。
(d)Flatten and Dense Layer

C 空间与空间复杂性分析

(1)空间复杂度
(2)时间复杂度

5、评估

数据集:
ISCX VPN-non VPN (http://www.unb.ca/cic/datasets/vpn.html)
HTTPS(http://betternet.lhs.loria.fr/datasets/https)
在这里插入图片描述
在这里插入图片描述

6、总结

本文提出一种轻量级模型,主要通过thin module来提取flow level and packet level特征

数据集仅包括HTTPS和VPN流量,但不涉及其他加密协议
缺点:没有进行消融实验,在与1D-CNN以及CNNwithLSTM进行对比时,不知道前面的嵌入层是否一样

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1069692.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RF元素定位

元素定位方式:id, name, link, partial_link_text, xpath, css id 【登录输入框】id session_email_or_mobile_number input text id session_email_or_mobile_numbername 【登录输入框】name session[email_or_mobile_number] input text name sessi…

react-antd 文件导入按钮增加一个加载状态

1、效果图实例: 2、部分代码 2.1 props : 2.2 handleChange、上传的文件检验 : construction中定义 construction(props) { super(props); this.state { loadingStaus: flase, loadingDisabled: flase, // 作用:按钮如果在加 载状态中,没…

Android多线程学习:线程

一、概念 进程:系统资源分配的基本单位,进程之间相互独立,不能直接访问其他进程的地址空间。 线程:CPU调度的基本单位,线程之间共享所在进程的资源,包括共享内存,公有数据,全局变量…

【Pod】

Pod 一、Pod基本概念二、Pod的使用方式pause容器(pod的基础容器)核心功能pause容器使得Pod中所有容器可以共享两种资源:网络和存储网络存储 三、Pod分类自主式Pod/静态pod控制器管理的Pod 四、三种容器五、镜像拉取策略(image Pul…

云计算安全和云原生安全的关系

云计算安全(Cloud Computing Security)指的是在云环境中保护数据、应用程序和基础设施的安全性。它包括保护云服务提供商的基础设施和平台,以及云服务用户的数据和应用程序。 云原生安全(Cloud-Native Security)则是指在云原生环境中保护应用程序和服务的安全性。云…

谁说手机没有高质量抓拍?华为Mate 60系列与Mate X5让你体验“时间凝固”!

我们日常拍照时,经常会出现“照片糊了”的现象,这是由于被拍摄的人或者物快速移动导致。 来源网图,侵删 抓拍,Snap photography,“抓住时机,把瞬间出现的情景拍摄下来拍照”,又名写实抓拍&…

手写Demo体验volatile可见性的作用

volatile是java的关键字,作用:①保证线程间的可见性;②防止指令重排。下面看一个demo,启动2个线程,一个线程读取flag变量的值,另外一个线程修改flag变量的值。 public class VolatileDemo {private static…

前端自动化测试入门教程

🪴 背景 前端的自动化测试主要可以分为以下四种: 单元测试(Unit Test):对一个函数/组件进行测试,一般用于公共函数/公共组件的测试维护。常用框架有 Jest、Jasmine、Mocha等; 集成测试&#x…

VR全景拍摄酒店,为用户消除“不透明度”

近日在各大社交平台上,出现了不少吐槽国庆期间酒店价格太贵的帖子,而一些热门旅游地的度假酒店、网红民宿的热门房型已经“一房难求”,这就出现酒店房型与预定房型不同的现象出现,VR全景拍摄技术同酒店行业的结合,就可…

韩语学习|韩语零基础|柯桥韩语学校,每日一词

今日一词:개방도 평지 韩语每日一词打卡:개방도[개방도]【名词】开放度,开放程度 原文:한 지역의 개방도는 경제 발전 수준에 달려 있습니다. 意思:一个地区的开放程度取决于经济发展水平。 【原文分解】 1、경제[경제]经济 2、지역[지역]地域 3、발전[발…

代码随想录算法训练营第23期day12| 239. 滑动窗口最大值 、347. 前K个高频元素

目录 一、(leetcode 239)滑动窗口最大值​​​jiao 二、(leetcode 347)前 K 个高频元素 优先级队列与大小顶堆 一、(leetcode 239)滑动窗口最大值​​​jiao 力扣题目链接 状态:待回顾&…

kafka、rabbitmq 、rocketmq的区别

一、语言不同 RabbitMQ是由内在高并发的erlanng语言开发,用在实时的对可靠性要求比较高的消息传递上。 kafka是采用Scala语言开发,它主要用于处理活跃的流式数据,大数据量的数据处理上 二、结构不同 RabbitMQ采用AMQP(Advanced Message Q…

Excel·VBA使用ADO读取工作簿工作表数据

目录 查询遍历写入数组查询整体写入数组查询工作簿所有工作表名称查询工作簿所有工作表数据 不打开工作簿读取数据,以下举例都为《ExcelVBA合并工作簿》中 7,合并子文件夹同名工作簿中同名工作表,纵向汇总数据所举例的工作簿,使用…

国庆作业day10.4

QT实现TCP服务器客户端搭建的代码,现象 服务器 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);//实例化一个服务器servernew QTcpServer(this);c…

探秘小米增程汽车与仿生机器人的未来:AI大模型的潜在影响及苹果iPhone15Pro发热问题解决之道

🌷🍁 博主猫头虎 带您 Go to New World.✨🍁 🦄 博客首页——猫头虎的博客🎐 🐳《面试题大全专栏》 文章图文并茂🦕生动形象🦖简单易学!欢迎大家来踩踩~🌺 &a…

智能井盖传感器:城市安全卫士

随着城市人口的不断增加和城市基础设施的不断发展,井盖作为城市道路和排水系统的重要组成部分,承担着确保城市安全和便利性的关键角色。然而,井盖在日常使用中常常面临倾斜、水浸和翻转等问题,这些问题可能导致交通阻塞、行人坠井…

漏洞挖掘--edusrc两连杀

免责声明:文章中涉及的漏洞均已修复,敏感信息均已做打码处理,文章仅做经验分享用途,切勿当真,未授权的攻击属于非法行为! 最近闲来无事,研究了下通达的day,由于本人太菜了&#xff…

软考网络工程师考前如何复习?

先看一下这知识点总结图,在备考复习前大致简单了解一遍! 第一步: 通读教程(《网络工程师》),首先对教程中的各章节及知识点有一个基本的认识,第一阶段基本以泛读为主,不求立刻记得所…

Maven 配置阿里云镜像

1. 查找maven setting.xml配置文件 find / -name "setting.xml" 2. 添加阿里云镜像 修改maven根目录下的conf文件夹中的setting.xml文件中的mirrors下添加mirror标签 <settings> <localRepository>E:\Maven\repository</localRepository> <…

LLMs Python解释器程序辅助语言模型(PAL)Program-aided language models (PAL)

正如您在本课程早期看到的&#xff0c;LLM执行算术和其他数学运算的能力是有限的。虽然您可以尝试使用链式思维提示来克服这一问题&#xff0c;但它只能帮助您走得更远。即使模型正确地通过了问题的推理&#xff0c;对于较大的数字或复杂的运算&#xff0c;它仍可能在个别数学操…