如何识别网络应用层协议?

news2025/1/24 2:21:22

能够标识出 Internet上每个流所使用的应用层协议是一系列网络应用的前提和基础。然而随着网络的高速化和协议的复杂化,传统的基于端 口识别应用层协议的算法已经不够准确,因此各种新的协议识别算法成为研究热点 。

本篇文章将重点介绍协议识别问题的几个基本概念 ,以及目前主要实现方式各自的优缺点及关键技术和当前具有代表性的实现项目。原文链接:如何识别网络应用层协议

一、基本概念

1.1 流

指在某一段固定时间间隔内通过网络上一个观测点的 IP报文集合。属于一个特定流的所有报文有一些相同的属性。 应用层协议识别的对象不是单个报文,而是将“流”作为一个整体考虑。

1.2 协议识别

标识出网络上每个流所使用的应用层协议 ,其是基于使用类型的流分类的延伸和精化。在基于使用类型的流分类问题中,每个类别可能包含某些属性类似的多种协议 ,但协议识别问题必须对流进行更精细的分类 , 使得每个类别中的流只使用一种应用层协议。

1.3 流分类

指利用流以及流中报文的某些信息将网络上的流分成既定的若干类别 (如长流/短流,快流/慢 流,或者各种使用类型的流),其是报文分类的扩展。

1.4 解决协议识别问题的基本思路

从本质上看 ,协议识别问题是多元统计学中的判别,分析在实际中的应用。首先根据所选择的 维流信息将流分为 k个类别 ,每个 类别对应一个协议,对于新到来的流,计算其 自身的n维流信 息值 ,根据结果将其划分到相应的类别中,给出类别号即协议名。从理论上说 ,流中每个报文的任意字段或流传输过程 中 的任何特性都可以作为一维的流信息即协议识别的依据。但实际使用中,如何选择最有效的流信息维度是面临的最大困难 。

二、实现方式

2.1 基于端口识别协议

这是最简单也是识别正确率最低的一种方式,传统的应用层协议识别算法只利用了端 口号一 维信息,其根据各个应用层协议在中注册的端 口号 来标识 协议 。例 如 ,若某个 TCP流使用 了端 口号 80、8080或 443,则将其标记为 Web流量,53端口识别为dns等。

2.2 基于负载识别协议

基于负载的算法仍是一个一元判别 问题 ,其需要事先详细分析待识别的应用层协议,找出其交互过程中不 同于其他任何协议的字段,作为该协议的特征。在识别的过 程中,该类算法检查流中每个报文 TCP首部之后的负载部分 ,若匹配到某协议的特征 ,则将该流标记为相应的协议。基 于负载的算法不仅能识别出使用单一连接进行通信的协议 ,而且能够识别出如 PASVFTP、流媒体等使用多个连接、动态端口进行通信的协议。在这些协议 中,数据传输所使用的端口是在事先建立的控制连接中协商的。基于负载的算法检查控制连接中的每个报文 ,找出协商得到的端口号,并以此端口识别数据连接 。

优缺点:正确率高,不过当协议规范发生变化或者新协议出现时,寻找特征的工作必须重新进行,工作量非常大,更新困难 ,因此 ,该类算法通常只被用在需准确识别数量较少的协议时,且需要有相当的工作量。

2.3 基于测度识别协议

基于测度识别协议的算法利用协议规范的不同所造成的流测度的差异区别各个协 议 。例如 ,Web流一般为短流小报 文 ,而 P2P流一般为长 流大报文 。基 于测度 的算法 要求事先有标准的训练集可用,即要用已按各个协议分类的 报文集合来训练识别器,使其在使用的过程中根据已知的标 准答案和新计算 的流测 度 ,按 照某 种判别算法得出当前流所属的类别 ,即所使用的协议 。

优缺点:成熟度不够,样本需求大,相关开源实现项目少;

2.4 基于行为特征的协议识别

将各个应用层协议的特点进行收集整理,对比数据包,匹配出对应的应用层协议。它需要训练数据集作为输入,构建一个分类器或者分类模型,通过模型识别为哪一种应用层协议

2.5 综合算法

综合上述方式实现对应用层协议的解析。

三、WireShark的识别方式

3.1 实现过程

1.基于传输层协议获取可能的应用层协议集合,例如基于udp实现的可能是dns、zookper等,基于tcp可能为http、grpc等;下图为TCP/IP详解一书中关于协议的引用。

img

2.基于负载匹配行为特征

3.2 源码分析 todo

四、参考链接

1.陈 亮 龚 俭 徐 选. 应用层协议识别算法综述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/92237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第三章、前端知识(测试基础)---HM

文章目录一、web前端三大核心技术二、HTML基础1. HTML简介1.1 什么是HTML?1.2 HTML标签1.2.1 HTML单标签和双标签:1.3 HTML属性2. HTML标签骨架3. 基本的HTML标签3.1 HTML标题3.2 HTML段落3.3 HTML超链接3.4 HTML图片3.5 HTML空格和回车3.6 布局标签4、H…

【水果识别】苹果质量检测及分级系统(带面板)【含GUI Matlab源码 1613期】

⛄一、简介 1 案例背景 目前,苹果的分级主要靠人工完成,该方法存在主观误差大、效率低和苹果易造成二次损伤等问题。随着机器视觉技术的快速发展, 图像处理在水果质量检测方面也取得了深入进展。 试验拟通过采集视野内苹果图, 综…

ssm+Vue计算机毕业设计校园学生体温管理系统(程序+LW文档)

ssmVue计算机毕业设计校园学生体温管理系统(程序LW文档) 项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项…

Linux 设备驱动

驱动编译要用到kernel的Makefile文件 — — 也就是源码树的编译系统。因此,源码需要被配置和编译,以ubuntu自带的源码为例: 编译外部模块(.ko)的编译命令是: make -C Mmak**e−Cpathtokernelsrc>MPWD 也就是进入到kernel目录&a…

oracle经典习题(一)

oracle经典习题(一) 1.显示与BLAKE在同一部门工作的雇员的姓名、工作和入职日期&#xff0c;但是BLAKE不包含在内 1.1 示例sql语句 SELECT ename,job,hiredate FROM emp WHERE deptno(SELECT deptno FROM emp WHERE enameBLAKE) AND ename <> BLAKE1.2 运行截图 2.显示…

vpp hash源码分析

概述 vpp的hash结构分为hash头、桶&#xff08;_hash_create或hash_resize申请&#xff09;和桶下元素&#xff08;clib_mem_realloc申请&#xff09;&#xff0c;总共3个部分组成。 根据元素key的hash值不同&#xff0c;分配到不同的桶下&#xff0c;与其他hash表原理相同。 …

Python利用pandas处理Excel数据的应用

最近迷上了高效处理数据的pandas&#xff0c;其实这个是用来做数据分析的&#xff0c;如果你是做大数据分析和测试的&#xff0c;那么这个是非常的有用的&#xff01;&#xff01;但是其实我们平时在做自动化测试的时候&#xff0c;如果涉及到数据的读取和存储&#xff0c;那么…

二叉树5:二叉树层序遍历

学会二叉树的层序遍历&#xff0c;可以一口气打完以下十题&#xff1a; 强烈建议大家和我一样&#xff0c;先看一下第一道题&#xff0c;大家可以去看看卡哥的哔站视频&#xff0c;理解透。然后后面的九道题自己先动手做一下&#xff0c;别急着看答案&#xff0c;真心不难&…

Git流程规范

开发新功能 1、从master拉一个功能分支&#xff0c;取名为某个版本下的某个产品功能 4.3/精确发券 2、当功能开发好了&#xff0c;合并分支到dev进行联调 3、如果是俩个关联性的分支&#xff0c;应该把分支合并到另外一个分支&#xff0c;在合并到dev分支中。如图。feature3…

【学习笔记01】vue的了解和指令

一、什么是 Vue&#xff1f; Vue (发音为 /vjuː/&#xff0c;类似 view) 是一款用于构建用户界面的JavaScript框架。它基于标准 HTML、CSS 和 JavaScript 构建&#xff0c;并提供了一套声明式的、组件化的编程模型&#xff0c;帮助你高效地开发用户界面。 二、Vue的两个核心功…

Day831.局部变量为什么是线程安全的 -Java 并发编程实战

局部变量为什么是线程安全的 Hi&#xff0c;我是阿昌&#xff0c;今天学习记录的是关于局部变量为什么是线程安全的。 一遍一遍重复再重复地讲到&#xff0c;多个线程同时访问共享变量的时候&#xff0c;会导致并发问题。 那在 Java 语言里&#xff0c;是不是所有变量都是共…

【java设计】:全民飞机大战小游戏制作

文章目录 前言 一、全民飞机大战 二、计划安排 三、源码图和类图展示

CTF Android逆向 -- KGB Messenger APK文件结构介绍,破解账户与密码,静态分析,修改并构建APK,逆向算法,APK文件签名

前言 一次练习Android逆向的记录&#xff0c;写得很详细&#xff0c;有什么没有理解的地方可以私信 csdn不让我加外链&#xff0c;所以将链接前面的#号去掉即可 题目&#xff1a; ht#tps://github.com/tlamb96/kgb_messenger在这个挑战中&#xff0c;一共有三个flag&#x…

UE4 Pak打包、挂载、加载

首先&#xff0c;必须得明确的一点就是如果想要加载Pak内资源&#xff0c;那么这些资源必须是经过Cook的。如果打包的是未Cook的资源&#xff0c;那么即使Pak挂载成功&#xff0c;也不可能会成功加载Pak内资源。 不知道怎么生成Cook资源&#xff0c;可以看我前一篇 ​​​​​…

持之以恒,方得始终|海联捷讯的六年数字化历程

企业数字化已经成为了企业家与管理者的共识。如何实现数字化转型&#xff0c;从认知到战略&#xff0c;上至组织文化&#xff0c;下至每个组织成员的行为&#xff0c;都需要做出改变——它本质上是一种创新的企业管理模式和运营机制&#xff0c;重要性不言而喻。而降本增效也是…

学习->C++篇十七:C++的类型转换和IO流

目录 一.类型转换 1.C语言中的类型转换 2.C中的类型转换 二.IO流 1. C语言的输入与输出 2. 流是什么 3. stringstream 一.类型转换 1.C语言中的类型转换 &#xff08;1&#xff09;隐式类型转换&#xff0c;编译阶段自动进行&#xff0c;不能转换就编译报错。&#xff…

TCP/IP四层协议

七层模型层数太多记不住&#xff0c;四层模型 应用层&#xff0c;传输层&#xff0c;网络层&#xff0c;网络接口层的名字必须记得滚瓜烂熟。&#xff08;重点也是tcp/ip四层模型&#xff09; 四层模型&#xff1a; 1.应用层&#xff1a; 两台终端设备上的应用程序 应该遵守…

三面美团 Java 岗,HR 现场直接发 offer,他是横着走出来的

前情提要 这是一个发生在我朋友身上的真实事情&#xff1a; 这里就叫他程序员 Y 吧。 程序员 Y 工作不到两年&#xff0c;周末在朋友圈发了个喜报&#xff0c;准备入职美团。 之后&#xff0c;我就带着祝福跟 Y 聊了许久&#xff0c;聊天的内容就是具体了解一下他面试的过程…

技术分享之IntelliJ plugin

资料 https://zhaojian.blog.csdn.net/article/details/127882946 Plugin Configuration File https://plugins.jetbrains.com/docs/intellij/plugin-configuration-file.html 今天分享的主要内容: 了解插件能够做什么 如何开发一个插件 阅读两个常用的插件源码 intellij的窗…

15.Django大型电商项目之创建模型与sql表反向生成模型

1.用户模块模型类创建 1.1 创建用户的子应用 python .\manage.py startapp userapp在settings中挂载子应用 创建子应用urls.py 在主应用中加入子应用的urls.py 1.2 创建表 如何在直接导入sql文件形成表&#xff0c;这里就直接在navicate中把sql文件拖进去点击开始即可 这里…