【XSS_MSN】基于GCN的web攻击Payload识别与可解释性分析

news2024/11/18 0:39:41

原文标题:Web Attack Payload Identification and Interpretability Analysis Based on Graph Convolutional Network 

原文链接:https://ieeexplore.ieee.org/document/10076547/    

作者单位:四川大学网络安全学院

相似原理论文:GraphXSS: an efficient XSS payload detection approach based on graph convolutional network,两篇论文应该来自同一个组,含两个共同作者

论文中Web Payload攻击可分为SQL注入、XSS、命令注入、文件泄露、XML注入等攻击。 

1、论文针对的关键性问题

  • 如何结合字段间的联系以及双向关系用于分析
  • 如何结合微观和宏观视角提取web攻击Payload特征,以减少Payload稀释问题所带来的影响           Hackers will also attempt to construct long payloads for attacks, which serve multiple purposes,The first is to create a buffer overflow error, which can be used as a vulnerability to attack. Secondly, some Web firewalls read a limited number of character lengths and cannot detect content beyond the maximum number. Hackers can use it to construct malicious code after the maximum size. In addition, long payloads can dilute the proportion of malicious content in the payload, reducing the probability of some detection models identifying them as malicious。
  • 如何构建一个更具解释性的web攻击Payload检测模型

2、论文中所做的工作 

  • 提出了一种基于图关系的Web Payload建模方法(基于word),可在宏观视角(图)和微观视角(节点)提取Payload的特征
  • 提出了一种基于GCN的Web Payload攻击识别方法,节点的初始特征向量采用Bert预训练模型获取,并由GCN执行节点embedding,进而得到图的表示向量,训练模型得到Payload攻击识别模型。
  • 设计实验并对所提到的方法进行了可解释性分析

3、论文的详细设计

        1)Web Payload 图构建

        Web Payload图类型: 无向图

        两种节点类型:字段名称(field name)、参数值依据预设规则切分后的token。进一步论文在构建图时分为了纯数字、纯字母、特殊字符以及其他四种节点类型,各自占比如下。

        三种边类型:字段名称之间的双向连接、字段名称与参数值的(value的第一个token)连                                     接、参数值token之间的序列关系

        2)检测框架说明

              数据层:数据来自Web服务器日志和Pcap文件,Payload均含字段名称和参数值,对混                               淆的Payload执行解码、等式替换以及无关字符删除等多次类似的数据恢复操作。

              图构建层:参考1),节点特征通过预训练的Bert模型获取。

              训练层:采用GCN训练,做图分类任务

        3)可解释性分析

        通过删除节点,计算每个节点的影响率,通过分析高影响率的节点来做可解释性分析。

4、实验分析

        数据集:CSIC 2010 v2 HTTP dataset

        实验主要结果:论文实验是做图分类任务,使用RF、LSTM、SVM等做对比实验时,提取了节点特征做融合,作为某个Web Payload的特征向量。

5、总结

        论文使用Web payload参数对进行图构建,并进一步将节点类型划分为纯数字、纯字符、特殊字符以及其他共四种类型,边包含参数之间的互联关系、参数与参数值第一个token的邻接关系、参数值的序列关系三种,最后做一个GCN图分类任务,同时对预测结果的可解释性做了初步探索,其结果表明与Web攻击相关的字符拥有更高的积极影响。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1113129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Excel拆分单元格怎么操作?学会这4招,工作效率倍涨!

“刚刚在做一份Excel的报表,需要将某些单元格进行拆分,但是我不知道应该如何处理,大家在使用Excel时有什么比较简单的单元格拆分方法吗?” 当我们需要使用Excel处理大量数据或者创建专业报表时,可能需要对单元格进行拆…

【试题011】C语言多个运算符计算例题

1.题目&#xff1a;表达式1!23/45%6(78)9的值是&#xff1f; 2.代码&#xff1a; #include <stdio.h> int main() {//表达式1 !2 3 / 4 5 % 6 (7 8) 9的值printf("%d\n", (1 !2 3 / 4 5 % 6 (7 8) 9));//分析&#xff1a;多个运算符先考虑优先级…

如何用R语言优雅地玩转PubMed-RISmed包的使用

PubMed是最大的生命科学文献数据库之一&#xff0c;在开展课题使用关键词搜索时&#xff0c;会检索出大量文献。如何对这些文献进行筛选&#xff0c;出了巧妙使用关键词组合外&#xff0c;还可以使用R将相关文献信息一键提取&#xff0c;实现文献的快速浏览。RISmed是一个用于从…

淘宝卖家如何批量采集竞品sku进行分析?推荐2个商品sku获取API

item_sku-获取sku详细信息 请求参数 请求参数&#xff1a;num_iid572050066584&sku_id3880971359554&is_promotion0 参数说明&#xff1a;sku_id:SKU ID num_iid:商品ID is_promotion:是否获取取促销价 API测试页 获取key&secret 响应参数 Version: Date: 名…

实现自动推送:工具助力公众号运营

公众号的运营离不开定期推送内容给用户&#xff0c;但手动推送过程繁琐且耗时。现在&#xff0c;借助乔拓云公众号助手工具&#xff0c;你可以轻松实现自动推送消息的功能。下面&#xff0c;我们一步一步教你如何操作。 首先&#xff0c;我们需要注册并登录乔拓云公众号助手工具…

MATLAB中 tf2zp函数用法

目录 语法 说明 示例 连续时间系统的零点、极点和增益 tf2zp函数的功能是将传递函数滤波器参数转换为零极点增益形式。 语法 [z,p,k] tf2zp(b,a) 说明 [z, p, k] tf2zp(b, a) 从传递函数参数 b 和 a 中找到零点矩阵 z&#xff0c;极点向量 p&#xff0c;以及相关的增益…

uniapp开发多端应用项目时的常见跨端兼容处理

一、跨端兼容 每个端有每个端的特点&#xff0c;有的能被抹平&#xff0c;有的不可能被抹平。 跨端&#xff0c;不是把web的习惯迁移到全平台。而是按照uni的写法&#xff0c;然后全平台使用。 按照uniapp规范开发可以保证多平台兼容&#xff0c;但每个平台有自己的一些特性。…

实用的数据集成方式

随着企业数字化转型的加速推进&#xff0c;数据集成变得愈发重要&#xff0c;它是实现信息流动和系统协同的关键步骤。 数据集成是企业数字化转型的重要一环。利用实用的数据集成方式&#xff0c;企业能够高效地实现信息流动和系统协同&#xff0c;提升企业运营效率和决策能力…

重庆东微电子推出高性能抗射频干扰MEMS硅麦放大器芯片

专业的模拟及混合信号芯片设计企业重庆东微电子股份有限公司日前宣布&#xff1a;成功开发并推出其第三代硅基微机电系统麦克风&#xff08;Silicon MEMS Microphone&#xff0c;以下简称“MEMS麦克风”&#xff09;模拟接口放大器芯片EMT6913。该芯片针对低功耗MEMS麦克风应用…

中科芯与IAR共建生态合作,IAR集成开发环境全面支持CKS32系列MCU

中国上海–2023年10月18日–嵌入式开发软件和服务的全球领导者IAR今日宣布&#xff0c;与中科芯集成电路有限公司&#xff08;以下简称中科芯&#xff09;达成生态合作&#xff0c;IAR已全面支持CKS32系列MCU的应用开发。这一合作将进一步推动嵌入式系统的发展&#xff0c;并为…

asp.net乒乓球场地管理系统VS开发sqlserver数据库web结构c#编程Microsoft Visual Studio

一、源码特点 asp.net乒乓球场地管理系统是一套完善的web设计管理系统&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。开发环境为vs2010&#xff0c;数据库为sqlserver2008&#xff0c;使用c#语 言开发 asp.net 乒乓球场地管理系统 二…

tensorrt安装使用教程

一般的深度学习项目&#xff0c;训练时为了加快速度&#xff0c;会使用多GPU分布式训练。但在部署推理时&#xff0c;为了降低成本&#xff0c;往往使用单个GPU机器甚至嵌入式平台&#xff08;比如 NVIDIA Jetson&#xff09;进行部署&#xff0c;部署端也要有与训练时相同的深…

WEB网络渗透的基础知识

网络渗透 1.什么是网络渗透 网络渗透是攻击者常用的一种攻击手段&#xff0c;也是一种综合的高级攻击技术&#xff0c;同时网络渗透也是安全工作者所研究的一个课题&#xff0c;在他们口中通常被称为”渗透测试&#xff08;Penetration Test&#xff09;”。 网络渗透的目的…

光模块对网络延迟的影响如何?

网络的延迟是网络运作过程中经常碰到的问题&#xff0c;光纤传输环节的光模块是影响网络延迟的关键因素之一。作为光通信的核心组件&#xff0c;光模块的性能直接影响到数据传输的速率、稳定性和可靠性&#xff0c;从而影响网络的延迟情况。 首先&#xff0c;传输速率越高的光…

php对接飞书机器人

有同事接到对接飞书机器人任务&#xff0c;开发中遇到响应错误&#xff1a; {"code": 19021,"msg": "sign match fail or timestamp is not within one hour from current time" } 意思应该就是签名错误或者时间戳不在有效范围内等&#xff0c…

一键更新图像或表格号

一键更新图像或表格号 首先&#xff0c;在图像或者表格处插入题注 第二步&#xff1a;在对图像描述处&#xff0c;插入交叉编译 第三步&#xff1a;如果图标编号改变了&#xff0c;右击更新域

受邀参加第 60 届中国高博会 星辰天合以 SDS 助力高校数字化转型

近日&#xff0c;第 60 届中国高等教育博览会&#xff08;以下简称&#xff1a;高博会&#xff09;在山东青岛开幕。中国高等教育学会会长杜玉波&#xff0c;山东省人民政府副省长王桂英出席开幕式并致辞。 本届高博会由中国高等教育学会主办&#xff0c;以“职普融通•产教融…

Python数据挖掘:自动售货机销售数据分析与应用

&#x1f4d5;作者简介&#xff1a;热爱跑步的恒川&#xff0c;致力于C/C、Java、Python等多编程语言&#xff0c;热爱跑步&#xff0c;喜爱音乐的一位博主。 &#x1f4d7;本文收录于恒川的日常汇报系列&#xff0c;大家有兴趣的可以看一看 &#x1f4d8;相关专栏C语言初阶、C…

数据库复习——闭包

【例】关系模式R<U&#xff0c;F>&#xff0c;其中U{A&#xff0c;B&#xff0c;C&#xff0c;D&#xff0c;E}&#xff0c;F{AB→C&#xff0c;B→D&#xff0c;C→E&#xff0c;EC→B&#xff0c;AC→B}&#xff0c;求&#xff08;AB) 第一步&#xff0c;令X(0)AB。 …

Nexus的管理

仓库的配置 1登录以后点击设置图标&#xff0c;点击Repository 进行仓库管理 2 点击Create repository&#xff0c;选择 填写相关内容&#xff0c;阿里云仓库地址http://maven.aliyun.com/nexus/content/groups/public 点击 maven-public group进行配置&#xff0c; 角色配置…