【论文速读】| AttackQA:利用微调及开源大语言模型辅助网络安全运营的数据集的开发与应用

news2024/12/12 20:31:27

图片

基本信息

原文标题: AttackQA: Development and Adoption of a Dataset for Assisting Cybersecurity Operations Using Fine-Tuned and Open-Source LLMs

原文作者: Varun Badrinath Krishna

作者单位: SambaNova Systems

关键词: 网络安全、检索增强生成(RAG)、开源LLM、数据集开发、SOC

原文链接: https://arxiv.org/pdf/2411.01073

开源代码: 暂无

论文要点

论文简介:近年来,大语言模型(LLM)在回答复杂领域问题方面表现出色,尤其是在微调后的特定领域数据集上,生成准确、上下文相关的答案能力大幅提高。本研究提出了一个名为AttackQA的网络安全问答(Q&A)数据集,专为支持安全运营中心(SOC)分析师设计。该数据集基于MITRE ATT&CK知识库开发,包含25,335对问答及其推理,80%的内容由开源LLM自动生成。研究表明,通过对开源嵌入模型和生成模型的微调,能够显著超越OpenAI的专有模型(如GPT-4o)在准确性和效率上的表现,形成一套低延迟、高性能的端到端检索增强生成(RAG)系统。

研究目的:安全运营中心(SOC)是现代企业网络安全的核心,但也面临诸多挑战,例如技能短缺、过多时间花费在警报调查上以及对高级威胁的响应迟缓等。传统上,SOC团队需耗费巨资培训员工使用复杂的网络安全工具,仅培养10名分析师就需约369万美元,而这对大多数企业来说成本高昂且难以承受。

本研究旨在通过人工智能技术开发一套网络安全问答系统,帮助SOC分析师快速获得网络攻击相关问题的高质量答案。系统完全依托开源大语言模型,通过微调与优化,不仅提升了准确性,还降低了部署与使用成本。其核心目标是简化SOC分析师的工作流程,加速网络攻击的检测与响应,从而提升网络安全运营的效率。

研究贡献:

1. 高质量网络安全数据集创建:利用开源LLM生成并微调了基于MITRE ATT&CK知识库的高质量问答数据集AttackQA。

2. 数据质量控制:通过微调Llama 3 70B模型,自动筛选并剔除低质量的问答对,确保数据集的整体质量。

3. 嵌入模型性能提升:在检索任务中,微调的嵌入模型表现优异,其上下文召回率显著高于未优化模型和OpenAI最先进的嵌入模型。

4. 生成模型优化:通过Llama 3 405B对生成结果的评估,证明微调后的生成模型在生成准确性和回答推理能力上均超越了更大规模的专有模型。

5. 构建高效RAG管道:开发了一套精准、低延迟的RAG系统,能够快速服务于SOC分析师的问答需求。

引言

安全运营中心(SOC)是企业网络安全的核心枢纽,其职责涵盖威胁检测、调查与响应。然而,当前SOC的运作效率仍面临巨大挑战。一项研究指出,企业每年在SOC上的平均投入高达1460万美元,其中80%用于人力成本。即便如此,SOC团队仍需要投入大量时间来应对警报和高级威胁。此外,学习掌握多种安全工具也增加了培训成本和技术门槛。

图片

为了减轻这些挑战并提升SOC的效率,本研究提出了一种基于问答系统的解决方案。通过微调开源LLM,研究者开发了AttackQA数据集,并利用该数据集构建了一套RAG框架下的问答系统。数据集来源于MITRE ATT&CK知识库,这是一个基于真实世界网络攻击行为的数据库,涵盖攻击技术、工具、策略和缓解方法。然而,由于其原始数据结构复杂,不适合直接用于问答任务,因此研究团队对其进行了重组和优化,使其能够高效服务于LLM的训练与推理。

相关工作

此前已有研究证明,使用LLM生成、整理和评估合成数据集是提升模型性能的重要途径。例如,Atlas和RankRAG等模型在特定领域的检索增强生成任务中表现突出。然而,这些研究大多依赖于专有模型和复杂的技术,而本研究的创新之处在于利用完全开源的LLM,结合轻量化的优化策略,实现了更高的性价比与性能表现。

问答数据集创建

图片

论文描述了数据集AttackQA的开发过程,核心步骤包括:

1. 数据提取与处理:从MITRE ATT&CK知识库提取了涉及攻击技术、策略、工具、组织及缓解方法的关键信息,并将其整理为适合LLM训练的文档格式。

2. 问题生成:通过结合人工和LLM的方式生成问答对,其中20%由人工设计,涵盖复杂且具有覆盖性的网络安全问题,其余80%由Llama 3 8B自动生成。

3. 数据质量控制:引入Llama 3 70B模型,通过微调实现对问答对的评分与筛选,最终保留25,335个高质量问答对。

最终,数据集包含25,335个问答对,为系统微调与评估提供了坚实基础。

用于RAG模型微调

图片

论文对检索增强生成模型的嵌入与生成部分分别进行了微调:

1. 嵌入模型微调:利用问答数据中的相关文档对,提升模型的检索准确性。

2. 生成模型微调:通过对包含干扰文档的上下文进行训练,使生成模型能够准确回答问题。

3. 优化策略:在训练集中加入“无答案”情况的例子,以减少模型生成错误答案的可能性。

微调后的模型在上下文检索准确性和答案生成质量上均超过了开源基线模型和OpenAI的专有模型。

研究评估

论文使用多个指标评估了RAG系统的性能,包括:

图片

1. 上下文检索回忆率:微调后的嵌入模型在检索相关文档时准确率高达92.18%。

2. 回答生成质量:通过评估模型回答的正确性,证明微调后的生成模型在答案准确性上提升了26个百分点。

3. 综合性能比较:微调后的开源模型在回答准确性上甚至超越了OpenAI的GPT-4o。

论文结论

论文开发了一套完整的网络安全问答系统,从数据集生成到模型微调和性能评估,均展示出开源模型的巨大潜力。AttackQA数据集为领域内的进一步研究提供了重要基础,而优化后的RAG模型则显著提升了SOC分析员处理网络威胁的效率。这一工作证明,经过微调的开源LLMs能够在特定领域中挑战甚至超越专有技术,为开源社区和网络安全领域的发展注入新活力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2258413.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android 车载虚拟化底层技术-Kernel 5.10 -Android12(multi-cards)技术实现

详细代码实现见 Android Display Graphics系列文章-汇总​​​​​​Android Display Graphics系列文章-汇总 Android Display Graphics系列文章-汇总 Android Display Graphics系列文章-汇总 本文主要包括部分: 一、Android12的Kernel 5.10版本 1.1 Kernel 5…

lqb_算法

1.蓝桥杯2024年第十五届决赛真题- 蚂蚁开会 题目描述 二维平面上有 n 只蚂蚁,每只蚂蚁有一条线段作为活动范围,第 i 只蚂蚁的活动范围的两个端点为 (uix, uiy),(vix, viy)。现在蚂蚁们考虑在这些线段的交点处设置会议中心。为了尽可能节省经费&#xf…

【银河麒麟高级服务器操作系统】修改容器中journal服务日志存储位置无效—分析及解决方案

了解更多银河麒麟操作系统全新产品,请点击访问 麒麟软件产品专区:https://product.kylinos.cn 开发者专区:https://developer.kylinos.cn 文档中心:https://documentkylinos.cn 服务器环境以及配置 【机型】 整机类型/架构&am…

springboot422甘肃旅游服务平台代码-(论文+源码)_kaic

摘 要 使用旧方法对甘肃旅游服务平台的信息进行系统化管理已经不再让人们信赖了,把现在的网络信息技术运用在甘肃旅游服务平台的管理上面可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及时纠正等问题。这次开发的…

决策曲线分析(DCA)中平均净阈值用于评价模型算法(R自定义函数)

决策曲线分析(DCA)中平均净阈值用于评价模型算法 DCA分析虽然不强调用来评价模型算法或者变量组合的优劣,但是实际应用过程中感觉DCA曲线的走势和模型的效能具有良好的一致性,其实这种一致性也可以找到内在的联系,比如…

短信验证码burp姿势

首先声明,本文仅仅作为学习使用,因个人原因导致的后果,皆有个人承担,本人没有任何责任。 在之前的burp学习中,我们学习了图片验证码的突破,但是现实中还有很多短信验证码,在此我介绍几种短信验…

机器学习:全面学习路径指南

摘要: 本文精心规划了一条从入门到精通机器学习的学习路线,详细涵盖了基础理论构建、核心技术栈掌握、主流算法学习、实践项目锻炼以及前沿领域探索等多个关键阶段。通过逐步深入各个层面,介绍必备的数学知识、编程工具、经典与现代机器学习算…

聚类及Python下实现 K-means 算法

聚类 聚类是无监督学习中的一种重要方法,旨在将数据集中相似的数据对象划分到同一个簇中,使得不同簇之间的数据对象差异尽可能大。在大数据环境下,聚类可以帮助挖掘数据中的隐藏结构和模式,应用场景十分广泛,比如在客…

【Qt在线安装器】不能下载Qt5

qt在线下载不显示以前的版本时: 勾选”Archive“,点击”筛选“ 然后就会显示出QT5的版本, 按流程下载即可

html|本地实现浏览器m3u8播放器,告别网络视频卡顿

前言 网络上经常是以m3u8文件传输视频流的 ,但是有时网络慢往往导致视频播放卡顿。于是我在想能不能先下载然后再播放呢?于是尝试下载然后实现本地播放m3u8视频。 正文 1.找到网络视频流的m3u8连接 一般在浏览器按F12就可以看到有请求视频流的连接。 …

[leetcode100] 101. 对称二叉树

https://leetcode.cn/problems/symmetric-tree/description/?envTypestudy-plan-v2&envIdtop-100-liked 心血来潮,突然感觉很久没做leetcode,刷一题。 看到“简单”,哦吼,应该很快吧。 结果真是《简单》 题目描述 给你一个…

技术速递|dotnet scaffold – .NET 的下一代内容创建

作者:Sayed Ibrahim Hashimi - 首席项目经理 排版:Alan Wang Visual Studio 中为 ASP.NET Core 项目搭建脚手架是一项长期特性,是在 ASP.NET Core 发布后不久添加的。多年来,我们一直支持从命令行搭建脚手架。根据从命令行操作中获…

经纬度解析到省市区【开源】

现在业务中有需要解析经纬度到省市区。 按理说可以直接使用高德,百度之类的。 但是老板太抠。于是去找开源项目。找了一圈,数据都太老了,而且有时候编码还不匹配。 所以诞生了这个项目,提供完整的一套省市区编码和定位反解析。…

打开分页机制

分页机制的表 一般线性地址和物理地址大小不会一样,物理内存空间不够时候,涉及和外部磁盘的swap过程,但是这个系统不涉及 CR3放的是页表的起始地址 代码部分 PDE:4MB page 一级页表的页块大小为4MB 然后是这个二级页表 PTE:4KB page 关于什…

EasyPlayer.js播放器如何在iOS上实现低延时直播?

随着流媒体技术的迅速发展,H5流媒体播放器已成为现代网络视频播放的重要工具。其中,EasyPlayer.js播放器作为一款功能强大的H5播放器,凭借其全面的协议支持、多种解码方式以及跨平台兼容性,赢得了广泛的关注和应用。 那么要在iOS上…

多模态大语言模型 MLLM 部署微调实践

1 MLLM 1.1 什么是 MLLM 多模态大语言模型(MultimodalLargeLanguageModel)是指能够处理和融合多种不同类型数据(如文本、图像、音频、视频等)的大型人工智能模型。这些模型通常基于深度学习技术,能够理解和生成多种模…

uniapp uni-table最简单固定表头

需求:固定表头数据,在网上找了半天,啥都有,就是一直实现不了,最后更改代码实现 1.效果 2.主要代码讲解完整代码 表格的父级一定要设置高度,不然会错位,我看网上说设置position:fixed…

在C#中编程绘制和移动线段

这个示例允许用户绘制和移动线段。它允许您根据鼠标下方的内容执行三种不同的操作。 当鼠标位于某个线段上时,光标会变成手的形状。然后您可以单击并拖动来移动该线段。当鼠标位于线段的终点上时,光标会变成箭头。然后您可以单击并拖动以移动终点。当鼠…

Hyperbolic Representation Learning: Revisiting and Advancing 论文阅读

Hyperbolic Representation Learning: Revisiting and Advancing 论文地址和代码地址1 介绍2 背景知识2.1 黎曼几何与双曲空间(RiemannianGeometry and Hyperbolic Space)2.2 双曲浅层模型2.3 双曲神经网络(HNNs)2.4 双曲图卷积神经网络(HGCN…

Ansible自动化运维(三)playbook剧本详解

Ansible自动化运维这部分我将会分为五个部分来为大家讲解 (一)介绍、无密钥登录、安装部署、设置主机清单 (二)Ansible 中的 ad-hoc 模式 模块详解(15)个 (三)Playbook 模式详解 …