【论文速读】| MoRSE:利用检索增强生成技术填补网络安全专业知识的空白

news2025/1/15 16:56:32

图片

本次分享论文:MoRSE: Bridging the Gap in Cybersecurity Expertise with Retrieval Augmented Generation

基本信息

原文作者:Marco Simoni, Andrea Saracino, Vinod Puthuvath, Maurco Conti

作者单位:意大利比萨国家研究委员会信息学与电信研究所,圣安娜高等大学TeCIP研究所,意大利帕多瓦大学和荷兰代尔夫特理工大学

关键词:MoRSE, 网络安全, 检索增强生成, 人工智能聊天机器人

原文链接:https://arxiv.org/pdf/2407.15748

开源代码:

https://github.com/Mixture-of-RAGs-Security-Experts/MoRSE

论文要点

论文简介:本文介绍了MoRSE(Mixture of RAGs Security Experts),这是首个专为网络安全设计的AI聊天机器人。MoRSE利用两个并行工作的RAG(检索增强生成)系统,从多维网络安全背景中检索并组织信息。

与依赖固定知识库的传统大语言模型不同,MoRSE实时从非固定知识库中检索文档并生成准确的答案,同时不断更新其知识库。评估结果显示,MoRSE在600个网络安全问题上的回答相关性和正确性比GPT-4和Mixtral 7x8等现有模型高出10%以上,显著提升了网络安全领域的知识覆盖和回答准确性。

研究贡献:

本文的主要贡献可以总结如下:

1. 研究者引入了 MoRSE 这一开源框架,它是首个尝试集成两个 RAG 系统以处理多维网络安全上下文的架构。该架构达成了不同数据源的独特综合,提升了安全见解的深度与相关性。

2. 研究者引入了一个由三部分组成的评估测试套件,用于衡量 RAG 系统与 LLM 相结合在相关性、相似性和正确性方面的表现。此外,研究者还基于LLM作为评判者的方法,使用另外两个测试套件进一步验证了这些结果。据研究者所知,这是首次作出这样的贡献。

3. 研究者展示了 MoRSE 是如何凭借其独特的实时网络安全关键字检测能力,将响应的正确性提高 10%,从而满足及时且准确的安全分析这一关键需求。

4. MoRSE 有别于传统的 RAG,其通过运用并行检索器来检索不同格式和结构的语义相关信息。这在网络安全领域极为重要,因为针对特定威胁,通常存在不同的数据类型(例如漏洞利用代码、TTP 描述、CVE 和白皮书),然而这些数据极少相互关联。MoRSE 借助这些并行检索器和 LLM 来整合相关信息,并提供全面的查询答案。

引言

随着网络威胁的频率和复杂性不断增加,网络安全已成为各行业的关键优先事项。尽管近年来与网络安全相关的信息量激增,为应对这些威胁提供了重要资源,但这种信息的快速增长也导致了数据的杂乱和无结构化,使专业人员难以获得可操作的见解。

大语言模型(LLM)虽然在合成大量信息方面取得了显著进展,但在处理技术话题时存在可靠性问题,尤其是在面对快速演变的网络威胁时。LLM生成错误或不可靠回答的情况并不少见,特别是在代码生成任务中。为了应对这些挑战,MoRSE通过集成两个RAG系统,实现了实时更新知识库的能力,提供了更加准确和全面的网络安全解决方案。

研究背景

MoRSE的开发是为了应对现有大语言模型在网络安全领域的不足。随着网络威胁的不断增加和复杂化,及时、准确和全面地理解漏洞、利用和防御策略变得至关重要。虽然LLM在合成大量信息方面取得了重大进展,但其在处理技术话题时的可靠性差异较大,尤其是在网络威胁快速演变的情况下。MoRSE通过引入检索增强生成技术,将传统RAG系统与实时更新的知识库相结合,有效解决了这一问题。

相关工作

现有研究在网络安全领域中探索了大语言模型(LLMs)和检索增强生成(RAG)系统的应用。传统LLMs如GPT-4在处理技术话题时存在可靠性问题,尤其在动态网络威胁环境中表现不佳。

为解决这些问题,研究者们开发了各种增强模型,如GEMINI、MIXTRAL和HACKERGPT,这些模型在特定任务中显示出一定优势。然而,这些模型仍然面临知识库更新不及时、信息检索效率低等挑战。

MoRSE通过集成双RAG系统和实时更新机制,实现了知识的动态扩展和多维数据的综合检索,显著提升了答案的准确性和覆盖范围,为网络安全问答提供了更为全面和可靠的解决方案。

MORSE架构

MoRSE架构由两个主要组件组成:结构化RAG非结构化RAG。结构化RAG从预处理的结构化数据中快速检索信息,如MITRE、CVE库、Metasploit和ExploitDB等。这个模块通过将文本转换为结构化格式,使检索过程更加高效和准确。非结构化RAG用于处理结构化RAG无法解决的查询,主要从未处理的原始文本中检索信息。它包含多个缓冲区,每个缓冲区专门处理不同类型的数据(如文本、代码、学术论文等)。

当用户提交查询时,系统首先通过结构化RAG进行检索,如果未找到相关信息,则调用非结构化RAG。MoRSE还集成了实时更新机制,允许知识库在无需重新训练的情况下动态扩展。

此外,MoRSE的并行检索器能够同步检索多种格式和结构的信息,确保提供全面且准确的答案。这种双重RAG架构使MoRSE能够有效应对复杂的网络安全查询,显著提升回答的准确性和覆盖范围。

图片

实验与评估

研究者通过600个网络安全特定问题对MoRSE的性能进行了全面评估,并与现有的先进大语言模型(如GPT-4、GEMINI、MIXTRAL和HACKERGPT)进行了比较。这些问题包括150个普通网络安全问题、150个多跳问题和300个CVE问题。

评估结果显示,MoRSE在答案的相关性和正确性方面表现优异,普通问题的相关性和正确性提高了15%以上,多跳问题和CVE问题的正确性提高了10%以上。特别是在处理CVE问题时,MoRSE的回答准确性比GPT-4高出50%。

此外,通过基于LLM的裁判方法,MoRSE在对手模型中的Elo评分也显著领先。这些结果验证了MoRSE在网络安全领域提供高质量回答的能力,表明其在应对复杂和多变的网络安全挑战方面具有显著优势。

图片

论文结论

本文介绍了MoRSE,这是一个创新的网络安全问答框架,通过集成两个RAG系统,MoRSE能够从多维数据源中检索并生成高质量的答案。实验结果表明,MoRSE在处理普通网络安全问题、多跳问题和CVE问题时,表现均优于现有的先进模型,如GPT-4和MIXTRAL,尤其在准确性和相关性方面提升显著。

MoRSE的实时更新机制和并行检索能力确保其在动态变化的网络安全环境中保持领先地位。这一研究展示了RAG系统在提升网络安全问答质量和覆盖范围方面的巨大潜力。

原作者:论文解读智能体

校对:小椰风

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1963778.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024 年最新 windows 操作系统搭建部署 nginx 服务器应用详细教程(更新中)

nginx 服务器概述 Nginx 是一款高性能的 HTTP 和 反向代理 服务器,同时是一个 IMAP / POP3 / SMTP 代理服务器。Nginx 凭借其高性能、稳定性、丰富的功能集、简单的配置和低资源消耗而闻名。 浏览 nginx 官网:https://nginx.org/ Nginx 应用场景 静态…

最新保姆级教程使用WildCard开通Claude3升级ChatGPT4.0(2024.8)

如何使用 WildCard 服务注册 Claude3 随着 Claude3 的震撼发布,最强 AI 模型的桂冠已不再由 GPT-4 独揽。Claude3 推出了三个备受瞩目的模型:Claude 3 Haiku、Claude 3 Sonnet 以及 Claude 3 Opus,每个模型都展现了卓越的性能与特色。其中&a…

【rockyLinux·9.4】安装 java jdk

一、安装 java 1.选择版本 yum list | grep jdk各个版本之间的区别: 2.选择了:java-17-openjdk-devel.x86_64(开发者版本),开始安装 建议安装在 /usr/local 这个目录下,可以创建一个 app 目录来收录它…

如何高情商处世:小李的职场智慧

如何高情商处世:小李的职场智慧 在职场这片大海中,我们都是游泳者,有的人轻松自如,而有的人却挣扎不已。今天,我要和大家分享一个关于如何用高情商处世的故事,它来自于我的侄子小李。 初出茅庐的小李 小…

SAP BW系统表分享第一弹

有时候想要查看BW系统中存在了多少的表时,包含SAP以及自建表,这个时候我们怎么去找呢? 不要慌,BW系统中也有其对应系统表来存储表对应的信息的,存储所有表信息的是DD02V或者DD02VV,我比较推荐使用DD02VV&a…

CSS实现图片边框酷炫效果

一、前言 我们在浏览一些网页时,经常会看到一些好看酷炫的元素边框效果(如下图),那么这些效果是怎么实现的呢?我们知道,一般的边框,要么是实线,要么是虚线(点状&#xf…

python随机选取数据算法

python随机选取数据算法: 使用sample方法 pandas的sample方法是最常用的方法来随机选取DataFrame中的数据。可以通过设置frac参数来指定选取的比例。 代码: import pandas as pd# 创建一个示例DataFrame data {A: range(1, 101),B: range(101, 201) }…

大厂linux面试题攻略四之Linux网络服务(一)

一、Linux网络服务-SSH服务 1.哪些设置能够提升SSH远程管理的安全等级? ssh的登录验证方式 ssh的登录端口和监听设置: 配置文件: /etc/ssh/sshd_config #Port 22 #ssh服务默认监听端口 #ListenAddress 0.0.0.0 #ssh服务…

配置静态IP,解决在虚拟机装Linux没有网络的问题

配置静态IP,解决在虚拟机装Linux没有网络的问题 问题 VMware中的虚拟机有时会随着外部宿主机的IP变化而变化,导致使用起来很麻烦。最直接的就是XShell连接不上,其次就是项目中的配置文件中写了关于虚拟机的ip地址,比如redis mys…

编程小白如何成为大神?大学新生的最佳入门攻略

📢博客主页:https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 JohnKi 原创,首发于 CSDN🙉 📢未来很长&#…

【视频讲解】Python用LSTM、Wavenet神经网络、LightGBM预测股价

原文链接:https://tecdat.cn/?p37184 原文出处:拓端数据部落公众号 分析师:Yuyan Ye 在金融科技的浪潮中,量化投资方法以其数据驱动和模型导向的特性,日益成为资本市场分析的重要工具。 特别是,长短期…

2024最全的软件测试面试八股文【附答案+文档】

🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 前言 最近有很多粉丝问我,有什么方法能够快速提升自己,通过阿里、腾讯、字节跳动、京东等互联网大厂的面试,我觉得短时间提升…

美容院会员管理系统|美业收银系统源码-已注册的客户,如何异店添加?

情景举例说明: 客户“张三”在A店已注册、消费,然后又到B店去消费。如何通过APP端和PAD端添加客户? ▶▶▶ • 在“客户管理”或“收银台”添加客户区域 • 搜索客户注册手机的完整手机号找到该客户 • 将其添加到本店即可

JavaScript 和 HTML5 Canvas实现图像绘制与处理

前言 JavaScript 和 HTML5 的 canvas 元素提供了强大的图形和图像处理功能,使得开发者能够在网页上创建动态和交互式的视觉体验。这里我们将探讨如何使用 canvas 和 JavaScript 来处理图像加载,并在其上进行图像绘制。我们将实现一个简单的示例&#xf…

揭秘住宅IP代理:原理、用途以及应用分析

在大数据时代,互联网成为我们生活与工作中不可或缺的一部分。然而,随着网络环境的日益复杂,隐私保护、网络访问限制等问题也逐渐凸显;以及跨境业务蓬勃发展。在这样的背景下,住宅IP代理作为一种技术解决方案&#xff0…

6、指针

6 指针 6.1 指针的本质(间接访问的原理) 指针:变量的地址 指针变量:用一个变量来存放另一个变量的地址,该变量即为指针变量 指针变量占内存大小,32位程序占4字节,64位占8字节 取地址操作符、取…

数据结构_study(三)

栈 先进后出,LIFO(last in first out),只能在表尾做插入删除操作的线性表 栈顶:允许插入和删除的一端 栈底:最先进栈 空栈:没有数据元素 压栈、入栈:插入操作 弹栈、出栈&#xf…

ubuntu20复现NBV探索

官网代码 后退地平线下一个最佳景观规划师 这个代码有些久远,issue里面有人已经在ubuntu20里面使用了3dmr,但是他那个代码我也运行不成功,docker网络一直也不佳,所以还是自己重新修改源码靠谱。 最终实现的代码等有时间上传到gi…

Day26 | 贪心算法 134. 加油站 135. 分发糖果 860.柠檬水找零 406.根据身高重建队列

语言 Java 134. 加油站 题目链接:加油站 题目 在一条环路上有 n 个加油站,其中第 i 个加油站有汽油 gas[i] 升。 你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i1 个加油站需要消耗汽油 cost[i] 升。你从其中的一个加油站出发…

【每日一题】【map和set】RC-v7 熊猫血 C++

2024 睿抗机器人开发者大赛CAIP-编程技能赛-高职组(省赛) RC-v7 熊猫血 题目描述 在“一年一度喜剧大赛”上有一部作品《少爷和我》,讲的是霸道管家龙傲天和憨厚少爷刘波的故事。管家有着霸总文学主人公所有的毛病,包括会咳出熊…