第64期 | GPTSecurity周报

news2024/11/26 0:48:12

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. CodeMirage: 由大语言模型生成的代码幻觉

简介:大语言模型(LLMs)在程序生成和自动化编码领域展现出巨大潜力,但同时也存在生成错误代码的风险。这些错误可能包括语法、逻辑错误,甚至安全漏洞和内存泄漏。鉴于LLMs在提升编码效率方面的广泛应用,深入研究其在代码生成中的错误显得尤为重要。本研究首次系统性地探讨了LLMs生成的代码幻觉问题,定义了代码幻觉,并分类了其类型。研究者创建了首个基准数据集CodeMirage,包含1137个由GPT-3.5生成的Python代码片段。通过对比开源模型CodeLLaMA、GPT-3.5和GPT-4的检测方法,发现GPT-4在HumanEval数据集上表现优异,与CodeBERT在MBPP数据集上的结果相当。最后,研究者讨论了减少代码幻觉的策略,为未来研究提供了方向。

链接:

https://arxiv.org/abs/2408.08333

2. Transformers 和大语言模型在高效入侵检测系统中的应用:一项全面调查

简介:随着 Transformers 和大语言模型(LLMs)在自然语言处理(NLP)领域迅速发展,它们在网络安全领域的应用不断增加。网络安全中的众多关键参数以文本和表格形式呈现,使得 NLP 技术成为强化通信安全的重要工具。本综述论文深入剖析了 Transformers 和 LLMs 在网络威胁检测系统中的应用,构建了评估现有研究的严格框架。论文论述了 Transformers 的基础知识,涵盖网络攻击背景及常用数据集。着重分析了基于注意力的模型、BERT、GPT 等 LLMs,还有 CNN/LSTM-Transformer 混合体、ViTs 等不同架构在入侵检测系统中的运用。同时,探讨了这些技术在计算机网络、物联网、关键基础设施、云计算、SDN 和自动驾驶车辆等领域的实施状况。文章还指明了研究面临的挑战,例如可解释性、可扩展性和适应性,并提出了未来的研究方向,强调了 Transformers 和 LLMs 在提升网络威胁检测能力方面的关键作用。

链接:

https://arxiv.org/abs/2408.07583

3. 评估基于大语言模型的个人信息提取及其对策

简介:研究者进行了一项有关基于大语言模型(LLM)的个人信息提取及对策的系统测量研究。传统方法在从公开个人资料中提取个人信息(如姓名、电话、邮箱等)方面成效有限。研究者为此提出基于 LLM 的提取攻击框架,收集了三个数据集(含 GPT-4 生成的合成数据集和两个真实世界数据集),引入基于“提示注入”的新缓解策略,并使用 10 个 LLM 和 3 个数据集进行基准测试。关键发现有:攻击者可能滥用 LLM 准确提取个人信息,LLM 在此方面优于传统方法,提示注入能很大程度减轻风险且优于传统对策。

链接:

https://arxiv.org/abs/2408.07291

4. 使用高级大语言模型增强较小大语言模型:一种可解释的知识蒸馏方法

简介:研究者指出,像 GPT-4 或 LlaMa 3 这类先进大语言模型在复杂的类人交互中性能优越。但它们成本高、规模大,不适合边缘设备且自行托管难度大,存在安全与隐私问题。为此,研究者引入一种新颖的可解释知识蒸馏方法,以提升公司可自行托管的更小型、更经济的语言模型的性能。他们在构建以目标导向对话实现高客户满意度的客户服务代理情境中进行研究。与传统知识蒸馏不同,此可解释的“策略”教学法让教师提供策略以改善学生在各种场景中的表现,方法在“场景生成”和“改进策略”步骤间交替,仅需黑箱访问模型,无需操作参数。在客户服务应用中,该方法提升了性能,所学策略可转移,其可解释性还能通过人工审核防范潜在危害。

链接:

https://arxiv.org/abs/2408.07238

5. 用于安全代码评估的大语言模型:一项多语言实证研究

简介:研究者指出,多数漏洞检测研究聚焦于 C/C++ 代码的漏洞数据集,语言多样性受限,包括大语言模型在内的深度学习方法在检测其他语言软件漏洞的有效性仍待探索。为此,研究者使用不同提示和角色策略,针对六种先进预训练的 LLM(如 GPT-3.5-Turbo 等)及五种编程语言(Python、C、C++、Java、JavaScript),评估其在检测和分类常见弱点枚举方面的效果。他们从不同来源编译多语言漏洞数据集以确保代表性,结果显示 GPT-4o 在少样本设置下,漏洞检测和分类得分最高。此外,研究者还开发了与 VSCode 集成的 CODEGUARDIAN 库,通过涉及 22 名行业开发人员的用户研究评估发现,使用该库能让开发人员更准确快速地检测漏洞。

链接:

https://arxiv.org/abs/2408.06428

6. 基于RAG的网络攻击调查和归因问题的问答解决方案

简介:研究者在这项工作中,首次引入了基于检索增强生成(RAG)技术和大语言模型(LLM)的问答(QA)模型,旨在为网络安全专家提供有关网络攻击调查和归因的信息。该 QA 模型依据包含网络攻击调查和归因精选信息的知识库(KB),或者用户提供的外部资源来提供答案。研究者用各类问题对 QA 模型进行了测试和评估,包括基于 KB 的、基于元数据的、来自 KB 的具体文档以及基于外部资源的问题。他们还将基于 KB 问题的答案与 OpenAI 的 GPT-3.5 和最新的 GPT-4o LLMs 的答案作比较。研究者提出的 QA 模型因能提供答案来源并克服 GPT 模型的幻觉限制,优于 OpenAI 的 GPT 模型,这在网络攻击的调查和归因中至关重要。此外,分析表明,RAG QA 模型给出少量样本示例时生成的答案比零样本指令更好。

链接:

https://arxiv.org/abs/2408.06272

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2061215.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

免费图形化nginx管理工具nginxWebUI

nginxWebUI是一款图形化管理nginx配置得工具, 可以使用网页来快速配置nginx的各项功能, 包括http协议转发, tcp协议转发, 反向代理, 负载均衡, 静态html服务器, ssl证书自动申请、续签、配置等, 配置好后可一建生成nginx.conf文件, 同时可控制nginx使用此文件进行启动与重载, 完…

Linux基础软件-软件安装

作者介绍:简历上没有一个精通的运维工程师。希望大家多多关注作者,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 Linux进阶部分又分了很多小的部分,我们刚讲完了Linux日常运维。讲的那些东西都算是系统自带的,但是Linux作为一个…

mklink 命令详解

mklink 命令详解 在命令提示符中输入 mklink 可以查看相关的运行命令。 创建符号链接。MKLINK [[/D] | [/H] | [/J]] Link Target/D 创建目录符号链接。默认为文件符号链接。/H 创建硬链接而非符号链接。/J 创建目录联接。Link 指定新的符号链接名称。Targ…

前端3d动画-----平移 transform: translate3d()

必须加这个属性&#xff1a;transform-style: preserve-3d; perspective: 900px; 设置了景深才能感到近大远小的感觉 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible&q…

CTF中的换表类Crypto题目

目录 [安洵杯 2019]JustBase[SWPUCTF 2021 新生赛]traditional字符替换解密 [BJDCTF 2020]base??字符替换 --》 base64解密 [安洵杯 2019]JustBase VGhlIGdlbxvZ#kgbYgdGhlIEVhcnRoJ#Mgc#VyZmFjZSBpcyBkb!pbmF)ZWQgYnkgdGhlIHBhcnRpY#VsYXIgcHJvcGVydGllcyBvZiB#YXRlci$gUHJ…

图神经网络教程3——循环图神经网络-2

目录 计算下游输出 序列图数据的扩展 图长短期记忆网络 循环转换在RGNN应用于图分类时的作用 数据集 算法 结果和讨论 门控循环单元 优缺点 前文索引 本篇是GRNN的第二篇文章&#xff0c;点击此处可到达第一篇文章的位置。 计算下游输出 一旦我们以图中的每个顶点为…

webm格式怎么转换成mp4?7个有效方法将webm转mp4

在数字媒体的浩瀚宇宙中&#xff0c;视频格式的多样性犹如繁星点点&#xff0c;既点亮了创意的火花&#xff0c;也铺设了内容分享的广阔道路。每一种视频格式都承载着其独特的技术优势与设计初衷&#xff0c;WebM便是其中一颗璀璨的新星&#xff0c;专为优化网络传输而生。它凭…

Unity | Shader基础知识(第二十二集:两次渲染)

目录 一、前言 二、“渲染两次” 三、本次成品介绍 四、第一次渲染代码 五、第二次渲染代码 六、截止目前的所有代码 七、调整代码 八、总结 一、前言 之前一直讲的shader文件中&#xff0c;都只写了一次CG代码。 为了大家对这部分的整体理解&#xff0c;我们这次渲…

微服务的保护

一、雪崩问题及解决方案 1.雪崩问题 微服务之间&#xff0c;一个微服务依赖多个其他的微服务。当一个微服务A依赖的一个微服务B出错时&#xff0c;微服务A会被阻塞&#xff0c;但其他不依赖于B的微服务不会受影响。 当有多个微服务依赖于B时&#xff0c;服务器支持的线程和并…

使用策略模式代替多个ifelse

传统的多个 public class OrderServiceImpl implements IOrderService {Overridepublic String handle(OrderDTO dto) {String type dto.getType();if ("1".equals(type)) {return "处理普通订单";} else if ("2".equals(type)) {return "…

PMP–知识卡片--产品管理知识体系

产品管理是公司为管理一个产品或者产品线的产品计划、产品市场和产品生命周期所采用的组织架构。产品管理是一个典型的强矩阵的管理方式。产品管理是企业或组织在产品生命周期中对产品规划、开发、生产、营销、销售和支持等环节进行管理的业务活动。 项目经理和产品有着直接、间…

xmind 2024下载,安装目录更改为其他盘

下载 最新版官网地址 更改目录

网络编程Day9_IO多路复用 20240821

运行1个服务器和2个客户端实现效果&#xff1a; 服务器和2个客户端互相聊天&#xff0c;服务器和客户端都需要使用select模型去实现 服务器要监视2个客户端是否连接&#xff0c;2个客户端是否发来消息以及服务器自己的标准输入流 客户端要监视服务器是否发来消息以及客户端自…

Go小技巧易错点100例(十七)

Go定时任务 在Go语言中&#xff0c;定时任务&#xff08;也称为定时器或cron作业&#xff09;具有多种作用&#xff0c;这些作用在应用程序的开发和运维中非常有用。以下是一些常见使用场景&#xff1a; 任务调度&#xff1a;定时任务可以在特定的时间点执行特定的任务&#…

云渲染服务大揭秘:为何它值得成为你的渲染新选择

云渲染是一种基于云计算的服务&#xff0c;它利用大量高性能计算机组成的集群来渲染高质量的图像和动画。这种服务能够显著加快3D动画或视觉效果项目的渲染速度&#xff0c;将原本可能需要数天的渲染任务缩短至数小时。 云渲染的优势 本文将探讨使用云渲染的好处&#xff0c;并…

【ACM出版,高录用EI快检索】第七届计算机信息科学与人工智能国际学术会议(CISAI 2024,9月6-8)

第七届计算机信息科学与人工智能国际学术会议(CISAI 2024) 将于2024年09月6-8日在中国浙江-绍兴举行。 计算机信息科学与人工智能国际学术会议的主题主要围绕“信息科学”与“人工智能”的最新研究展开&#xff0c;旨在荟聚世界各地该领域的专家、学者、研究人员及相关从业人员…

React学习笔记,从入门到砸门

项目构建命令 npx create-react-app react-basic npx&#xff1a;node语法 create-react-app&#xff1a;项目模板 react-basic&#xff1a;项目名称 项目结构 项目打包和本地预览 项目打包npm run build本地预览&#xff08;模拟服务器运行项目&#xff09; 安装本地服务包…

STM32f407 网络接收 fpga 的 bin 文件并更新到 fpga series7(3)

STM32f407 网络接收 fpga 的 bin 文件并更新到 fpga series7(3) 简介 实验 3&#xff1a;在搭建好 tcp 服务器&#xff0c;并拟定好协议的前提下&#xff0c;接收每一个 bin 文件的块&#xff0c;配置到 fpga。 原理图 fpga fpga1 stm32 接线总结 // fpga引脚 stm32…

快速了解矿用电源特性及其性能测试利器电源ate检测系统

在矿产资源开采的每一个环节&#xff0c;矿用电源都扮演着幕后英雄的角色&#xff0c;它的作用不可小觑。那么什么是矿用电源呢&#xff1f;电源ate检测系统如何助力矿用电源性能测试呢&#xff1f; 矿用电源模块介绍 矿用电源是专门用于矿井等地下作业场所的重要电源设备&…

阿里MAXCOMPUTE数据专辑信息读取并同步数据表

阿里MAXCOMPUTE数据专辑信息读取并同步数据表 在阿里云大数据体系中&#xff0c;我们可以使用数据地图的数据专辑&#xff0c;对数据的类别等进行一个管理 那么管理后的数据&#xff0c;我们想要落表进行相关的数据分析&#xff0c;如何做呢&#xff1f; 查看阿里云官方文档…