第69期 | GPTSecurity周报

news2024/10/10 8:53:51

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. AutoSafeCoder:通过静态分析和模糊测试保障LLM代码生成安全的多智能体框架

简介:最近,大语言模型(LLM)的自动代码生成技术取得了重大进展,推动着我们向完全自动化安全软件开发的目标迈进了一步。然而,现有的方法多依赖单一智能体进行代码生成,这种方式难以生成安全且无漏洞的代码。传统基于 LLM 的程序合成主要关注功能正确性,常常忽视运行时的动态安全隐患。为解决这些问题,研究者提出了 AutoSafeCoder——一个多智能体框架,该框架利用 LLM 驱动的智能体进行代码生成、漏洞分析以及通过持续协作进行安全增强。此框架由三个智能体组成,分别是负责代码生成的编码智能体、识别漏洞的静态分析智能体以及使用基于变异的模糊测试方法进行动态测试以检测运行时错误的模糊测试智能体。研究者的贡献在于通过在代码生成过程中整合动态和静态测试,以迭代的方式提高 LLM 生成代码的安全性。基于 SecurityEval 数据集的实验结果表明,与基准 LLM 相比,代码漏洞减少了 13%,且未对功能性造成影响。

链接:

https://arxiv.org/abs/2409.10737

2. PROMPTFUZZ:利用模糊测试技术对大语言模型中的提示注入进行鲁棒性测试

简介:大语言模型(LLMs)虽在各种应用中广泛使用,但其安全性和可靠性因提示注入攻击而引发担忧。提示注入攻击可通过恶意提示覆盖模型原始指令操纵生成文本,确保 LLM 抵御此类攻击的鲁棒性对其在现实世界尤其是关键任务中的部署至关重要。

研究者提出新颖测试框架 PROMPTFUZZ,利用模糊测试技术系统性评估 LLM 抵御提示注入攻击的鲁棒性。该框架受软件模糊测试启发,分为准备和重点两个阶段。准备阶段选择有潜力的初始种子并收集少量示例;重点阶段利用收集的示例生成多样化高质量提示注入,能发现更多 LLM 漏洞。在实际竞赛中,部署 PROMPTFUZZ 生成的攻击提示后,在 4000 多名参与者中获得第七名,仅用时 2 小时。此外,研究者还构建数据集用于微调 LLM 以增强其抗攻击鲁棒性,即便微调后,PROMPTFUZZ 仍能发现漏洞。

总之,研究者的工作突出了有效测试工具的关键需求,提供了实用框架用于评估和提高 LLM 抵御提示注入攻击的鲁棒性,强调了对 LLM 进行鲁棒性测试的重要性。

链接:

https://arxiv.org/abs/2409.14729

3. 针对大语言模型的有效且具有规避性的模糊测试驱动越狱攻击

简介:近年来,研究者发现大语言模型(LLMs)虽然在多项任务中表现出色,但仍然容易遭受越狱攻击,攻击者通过提示设计误导模型生成有害内容。现有越狱方法依赖手动设计模板,扩展性差,或生成语义不连贯的提示,容易被检测到。为解决这些问题,研究者提出了一种自动化黑盒越狱攻击框架,通过结合黑盒模糊测试与定制化设计,克服了传统方法的局限性。

该框架无需手动设计模板,从空种子池开始,依靠三个新型问题相关变异策略生成语义连贯且简短的提示。同时,研究者设计了两级评判模块,精确识别成功的越狱攻击。在对7个主流LLMs的评估中,该方法在GPT-3.5 Turbo、GPT-4和Gemini-Pro上的攻击成功率分别超过90%、80%和74%,相比现有基线提升了60%以上。此外,提示长度大幅缩短,语义连贯性得到保持,且对最先进的防御措施具有较强鲁棒性。

链接:

https://arxiv.org/abs/2409.14866

4. 攻击图谱:从实践者的角度看生成式人工智能红队测试中的挑战与陷阱

简介:随着生成式人工智能,特别是大语言模型(LLMs)逐渐融入生产应用,新的攻击面和漏洞不断出现,进一步增强了对自然语言和多模态系统中对抗性威胁的关注。在这一背景下,红队测试在主动识别系统弱点方面变得尤为重要,而蓝队则专注于抵御这些对抗性攻击。尽管学术界对生成式人工智能的对抗风险日益重视,但针对实践者在实际环境中评估和缓解这些挑战的指导仍显不足。

为此,研究者提出了以下贡献:(1) 对保护生成式人工智能的红队和蓝队策略进行了实用性检验;(2) 识别了防御开发和评估过程中面临的关键挑战及未解问题;(3) 提出了“攻击图谱”,这是一个直观的框架,为分析单轮输入攻击提供了实用的方法,使其成为实践者的重要参考工具。此项研究旨在弥合学术见解与生成式人工智能系统保护的实际安全措施之间的差距,以增强对抗性威胁的应对能力。

链接:

https://arxiv.org/abs/2409.15398

5. LSAST — 通过LLM支持的静态应用安全测试增强网络安全

简介:在快速发展的网络安全领域,研究者们认识到大语言模型(LLMs)在分析软件代码方面发挥着至关重要的作用,持续提升其性能。本文提出了一种创新的漏洞扫描方法,通过将保守的静态应用安全测试(SAST)扫描器与LLM能力相结合,构建了LSAST(LLM支持的静态应用安全测试)框架。该方法显著增强了LLM在漏洞扫描中的性能,确立了该领域的新标准。

研究者们对LSAST的效率进行了基准测试,并将其结果与最先进的LLM进行了对比分析。同时,本文还讨论了LLM在漏洞扫描过程中存在的固有缺陷,包括对静态训练数据集的依赖,导致最新漏洞的遗漏,以及将代码发送至第三方LLM提供商所引发的隐私问题。为解决这些挑战,研究者们采用了一个开源LLM,以确保用户隐私,并提出了一种新颖的方法来收集相关的漏洞信息,从而为LLM提供最新的知识。这一工作为提升网络安全中的漏洞扫描能力提供了有效的解决方案。

链接:

https://arxiv.org/abs/2409.15735

6. APILOT:通过避开过时API陷阱,导航大语言模型生成安全代码

简介:随着大语言模型(LLMs)的快速发展,研究者们发现其应用领域已扩展至代码辅助等多个方面。然而,LLMs的庞大规模使得训练过程非常耗费资源和时间,频繁的再训练或更新变得不切实际。因此,时效性数据可能会过时,从而在时效性任务中误导LLMs。例如,每天都会在各种程序中发现新的漏洞,如果不更新知识,LLMs可能会不小心生成包含这些新发现漏洞的代码。当前的策略,如提示工程和微调,并未有效解决这一问题。

为了解决这一挑战,研究者提出了名为APILOT的解决方案,该方案维护了一个实时、快速可更新的过时API数据集。此外,APILOT利用增强生成方法,通过该数据集引导LLMs生成安全的、版本感知的代码。研究者们进行了全面评估,以衡量APILOT在减少七种不同最先进LLMs中过时API推荐的有效性。评估结果显示,APILOT平均可以减少89.42%的过时代码推荐,且性能开销有限。值得注意的是,APILOT在增强安全性的同时,还提高了LLMs生成代码的可用性,平均提升了27.54%。这一研究成果突显了APILOT在当代软件开发环境中同时提升代码建议的安全性和实用性的双重能力。

链接:

https://arxiv.org/abs/2409.16526

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2201581.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LeetCode 1928.规定时间内到达终点的最小花费:动态规划

【LetMeFly】1928.规定时间内到达终点的最小花费:动态规划 力扣题目链接:https://leetcode.cn/problems/minimum-cost-to-reach-destination-in-time/ 一个国家有 n 个城市,城市编号为 0 到 n - 1 ,题目保证 所有城市 都由双向道…

Apache DolphinScheduler社区9月进展记录

各位热爱 Apache DolphinScheduler 的小伙伴们,社区 9 月月报更新啦!这里将记录 Apache DolphinScheduler 社区每月的重要更新,欢迎关注! 月度 Merge Star 感谢以下小伙伴上个月为 Apache DolphinScheduler 做的精彩贡献&#x…

数据结构前置知识(上)

1. 初识集合框架 1.1 什么是集合框架 在了解集合框架之前,我们先来认识一下数据结构,所谓数据结构就是描述和组织数据的一个东西. 那什么是集合框架呢?在java里面集合框架(Java Collection Framework),又被称为容器container,说白了就是很多个接口,抽象类,实现类组成的一个包,…

Node脚本实现批量打包Vue项目(child_process子进程、window)

前言 前几天用pnpmworkspace实现了monorepo,也就是单仓库多个项目,并且互相之间可能存在一定的联系。所以就存在一个打包的问题,也就是说,我想在打包某个特定子项目时,其他项目也执行build的命令。主要用到的是node的…

字节跳动推机器人大模型GR-2 展现智能自主操作新高度

字节跳动研究团队近日推出的第二代机器人大模型GR-2(Generative Robot2.0)正在引发业界广泛关注。这款智能机器人不仅标志着机器人大模型技术的重大突破,更预示着智能机器人应用即将迎来一个全新纪元。 GR-2的独特之处在于其创新的学习方式。…

力扣之1355.活动参与者

题目: Sql 测试用例: Create table If Not Exists Friends (id int, name varchar(30), activity varchar(30)); Create table If Not Exists Activities (id int, name varchar(30)); Truncate table Friends; insert into Friends (id, name, acti…

FreeRTOS学习总结

背景:在裸机开发上,有时候我们需要等待某个信号或者需要延迟时,CPU的运算是白白浪费掉了的,CPU的利用率并不高,我们希望当一个函数在等待的时候,可以去执行其他内容,提高CPU的效率,同…

朝花夕拾:多模态图文预训练的前世今生

Diffusion Models专栏文章汇总:入门与实战 前言:时间来到2024年,多模态大模型炙手可热。在上一个时代的【多模态图文预训练】宛若时代的遗珠,本文的时间线从2019年到2022年,从BERT横空出世讲到ViT大杀四方,…

通过阿里云Milvus与PAI搭建高效的检索增强对话系统

阿里云Milvus现已无缝集成于阿里云PAI平台,一站式赋能用户构建高性能的RAG(Retrieval-Augmented Generation)对话系统。您可以利用Milvus作为向量数据的实时存储与检索核心,高效结合PAI和LangChain技术栈,实现从理论到…

数学建模算法与应用 第8章 时间序列分析

目录 8.1 确定性时间序列分析方法 Matlab代码示例:移动平均法提取趋势 8.2 平稳时间序列模型 Matlab代码示例:差分法与ADF检验 8.3 时间序列的Matlab相关工具箱及命令 Matlab代码示例:ARIMA模型的建立 8.4 ARIMA序列与季节性序列 Matl…

【Golang】Go语言中缓冲bufio的原理解读与应用实战

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,…

Ubuntu关闭anaconda自动进入base虚拟环境

问题描述:安装好Anconda后,每次打开终端后都会自动进入到base的虚拟环境中去 直接使用通常情况下也不会有什么影响,但是为了避免,有以下两个方法: 1.使用conda deactivate #每次使用conda deactivate,退…

鸿蒙开发(NEXT/API 12)【ArkWeb接入密码保险箱】系统安全

网页中的登录表单,登录成功后,用户可将用户名和密码保存到鸿蒙系统密码保险箱中。再次打开该网页时,密码保险箱可以提供用户名、密码的自动填充。 手机使用场景 在网站中输入用户名、密码,登陆成功后,ArkWeb会提示将用…

线程池的核心参数——Java全栈知识(50)

线程池的核心参数 线程池核心参数主要参考ThreadPoolExecutor这个类的7个参数的构造函数 corePoolSize 核心线程数目maximumPoolSize 最大线程数目 (核心线程救急线程的最大数目)keepAliveTime 生存时间 - 救急线程的生存时间,生存时间内没有新任务,此…

前端Vue3字体优化三部曲(webFont、font-spider、spa-font-spider-webpack-plugin)

前端Vue字体优化三部曲(webFont、font-spider、spa-font-spider-webpack-plugin) 引言 最近前端引入了UI给的思源黑体字体文件,但是字体文件过于庞大,会降低页面首次加载的速度,目前我的项目中需要用到如下三个字体文…

视频理解模型

LSTM 视频分解成图片帧分别进行特征提取,最后把提取到的特征放到LSTM网络里提取时序信息。 3D-ConvNet 把一组图片帧作为一个整体输入到3D卷积网络中,由于多了一个维度,参数变得多,模型变深,但当时没有大量的视频数…

PMP--冲刺题--解题--71-80

文章目录 14.敏捷--合规--测试无问题,安全团队却拒绝部署,则意味着可能存在某方面安全问题71、 [单选] 一个项目经理正在为一家政府所有的公司管理一个采用迭代方法的项目。第一个有用的生产发布由三次迭代组成。每次迭代都在测试环境中成功通过了客户代…

qwt实现码流柱状图多色柱体显示

qwt实现码流柱状图多色柱体显示 1. 前言2. qt实现柱状图3.qwt基础说明3.1 qwt安装与使用3.1.1 下载qwt源码3.1.2 编译3.1.3 安装3.1.4 使用3.2 QwtPlotBarChart类3.2.1画图步骤3.2.2 specialSymbol3.3.3 barTitle4 BsBarChart定制4.1 每个柱体可以显示不同的颜色4.2 每个柱体可…

网络安全-IPv4和IPv6的区别

1. 2409:8c20:6:1135:0:ff:b027:210d。 这是一个IPv6地址。IPv6(互联网协议版本6)是用于标识网络中的设备的一种协议,它可以提供比IPv4更大的地址空间。这个地址由八组十六进制数字组成,每组之间用冒号分隔。IPv6地址通常用于替代…

大数据毕业设计选题推荐-B站热门视频数据分析-Python数据可视化-Hive-Hadoop-Spark

✨作者主页:IT研究室✨ 个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…