第56期 | GPTSecurity周报

news2025/1/10 23:54:47

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. SelfDefend: LLMs能够以实用的方式自我防御免受破解

简介:SelfDefend是一种新型的大语言模型(LLMs)防御框架,旨在对抗越狱攻击,即绕过安全对齐措施的攻击。该框架通过建立一个影子LLM实例来保护目标LLM,同时进行基于检查点的访问控制。SelfDefend利用现有LLMs识别用户查询中潜在有害内容的能力,通过实验验证了其有效性,能够显著降低攻击成功率,同时对正常查询影响极小。此外,通过数据蒸馏方法,SelfDefend还优化了开源防御模型,使其在抵御越狱攻击方面表现优异,且延迟低,进一步增强了其在实际应用中的实用性。

链接:

https://arxiv.org/abs/2406.05498

2. 多智能体软件开发实验:迈向统一平台

简介:大语言模型正在革新软件工程,通过AI技术贯穿需求收集、架构设计、代码编写、测试和部署等环节。本研究旨在构建一个统一平台,利用多个AI代理自动将用户需求转化为结构化的软件交付物,包括用户故事、优先级排序、UML图、模块化API、单元测试和端到端测试。该平台还负责任务组织、安全合规性检查,并为非功能性需求提供设计建议。用户可按偏好控制各阶段,平台遵循欧洲标准进行安全合规性检查,并提出设计优化。研究使用GPT-3.5、GPT-4和Llama3等模型生成模块化代码,并在GitHub上公开源代码,以支持研究和实践。

链接:

https://arxiv.org/abs/2406.05381

3. PowerPeeler:一种精确且通用的PowerShell脚本动态去混淆方法

简介:PowerShell作为强大的自动化工具,常被网络攻击者利用进行恶意脚本编写和混淆,以逃避检测和分析。为解决这一问题,本文提出了一种名为PowerPeeler的动态去混淆方法,它通过分析抽象语法树(AST)节点来识别和跟踪脚本执行过程中的混淆部分,并动态记录执行结果,从而实现精确的去混淆。与现有工具相比,PowerPeeler在去混淆正确率上达到95%,显著领先,并能恢复最多敏感数据,同时保持高语义一致性。此外,PowerPeeler在有限时间内能有效产出最多有效去混淆结果,且具有良好的可扩展性,可作为网络安全解决方案的一部分。

链接:

https://arxiv.org/abs/2406.04027

4. 探索针对基于大语言模型的决策制定的后门攻击

简介:大语言模型(LLMs)在特定应用的微调阶段,因其强大的常识和推理能力,在决策任务中表现出巨大潜力。然而,这一阶段也存在显著的安全风险。本研究提出了首个针对LLM决策系统的后门攻击框架(BALD),系统地探讨了如何在微调阶段通过不同渠道引入后门攻击。研究者提出了三种攻击机制:词注入、场景操纵和知识注入,并通过实验验证了这些攻击的有效性和隐蔽性。研究还评估了LLMs在决策任务中的脆弱性,并探讨了潜在的防御措施,以保护基于LLM的决策系统。

链接:

https://arxiv.org/abs/2405.20774

5. 针对GPT-4o的语音破解攻击

简介:随着GPT-4o这一多模态大语言模型的推出,它通过音频、视觉和文本的交互能力,将人机交互带入了更自然的领域。然而,这同时也为潜在的语音破解攻击提供了新的机会。本研究首次系统地评估了针对GPT-4o语音模式的破解攻击,并发现GPT-4o在将文本破解提示转换为语音时具有较强的抵抗性。研究者提出了VoiceJailbreak攻击,通过模拟人类行为和虚构故事讲述来诱使GPT-4o泄露敏感信息。实验表明,VoiceJailbreak能显著提高攻击成功率,从0.033提升至0.778。研究还探讨了不同因素对攻击效果的影响,并通过高级写作技巧进一步增强了攻击效果。研究者希望这项研究能为构建更安全的多模态语言模型提供帮助。

链接:

https://arxiv.org/abs/2405.19103

6. LLM辅助的静态分析用于检测安全漏洞

简介:软件存在安全漏洞的风险,而用于检测这些漏洞的程序分析工具在实际应用中的效果并不理想。尽管大语言模型(LLMs)在代码生成方面表现出色,但是它们难以进行复杂的代码推理以发现安全漏洞。本研究提出了一种名为IRIS的新方法,它首次将LLMs与静态分析相结合,以实现对整个代码库的推理,从而检测安全漏洞。研究者创建了一个包含120个真实Java项目中手动验证的安全漏洞的新数据集CWE-Bench-Java。IRIS利用GPT-4模型检测出其中的69个漏洞,而最先进的静态分析工具仅检测到27个。此外,IRIS还显著降低了误报率,最高减少了80%以上。这一成果不仅提高了漏洞检测的准确性,还减少了开发者的负担。

链接:

https://arxiv.org/abs/2405.17238

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1873512.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一种自定义SPI通信协议

本文介绍一种自定义SPI通信协议。 项目开发过程中,有时候会涉及到主处理器或FPGA和MCU之间的SPI通信,涉及到通信就需要考虑通信协议,本文给出一种简单的通信协议。 1.协议格式 协议格式如下图。 其中,将40 bit划分为2大部分&am…

Spring Boot 过滤器和拦截器详解

目录 Spring Boot 过滤器1.什么是过滤器2.工作机制3.实现过滤器 Spring Boot 拦截器1. 什么是拦截器2. 工作原理3.实现4.拓展(MethodInterceptor 拦截器)实现 过滤器和拦截器区别过滤器和拦截器应用场景过滤器拦截器 Spring Boot 过滤器 1.什么是过滤器 …

OpenCV视觉--视频人脸微笑检测(超详细,附带检测资源)

目录 概述 具体实现 1.加载分类器 2.打开摄像头并识别人脸 3.处理人脸并检测是否微笑 效果 总结 概述 OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习库,广泛应用于图像处理和视频分析等领…

精密机器中的交叉导轨负荷与容许负荷的差异!

交叉导轨的设计和制造过程中,负荷及容许负荷是至关重要的参数,只有准确计算出交叉导轨的载荷,才能保证交叉导轨的稳定性和使用寿命。 负荷和容许载荷是两个不同的参数,那这两者的有什么差异呢? 交叉导轨的负荷是指其承…

[深度学习] 前馈神经网络

前馈神经网络(Feedforward Neural Network, FFNN)是人工神经网络中最基本的类型,也是许多复杂神经网络的基础。它包括一个输入层、一个或多个隐藏层和一个输出层。以下是详细介绍: 1. 结构 1. 输入层(Input Layer&am…

在微信小程序中使用svg图标

在项目中引入图标组件是很常见的一个问题&#xff0c;但是这里我在小程序中引入图标组件的时候报错了&#xff01; 这个主要原因是 微信小程序上不支持 SVG 字体图标&#xff01; <image src"./xx.svg"/>所以参考微信开放社区 我们想要在微信小程序中使用svg图…

java基于ssm+jsp 电子商城系统

1管理员功能模块 管理员登录&#xff0c;通过填写用户名、密码进行登录&#xff0c;如图1所示。 图1管理员登录界面图 管理员登录进入电子商城系统可以查看个人中心、用户管理、医生管理、药品信息管理、线上诊疗管理、医生信息管理、管理员管理、论坛管理、系统管理、订单管…

智慧数据中心可视化:高效管理与直观监控的未来

随着数据中心的规模和复杂性不断增加&#xff0c;传统管理方式难以满足需求。智慧数据中心通过图扑可视化实现实时数据监控和智能分析&#xff0c;将复杂的基础设施直观呈现&#xff0c;极大提升了运维效率、故障排查速度和资源优化能力&#xff0c;为企业提供现代化、智能化的…

卡尔曼滤波公式推导笔记

视频见B站上DR_CAN的卡尔曼滤波器 【卡尔曼滤波器】3_卡尔曼增益超详细数学推导 &#xff5e;全网最完整_哔哩哔哩_bilibili

4. node联调devtools

4. node联调devtools 把node代码放在开发者工具执行代码执行命令 node --inspect-brk js文件浏览器执行命令 chrome://inspect/#devices检测到文件之后会有个点击选项,点击进入就能调试自己的代码 有了开发者工具调试之后我们可以给自己的吐环境脚本在完善一下,当获取的参数是…

实力认可!安全狗受聘成为福建省网信系统2024年度网络安全技术支撑单位

6月6日&#xff0c;福建省委网信办组织召开福建省网信系统2024年度网络安全技术支撑单位座谈会。 作为国内云原生安全领导厂商&#xff0c;安全狗也受邀出席此次活动。 省委宣传部副部长、省委网信办主任、省互联网信息办公室主任张远出席会议并颁发支撑单位证书。安全狗凭借出…

Java面向对象特性

Java继承&#xff1a; 继承的概念&#xff1a; 在Java中&#xff0c;继承&#xff08;inheritance&#xff09;是面向对象编程的一个重要概念&#xff0c;它允许一个类&#xff08;子类&#xff09;继承另一个类&#xff08;父类&#xff09;的属性和方法。通过继承&#xff0c…

Java养老护理助浴陪诊小程序APP源码

&#x1f496;护理助浴陪诊小程序&#x1f496; 一、引言&#xff1a;养老新趋势&#x1f331; 在快节奏的现代生活中&#xff0c;养老问题逐渐成为了社会关注的焦点。如何为老年人提供便捷、贴心的服务&#xff0c;让他们晚年生活更加安心、舒适&#xff0c;是我们每个人都需…

BUUCTF--WEB

首頁 - OWASP Top 10:2021 [极客大挑战 2019]EasySQL 类型:sql注入 使用万能密码 flag{f580db5b-c0c9-4b13-bfb6-adfa525c93f5} [极客大挑战 2019]Havefun 类型:代码审计 F12打开浏览器控制台 GET请求,在url添加参数/?cat=dog访问 返回flag{f60c7d5c-9f44-4e92-88c0…

驱动LSM6DS3TR-C实现高效运动检测与数据采集(6)----FIFO数据读取与配置

驱动LSM6DS3TR-C实现高效运动检测与数据采集.6--FIFO数据读取与配置 概述视频教学样品申请源码下载主要内容生成STM32CUBEMX串口配置IIC配置CS和SA0设置ICASHE修改堆栈串口重定向参考驱动程序FIFO参考程序初始化管脚获取ID复位操作设置量程BDU设置设置速率FIFO读取程序设置FIFO…

鸿蒙开发 之 健康App案例

1.项目介绍 该项目是记录用户日常饮食情况&#xff0c;以及针对不同食物摄入营养不同会有对应的营养摄入情况和日常运动消耗情况&#xff0c;用户可以自己添加食品以及对应的热量。 1.1登陆页 1.2饮食统计页 1.3 食物列表页 2.登陆页 2.1自定义弹框 import preferences from oh…

词向量模型

文章目录 RNN词向量模型模型整体框架训练数据构建CBOW与Skip-gram模型负采样 RNN 卷积神经网络&#xff08;CNN&#xff09;主要应用计算机视觉&#xff0c;而递归神经网络&#xff08;RNN&#xff09;主要应用于自然语言处理。 递归神经网络会涉及处理之前所有的数据&#x…

Linux高级编程——线程

pthread 线程 概念 &#xff1a;线程是轻量级进程&#xff0c;一般是一个进程中的多个任务。 进程是系统中最小的资源分配单位. 线程是系统中最小的执行单位。 优点&#xff1a; 比多进程节省资源&#xff0c;可以共享变量 进程会占用&am…

【漏洞复现】金和OA 未授权访问

【产品介绍】 金和OA协同办公管理系统C6软件&#xff08;简称金和OA&#xff09;&#xff0c;本着简单、适用、高效的原则&#xff0c;贴合企事业单位的实际需求&#xff0c;实行通用化、标准化、智能化、人性化的产品设计&#xff0c;充分体现企事业单位规范管理、提高办公效…

ubuntu22.04编译安装tesseract

1、 为什么用自己编译安装&#xff0c;而不采用apt安装&#xff1f; 由于tesseract有很多依赖包&#xff0c;直接用deb包或者rpm包等安装包安装很复杂&#xff0c;不一定能成功安装。 2、安装基本的依赖包 sudo apt update sudo apt install g autoconf automake libtool pkg…