第50期|GPTSecurity周报

news2024/11/24 17:15:51

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. 针对硬件安全的进化型大语言模型:一项比较性调查研究

简介:在芯片制造前自动化检测和缓解硬件安全漏洞至关重要,因为后期修复成本高昂且不现实。现代硬件的复杂性也增加了未知漏洞的风险。大语言模型(LLM)在半导体领域中,有潜力自动纠正设计中的安全漏洞。本研究聚焦于LLM在寄存器传输级设计中的应用,评估其独立解决安全漏洞的能力,并探讨了方法论、可扩展性、可解释性,以及未来的研究方向,旨在通过特定领域知识提升模型性能,实现硬件安全的自动化测量和风险缓解。

链接:

https://arxiv.org/pdf/2404.16651

2. 大语言模型中的机器遗忘

简介:大语言模型(LLMs)因能自动生成智能内容而备受瞩目,但也面临安全和隐私挑战。为应对这些问题,本文提出了一个机器遗忘框架,旨在防止LLMs生成有害、幻觉或侵犯隐私的响应,同时保留其标准输出功能。通过评估模型识别需遗忘的对话,并利用距离损失和簇均值正损失引导模型输出向更优结果,而不损害其推理和性能。实验证明,该方法能有效实现遗忘目标,且对模型性能影响不大。

链接:

https://arxiv.org/pdf/2404.16841

3. 用于大语言模型(LLMs)的快速自适应对抗性提示

简介:大语言模型(LLMs)虽取得显著进展,但易受越狱攻击影响,产生不当内容。传统手动寻找对抗性提示方法效率低下。自动生成对抗性提示易被检测,且扩展性差。本文提出AdvPrompter,一种新型LLM,能在几秒内生成易读的对抗性提示,速度提升约800倍。AdvPrompter采用无需目标LLM梯度信息的新算法训练,通过优化预测和微调两个步骤生成后缀,使目标LLM在不改变输入指令含义的情况下生成有害响应。实验显示,AdvPrompter在AdvBench数据集上达到最佳效果,并可迁移至闭源LLM API。此外,通过在AdvPrompter生成的合成数据集上微调,LLMs可增强对越狱攻击的鲁棒性,同时保持高性能。

链接:

https://arxiv.org/pdf/2404.16873

4. 针对大语言模型第三方API的攻击

简介:大语言模型(LLM)服务通过插件生态系统与第三方API服务交互,虽然增强了功能,但也带来了安全风险。本文提出了一个新框架,专门用于检测整合第三方服务的LLM平台的安全漏洞。研究团队在多个领域识别出真实世界的恶意攻击,这些攻击能够悄无声息地改变LLM的输出结果。文章讨论了第三方API集成所面临的挑战,并提出了加强LLM生态系统安全性和安全性的战略性建议。相关代码已在指定网址发布。

链接:

https://arxiv.org/pdf/2404.16891

5. 在由大语言模型(LLM)支持的应用程序中的人类不可感知的检索投毒攻击

简介:当前,借助先进的大语言模型(LLM)应用开发框架,应用程序能轻松利用检索增强生成(RAG)技术扩展LLM知识库。但这些框架未充分考虑外部内容风险,易受攻击者破坏。本文揭示了一种名为“检索投毒”的新威胁,攻击者可通过RAG过程诱导应用产生恶意回应。攻击者分析框架后,制作出看似无害却能误导RAG参考源的文档,导致应用生成错误响应。初步实验显示,攻击者能以88.33%的成功率误导LLM,现实应用中成功率达66.67%,突显了检索投毒的严重性。

链接:

https://arxiv.org/pdf/2404.17196

6. FormAI-v2 数据集:标记由大语言模型生成的代码中的漏洞

简介:本研究对当前先进的大语言模型(LLMs)进行了比较分析,探讨了它们在无特定指令下编写简单C程序时产生安全漏洞的倾向。先前研究中对这些模型生成的代码安全性缺乏深入探讨,本研究填补了这一空白。基于PROMISE '23上介绍的FormAI数据集,本研究扩展出了FormAI-v2,包含265,000个由不同LLMs生成的C程序,并通过高效SMT模型检查器(ESBMC)进行形式验证,标记了源代码中的漏洞。研究发现,至少63.47%的程序存在安全漏洞,不同模型间的差异不大。研究结果表明,尽管LLMs在代码生成上展现出巨大潜力,但在生产环境中应用其生成的代码前,必须进行风险评估和验证。

链接:

https://arxiv.org/pdf/2404.18353

编辑:小椰风

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1651601.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

五道数组习题,只过思路

建议先过一遍:保研机试前的最后七道数组题-CSDN博客 第一题: 88. 合并两个有序数组 - 力扣(LeetCode) ​ 跟合并两个有序链表类似, 快慢指针的用法,新建立一个数组,再将数组赋给nums1。 第…

mysql 不停的重启关闭

早上在使用phpstudy的时候,发现自己的mysql5.7和5.8都出现了问题,就是不停的重启,在梳理了状况之后,可能是硬盘的内存空间不足,或者硬盘出现了问题;于是我将mysql 重新安装了一次,整个问题就解决…

图算法必备指南:《图算法:行业应用与实践》全面解读,解锁主流图算法奥秘!

《图算法:行业应用与实践》于近日正式与读者见面了! 该书详解6大类20余种经典的图算法的原理、复杂度、参数及应用,旨在帮助读者在分析和处理各种复杂的数据关系时能更好地得其法、善其事、尽其能。 全书共分为10章: 第1~3章主要…

苹果删除的短信怎么恢复?这里有4个恢复技巧

手机短信已成为我们日常沟通中不可或缺的一部分,其中包含了与家人、朋友的温馨对话,以及与工作伙伴的重要信息。然而,有时我们可能会因为误操作或其他原因不小心删除了重要的短信。请别担心,本文将为您详细介绍删除的短信怎么恢复…

为什么说气膜是建造游泳馆的好选择?—轻空间

随着气温逐渐攀升,夏日游泳成为人们追求凉爽的理想选择。在这个时候,选择气膜建筑作为游泳馆的建筑材料具有许多优势。 首先,气膜建筑具备出色的隔热和保温效果。其特殊的材料和结构设计有效隔绝了外界高温,同时保持了良好的通风和…

【吊打面试官系列】Java高并发篇 - 如何让正在运行的线程暂停一段时间?

大家好,我是锋哥。今天分享关于 【如何让正在运行的线程暂停一段时间?】面试题,希望对大家有帮助; 如何让正在运行的线程暂停一段时间? 我们可以使用 Thread 类的 Sleep()方法让线程暂停一段时间。需要注意的是&#x…

antd vue pro (vue 2.x) 多页签详细操作

antd vue pro 多页签配置操作,具体操作如下。 1.引入 tagviews文件 在 store/modules 中创建 tagviews.js ,复制一下代码到文件中保存 const state {visitedViews: [],cachedViews: [] }const mutations {ADD_VISITED_VIEW: (state, view) > {if …

【IP:Internet Protocol,子网(Subnets),IPv6:动机,层次编址:路由聚集(rout aggregation)】

文章目录 IP:Internet Protocol互联网的的网络层IP分片和重组(Fragmentation & Reassembly)IP编址:引论子网(Subnets)特殊IP地址IP 编址: CIDR子网掩码(Subnet mask)转发表和转发…

64-RJ45网口电路设计

视频链接 RJ45网口电路设计01_哔哩哔哩_bilibili RJ45网口电路设计 千兆(十兆、百兆、千兆自适应)以太网电路设计(参考第2课) 万兆以太网电路设计(参考第3课) Pcie转网口电路设计(参考第49课) RGMII &…

掌握Android Fragment开发之魂:Fragment的深度解析(上)

Fragment是Android开发中用于构建动态和灵活界面的基石。它不仅提升了应用的模块化程度,还增强了用户界面的动态性和交互性,允许开发者将应用界面划分为多个独立、可重用的部分,每个部分都可以独立于其他部分进行操作。本文将从以下几个方面深…

2024年成都市企业技术标准制(修)订申报条件奖励、材料流程须知

一、2022 年期间奖励项目 (一)申报条件 2022 年期间主导制(修)订并获批发布国际、国家和行业技术标准的工业和信息化企业(其中:民营企业获批发布时间在2022年1月1日至2022年12月31日期间,其他企业获批发布时间在2022年1月1日至2022年7月7日期间)。 (二)支持标准 …

Python | Leetcode Python题解之第76题最小覆盖子串

题目: 题解: class Solution:def minWindow(self, s: str, t: str) -> str:ans_left, ans_right -1, len(s)left 0cnt_s Counter() # s 子串字母的出现次数cnt_t Counter(t) # t 中字母的出现次数less len(cnt_t) # 有 less 种字母的出现次数…

车路云一体化简介

车路云一体化 车路云一体化融合控制系统( System of Coordinated Control by Vehicle-Road-Cloud Integration,SCCVRCI),是利用新一代信息与通信技术, 将人、车、路、云的物理层、信息层、应用层连为一体,…

asp.net不用验证码包,如何实现手写验证码

引文:众所周知,一般我们日常碰到的验证码是一个图形样式的,列入这个样子的,那么在这个图片里面我们想实现我们自己界面上有这样的一个验证码就需要做两个操作,一个是在我们自己界面上生成如图所示的一个验证码图片&…

公司数据防泄漏方案分享|防泄密软件有哪些

企业的数据安全是公司稳定发展的必要条件,如何防止内部数据泄露企业的数据安全是公司稳定发展的必要条件,如何防止内部数据泄露已经成为了一个亟待解决的问题。在这个信息时代,数据已经成为企业最重要的资产之一,因此,…

125.两两交换链表中的节点(力扣)

题目描述 代码解决及思路 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), next(nullptr) {}* ListNode(int x, ListNode *next) : val(x), …

flutter安卓项目生成MD5、sha1、公钥等

一:MD5、SHA1等生成方式 工具:Android Studio 1. 打开flutter项目下的Android目录 2. 创建signingReport运行配置项 3. build apk: 导航栏->build->Generate Signed App Bundle / APK... 4. 填写存放路径,同时创建文件xx…

了解集合与数据结构(java)

什么是数据结构? 数据结构就是 数据结构, 功能就是描述和组织数据 比如我有10万个QQ号, 我来组织, 有很多种组织方法, 比如链表, 树, 堆, 栈等等. 假如QQ号要查找数据, 有种数据结构查找数据速度很快, 我们就用它 加入QQ号要进行删除数据, 有种数据结构删除速度很快, 我们…

编程入门(六)【Linux系统基础操作三】

读者大大们好呀!!!☀️☀️☀️ 🔥 欢迎来到我的博客 👀期待大大的关注哦❗️❗️❗️ 🚀欢迎收看我的主页文章➡️寻至善的主页 文章目录 🔥前言🚀LInux的进程管理和磁盘管理top命令显示查看进…

【CTS :testExtensionAvailability】

【CTS】android.hardware.camera2.cts.CameraExtensionCharacteristicsTest#testExtensionAvailability 报错: java.lang.AssertionError: Extensions system property : true does not match with the advertised extensions: false expected: but was: 通过对这…