第63期 | GPTSecurity周报

news2024/11/13 22:14:21

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. 通过意外标记进行大语言模型的自适应预训练数据检测

简介:在本文中,研究者提出了一种自适应的预训练数据检测方法,该方法减轻了对大语言模型逐字记忆能力的依赖,有效增强了识别能力。研究者的方法能自适应定位输入的“意外标记”,若对一个标记的预测是“确定但错误”,即概率分布的香农熵低且真实标记概率低,此标记对模型就是意外的。通过意外标记的预测概率衡量“意外”,检测方法基于简单假设:模型看到已见过的数据比未见过的更不意外。此方法无需访问预训练数据语料库或像参考模型那样额外训练即可应用。在多种基准和模型的不同实验中,该方法持续优于现有方法,最大改进达 29.5%。此外,研究者还引入新基准 Dolma-Book,它基于新框架,用模型训练前后收集的书籍数据进一步评估。

链接:

https://arxiv.org/abs/2407.21248

2. BadRobot: 在物理世界中对基于大语言模型的具身 AI 进行越狱

简介:研究者正在深入研究基于大语言模型(LLMs)的具身人工智能(AI),这一技术能够通过传感器和执行器与物理世界互动,使AI在复杂的真实环境中学习和操作。LLMs在复杂任务的规划中起着关键作用,因此,基于LLM的具身AI逐渐成为研究的焦点。未来十年内,这类机器人预计将在家庭和工业领域广泛普及。然而,研究者发现,这些AI系统存在严重的安全隐患,可能会执行有害行为,违反阿西莫夫的机器人三定律,威胁人类安全。研究揭示了三大关键安全漏洞:通过受损的LLM实现对机器人的越狱、安全性在行动与语言空间之间的错配、以及欺骗性提示导致的危险行为。研究者呼吁增强对具身AI安全性的关注,并提出了潜在的缓解措施。

链接:

https://arxiv.org/abs/2407.20242

3. 大语言模型(LLMs)能被欺骗吗?探究LLMs中的漏洞

简介:大语言模型(LLMs)在自然语言处理领域获得了广泛应用,但其存在的漏洞可能带来严重后果。一个典型的例子是,某些LLM在处理医疗文档时,可能在未经授权的情况下泄露患者个人数据。为了应对这些风险,研究者们深入分析了LLM的多种漏洞,涵盖了模型层面、训练阶段和推理阶段的问题。他们提出了一些缓解策略,包括“模型编辑”以修改LLM的行为,以及“Chroma Teaming”这种结合多种团队策略来增强LLM抗风险能力的方法。通过这些研究,旨在识别和理解LLM的现有漏洞,并探索未来改进的方向,以构建更安全、健壮的LLM系统。

链接:

https://arxiv.org/abs/2407.20529

4. 破坏智能体:通过故障放大损害自主的大语言模型智能体

简介:近年来,基于大语言模型(LLMs)的自主智能体技术取得了显著进展,并广泛应用于实际场景。这些智能体不仅能够在现实世界中执行实际动作,如使用工具与环境互动,还扩展了基础LLM的功能。然而,由于这些系统能够执行关键操作,一旦受到攻击,其造成的损害可能比单一语言模型更为严重。因此,对这些系统潜在漏洞的评估变得尤为重要。

尽管已有研究探讨了LLM智能体的有害行为,研究者们从新的角度入手,提出了一种新型攻击方法——通过误导智能体执行重复或无关的动作来引发故障。研究者们通过多种攻击方法和评估手段进行综合测试,发现这些攻击在多个场景中导致了超过80%的失败率。这些实验结果突显了漏洞的现实风险,并提出了自我检查检测方法作为缓解措施。然而,研究表明,仅依靠LLM进行攻击检测存在困难,这表明这些漏洞带来了显著的风险。

链接:

https://arxiv.org/abs/2407.20859

5. 通过跨模态信息检测器防御视觉语言模型中的越狱攻击

简介:研究者们发现,视觉语言模型(VLMs)在扩展大语言模型(LLMs)对视觉信息的理解能力方面表现出色,尤其是在视觉相关任务中取得了显著成绩。然而,最近的研究表明,这些模型容易受到越狱攻击,即恶意用户通过技术手段破坏模型的安全性,生成误导性和有害的回答。这种威胁既源于LLM的固有漏洞,也受到视觉输入带来的更大攻击范围的影响。为了提高VLMs对越狱攻击的防御能力,研究者们开发了多种防御技术,但这些方法往往需要对模型进行内部结构的修改或在推理阶段消耗大量计算资源。鉴于多模态信息的双重性质,研究者们提出了CIDER(Cross-modality Information DETector),一种即插即用的越狱检测器。CIDER利用有害查询与对抗性图像之间的跨模态相似性,能够识别恶意扰动的图像输入。这个检测器简单有效,独立于目标VLMs,且计算成本较低。大量实验结果证明了CIDER的有效性和效率,以及其在白盒和黑盒VLMs中的可迁移性。

链接:

https://arxiv.org/abs/2407.21659

6. 关于使用 ChatGPT 进行软件安全的定性研究:认知与实用性

简介:研究者们发现,随着人工智能(AI)的进步,大语言模型(LLMs)如 ChatGPT 在执行知识密集型任务方面表现出色。鉴于软件安全工程的复杂性,研究者们探索了 ChatGPT 在软件安全任务中的潜力。为了评估 ChatGPT 作为支持软件安全的技术,研究者们采取了两种方法。首先,他们分析了在 Twitter 上分享 ChatGPT 应用于安全任务经验的人员观点,发现安全从业者认为 ChatGPT 对漏洞检测、信息检索和渗透测试等任务有一定帮助。其次,研究者们设计了实验,评估 ChatGPT 在实际环境中作为 oracle 的实用性,特别关注漏洞检测。结果表明,ChatGPT 的回应通常包含通用安全信息,可能不适合行业实际应用。为了避免数据泄露,研究者们使用了 OpenAI 数据截止日期之后编制的漏洞数据集,该数据集来自真实项目,涵盖40种漏洞类型和12种编程语言。研究结果对未来开发和评估专注于软件安全的 LLMs 提供了重要参考。

链接:

https://arxiv.org/abs/2408.00435

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2037606.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何使用unittest和pytest进行python脚本的单元测试

1. 关于unittest和pytest unittest是python内置的支持单元测试的模块,他提供了核心类,TestCase,让单元测试 代码的编写不再是从0开始,不再是作坊式,而是标准化,模板化,工厂化。 pytest是第三方…

微软官方U盘制作工具重装Windows11系统教程

微软官方U盘制作工具重装Windows11系统教程 **注意:**在安装系统的过程中,有可能会因为操作失误造成硬盘原有数据丢失,建议大家要提前做好重要资料备份,避免出现无法挽回的损失。 ​ Windows 11 对于大部分用户而言是完全没有使用…

国产JS库(js-tool-big-box)7月度总结

js-tool-big-box开发已经有3个月了,团队内的小伙伴进行了热烈的讨论,持续做了功能迭代。小伙伴们也做了艰苦卓绝的文档分享,有纯功能分享类的,有带有小故事的,有朋友们利用自己独自网站分发分享的。7月份快要结束了&am…

【云原生】Pass容器研发基础——汇总篇

云原生基础汇总 系列综述: 💞目的:本系列是个人整理为了云计算学习的,整理期间苛求每个知识点,平衡理解简易度与深入程度。 🥰来源:每个知识点的修正和深入主要参考各平台大佬的文章&#xff0c…

Backtrader 文档学习- 整体架构功能分析理解

Backtrader 文档学习- 架构功能分析理解 1. 概述 backtrader是一个用于开发和执行交易策略的Python框架。它提供了一套完整的工具和功能,使得用户可以方便地进行策略回测、实盘交易以及数据分析。 backtrader的入口为Cerebro类,该类将所有输入(Data F…

FPGA学习笔记-1 FPGA原理与开发流程

1 初识FPGA 文章目录 1 初识FPGA1.1 基本认知1.1.1 什么是FPGA?1.1.2 什么是HDL?什么是Verilog?1.1.3 硬件开发与软件开发1.1.4 FPGA与其他硬件的对比1.1.5 FPGA优势与局限性1.1.6 FPGA的应用1.1.7 FPGA的学习之路 1.2 FPGA开发流程1.2.1 一般…

【学习AI-相关路程-概念了解-基础概念-正负样本-模型-文件结尾-卷积-yolov8模型-概念学习】

【学习AI-相关路程-概念了解-基础概念-正负样本-模型-文件结尾-卷积-yolov8模型-概念学习】 1、前言2、了解正负样本1-定义2-正样本3-负样本4-举例 3、模型这个概念1- 模型的定义2- 模型的训练3- 模型的推理4- 模型的评估5- 模型的类型6- 常见的模型 4、以这样 .yaml 结尾文件是…

以太坊私有链 搭建及相关操作

文章目录 1、创建私有链1.1 创建配置文件1.2 初始化私有链1.3 启动私有链1.4 添加节点1.4.1 启动节点A1.4.2 启动节点B1.4.3 查看节点A信息1.4.4 节点B主动加入到节点A1.4.5 查看已连接的节点数1.4.6 查看其它节点信息2、以太坊挖矿相关操作2.1 查看账户2.2 创建账户2.3 查看账…

RUST实现远程操作电脑手机

简介: Rust Desk 是一个开源的远程桌面软件,能够完全替代向日葵和ToDesk的功能,包括电脑控制电脑、电脑控制手机、手机控制电脑等。它是完全免费的。 下载: 需要下载 Rust Desk 的服务端和客户端安装包。 安装: 服务…

PHP移动端商城分销全平台全端同步使用

📱【掌中购物新纪元:探索移动端购物商城系统的无限魅力】🛍️ 🚀 随时随地,购物自由新体验 在这个快节奏的时代,移动端购物商城系统彻底颠覆了传统购物方式,让消费者享受到了前所未有的便捷与…

探索RPA自动化流程机器人在财务领域的应用

随着科技的不断发展,企业对于流程自动化的需求日益增长。在此背景下,RPA机器人流程自动化技术应运而生,并在财务领域展现出强大的应用潜力。RPA能够模拟人类在计算机上的操作,自动化处理大量重复、繁琐的财务流程,为企…

linux共有云主机ssh升级(以openEuler22.03为例)

目录 为什么要升级ssh怎么查看CVE如何查找新版本的opensshOpenSSH 升级ssh步骤1. 下载源码包2. 备份旧文件防止升级失败3. 停止并卸载旧ssh4. 解压、编译、编译安装新ssh5. 修改systemd文件以便systemctl使用sshd6. 测试 为什么要升级ssh openssh作为使用最为广泛的linux下ssh…

机器学习——线性回归(sklearn)

目录 一、认识线性回归 1. 介绍 2. 多元线性回归的基本原理(LinearRegression) 二、多重共线性 1. 介绍 2. 多重共线性详细解释 三、岭回归(解决多重共线性问题) 1. 模型推导 2. 选取最佳的正则化参数取值 四、Lasso&am…

(寄中寄) docker destop 的wsl问题——记一次在win10虚拟机的上的启动docker

🎪🎢🎡🎠🤡🦁 在win10上可能可以用docker,不过在win10上用docker有点不可能 wsl在windows中可能需要安装,不过wsl在windows安装有点不可能 应该是不用安装吧 可能需要重启 然后 …

移动运维APP项目建设:重塑运维服务新范式

在当今信息化高速发展的时代,信息系统已成为企业运营的核心支撑。为确保信息系统稳定、高效运行,运维团队面临着前所未有的挑战。传统运维方式受限于固定场所和设备,难以满足随时随地访问、快速响应等现代运维需求。因此,依托现有…

uniapp自定义navigationBar

最终效果: 一、关闭默认导航栏 pages.json文件中,对单个页面关闭 "navigationStyle": "custom" "pages": [ //pages数组中第一项表示应用启动页,参考:https://uniapp.dcloud.io/collocation/pag…

IP地址证如何实现HTTPS访问?(内网IP、公网IP)

IP地址证书(全称为IP地址的SSL/TLS证书)是实现通过IP地址进行HTTPS访问的关键。以下是实现这一目标的详细步骤: 一、选择证书颁发机构(CA) 1.选择支持IP证书的CA:并非所有证书颁发机构都提供为IP地址颁…

(计算机网络)网络层

目录 一.网络层提供哪种服务 二.两种服务的比较 三.ip协议 四.ip地址 五.ip地址的分类 六.子网掩码 七.路由器介绍 一.网络层提供哪种服务 1.ip地址--唯一的标识互联网上的某一台主机 2. 虚电路:虚拟的电路 二.两种服务的比较 ip数据报,不需要建…

航空航天构型管理

构型管理(CM)被定义为在产品的生命周期中应用的SE技术和管理规程。CM的五个原则是:CM计划与执行、配置识别、配置变更和差异控制、配置状态核算和配置验证。 广义上的构型管理规划和管理是有效实施配置管理的关键。特别是在不同项目之间的差异中,构型管理…

网络协议九 应用层 HTTPS

一 什么是 HTTPS 二 什么是 SSL/TLS 协议 ,TLS 是 SSL 升级后的名字 三. TLS 协议 工作在那一层 四 。OpenSSL 是 SSL/TLS协议的开源实现。 五。重点 HTTPS 的通讯过程 六 TLS 1.2 的连接过程 1. client hello 是浏览器发送给服务器的第一条信息, 是客户…