第67期 | GPTSecurity周报

news2024/12/24 20:51:13

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. GitHub Copilot 在编程方面表现出色,但它是否确保了负责任的输出?

简介:大语言模型(LLMs)的快速发展极大地推动了代码补全工具(LCCTs)的进化。这些工具通过整合多种信息源并优先提供代码建议,与传统LLMs不同,它们在安全方面面临独特挑战。特别是,LCCTs在训练时依赖专有代码数据集,这可能增加敏感数据泄露的风险。研究表明,LCCTs存在显著的安全漏洞,例如,针对GitHub Copilot的越狱攻击成功率高达99.4%,而从其中提取敏感用户数据的成功率也相当高。这些发现强调了LCCTs在安全方面的挑战,并为加强其安全框架提供了重要方向。

链接:

https://arxiv.org/abs/2408.11006

2. 语言模型应用程序中的数据泄露:对 OpenAI 的 GPT 产品的深入调查

简介:研究者们在探索大语言模型(LLM)应用的数据实践透明度时,以OpenAI的GPT应用生态系统作为案例研究。他们开发了一个基于LLM的框架,对GPT及其动作(外部服务)的源代码进行了静态分析,以揭示其数据收集的做法。研究发现,这些动作收集了大量用户数据,包括OpenAI明令禁止的敏感信息,如密码。此外,一些与广告和分析相关的动作嵌入在多个GPT中,使得它们能够跨平台追踪用户活动。动作的共现还可能导致用户数据的进一步暴露,增加了隐私风险。研究者还开发了一个基于LLM的隐私政策分析框架,用以自动检查动作的数据收集是否与隐私政策中的披露相一致。结果显示,大多数收集的数据类型在隐私政策中并未明确披露,仅有5.8%的动作清晰地说明了它们的数据收集实践。这一发现强调了LLM应用在数据实践透明度方面存在的问题,并指出了加强隐私保护措施的必要性。

链接:

https://arxiv.org/abs/2408.13247

3. 去伪存真:利用执行反馈对生成的代码候选进行排序

简介:大语言模型(LLMs)如GPT-4、StarCoder和CodeLlama正在改变编程方式,通过自然语言描述自动生成代码。尽管如此,生成正确代码仍然具有挑战性。为了提高正确代码的生成率,开发者通常使用LLMs生成多个候选解决方案,然后进行代码排名,即从多个候选代码中选择正确的一个。现有的代码排名研究主要分为基于执行和非基于执行的方法。基于执行的方法虽然有效,但受限于高质量单元测试的稀缺和潜在的安全风险。而非基于执行的方法,如CodeRanker,主要依赖分类标签进行训练,难以捕捉细微错误和提供错误洞察。

为了克服这些限制,研究者提出了一种新的方法——RankEF。RankEF是一种创新的代码排名方法,它利用执行反馈并通过多任务学习整合代码分类与执行反馈生成。这种方法使模型能够在不执行代码的情况下,理解错误代码的原因,并区分正确与错误的解决方案。在三个代码生成基准上的实验显示,RankEF显著优于现有的CodeRanker,展现出在代码排名方面的高效性和准确性。

链接:

https://arxiv.org/abs/2408.13976

4. 调查贝叶斯垃圾邮件过滤器在检测经语言模型修改的垃圾邮件中的有效性

简介:垃圾邮件和网络钓鱼是网络安全的重大威胁,贝叶斯垃圾邮件过滤器如 SpamAssassin 是重要防御工具。但大语言模型的出现带来新挑战,因其强大、易获取且成本低,可能被用于制作复杂垃圾邮件逃避传统过滤器。研究者开发管道测试 SpamAssassin 对经语言模型修改邮件的有效性,结果显示其会将高达 73.7%的此类邮件误分类为合法邮件,而简单字典替换攻击成功率仅 0.4%。这凸显了经语言模型修改的垃圾邮件的重大威胁及成本效益。该研究为当前垃圾邮件过滤器的漏洞及网络安全措施的持续改进提供了关键见解。

链接:

https://arxiv.org/abs/2408.14293

5. 检测人工智能缺陷:针对语言模型内部故障的目标驱动攻击

简介:大语言模型(LLMs)在人工智能领域的重要性日益凸显,但这些模型在预训练语料中可能包含有害内容,导致生成不适当的输出。为了提高LLMs的安全性,研究人员探索了检测模型内部缺陷的方法。目前的研究主要集中在越狱攻击上,这些攻击通过构建对抗性内容来诱导模型产生意外响应。然而,这些方法依赖于提示工程,既耗时又需要特别设计的问题。

为了解决这些挑战,研究人员提出了一种新的攻击范式,即目标驱动的攻击,它专注于直接引出目标响应,而不是优化提示。研究中引入了名为ToxDet的LLM,作为有毒内容的检测器。ToxDet能够根据目标有毒响应生成可能的问题和初步答案,以诱导目标模型产生与提供含义相当的有毒响应。ToxDet通过与目标LLM交互并接收奖励信号进行训练,利用强化学习优化过程。尽管ToxDet主要针对开源LLMs,但经过微调后,它也可以转移到攻击如GPT-4o这样的黑盒模型,并取得了显著结果。在AdvBench和HH-Harmless数据集上的实验结果证明了该方法在检测目标LLMs生成有害响应倾向方面的有效性。这不仅揭示了LLMs的潜在漏洞,还为研究人员提供了加强模型抵御此类攻击的宝贵资源。

链接:

https://arxiv.org/abs/2408.14853

6. 参数高效的量化专家混合体与视觉 - 语言指令调优在半导体电子显微图像分析中的应用

简介:研究者指出半导体在基础模型中研究不足,需增强半导体器件技术。为此,他们推出了 sLAVA,一个针对半导体制造的小型视觉语言助手,专注于电子显微镜图像分析。采用师生范式,以 GPT-4 等基础视觉语言模型为教师,为 sLAVA 创建遵循指令的多模态数据,解决数据稀缺问题,可在预算有限的消费级硬件上进行任务,且企业能在自身基础设施内用专有数据安全微调框架以保护知识产权。严格实验表明,该框架超越传统方法,能处理数据偏移并实现高通量筛选,有助于半导体制造中的电子显微镜图像分析,为企业提供了一种有效的解决方案,也为半导体技术发展提供了新的思路和方法。

链接:

https://arxiv.org/abs/2408.15305

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2123161.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Leetcode sql high frequency questions 50 (based)

high frequency SQL 50 (basic version) 高頻sql題目(Leetcode) 查詢 1757. 可回收且低脂的产品 Question 表:Products ---------------------- | Column Name | Type | ---------------------- | product_id | int | | low_fats | enum | | rec…

评测AI写毕业论文软件排行榜前十名的网站

在当今信息爆炸的时代,AI智能写作工具已经成为我们写作过程中的得力助手。特别是对于学术论文的撰写,这些工具不仅能够提高写作效率,还能帮助用户生成高质量的文稿。以下是五款值得推荐的AI智能写论文软件,其中特别推荐千笔-AIPas…

Mysql基础练习题 1729.求关注者的数量 (力扣)

编写解决方案,对于每一个用户,返回该用户的关注者数量。 #按 user_id 的顺序返回结果表 题目链接: https://leetcode.cn/problems/find-followers-count/description/ 建表插入语句: Create table If Not Exists Followers(us…

VMware Workstation Pro 17 下载教程(Window环境)

自从24年中旬,博通公司以 610 亿美元收购的 VMware 宣布对其虚拟化软件套件进行一些重大调整。Windows 和 Linux 版 VMware Workstation Pro 和 Mac 版 VMware Fusion 不再需要个人使用许可证,也就是对个人用户免费。 1. 下载方式 Windows 和 Linux 版…

IDEA 编译运行gradle项目

IDEA 编译运行gradle项目 本文介绍Gradle 的三种安装方式 1.IDEA 编译自动安装gradle【推荐】 2.mac brew 安装 gradle 3.手动 安装 gradle IDEA 编译gradle项目,之前的项目都是maven管理,今天遇到一个sping boot 的项目是用gradle管理的,下面…

[Linux]:文件(下)

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:Linux学习 贝蒂的主页:Betty’s blog 1. 重定向原理 在明确了文件描述符的概念及其分配规则后,我们就可…

C程序设计(7.0安徽专升本函数)

在之前我很多代码执行都是放在函数里的,这样方便我管理和演示,现在能和大家更好的去了解函数了 考纲教材关于这个的理论知识太多了,且废话占大多数,甚至有些对于小白很晦涩难懂或容易搞混!所以在这我就尽量缩减理论知…

C语言——希尔排序

希尔排序是对于插入排序的一种优化 代码&#xff1a; #include <stdio.h> #include <stdlib.h> void shell_sort(int* p, int len) { int i; int j; int step; int tmp; for (step len / 2; step > 0; step step / 2) { fo…

手把手教你实现微信小程序定位

实现小程序的定位 框架&#xff1a;uniappvue 1&#xff0c;用户授权配置 在pages.json文件中配置 "pages": [{"path": "pages/home/index","style": {"navigationBarTitleText": "首页","navigationBarBac…

监控-zabbix

1运维监控 是指对计算机系统、网络、服务器等关键IT基础设施进行实时监控&#xff0c;以确保系统的稳定运行和及时发现潜在问题 2老监控框架&#xff08;不会用但需要知道&#xff09; Cacti&#xff1a; Cacti是一款基于PHP、MySQL开发的网络流量监测图形分析工具。主要监…

CSP-J算法基础 计数排序

文章目录 前言计数排序计数排序的过程总结 代码实现计数排序总结 前言 计数排序 计数排序&#xff08;Counting Sort&#xff09;是一种线性时间复杂度的排序算法&#xff0c;适用于范围有限的整数排序。它通过计数每个值出现的次数&#xff0c;依次排列这些值。该算法不通过比…

LVGL 控件之线条(lv_line)

目录 一、概述二、线条1、设置连接点2、自适应大小3、翻转 y 轴4、样式4.1 设置宽度4.2 末端形态 4.3 虚线5、API 函数 一、概述 线条部件只有一个组成部分&#xff1a;主体 LV_PART_MAIN。 通过一组点绘制出相连的直线&#xff0c;通过 lv_line_create 创建相应的对象。 二…

利用深度学习实现验证码识别-4-ResNet18+imagecaptcha

在当今的数字化世界中&#xff0c;验证码&#xff08;CAPTCHA&#xff09;是保护网站免受自动化攻击的重要工具。然而&#xff0c;对于用户来说&#xff0c;验证码有时可能会成为一种烦恼。为了解决这个问题&#xff0c;我们可以利用深度学习技术来自动识别验证码&#xff0c;从…

5.第二阶段x86游戏实战2-认识内存

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 本次游戏没法给 内容参考于&#xff1a;微尘网络安全 工具下载&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1rEEJnt85npn7N38Ai0_F2Q?pwd6tw3 提…

Cesium 展示——Cesium 初始化视角在中国并加载数据(china.json)

文章目录 需求一:初始化视角在中国分析需求二:加载中国数据(china.json)需求一:初始化视角在中国 在初始化 Cesium 的 Viewer 后,视角是在美国,如何让其视角指向中国 分析 viewer.value = new Cesium.Viewer(cesiumContainer.value, {homeButton

redis基本数据结构-string

文章目录 1. redis的string数据结构2. 常见的业务场景2.1 缓存功能案例讲解背景优势解决方案代码实现 2.2 计数器案例讲解背景优势解决方案代码实现 2.3 分布式锁案例讲解背景优势解决方案代码实现 2.4 限流案例讲解背景优势解决方案代码实现 2.5 共享session案例讲解背景优势解…

Docker突然解封,直接拉取!

文章目录 Docker突然解封&#xff0c;直接拉取&#xff01;封禁的原因是什么&#xff1f;解封的原因是什么&#xff1f;封禁对开发的影响经验教训 最近开始公众号文章也开始同步更新了&#xff0c;对Java、大数据、人工智能、开发运维相关技术分享&#xff0c;文章对您有用的话…

Linux 8250串口控制器

1 8250串口类型的识别 Intel HW都使用DesignWare 8250&#xff1a; drivers/mfd/intel-lpss-pci.c drivers/tty/serial/8250/8250_dw.c IIR寄存器的高2位bit7、bit6用来识别8250串口的类型&#xff1a; 0 - 8250&#xff0c;无FIFO 0 - 并且存在SCR&#xff08;Scratch registe…

SQL优化(二)统计信息

收集统计信息 数据库的统计信息非常重要&#xff0c;如果没有正确地收集表的统计信息&#xff0c;或者没有及时地更新表的统计信息&#xff0c;SQL就有可能走错执行计划&#xff0c;也就会出现性能问题。 统计信息主要分为表的统计信息、列的统计信息、索引的统计信息、系统的…

TeamTalk数据库代理服务器

文章目录 main函数主流程关键步骤线程池redis缓存未读消息计数未读消息计数-单聊未读消息计数-群聊 群成员管理 main函数主流程 关键步骤 初始化epoll 线程池数据入口 reactor CProxyConn::HandlePduBuf异步task任务封装&#xff0c;把任务放入线程池&#xff1b;线程池里的…