第55期|GPTSecurity周报

news2025/1/21 15:38:28

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. REVS: 通过词汇空间中的排名编辑在语言模型中消除敏感信息

简介:大语言模型(LLMs)可能无意中记住并泄露训练数据中的敏感信息,引发隐私担忧。为解决此问题,研究者提出了一种名为REVS的创新模型编辑技术。该技术通过识别和修改与敏感信息相关的神经元子集来消除这些信息。REVS将这些神经元映射到词汇空间,以确定生成敏感内容的关键组件,并通过计算反嵌入矩阵的伪逆来编辑模型,从而减少敏感数据的生成。研究者通过电子邮件数据集和合成的社会保障号码数据集这两个数据集,验证了REVS的有效性。结果表明,REVS在消除敏感信息和抵御提取攻击方面表现出色,同时保持了模型的完整性。

链接:

https://arxiv.org/pdf/2406.09325

2. 人工智能作为新黑客:开发用于进攻性安全的智能体

简介:在网络安全领域,人工智能(AI)技术正被用于开发自主攻击代理ReaperAI,以模拟和执行网络攻击。通过利用大语言模型如GPT-4的能力,ReaperAI能够自主识别和利用安全漏洞。在多个平台上的测试表明,ReaperAI成功利用已知漏洞,展示了其在进攻性安全策略中的潜力。然而,AI在进攻性安全中的应用也引发了伦理和操作上的挑战,包括命令执行、错误处理和伦理约束。本研究强调了AI在网络安全中创新应用的重要性,并提出了未来研究方向,包括AI与安全工具的交互优化、学习机制的提升以及伦理指导方针的讨论。

链接:

https://arxiv.org/abs/2406.07561

3. 利用大语言模型(LLM)辅助的代码补全模型易触发后门攻击:注入伪装的漏洞以对抗强检测

简介:大语言模型(LLMs)在软件工程中通过提供上下文建议显著提高了代码补全的效率。然而,这些模型在特定应用中的微调可能遭受中毒和后门攻击,导致输出被秘密篡改。为应对这一安全威胁,研究者提出了CodeBreaker,这是一个利用LLMs(如GPT-4)进行复杂载荷转换的后门攻击框架,确保中毒数据和生成代码能够绕过强漏洞检测。CodeBreaker通过直接将恶意载荷集成到源代码中,挑战了现有的安全措施,凸显了对代码补全系统加强防御的必要性。实验和用户研究证实了CodeBreaker在不同环境下的攻击效能,证明了其在现有方法中的优越性。

链接:

https://arxiv.org/abs/2406.06822

4. SecureNet: DeBERTa与大语言模型在钓鱼检测中的比较研究

简介:在网络安全领域,钓鱼攻击通过社会工程学手段诱骗用户泄露敏感信息,对组织构成重大威胁。本文探讨了大语言模型(LLMs)在检测钓鱼内容方面的潜力,并与DeBERTa V3模型进行了比较。通过使用包括电子邮件、HTML、URL、短信和合成数据在内的公共数据集,研究者系统地评估了这些模型的性能和局限性。

研究发现,基于Transformer的DeBERTa模型在检测钓鱼内容方面表现最佳,其召回率高达95.17%,而GPT-4的召回率为91.04%。此外,研究者还探讨了这些模型在生成钓鱼邮件方面的挑战,并评估了它们在这一背景下的性能。研究结果为未来加强网络安全措施提供了宝贵的见解,有助于更有效地检测和应对钓鱼威胁。

链接:

https://arxiv.org/abs/2406.06663

5. 探索大语言模型(GPT-4)在二进制逆向工程中的有效性

简介:本研究探讨了大语言模型(LLMs),特别是GPT-4,在二进制逆向工程(RE)领域的应用能力。通过结构化的实验方法,研究者分析了LLMs在解释人类编写的和反编译的代码方面的性能。研究包括两个阶段:第一个阶段关注基本代码解释,第二个阶段则涉及更复杂的恶意软件分析。关键发现表明,LLMs在一般代码理解方面表现出色,但在详细的技术和安全分析方面效果各异。

研究强调了LLMs在逆向工程中的潜力和当前的局限性,为未来应用和改进提供了关键的见解。此外,研究者还检查了实验方法,如评估方法和数据限制,为研究者未来在此领域的研究活动提供了技术视野。

链接:

https://arxiv.org/abs/2406.06637

6. OccamLLM:单步快速精确语言模型算术

简介:为了提高大语言模型(LLMs)在执行复杂算术运算时的准确性,研究者提出了一种新框架,该框架允许在单个自回归步骤中进行精确的算术运算。通过利用LLM的隐藏状态来控制符号架构,研究者的方法在单个算术运算上达到了100%的准确率,与GPT-4相当,甚至在多步骤推理问题上也超过了Llama 3 8B Instruct和GPT-3.5 Turbo。该方法不仅提高了速度和安全性,还保持了LLM的原有能力。研究者计划不久后公开代码,以促进更广泛的研究和应用。

链接:

https://arxiv.org/abs/2406.06576

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1837704.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

怎样搭建serveru ftp个人服务器

首先说说什么是ftp? FTP协议是专门针对在两个系统之间传输大的文件这种应用开发出来的,它是TCP/IP协议的一部分。FTP的意思就是文件传输协议,用来管理TCP/IP网络上大型文件的快速传输。FTP早也是在Unix上开发出来的,并且很长一段…

【linux】内核从tcp层调用IP层摸索中

合入代码: 登录 - Gitee.com 这是运行日志: https://gitee.com/r77683962/linux-6.9.0/raw/master/test_log/kern_tcp_ip.log 日志截取部分(也不知道对不对,凭感觉走。。。。)

「51媒体」电视台媒体邀约采访报道怎么做?

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 电视台作为地方主流媒体,对于新闻报道有着严格的选题标准和报道流程。如果您希望电视台对某个会议或活动进行报道,可以按这样的方法来做: 1.明确活动信…

BizDevOps全局建设思路:横向串联,纵向深化

本文来自腾讯蓝鲸智云社区用户:CanWay BizDevOps概述 IT技术交付实践方法在不断迭代中持续优化。在工业化时代,Biz(业务)、Dev(开发)、Ops(运维)三者往往相对分离,甚至有…

Python3 Matplotlib展示数据

matplotlib 是一个 Python 库,用于创建各种类型的图表和可视化。它提供了一个类似于 MATLAB 的绘图界面,使用户能够轻松地绘制线图、散点图、直方图、饼图等各种图表类型。matplotlib 可以在 Python 脚本、IPython shell、Jupyter Notebook 等环境中使用…

《梦醒蝶飞:释放Excel函数与公式的力量》3.3常用数学函数:AVERAGE

3.3常用数学函数:AVERAGE 在Excel中,AVERAGE 函数用于计算一系列数值的平均值。这个函数在数据分析中非常有用,因为它可以快速提供数值集的中心趋势。 1)基本语法: AVERAGE(range) 或者 AVERAGE(number1,[number2,...]) ran…

Jetpack Compose_Alignment对其+Arrangement排列

文章目录 1.Alignment 对齐1.1Alignment 对齐方式1.2AbsoluteAlignment 绝对对齐1.3BiasAlignment 偏差对齐1.4BiasAbsoluteAlignment偏差绝对对齐 2.Arrangement 排列2.1Arrangement 排列方式2.2Arrangement.Horizontal2.3Arrangement.Vertical 1.Alignment 对齐 1.1Alignmen…

Linux之旅: 基础知识点的终极指南

文章目录 1、Linux的目录结构2、ls命令3、管理文件和目录4、linux命令使用细节和技巧5、权限管理基本命令6、搜索命令7、管道符与重定向8、压缩和解压命令9、用户及vim编辑器10、用户和用户组管理一、Linux系统用户账号的基本管理二、Linux系统用户组的管理 1、Linux的目录结构…

大数据集群离线解析经纬度逆编码地址

背景 最近有个需要需求把经纬度解析为地址,那么通常解析地址市面上流行的方案就是调取百度、高德地图的接口进行解析。 难点 但是在用这个方案遇到一个问题就是企业认证的百度地图每天的逆编码解析为300w次,qps为100次/秒,对于日增上千万的…

2025年计算机毕业设计题目参考-简单容易

2025年最新计算机毕业设计题目参考-第二批 以下可以参考 企业员工薪酬关系系统的设计 基于SpringBoot在线远程考试系统 SpringBootVue的乡政府管理系统 springboot青年公寓服务平台 springboot大学生就业需求分析系统 基于Spring Boot的疗养院管理系统 基于SpringBoot的房屋交…

MySQL全解(基础)-(MySQL的安装与配置,数据库基础操作(CRUD,聚合,约束,联合查询),索引,事务)

MySQL安装与配置 1.数据库介绍 存储数据用文件就可以了,为什么还要弄个数据库? 文件保存数据有以下几个缺点: 文件的安全性问题 文件不利于数据查询和管理 文件不利于存储海量数据 文件在程序中控制不方便数据库存储介质: 磁盘 内存 为了…

从ITIL,CMMI到DevOps的实践与思考

点击进入IT管理资料库 在信息技术迅猛发展的今天,企业对IT运维和管理的要求越来越高。从最早的ITIL,到后来的CMMI,再到现在风靡全球的DevOps,每一个管理框架的出现都代表着一种新的思维和实践模式。ITIL帮助企业建立起系统的IT服…

微信小程序生命周期分为3种:页面级别,应用级别,组件级别

应用级别: onLaunch,onShow,onHide 页面级别:onLoad,onShow,onReady,onHide,onUnload 组件级别:

Webmin介绍与安装

文章目录 前言定义与功能:支持的操作系统:功能特性:插件与模块:使用场景:特点:安装与配置:总结 前言 Webmin是一款功能强大的基于Web的Unix系统管理工具 定义与功能: Webmin允许管…

HTTP性能测试工具-wrk

wrk性能测试工具详解 wrk是一款轻量级但功能强大的HTTP基准测试工具,主要用于在单机多核CPU环境下对HTTP服务进行性能测试。它通过利用系统自带的高性能I/O机制(如epoll、kqueue等),结合多线程和事件模式,能够产生大量…

SpringMVC系列五: SpringMVC映射请求数据

SpringMVC映射请求数据 💞获取参数值说明应用实例 💞获取http请求消息头💞获取JavaBean对象使用场景说明应用实例注意事项和细节 💞获取servlet api说明应用实例注意事项和细节 上一讲, 我们学习的是SpringMVC系列四: Rest-优雅的…

「51媒体」上海电视台媒体邀约专访怎么做?

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 电视台专访通常会对一些热门话题,行业热点,或者新闻焦点,邀请嘉宾进行访谈。企业如果想要在电视台进行专访,通常要有合适的时机和选题。 下…

WordPress插件数据库批量替换内容工具插件

1、安装插件后,我们就可以在后台菜单看到工具操作界面 2、目前支持网站内容、标题、评论指定字符的快速替换 3、可以快速解决以往我们需要从MYSQL数据库命令替换的烦恼

YOLOv8旋转目标检测Yolov8n-obb详细实例+rolabelimg

一、Yolov8环境搭建 首先创建虚拟环境下载安装(其实就是yolov8的环境)再大概写一下步骤,没有想详细的看本人另外一篇:YOLOv8环境搭建_yolov8环境配置-CSDN博客 1、下载安装anaconda 2、创建虚拟环境 conda create -n my_yolov8…

JavaFX HTMLEditor

HTMLEditor控件是一个富文本编辑器,具有以下功能。 粗体斜体下划线删除线字体系列字体大小前景色背景颜色缩进项目符号列表编号列表对齐水平线复制文本片段粘贴文本片段 HTMLEditor类返回HTML字符串中的编辑内容。 创建HTML编辑器 import javafx.application.App…