第68期 | GPTSecurity周报

news2024/9/25 14:04:42

图片

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

1. 代码漏洞检测:新兴大语言模型的比较分析

简介:由于对开源项目的高度依赖,软件开发中漏洞问题日益增长的趋势最近受到了相当大的关注。研究者对大语言模型(LLMs)在识别代码库中的漏洞方面的有效性进行了研究,重点关注 LLM 技术的最新进展。通过比较分析,研究者评估了新兴的大语言模型,即 Llama、CodeLlama、Gemma 和 CodeGemma 的性能,并与已有的先进模型如 BERT、RoBERTa 和 GPT-3 进行了对比。研究者的研究旨在揭示大语言模型在漏洞检测方面的能力,为提高不同开源存储库中的软件安全实践做出贡献。研究者观察到,在用于检测软件安全漏洞的大语言模型的最新成员中,CodeGemma 实现了最高的 F1 分数 58 和召回率 87。

链接:

https://arxiv.org/abs/2409.10490

2. 基于大语言模型的代码补全工具的安全攻击

简介:大语言模型的快速发展催生了新一代基于大语言模型的代码补全工具(LCCTs)。研究者指出,LCCTs 有独特的工作流程,将多个信息源作为输入,并优先考虑代码建议而非自然语言交互,这引入了独特的安全挑战,且常依赖专有代码数据集训练,易致敏感数据泄露。研究者针对越狱和训练数据提取攻击这两种安全风险,开发攻击方法。实验结果显示,对 GitHub Copilot 越狱攻击成功率达 99.4%,对 Amazon Q 为 46.3%,还从 GitHub Copilot 提取出敏感用户数据。研究表明,基于代码的攻击方法对通用大语言模型也有效,凸显安全问题。这些发现强调了 LCCTs面临的安全挑战,也为加强其安全框架提供方向。

链接:

https://arxiv.org/abs/2408.11006

3. 大语言模型作为端到端的安全代码生成器的效果如何?

简介:大语言模型(如 GPT-4)的快速发展改变了软件工程格局。研究者对大语言模型作为端到端安全代码生成器的效果展开研究。他们研究了 GPT-3.5 和 GPT-4 识别和修复包括自身在内的四种流行大语言模型生成代码中漏洞的能力。通过审查 4900 段代码,发现大语言模型缺乏对场景相关安全风险的认识,生成超 75%有漏洞代码,且无法准确识别自身生成代码中的漏洞。在修复其他模型生成的不安全代码时成功率为 33.2%至 59.6%,但修复自身代码表现不佳。为解决单次修复局限性,研究者开发轻量级工具,借助语义分析引擎,将修复成功率提高到 65.9%至 85.5%。该研究为提升大语言模型生成安全代码的能力提供了方向。

链接:

https://arxiv.org/abs/2408.10495

4. CodeMirage:大语言模型生成代码中的幻觉

简介:大语言模型在程序生成和无代码自动化方面展现出巨大潜力,但容易产生幻觉。研究者指出,虽然文本生成中大语言模型幻觉的研究很多,但代码生成中也存在类似现象,如生成的代码可能有语法、逻辑错误及安全漏洞等问题。鉴于其广泛应用,研究代码生成中的幻觉势在必行。研究者首次尝试研究此问题,引入代码幻觉定义和分类法,提出基准数据集 CodeMirage,包含 GPT-3.5 为 Python 编程问题生成的幻觉代码片段。他们还提出检测方法,对 CodeLLaMA、GPT-3.5 和 GPT-4 等模型进行实验,发现 GPT-4 在 HumanEval 数据集上表现最佳,在 MBPP 数据集上与微调后的 CodeBERT 基线相当。最后,研究者讨论了缓解代码幻觉的策略并总结了工作。

链接:

https://arxiv.org/abs/2408.08333

5. 用于高效入侵检测系统的 Transformer 和大语言模型:全面综述

简介:随着 Transformer 大语言模型取得重大进步,自然语言处理在文本生成和用户交互方面能力增强,拓展至众多领域,其中网络安全领域受益颇丰。网络安全中许多需保护和交换的参数以文本和表格数据形式存在,使自然语言处理成为增强通信协议安全措施的有力工具。本综述全面分析 Transformer 和大语言模型在网络威胁检测系统中的应用。介绍了论文选择方法和文献计量分析框架,讨论了 Transformer 基础,包括网络攻击背景信息和常用数据集。探索其在入侵检测系统中的应用,涵盖多种架构,如基于注意力的模型、BERT 和 GPT 等大语言模型、CNN/LSTM-Transformer 混合模型及新兴的 ViTs 等。还探讨了其在不同环境和应用中的实现,包括计算机网络、物联网等。同时指出研究挑战和未来方向,如可解释性等问题。最后总结成果,强调其重要性并提出进一步研究方向。

链接:

https://arxiv.org/abs/2408.07583

6. 用于安全代码评估的大语言模型:多语言实证研究

简介:研究者指出,大多数漏洞检测研究集中在 C/C++代码漏洞数据集,语言多样性不足,深度学习方法包括大语言模型在其他语言软件漏洞检测中的有效性尚待探索。为此,他们使用不同提示和角色策略,评估六种先进预训练大语言模型(GPT-3.5-Turbo、GPT-4 Turbo、GPT-4o、CodeLlama-7B、CodeLlama-13B 和 Gemini 1.5 Pro)在五种编程语言(Python、C、C++、Java 和 JavaScript)中检测和分类通用弱点枚举(CWE)的有效性。研究者编译多语言漏洞数据集以确保代表性,结果显示 GPT-4o 在少样本设置下漏洞检测和 CWE 分类得分最高。此外,他们还开发了与 VSCode 集成的 CODEGUARDIAN 库,通过涉及 22 位行业开发人员的用户研究表明,使用该库可使开发人员更准确快速地检测漏洞。

链接:

https://arxiv.org/abs/2408.06428

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2163745.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【YashanDB知识库】如何配置jdbc驱动使getDatabaseProductName()返回Oracle

本文转自YashanDB官网,具体内容请见https://www.yashandb.com/newsinfo/7352676.html?templateId1718516 问题现象 某些三方件,例如 工作流引擎activiti,暂未适配yashandb,使用中会出现如下异常: 问题的风险及影响 …

【YashanDB知识库】查询YashanDB表空间使用率

本文转自YashanDB官网,具体内容请见https://www.yashandb.com/newsinfo/7369203.html?templateId1718516 【问题分类】功能使用 【关键字】表空间,使用率 【问题描述】YashanDB使用过程中,如何查询表空间的使用率 【问题原因分析】需要查…

NTPD使用/etc/ntp.conf配置时钟同步详解

NTPD使用/etc/ntp.conf配置时钟同步详解 引言安装NTPD配置/etc/ntp.conf1. 权限控制(restrict)2. 指定上层NTP服务器(server)3. 本地时间服务器(可选)启动NTPD服务验证时间同步ntpd服务默认多长时间同步一次ntp.conf上如何配置同步的频率和间隔配置步骤注意事项结论引言 …

虚拟数据架构能否取代传统数据架构?

虚拟数据架构能否取代传统数据架构? 前言虚拟数据架构能否取代传统数据架构 前言 数据虚拟化能够将分散在不同地方的数据整合起来,形成一个统一的视图,让数据同学能够更轻松地访问和分析这些数据。就像是把一堆杂乱无章的拼图碎片拼成了一幅…

从前端到全栈,你只差这款神器!

作为一名前端开发者,你是否也遇到过这样的困扰:界面做好了,功能完成了一半,却因为没有后端支持而卡住了进度?想自己搭建服务器,发现耗时耗力,学习曲线陡峭,最后项目拖延、效率大打折…

瑞芯微RK3566鸿蒙开发板Android11修改第三方输入法为默认输入法

本文适用于触觉智能所有支持Android11系统的开发板修改第三方输入法为默认输入法。本次使用的是触觉智能的Purple Pi OH鸿蒙开源主板,搭载了瑞芯微RK3566芯片,类树莓派设计,是Laval官方社区主荐的一款鸿蒙开发主板。 一、安装输入法并查看输入…

mysql如何快速编写单表查询语句

目录 背景生成sql语句 背景 我们在编写查询语句的时候,都提倡需要用到哪些字段就查哪些字段,这样有两个好处:1、可以增加程序运行效率,2、可以避免无关字段被暴露。那我们一个字段一个字段写就比较烦,有没有方法快速生…

优化 Go 语言数据打包:性能基准测试与分析

场景:在局域网内,需要将多个机器网卡上抓到的数据包同步到一个机器上。 原有方案:tcpdump -w 写入文件,然后定时调用 rsync 进行同步。 改造方案:使用 Go 重写这个抓包逻辑及同步逻辑,直接将抓到的包通过网…

udig处理 shape地图中 数据显示

比如城市的名称的显示 udig新建project 新建Map 然后添加shape 修改 attribute 中文 为英文 没啥用,改不了 这里Label 勾选下,选择 市 拷贝XML 到geoserver style里面 参考 geoserver发布shp地图-CSDN博客

排序算法Java实现

文章目录 排序算法概述比较排序算法非比较排序算法稳定 vs 不稳定Java 中的排序 外部排序1) 冒泡排序2) 选择排序3) 堆排序4) 插入排序5) 希尔排序6) 归并排序递归实现时间复杂度非递归实现 7) 归并插入8) 快速排序随机基准点处理重复值 9) 计数排序10) 桶排序11) 基数排序 排序…

javaseday31多线程

什么是多线程 线程与进程 小结 并发和并行 并发 并行 小结 多线程的实现方式 方法一 public class Demo1 {public static void main(String[] args) {//使用多线程的第一种方法/*** 1、创建一个类继承Thread类* 2、并重写run方法* 3、创建子类对象,并启动线程*/M…

深度知识追踪(论文复现)

深度知识追踪(论文复现) 本文所涉及所有资源均在传知代码平台可获取 文章目录 深度知识追踪(论文复现)论文概述论文方法实验部分数据集实验步骤step1:安装环境依赖step2:下载数据集,将其变成one-hot编码step3:进行训练…

备战软考Day04-计算机网络

1、计算机网络的分类 2、七层网络体系结构 3、网络的设备与标准 4、TCP/IP协议族 TCP/IP作为Internet的核心协议,被广泛应用于局域网和广域网中,目前已成为事实上的国际标准 1、TCP/IP分层模型 TCP/IP协议是Internet的基础和核心,和OSI参考…

SqlSugar的where条件中使用可空类型报语法错误

SQLServer数据表中有两列可空列,均为数值类型,同时在数据库中录入测试数据,Age和Height列均部分有值。   使用SqlSugar的DbFirst功能生成数据库表类,其中Age、Height属性均为可空类型。   当Where函数中的检索条件较多时&a…

Web3技术在元宇宙中的应用:从区块链到智能合约

随着元宇宙的兴起,Web3技术正逐渐成为其基础,推动着数字空间的重塑。元宇宙不仅是一个虚拟世界,它还代表着一个由去中心化技术驱动的新生态系统。在这个系统中,区块链和智能合约发挥着至关重要的作用,为用户提供安全、…

cefsharp新版本OnBeforeResourceLoad 禁止http自动跳转https显示404错误解决办法 含代码

一、问题 因项目需要,域名没有ssl证书,结果http访问时被强制定向到https前缀,结果会显示404 测试版本cefsharp126.x (x64) 框架 CefSharp.WinForms.NETCore 二、代码(核心代码) 如果请求url是http,且目标是https时,则阻止请求 //判断请求变化 if (url.StartsWith(<…

[linux 驱动]regmap子系统详解与实战

目录 1 描述 2 结构体 2.1 regmap 2.2 regmap_bus 2.3 regmap_config 3 regmap 操作函数 3.1 regmap 申请与初始化 3.1.1 regmap_init_i2c 3.1.2 regmap_init_spi 3.1.3 regmap_exit 3.2 regmap 设备访问 API 函数 3.2.1 regmap_read 3.2.2 regmap_write 4 示例 1…

如何在NXP源码基础上适配ELF 1开发板的UART功能

UART即通用异步收发器&#xff0c;是一种支持全双工串行通信协议的接口。在i.MX6ULL处理器平台上&#xff0c;该处理器原生支持多达8路的UART接口&#xff0c;提供了丰富的串行通信能力。 针对ELF 1开发板&#xff0c;实际引出了4路UART接口供开发者使用&#xff0c;具体包括U…

艾默生电源维修ASTEC电源模块MP4-2Q-1E-4EE-0N

Emerson/ASTEC电源模块维修-艾默生/雅达电源维修MP1,MP4,MP6,MP8系列型号。 电源维修中&#xff0c;许多电源采用UC38系列8脚PWM组件&#xff0c;大多数电源不能工作都是因为电源启动电阻损坏&#xff0c;或芯片性能下降。当R断路后无VC&#xff0c;PWM组件无法工作&#xff0…

实现领域驱动设计(DDD)系列详解:集成限界上下文

一个项目中通常存在着多个限界上下文&#xff0c;并且我们需要在它们之间进行集成。 在上下文映射图中存在两种主要形式&#xff1a;一种是通过绘制一些简单的框图来展示它们之间的集成关系&#xff1b;另一种则是通过代码来实现这些集成关系。 到了具体的技术实现&#xff0…