开源 LLM 安全扫描器

开源 LLM 安全扫描器

news2025/1/12 4:05:18

Vigil 是一款开源安全扫描程序，可检测即时注入、越狱以及对大型语言模型(LLM) 的其他潜在威胁。

当攻击者使用专门设计的输入成功影响 LLM 时，就会出现即时注入。这导致 LLM 无意中实现了攻击者设定的目标。

LLM安全扫描仪

我对 LLM 的可能性感到非常兴奋，但也注意到围绕它们构建的应用程序以及我们允许应用程序访问的数据需要更好的安全实践。

这个项目给了我一个很好的机会在人工智能和网络安全的交叉点上构建一些东西。希望它能为其他安全研究人员和开发人员提供一个尝试现有的 LLM 输入和输出安全措施，甚至创建自己的安全措施的开始。

Vigil 的创建者 Adam M. Swanda 告诉我们，这比期望直接在生产中使用的任何东西都更有“可能”。

Vigil LLM 安全扫描仪亮点

模块化和可扩展的设计
支持YARA（启发式）、矢量数据库相似性、变压器模型、提示响应相似性
只需很少的代码即可添加自定义扫描仪
自托管或使用 OpenAI
提供嵌入数据集和 YARA 签名
当扫描仪阈值匹配时，Vector DB 可以根据检测到的提示自动更新
非常可配置（启用/禁用扫描仪、修改阈值、使用不同的嵌入模型等）
通过添加自定义扫描仪、新的 YARA 签名或更新矢量数据库来轻松扩展

Vigil 可在 GitHub 上下载。该存储库还提供开始自托管所需的检测签名和数据集。

Swanda 计划在短期内继续开发 Vigil。

具体来说，他一直在开发一个应用程序，旨在根据自定义数据集评估 Vigil 及其各种扫描仪。

该应用程序评估误报和其他相关指标等方面。

此外，Swand 正在探索检测基于图像的提示注入的方法。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1276268.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

MFC、VC++操作excel后，excel程序进程无法正常退出的非暴力处理方法

MFC、VC++操作excel后，excel程序进程无法正常退出的非暴力处理方法

先说处理方式 1、最low的方式：强制结束进程 //打开进程得到进程句柄 HANDLE hProcessOpenProcess(PROCESS_ALL_ACCESS,FALSE,Pid); if(hProcess!NULL) { //结束进程 if (TerminateProcess(hProcess,0)){printf("结束进程成功\n");return 0;} }这种方式…

阅读更多...

【Linux系统化学习】揭秘命令行参数 | 环境变量

【Linux系统化学习】揭秘命令行参数 | 环境变量

个人主页点击直达：小白不是程序媛 Linux专栏：Linux系统化学习代码仓库：Gitee 目录命令行参数环境变量 PATH 查看PATH $PWD 查看环境变量PWD $HOME 查看系统支持的环境变量获取环境变量命令行参数在C/C编程语言中我们有一个…

阅读更多...

hls实现播放m3u8视频将视频流进行切片 HLS.js简介

hls实现播放m3u8视频将视频流进行切片 HLS.js简介

github官网GitHub - video-dev/hls.js: HLS.js is a JavaScript library that plays HLS in browsers with support for MSE.HLS.js is a JavaScript library that plays HLS in browsers with support for MSE. - GitHub - video-dev/hls.js: HLS.js is a JavaScript library …

阅读更多...

Redis——某马点评day01——短信登录

Redis——某马点评day01——短信登录

项目介绍导入黑马点评项目项目架构基于Session实现登录基本流程实现发送短信验证码功能 controller层中 /*** 发送手机验证码*/PostMapping("code")public Result sendCode(RequestParam("phone") String phone, HttpSession session) {// 发送短信…

阅读更多...

2024 年综合网络安全审计清单

2024 年综合网络安全审计清单

在网络威胁不断演变的时代，确保组织数据和系统的安全至关重要。全面的网络安全审核清单可以在实现这一目标方面发挥关键作用。但是，什么才是有效的网络安全审核清单呢？以及如何对其进行定制以满足您组织的独特需求？ 了解网络安…

阅读更多...

Linux部署elasticsearch集群

Linux部署elasticsearch集群

文章目录一、集群规划二、安装前准备(所有节点操作)创建数据目录修改系统配置文件/etc/sysctl.conf创建用户组设置limits.conf 三、初始化配置(在节点1上操作)下载安装包解压安装包修改jvm.options文件下配置的所占内存修改集群配置文件elasticsearch.yml将安装包传到另外两个…

阅读更多...

Python将excel模板复制到新的excel中，然后插入新数据导出

Python将excel模板复制到新的excel中，然后插入新数据导出

import copy import datetime import numpy import time import openpyxl import pymssql import requests import json from requests_toolbelt import MultipartEncoder from urllib import parse import os # 要想使用路径相关功能需要导入 os 模块 from apscheduler.sched…

阅读更多...

NXP iMX8M Plus Qt5 双屏显示

NXP iMX8M Plus Qt5 双屏显示

By Toradex胡珊逢简介双屏显示在显示设备中有着广泛的应用，可以面向不同群体展示特定内容。文章接下来将使用 Verdin iMX8M Plus 的 Arm 计算机模块演示如何方便地在 Toradex 的 Linux BSP 上实现在两个屏幕上显示独立的 Qt 应用。硬件介绍 Verdin iMX8M Plu…

阅读更多...

2024年甘肃省职业院校技能大赛中职组电子与信息类“网络安全”赛项竞赛样题-B卷

2024年甘肃省职业院校技能大赛中职组电子与信息类“网络安全”赛项竞赛样题-B卷

2024 年甘肃省职业院校技能大赛中职组电子与信息类“网络安全”赛项竞赛样题-B卷 2024 年甘肃省职业院校技能大赛中职组电子与信息类“网络安全”赛项竞赛样题-B卷A 模块基础设施设置/安全加固（200 分）A-1：登录安全加固（Windows…

阅读更多...

【漏洞复现】智跃人力资源管理系统GenerateEntityFromTable.aspx接口存在SQL注入漏洞附POC

【漏洞复现】智跃人力资源管理系统GenerateEntityFromTable.aspx接口存在SQL注入漏洞附POC

漏洞描述智跃人力资源管理系统是基于B/S网页端广域网平台，一套考勤系统即可对全国各地多个分公司进行统一管控，成本更低。信息共享更快。跨平台，跨电子设备。智跃人力资源管理系统GenerateEntityFromTable.aspx接口处存在SQL注入漏洞，攻击者可通过该漏洞获取数据库中的信…

阅读更多...

『 Linux 』环境变量

『 Linux 』环境变量

文章目录 🚀什么是环境变量🚀🚀查看环境变量🚀🕹️和环境变量有关的命令🕹️ 🚀PATH环境变量🚀🕹️设置PATH环境变量🕹️ 🚀HOME环境变量&#x1…

阅读更多...

手敲单链表，简单了解其运行逻辑

手敲单链表，简单了解其运行逻辑

1. 链表 1.1 结构组成链表是一种物理存储结构上非连续存储结构，数据元素的逻辑顺序是通过链表中的引用链接次序实现的。链表的结构如下图所示，是由很多个节点相互通过引用来连接而成的；每一个节点由两部分组成，分别数据域&…

阅读更多...

【LeetCode每日一题合集】2023.11.20-2023.11.26 （二叉树中的伪回文路径）

【LeetCode每日一题合集】2023.11.20-2023.11.26 （二叉树中的伪回文路径）

文章目录 53. 最大子数组和解法1——DP解法2——分治（维护区间、类似线段树的思想） 2216. 美化数组的最少删除数（贪心）2304. 网格中的最小路径代价1410. HTML 实体解析器（模拟）2824. 统计和小于目标的下标对…

阅读更多...

iOS Class Guard 成功了，但无法区分差异

iOS Class Guard 成功了，但无法区分差异

我正在开发一个静态库，并使用 Polidea 的 iOS Class Guard 来混淆我的静态库。我按照步骤在项目的根路径中下载 obfuscate_project，更改其中所需的名称，最后在终端中运行 bash obfuscate_project。我收到一条消息，说我的构建成…

阅读更多...

【漏洞复现】大华智慧园区综合管理平台deleteFtp接口远程命令执行

【漏洞复现】大华智慧园区综合管理平台deleteFtp接口远程命令执行

漏洞描述大华智慧园区综合管理平台deleteFtp接口存在远程命令执行，攻击者可利用该漏洞执行任意命令，获取服务器控制权限。免责声明技术文章仅供参考，任何个人和组织使用网络应当遵守宪法法律，遵守公共秩序，尊重社会公德，不得利用网络从事危害国家安全、荣誉和利益…

阅读更多...

CMMI认证含金量高吗

CMMI认证含金量高吗

一、CMMI认证含金量解答 CMMI，即能力成熟度模型集成，是由美国卡内基梅隆大学软件工程研究所开发的一种评估企业软件开发过程成熟度的模型。CMMI认证的含金量究竟高不高呢？答案是肯定的。CMMI认证被誉为软件开发行业的“金牌标准”&#xff0…

阅读更多...

spring cloud gateway源码分析，一个请求进来的默认处理流程

spring cloud gateway源码分析，一个请求进来的默认处理流程

1.前言 spring cloud gateway的基本组成和作用就不细赘述，此篇适合对此有一定了解的人阅读。 spring cloud gateway版本: Hoxton.SR1 spring cloud gateway的配置使用yml配置： server:port: 9527y#根据微服务名称进行动态路由的配置 spring:applicati…

阅读更多...

zookeeper心跳检测（实操课程）

zookeeper心跳检测（实操课程）

本系列是zookeeper相关的实操课程，课程测试环环相扣，请按照顺序阅读来学习和测试zookeeper。阅读本文之前，请先阅读----zookeeper 单机伪集群搭建简单记录（实操课程系列）zookeeper 客户端常用命令简单记录…

阅读更多...

人工智能-优化算法之学习率调度器

人工智能-优化算法之学习率调度器

学习率调度器到目前为止，我们主要关注如何更新权重向量的优化算法，而不是它们的更新速率。然而，调整学习率通常与实际算法同样重要，有如下几方面需要考虑： 首先，学习率的大小很重要。如果它太大&#xf…

阅读更多...

知识管理平台Confluence：win10安装confluence

知识管理平台Confluence：win10安装confluence

文章目录介绍主要功能安装教程安装java运行平台JRE安装数据库Postgresql在Postgresql创建confluence使用的数据库创建数据库用户创建数据库安装confluence注册confluence启动confluence 参考链接介绍 Confluence 是由澳大利亚软件公司 Atlassian 开发的企业协作平台。它提…

阅读更多...

推荐文章

最新文章