Microsoft 发布 PyRIT - 生成式 AI 的红队工具

news2025/1/10 17:13:48

图片

微软发布了一个名为PyRIT(Python风险识别工具的缩写)的开放访问自动化框架,用于主动识别生成式人工智能(AI)系统中的风险。

这个红队工具旨在“使全球的每个组织都能够负责任地利用最新的人工智能进步进行创新”,微软的AI红队负责人Ram Shankar Siva Kumar说。

图片

该公司表示,PyRIT可以用于评估大型语言模型(LLM)端点对不同攻击类别的鲁棒性,例如捏造(例如幻觉)、滥用(例如偏见)和禁止内容(例如骚扰)。

它还可以用于识别安全风险,从恶意软件生成到越狱,以及隐私风险,如身份盗窃。

PyRIT带有五个接口:目标、数据集、评分引擎、支持多种攻击策略的能力,以及包含一个JSON或数据库形式的记忆组件,用于存储中间输入和输出交互。

评分引擎还提供了两种不同的评分目标AI系统输出的选项,允许红队成员使用传统的机器学习分类器或利用LLM端点进行自我评估。

“目标是让研究人员有一个基准,了解他们的模型和整个推理管道在不同伤害类别中的表现如何,并能够将这个基准与他们模型的未来迭代进行比较,”微软说。

图片

“这使他们能够获得关于他们模型今天表现如何的经验数据,并基于未来改进检测性能的任何退化。”

尽管如此,这家科技巨头谨慎地强调,PyRIT不是替代生成式AI系统的手动红队评估,而是补充红队现有的领域专业知识。

换句话说,这个工具旨在通过生成可能用于评估AI系统的提示来突出风险“热点”,并标记需要进一步调查的区域。

微软进一步承认,红队评估生成式AI系统需要同时探测安全和负责任的AI风险,而且这个过程更具概率性,同时也指出了生成式AI系统架构之间的广泛差异。

“手动探测虽然耗时,但通常需要用于识别潜在的盲点,”Siva Kumar说。“自动化需要用于扩展,但不能替代手动探测。”

这一发展是在Protect AI披露了流行AI供应链平台(如ClearML、Hugging Face、MLflow和Triton Inference Server)中的多个关键漏洞之后,这些漏洞可能导致任意代码执行和敏感信息泄露。

工具地址:https://github.com/Azure/PyRIT

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2185547.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ros2 自定义工作空间添加source

新建一个工作空间:ros2 create pkg~~~~~~~~~~~~ colcon build之后 ,在install文件夹里面有一个 setup,bash文件 将这个文件添加到 bashrc gedit .bashrc 这样 在一个新终端中可以直接运行ros2 run package name (包名) 可执行…

消息中间件---初识(Kafka、RocketMQ、RabbitMQ、ActiveMQ、Redis)

1. 简介 消息中间件是一种支撑性软件系统,它在网络环境中为应用系统提供同步或异步、可靠的消息传输。消息中间件利用高效可靠的消息传递机制进行与平台无关的数据交流,并基于数据通信来进行分布式系统的集成。它支持多种通信协议和数据格式,…

CompletableFuture常用方法

一、获得结果和触发计算 1.获取结果 &#xff08;1&#xff09;public T get() public class CompletableFutureAPIDemo{public static void main(String[] args) throws ExecutionException, InterruptedException{CompletableFuture<String> completableFuture Com…

OpenAI 推理模型 O1 研发历程:团队访谈背后的故事

在 2024 年&#xff0c;OpenAI 推出了具有突破性推理能力的 O1 模型&#xff0c;自发布以来&#xff0c;这款新型 AI 模型引发了技术界的广泛关注。与 GPT-4 等大语言模型不同&#xff0c;O1 不仅具备处理复杂问题的能力&#xff0c;还能模拟人类思考过程&#xff0c;从而提高推…

告别 backtrader!换这个库实施量化回测

作者:老余捞鱼 原创不易,转载请标明出处及原作者。 写在前面的话: 在算法交易的领域,拥有一个强大的回测和策略分析工具至关重要。Vectorbt 已成为最有效且多功能的 Python 库之一。这款开源工具允许交易者在历史数据上测试策略、优化参数,并进行详尽的投资组合和风…

差分(续前缀和)(含一维二维)

题目引入 开发商小 Q 买下了一条街&#xff0c;他想在这条街的一边盖房子。 街道可以抽象为一条数轴&#xff0c;而小 Q 只会在坐标在 1~n 的范围内盖房子。 首先&#xff0c;小 Q 将街上坐标在 1∼ &#x1d45b;1∼ n 范围内的物体全部铲平。也就是说&#xff0c;在正式动工盖…

Kubernetes环境搭建

华子目录 Kubernetes部署说明环境准备工作主机准备harbor搭建k8s集群中的主机名和ip设定k8s集群中设置hosts解析k8s中的所有节点关闭防火墙和selinuxk8s集群中禁用swap分区k8s集群中安装docker-cek8s集群中下载harbor证书k8s集群中配置harbor镜像加速器 k8s节点登录harbor测试 …

当人工智能拥抱餐饮业,传统与创新的交融

大家好&#xff0c;我是Shelly&#xff0c;一个专注于输出AI工具和科技前沿内容的AI应用教练&#xff0c;体验过300款以上的AI应用工具。关注科技及大模型领域对社会的影响10年。关注我一起驾驭AI工具&#xff0c;拥抱AI时代的到来。 今天我们要聊一个充满烟火气的行业&#x…

C++进阶知识 AVL树实现

AVL树 1. AVL的概念2. AVL树的实现2.1 AVL树的结构2.2 AVL树的插⼊2.2.1 AVL树插⼊⼀个值的⼤概过程2.2.2 平衡因⼦更新 2.3 旋转2.3.1 旋转的原则2.3.2 右单旋2.3.4 左单旋2.3.5 左右双旋 3.代码实现 1. AVL的概念 • AVL树是最先发明的⾃平衡⼆叉查找树&#xff0c;AVL是⼀颗…

Linux Debian12使用Podman安装bwapp靶场环境

一、bwapp简介 bWAPP&#xff08;buggy Web Application&#xff09;是一个开源的、故意设计有漏洞的Web应用程序&#xff0c;旨在帮助安全爱好者、开发人员和学生发现和防止Web漏洞。它包含了超过100种不同的漏洞&#xff0c;涵盖了所有主要的已知Web漏洞。 二、bwapp下载 …

C++系列-多态

&#x1f308;个人主页&#xff1a;羽晨同学 &#x1f4ab;个人格言:“成为自己未来的主人~” 多态 多态就是不同类型的对象&#xff0c;去做同一个行为&#xff0c;但是产生的结果是不同的。 比如说&#xff1a; 都是动物叫声&#xff0c;猫是喵喵&#xff0c;狗是汪汪&am…

安装图片标识工具anylabeling

目录 下载压缩包 创建环境 安装opencv 安装第三方库 运行setup.py文件 安装过程可能会出现的错误&#xff1a; 错误1 错误2 安装完成 图标更换 之前提到的嵌入式开发】可编程4k蓝牙摄像头点击器还可以训练模型&#xff0c;使图像识别精度提高 现在讲解&#xff0c;如…

wsl(4) -- 编译驱动模块

1. 内核源码 编译模块需要内核源码信息&#xff0c;wsl是修改过的内核无法使用下面的命令从标准镜像源上下载内核源码信息。 sudo apt-get install kernel-headers-$(uname -r) sudo apt-get install kernel-devel-$(uname -r)2. 下载wsl内核源码 可以考虑下载wsl的源码重新…

【分页】Spring Boot 列表分页 + javaScript前台展示

后端&#xff1a; 准备好查询实体与分页实体 1、分页工具实体 package com.ruoyi.dms.config;import com.alibaba.nacos.api.model.v2.Result; import lombok.Data;import java.io.Serializable; import java.util.List;/*** author 宁兴星* description: 列表返回结果集*/ …

信息学奥赛复赛复习09-CSP-J2020-03表达式求值前置知识点-中缀表达式求值、模运算、模运算性质、栈

PDF文档回复:20241002 **1 P1981 [NOIP2013普及组] 表达式求值 ** [题目描述] 给定一个只包含加法和乘法的算术表达式&#xff0c;请你编程计算表达式的值 [输入格式] 一行&#xff0c;为需要你计算的表达式&#xff0c;表达式中只包含数字、加法运算符 “” 和乘法运算符 …

C/C++语言基础--C++IO流、输入输出流、文件流、字符串流、重定向流等详解

本专栏目的 更新C/C的基础语法&#xff0c;包括C的一些新特性 前言 流思想&#xff0c;我认为在计算机中是一个很重要的思想&#xff0c;因为计算机、编程无非就是获取数据&#xff0c;然后对数据进行操作&#xff1b;C给主要给我们提供了3种流&#xff0c;输入输出流、文件流…

react-问卷星项目(4)

项目实战 使用CSS 尽量不要使用内联CSS 内联style代码多&#xff0c;性能差&#xff0c;扩展性差外链css文件可复用代码&#xff0c;可单独缓存文件 元素内联style 和HTMl元素的style相似必须用JS写法&#xff0c;不能是字符串&#xff0c;里面必须是对象 <span style…

# VirtualBox中安装的CentOS 6.5网络设置为NAT模式时,怎么使用SecureCRT连接CentOS6.5系统?

VirtualBox中安装的CentOS 6.5网络设置为NAT模式时&#xff0c;怎么使用SecureCRT连接CentOS6.5系统&#xff1f; 一、查询 【VirtualBox Host-Only Network】虚拟网卡的网络配置 IP。 1、按键盘上WIN R 组合键&#xff0c;打开【运行】&#xff0c;输入【 ncpa.cpl 】&…

C0012.Clion改用VS编译器开发Qt界面

1.VS编译器添加 2.配置MSVC2019环境变量 3.各种问题报错与解决 问题描述 warning C4819&#xff1a;该文件包含不能在当前代码页(936)中表示的字符。解决办法 在CMakeLists.txt中添加如下代码 # 如下代码只在使用VS编译器时需要&#xff0c;使用mingw32编译器时需要注释掉 #…

利用Numpy实现全连接神经网络实验分析

一、实验要求 用 python 的 numpy 模块实现全连接神经网络。网络结构为一个输入层、一个隐藏层、一个输出层。隐藏层的激活函数为 Relu 函数&#xff0c;输出层的激活函数为 softmax 函数&#xff0c;损失函数为交叉熵。 二、实验目的 学会构建一个简单的全连接神经网络模型学…