AI风险管理新利器:SAIF CHECK利用Meta Llama 3保障合规与安全

news2024/10/6 6:51:14

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

随着人工智能越来越多地融入商业运营和日常生活,公司必须意识到潜在风险并遵守当地法律,否则可能面临严厉的后果,包括法律诉讼和巨额罚款。

虽然跟上风险变化不易,但却是必要的。位于沙特阿拉伯利雅得的公司SAIF CHECK (https://www.saifcheck.ai/)使用Meta Llama 3构建了一个模型评估系统,帮助解决这一挑战。SAIF CHECK与中东和北非地区的客户合作,提供评估、审计和认证服务,帮助公司检查其AI模型在法律、监管、隐私和数据安全方面的风险。

公司的一大工作部分是扫描全球监管环境,然后创建、获取和整理描述这些监管环境的具体文档。SAIF CHECK将这些发现整合到其不断增长的知识库中,涵盖各种监管领域。基于Llama 3的系统能够快速更新综合知识库,使机器代理能够理解客户AI模型的环境及其监管环境。通过使用在大量AI法规语料库上训练的检索增强生成(RAG)框架,该系统支持简便的对话查询,能够对用户的监管问题给出相关答案。

“SAIF CHECK的目标是使模型评估成为一个技术或非技术用户都能完成的对话工作流程,”SAIF CHECK的创始人兼CEO Shaista Hussain博士说,“我们已将Llama 3集成到一个系统中,该系统设计用于保留客户的独特业务背景(运营国家、监管机构),同时从多种来源检索和综合信息。”

保持上下文的幽灵注意力

SAIF CHECK团队首次关注到Llama是在阅读了2023年Llama 2团队发表的论文时。Hussain表示,他们特别感兴趣于Llama团队解决对话AI系统常见问题的方法——这些系统往往在对话过程中会忘记上下文。例如,如果告诉AI模型只用俳句回复,它可能在几次对话后就忘记这个初始指令,除非每次新请求时重复指令。重复指令会占用宝贵的tokens,限制对话的整体长度。

为解决这一问题,Llama团队开发了一种名为幽灵注意力(GAtt)的训练技术,使用人类反馈的强化学习来微调模型的响应,牢记初始指令。结果是,AI模型在多轮对话中更能保持初始指令。

“因为我们的AI模型评估调查在多次运行中进行,我们利用Llama的GAtt机制,帮助控制多轮对话的流程,”Hussain说,“通过这样做,我们的平台可以为用户提供更精确和信息丰富的响应,提高我们服务的输出质量。”

为了定制Llama以适应其用例,SAIF CHECK通过加法微调过程配置了多层。使用Llama 3 Instruct,生成层接收用户的提示和上下文,其输出被输入一个受SAIF CHECK综合知识库中各种监管机构和国家特定监管文档训练的监管分类器。这使得模型能够将提示和上下文分类到特定的国家和监管机构中。

通过伦理对齐建立信心

在了解了用于训练Llama的负责任AI原则后,团队决定使用Llama模型进行文本生成。Meta在蓝队和红队对其Llama模型进行显著努力,这让SAIF CHECK团队有信心Llama模型与他们的优先事项一致。

“使用Llama,我们在核心流程中使用了一个伦理训练和来源的模型,使我们的流程与我们的价值观一致,”Hussain说。

她承认,正确定位文档、查询它们以及生成适合每个人上下文和具体要求的响应仍然是挑战。

“每个机器学习模型都是不同的,每家公司使用其模型的过程也独一无二,”她补充道。

Hussain对团队的“分块”文档内容的方法充满信心,认为这一策略将取得成功。

“我们相信Llama是验证我们关于分块策略假设并监控我们服务响应效果的优秀模型,”她说。

AI与人类合作的未来

Llama的负责任基础和透明性对团队的价值观和他们对AI如何在全球产生影响的看法至关重要。SAIF CHECK认为,AI的真正作用在于补充和增强人类对计算机的使用。

为此,人们需要信任他们使用的AI模型。这种信任是SAIF CHECK的基石——无论是他们自己的AI模型,还是他们为客户验证的模型。

“由于Llama是开源的,我们可以清楚地看到其发展过程,信任其文档,并确信在理解和实施这一模型进入现实世界服务方面,我们不是孤军奋战,”Hussain说。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1857860.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计软件有哪些?贴图插件篇(2),渲染100邀请码1a12

这次我们继续介绍一些贴图插件。 1、Texporter Texporter是3ds Max的一个插件,用于快速导出贴图。它允许用户一次性导出多个贴图通道,如漫反射、法线、置换等,以各种格式,如TGA、BMP、JPEG等。Texporter提供了简单易用的界面和灵…

ctr/cvr预估之WideDeep模型

ctr/cvr预估之Wide&Deep模型 在探索点击率(CTR)和转化率(CVR)预估的领域中,我们始终追求的是一种既能捕获数据中的线性关系,又能发现复杂模式的模型。因子分解机(Factorization Machines, …

6.21长难句打卡

Students also benefit from learning something about coding before they get to college, where introductory computer-science classes are packed to the brim, which can drive the less-experienced or -determined students away. 1.brim v.充满 n.边缘 在上大学之前…

Nature重磅:揭开睡眠不足为什么会损害记忆力

我们的记忆力会在睡眠期间得到增强,海马体是大脑的记忆中心,而海马体尖波涟漪(sharp-wave ripple,SWR)期间觉醒体验的激活和重放被认为是记忆力得到增强的关键。睡眠不足会损害记忆力,然而,我们…

四川赤橙宏海商务信息咨询有限公司电商服务正规吗?

在数字时代的浪潮下,电商行业正以前所未有的速度蓬勃发展。而在这个风起云涌的电商江湖中,四川赤橙宏海商务信息咨询有限公司以其独特的抖音电商服务策略,迅速崭露头角,成为业界翘楚。今天,我们就来聊聊这家公司如何凭…

matplotlib赛博朋克绘图风格介绍(mplcyberpunk)

matplotlib绘图风格 mplcyberpunk mplcyberpunk是一个matplotlib绘图风格的扩展包,利用这个python包,可以轻易的创建出精美的赛博朋克风格图表,方法介绍: import matplotlib.pyplot as plt import mplcyberpunkplt.style.use("cyberpunk")add_glow_effects #使图形…

SQL Server - ROLLUP、GROUPING、CUBE、GROUPING SET

文章目录 SQL Server - ROLLUP、GROUPING、CUBE、GROUPING SETROLLUP函数GROUPING函数GROUPING SET函数CUBE函数网上例子 写在前面:如果我们想要对分组之后的数据进行类似小计的计算,那么就需要使用到下面的函数 SQL Server - ROLLUP、GROUPING、CUBE、G…

解决bat脚本输出中文乱码

2024.06.24 测试,使用方法(1)已解决问题。 原文连接 一、乱码原因 Windows的cmd.exe默认编码格式为ANSI。简体中文版的Windows, 其ANSI对应微软Codepage为cp936 如果你的bat文件是UTF-8编码的, 或者是是其他Codepage下创建的, 当bat文件编码…

C语言基础——函数(2)

ʕ • ᴥ • ʔ づ♡ど 🎉 欢迎点赞支持🎉 文章目录 前言 一、return语句 二、数组做函数参数 三、嵌套调用和链式访问 3.1 嵌套调用 3.2 链式访问 四、函数声明和定义 4.1 单个文件 4.2 多个文件 总结 前言 大家好啊,继我们上一…

快速鲁棒的 ICP (Fast and Robust Iterative Closest Point)

迭代最近点(Iterative Closet Point,ICP)算法及其变体是两个点集之间刚性配准的基本技术,在机器人技术和三维重建等领域有着广泛的应用。ICP的主要缺点是:收敛速度慢,以及对异常值、缺失数据和部分重叠的敏…

【强化学习的数学原理】课程笔记--1(基本概念,贝尔曼公式)

目录 基本概念State, Action, State transitionPolicy, Reward, Trajectory, Discount ReturnEpisodeMarkov decision process 贝尔曼公式推导确定形式的贝尔曼公式推导一般形式的贝尔曼公式State ValueAction Value 一些例子贝尔曼公式的 Matric-vector form贝尔曼公式的解析解…

图片多级缓存加载流程

图片多级缓存加载流程通常包括三个主要级别:内存缓存、本地缓存和网络缓存。以下是详细的加载流程: 1. 内存缓存(一级缓存) 流程: 当应用需要加载一张图片时,首先会检查内存缓存中是否存在该图片。 如果…

【Linux进阶】UNIX体系结构分解——操作系统,内核,shell

1.什么是操作系统? 从严格意义上说,可将操作系统定义为一种软件,它控制计算机硬件资源,提供程序运行环境。我们通常将这种软件称为内核(kerel),因为它相对较小,而且位于环境的核心。 从广义上…

智能屏幕人体雷达感应开关模块,飞睿智能低功耗毫米波雷达技术,让冰箱更节能

在智能家居日益普及的今天,各种创新技术层出不穷,极大地提升了人们的生活品质。其中,人体雷达感应开关模块作为一种创新的传感器技术,正在逐步改变我们对家电设备的传统认知。本文将深入探讨飞睿智能人体雷达感应开关中的毫米波雷…

【Golang】Steam 创意工坊 Mod 文件夹批量重命名

本文将介绍一个使用Go语言编写的脚本,其主要功能是解析XML文件并基于解析结果重命名文件夹。这个脚本适用于需要对文件夹进行批量重命名,并且重命名规则依赖于XML文件内容的情况。 脚本功能概述 Steam创意工坊下载的Mod文件夹批量重命名为id名称 运行前…

MySQL-java连接MySQL数据库+JDBC的使用

目录 1.准备所需要资源 2.导入驱动包 3.连接数据库步骤 首先在MySQL中创建好数据库和表 代码实现连接数据库 1.准备所需要资源 1.mysql和驱动包 我用的是5.7的mysql和5.1.49的驱动包,链接放在网盘里,需要的自取 链接:https://pan.bai…

K8S安装metrics-server

K8S安装metrics-server 使用kubeadm安装完成的集群,运行kubectl top node等命令式,报错:error: Metrics API not available。这是因为缺少metrics-server。 [rootk8s-master1 ~]# kubectl top node error: Metrics API not available简介 …

k8s集群搭建及对一些组件的简单理解

背景 k8s的学习环境(用kubeadm方式搭建),我也搭过几次了,但都有点问题。 要么在云服务器上弄,这个的问题是就只有一台轻量服务器,只能搭个单节点的;后来买了一台便宜的,所以就有了两…

SpringBoot使用滑动窗口限流防止用户重复提交(自定义注解实现)

在你的项目中,有没有遇到用户重复提交的场景,即当用户因为网络延迟等情况把已经提交过一次的东西再次进行了提价,本篇文章将向各位介绍使用滑动窗口限流的方式来防止用户重复提交,并通过我们的自定义注解来进行封装功能。 首先&a…

网络基础-协议

一、ARP 通过IP得到Mac 首先会查看缓存的arp表中是否有相应的IP和Mac对应关系,如果有直接进行包封装。如果没有则进行广播当对应的地址就收到广播包后会根据arp中的源地址进行单播返回相应的IP和Mac对应关系。 arp -a 查看现有的arp缓存 二、RARP反向地址解析 通过…