深度对话:以实在RPA Agent智能体安全机制破解LLM应用谜题

news2024/11/27 13:44:24

AI大模型席卷全球,为各个行业带来了颠覆式创新机遇,同时也打开了未知的潘多拉魔盒。随着大语言模型能力的不断增强和适用范围延伸,大模型本身带来的隐私泄漏、数据安全等问题越发成为各大厂商关注的核心,引发了各界更多的思考与发声,今天我们邀请到了王吉伟频道创始人、AIGC&超自动化分析师王吉伟做客实在智能会客厅,开启深度对话的共同探索之旅——Agents如何破解LLM应用安全谜题?

不少企业早已感受到了大模型惊艳四座的“阳面”能力,将其作为提升工作效率的工具,但对于大模型安全保护的“阴面”疑虑也是记忆犹新。

3月份ChatGPT发生了用户隐私数据泄露事件,OpenAI声明由于开源代码库中存在一个漏洞,使得部分用户能够看到另一个用户的聊天标题记录,并把ChatGPT短暂下线紧急修补了此漏洞。此事件,让大家认识到大模型并不是“大安全”。

试想如果不加限制地使用LLM,随着更多敏感数据被传输LLM服务器,并被用作模型训练数据集,也就意味着竞争对手通过随意的聊天对话就能获悉了你的核心数据。如果竞对用这些数据建模对你进行降维打击,会对企业会造成多大损失?

“数据泄露会造成严重的企业的信任度降低,让业务连续性受到影响,并可能会带来一定的法律责任。”王吉伟如是说。

实在AI Agent-个人PC数字助理

• 全球首个“实在RPA-Agent”生成式数字员工

• “你说PC做,所说即所得”

• 只需一句话,帮你操作电脑完成各种工作

 实在TARS-Agent智能体应用加速落地赋能行业安全运营

与此同时,随着技术的不断发展,LLM的应用也进入到了AI Agent智能体阶段。

AI Agent正在快速与许多领域融合,超自动化领域尤为如是。目前厂商们都在积极引入或投入到自研大语言模型上去,并基于这些大语言模型打造自己的Agent,以从安全、易用性等各方面提升超自动化的应用效率。而实在智能在今年8月已发布在业界首发基于大模型的Agent智能体产品,即TARS-RPA-Agent——则是基于“TARS+ISSUT”双模引擎,有“大脑”,更有“眼睛和手脚”的超自动化智能体

实在TARS-Agent是由AI驱动的程序,当给定目标时,能够自己创建任务、完成任务、创建新任务、重新确定任务列表的优先级、完成新的顶级任务,并循环直到达到目标。只需输入一句话或者更简单的指令,就能通过理解与分析获悉用户的意图,进而规划并执行一系列任务,最终输出详尽而具体的答案。不仅让输入更加简单,也在一定程度上提高了安全系数,有效避免了数据泄露的可能,还能最大限度发挥LLM的能力。

当然,超自动化Agent在数据安全方面远不是减少提示词输入那么简单。出于安全考虑,企业都希望在应用LLM时过滤内部敏感信息。以实在智能与湘财证券共建的财经行业大模型TARS-Finance-7B为例,一方面,金融领域的数据分散在各个金融机构,通用大模型缺少金融数据进行训练,金融专业知识不足;另外一方面,如果从底层开始训练大模型,所需要投入的算力成本非常高,比如千亿级别的通用大模型,训练一次需要付出几千万的成本。同时,金融是强监管行业,安全合规是大模型落地的前提条件和重要保障,金融大模型安全合规既需要监管政策的约束,更需要大模型企业自身的主动作为,防范大模型的潜在合规风险成为不少类似金融行业落地应用的刚性需求。

想要实现LLM的安全使用,需要分析数据泄露的相关因素。从已经发生的实践案例来看,造成LLM数据泄露的主要原因,大概有这几点:用户隐私泄露、内部安全风险、系统漏洞。

理论上,只要我们针对性的解决这几个问题,LLM的安全使用也就不在话下。现在,很多引入LLM的企业基本都建立了风控机制,按照LLM使用流程的先后顺序,这些机制包括加强安全培训、定期审查系统、加密处理敏感信息、使用可靠的人工智能服务提供商、建立应急预案等。

王吉伟认为,在这些安全措施中,“使用可靠的人工智能服务提供商”这一点最为重要,毕竟引入一个具备高度安全机制的LLM会事半功倍。其他几点也能起到一定的作用,但多是为了防患于未然以及事后补救,并且其中的很多人为因素难以避免。

实在RPA Agent智能体创新解决方案,有效避免LLM数据泄露

当然,凡事皆有利弊。虽然对话式交互的生成式AI会造成敏感数据泄露,但AI和自动化的使用,整体上正在降低数据泄露的成本。随着大语言模型技术在各行各业的应用越来越多,传统的安全工具、经验、策略将失去效力,企业急需重新构建能适应智能化时代的安全体系。

实在智能在服务众多大型企业客户的LLM实际落地中扮演着重要角色,着力打造“更有效、安全、可信任、可落地”、提供隐私保护和数据安全防护功能的创新解决方案,即业界首发的实在RPA Agent智能体用以保障用户数据安全,在超自动化领域通过AI Agent破解LLM安全谜题、提升安全系数。

实在RPA Agent智能体是基于实在智能自研垂直领域大模型TARS构建的RPA\超自动化智能体,是一种能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA全新模式。为了让用户更安全的使用AI智能体,实在RPA Agent智能体在TARS大语言模型和RPA工具包都设置的多重安全机制。

TARS大语言模型的安全机制侧重于敏感数据、内部政策和提示检查。在预训练或SFT阶段通过数据处理和文本分类算法删除敏感数据,在大模型的输出结果之上叠加一个辅助安全模型,RLHF(人类反馈强化学习)阶段使用内部策略,检查用户查询并添加安全提示等。这样就能保证用户输入内容的多层过滤,防止敏感数据的外露。

(实在TARS-Agent中的LLM安全机制)

TARS大语言模型基于充分细致的语料收集和清洗、数据处理及标注,超千亿Tokens的预训练语料和超百万条指令微调数据,实在智能独立完整复现大模型构建的预训练、指令微调和RLHF三阶段,使大模型具备完整能力。同时实在智能自主研发用于中文不当言论判别和生成终止的Detoxify系统,也提升了TARS的安全性和无害性,让大模型“既懂事,又懂法”。在RPA工具包上,TARS-RPA-Agent安全机制侧重于机器人授权继承和指挥官分配或分发授权:

(实在TARS-Agent中的RPA安全机制)

实在TARS-Agent中的RPA安全机制“利器攻利器”

阻碍广大企业应用大语言模型(LLM,Large Langeuage Models)的诸多因素中,无疑数据安全是最重要的。对于开发者和企业而言,大模型的开发与部署过程需要经过严格的审查,对数据的处理要严格遵循隐私保护原则,确保每一位用户的信息都得到妥善保管,确保其不会对用户和企业造成伤害。

目前市面上的数据安全管理软件,功能丰富但应用复杂且价格不菲。为了LLM数据过滤这种单一应用场景而斥巨资购买全数据监控软件,显然过于浪费,并不是LLM数据过滤的最优选。事实上,这类需求更适合LLM技术供应商基于大语言模型技术路径去做。

需在其LLM产品体系中添加隐私数据过滤功能,为企业用户开放不断更新或增删敏感数据库内容的权限。这种模式,不仅能为本身大语言模型提供过滤安全功能,还能用于企业所使用的第三方大语言模型,能够在最大限度保护员工创造力的同时做好公司敏感数据的防护。这样,企业就能实现花一份钱去保障更多LLM的安全。

实在TARS-Agent中的RPA安全机制正是采用这样的解决之道:

首先,RPA机器人的授权均继承自创建机器人的用户,同时其权限范围也和所在账号的权限是一致的,不会获取超出其权限范围的信息;

其次,RPA指挥官可以分配和控制TARS-RPA-Agent的授权;

第三,在开发过程中,实在智能设计了一个易于处理敏感数据的模块,使得敏感数据更易于通过配置、删除、导入等方式进行设置。除了LLM和RPA,TARS-RPA-Agent还包含其他辅助模块,其中的安全机制侧重于内部知识库认证、内部文档访问以及用户确认。

有了实在智能面向LLM、RPA和辅助模块的多重安全机制,在十几层防护墙的共同作用下,想要泄露隐私数据都很难,彻底杜绝了前文所讲的人为泄露数据的情况。再加上应对系统漏洞的相关安全机制,足以把LLM应用安全打造得固若金汤。当然,这还是直接使用TARS大模型或者调用API的情况。如果你是现金流充沛的企业,采用本地部署大语言模型的方式,安全情况会更上一层楼,这种整体安全解决方案非常适用于一些大型企业的LLM应用安全过滤。

如果你的企业正在为LLM的应用安全及预算而发愁,不妨试试实在智能的这种创新安全解决方案,会让你眼前一亮。实在智能从最初的大语言模型产品布局开始就将企业客户敏感数据的安全性防护列入了产品的SOP设计当中,目前已经为实在TARS垂直类大语言模型上了一道敏感数据过滤网,能够在源头上将企业客户的敏感数据进行过滤后再输出给到安全的数据,同时提供给企业客户一个可以对敏感数据库进行维护的权限,真正实现从企业客户内部就轻松实现数据安全的把控,让企业真正放心将智能体引入到整个企业数字化转型的各个阶段。

当前的大模型发展得尚不成熟,面临着诸多安全隐患与风险。随着深度学习技术的发展和研究的深入,未来大模型的攻防将在动态抗衡中不断升级,大模型需要应对的新型安全威胁将不断涌现和升级,建立完善统一的大模型安全评估框架、探索有效的防御机制、实现 AI 大模型安全监管和可控生成,以及促进大模型安全生态的建设等任务迫在眉睫,实在智能已在率先领跑的道路上迈着坚实的步伐,帮助企业解决数据安全和使用成本问题,助力越来越多的企业实现安全智能化转型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1207679.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试 —— 常见的自动化测试架构!

一个自动化测试架构就是一个集成体系,其中定义了一个特殊软件产品的自动化测试规则。这一体系中包含测试功能函数库、测试数据源、测试对象识别标准,以及各种可重用的模块。这些组件作为小的构建模块,被组合起来代表某种商业流程。自动化测试…

组件库篇 | EUI | 快速上手

组件库篇 | EUI | 快速上手 导入组件库 仅需三个步骤便可以导入组件库: 进入main.cpp所在目录,将EUI文件夹复制到该目录下 双击sln文件使用vs打开项目,右键项目名-添加-新建筛选器,命名为EUI 将第1步导入的EUI文件夹拖入到第2步…

做C语言的编程题总是想骂人怎么办?

做C语言的编程题总是想骂人怎么办? 可能C语言的编程题难住了您吧,导致情绪激烈不平静,那么做C语言的编程题可以顺利-些吗? 当然有一些方法可是现实此目标的:最近很多小伙伴找我,说想要一些C语言的资料,然后我根据自己…

K8S的基础知识

K8S的意义与入门 专有名词 容器:包含了运行一个应用程序所需要的所有东西,包括:代码、运行时、各种依赖和配置。pod:K8s调度的最小单元,包含一个或多个容器。一个容器组中的容器具有紧密耦合性,共享资源,存储空间和IP。即同一个容器组中的容器可以通过localhost:xxx访问…

【C++初阶(八)】C/C++内存管理详解

本专栏内容为:C学习专栏,分为初阶和进阶两部分。 通过本专栏的深入学习,你可以了解并掌握C。 💓博主csdn个人主页:小小unicorn ⏩专栏分类:C 🚚代码仓库:小小unicorn的代码仓库&…

C 语言指针怎么理解?

今日话题,C 语言指针怎么理解?让我用更简洁的方式来表达这个内容:就像桌面上的快捷方式一样,指针也可以有多层引用。我们可以将指针比作快捷方式的图标,快捷方式可以指向游戏(普通指针)&#xf…

人工智能基础_机器学习030_ElasticNet弹性网络_弹性回归的使用---人工智能工作笔记0070

然后我们再来看elastic-net弹性网络,之所以叫弹性是因为,他融合了L1和L2正则,可以看到 他的公式 公式中有L1正则和L2正则两个都在这个公式中 可以看到弹性网络,在很多特征互相联系的时候,非常有用,比如, 相关性,如果数学好,那么物理也好,如果语文好,那么英语也好 这种联系 正…

制作这种在线宣传画册,可轻松收获客户!

制作企业宣传画册,首先要了解企业制作宣传画册的需求以及展示方向,如今互联网时代,宣传画册的制作也应该要创新,而制作一本在线电子宣传画册用于线上宣传是非常有必要的。如何制作呢? 我们 可以使用FLBOOK平台在线制作…

bfc 简单理解及应用

1、概念 bfc 是 Block formatting context 的缩写,也就是块级格式化上下文,就是让元素形成独立的渲染区域,bfc容器内部的渲染对外部不会有影响。 2、形成bfc的常见条件 浮动 设置元素具有float: left/right绝对/固定定位:posit…

keepalived 的安装部署及使用详细完整版

架构 1.安装 yum install keepalived -ysystemctl enable keepalivedsystemctl restart keepalivedsystemctl status keepalived2.部署配置样例 vim /etc/keepalived/keepalived.conf global_defs {router_id PROXYSQL_HAscript_user rootenable_script_security } vrrp_scri…

js案例:跟随鼠标移动的大虫子

目录 效果预览图 整体思路 完整代码 效果预览图 整体思路 rang 函数用于生成指定范围内的随机整数。 通过循环,创建了50个div元素,每个div都有一个不同的数字和随机的背景颜色。 给每个div元素添加了名为 "ball" 的类名。 通过 documen…

为什么说葡萄酒越复杂,越有可能陈年?

大家都觉得老酒更好,对吧?一瓶酒在黑暗的洞穴里放得越久,瓶子慢慢积灰,我们喝的时候就越好喝,对吗?其实是不对的!葡萄酒陈酿的根本原因是为了让它的味道更好,或者更确切地说让风味发…

一文懂得电源模块过温保护测试方法 ate测试软件助力测试

过温保护测试是电源模块保护功能测试项目之一,也是电源模块测试的重要测试指标,以保证电源模块过温保护功能正常,确保电源模块不受损坏。用ate测试软件测试电源模块过温保护,不仅可以保证测试结果的准确性,还可以多维度…

SAP 70策略测试简介

在前面的文章中我们已经测试了10、11、20、40、50、52、60、62策略的测试,接下来我们需要对70策略进行测试,很多的项目中也都会用到70策略。 70策略是一种比较常见的、基于按库存且主要用于半成品或者原材料的计划策略。 我们还是按照之前的惯例,先看下70策略的后台配置 我…

书单 | 11月程序员新书播报

11月最新上架计算机书籍 1、人工智能(第3版) 美国经典人工智能教材第3版,人工智能的百科全书,新增深度学习及人工智能编程等内容,理论阐释结合动手实践,附赠PPT课件、配套视频及代码文件。 1.人工智能经典…

Linux线程池

文章目录: 线程池了解线程池模拟实现 线程池了解 线程池是一种常见的线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务,以避免在处理短时间任…

Python爬虫过程中DNS解析错误解决策略

在Python爬虫开发中,经常会遇到DNS解析错误,这是一个常见且也令人头疼的问题。DNS解析错误可能会导致爬虫失败,但幸运的是,我们可以采取一些策略来处理这些错误,确保爬虫能够正常运行。本文将介绍什么是DNS解析错误&am…

JLMR Micro Super Resolution Algorithm国产微超分算法DEMO

一、简介 目前,做超分算法基本还是以AI训练为主,但是AI基本上都是基于既定场景的训练。而传统的算法基本上都是利用上下文的纹理预测、插值等方案,在图像放大过程中会出现模糊,或马赛克等现象。 我们基于加权概率模型&#xff0c…

后端接口性能优化分析-1

👏作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家📕系列专栏:Spring源码、JUC源码🔥如果感觉博主的文章还不错的话,请👍三连支持&…

SQLite3 数据库学习(一):数据库和 SQLite 基础

参考引用 SQL 必知必会SQLite 权威指南(第二版)关系型数据库概述 1. 数据库基础 1.1 什么是数据库 数据库(database):保存有组织的数据的容器(通常是一个文件或一组文件) 可以将其想象为一个文…