知识图谱存在的挑战---隐私、安全和伦理相关和测试认证相关

news2025/1/15 1:34:02

文章目录

    • 隐私、安全和伦理相关
    • 测试认证相关

隐私、安全和伦理相关

    从部署拓扑结构而言,知识图谱技术以数据为核心、数据库为载体的方式来存储,有单机、云平台、集群及其组合的部署方式,结合大数据平台、云平台、业务系统、灾备、网络系统及其与知识图谱之间的通信接口。知识图谱的安全问题,是为了保护其数据内容、存储载体、能够访问知识图谱的系统、平台、网络及之间的接口安全。

图片名称
基于知识图谱的医疗应用系统

     内部业务人员、外部合作伙伴、第三方合作业务系统通过利用相应的系统权限违规窃取/滥用数据。一般来说,内部业务人员拥有比外部、第三方更高的系统访问权限,内部人员对数据的访问和使用虽然经过了账号授权,但没有对其访问和传输内容进行审查容易造成数据流失和敏感信息泄露的问题。外部合作伙伴虽然拥有较低的系统权限,但是通过漏洞或钓鱼进行渗透网络和系统渗透、数据库注入、账号提权、病毒植入等方式也可以访问到数据库中的核心信息,从而产生数据丢失、窃取甚至拖库等风险。第三方系统一般通过接口访问知识图谱存储的数据库,在接口本身安全性、三方系统安全性方面无法做到有效管理。其次,敏感应用/接口缺少监控管理手段,容易造成数据泄露和资源占用。对于这类场景,需要从流量中知识图谱相关的协议解析开始,审查各个账号、接口获取的数据内容,防止数据泄露和未授权流量的产生。

     根据国家《数据安全管理办法(征求意见稿)》第六条,数据安全的风险评估势在必行。在风险评估之前,必要的一步就是对当前的数据进行梳理,分类分级、打标签,并识别敏感数据。然后,对已识别数据的驻留和流转风险进行评估。梳理数据的一种手段就是资产扫描,通过对数据库、数据内容及相应的大数据平台组件进行扫描,识别其中的敏感组件和数据并分类。其次,还要扫描数据传输路径和驻留节点,对流程可视化之后更便于识别风险。

     行为异常一般包含的场景:内部业务人员违规访问内部系统造成数据泄露/滥用事件;运维人员违规访问数据库/服务器,造成数据泄露事件;第三方通过接口违规提取截留敏感数据,造成数据泄露。从安全运营和运维角度来说,希望能够主动发现潜在的风险,但无奈系统节点繁多、流量庞杂、日志种类多数量大。因此,该类场景下需要从用户行为分析和日志审计的角度来切入,以可视化的方式呈现安全隐患。

     网络攻击的纵深防御,可以分为事前、事中、事后三个阶段,事前感知与预防,事中拦截并阻断,事后加固和溯源。在进行攻击溯源时,安全或IT部门在遇到数据安全事件时由于攻击手段的多样性经常会缺少有效溯源手段;而各种设备、系统、数据库日志各自独立,无法关联分析,无法定位事件源头;并且对于海量日志的搜索,传统安全产品检索分析性能无法满足需要。因此在溯源取证环节,对日志关联分析、攻击者画像、发现攻击链条等方面,由于知识图谱的数据结构、日志以及系统拓扑有别于传统业务系统,都将对安全系统的构建提出挑战。

     知识图谱作为底层的数据服务,为多种应用(如各类搜索引擎、对话系统)和各类接口提供服务或数据。在认证、账号、权限和审计方面均需统一管理,也就是4A安全管理,其中审计管理(Audit)全面记录用户在知识图谱相关系统与接口的登录行为和操作行为。基于图谱的异常行为定义和规则,实现知识内容获取、数据库操作、相关组件使用的有效审计。

     知识图谱构建技术中最重要的一个环节就是知识获取,包括实体抽取和关系抽取等,而且最终提供服务的知识图谱也高度依赖于这两个技术要素,这两类技术决定了知识图谱内容质量的好坏。为了保证输出高质量的图谱,并且维持这一质量要求,不仅需要从系统、平台、数据库、网络维度保护模型本身的安全性,防止训练好的模型文件被破坏,而且还需要保证输入数据的安全性,从模型的训练数据到抽取好待入库的知识结构,避免如恶意代码或原有数据、关系的替换,以免篡改行为导致知识图谱的质量下降。

     数据时代的安全架构:以数据为中心的审计与保护(Data-Centric Audit and Protection,简称“DCAP”)是由Gartner提出的术语。它强调特定数据本身的安全性,弱化了周边环境的安全考虑。DCAP主要的优点之一是将数据安全应用于待保护的特定数据片段但不影响正常业务,数据保护与企业战略保持一致。而目前的安全系统与建设方案都是全方位的重型防护体系,势必对业务流畅性产生一定影响,其中包括数据的分类发现与安全策略、审计和行为分析与告警、数据的保护等。

测试认证相关

    知识图谱相关技术及系统的测试评估作为知识图谱发展中的重要环节,国内外不同机构正在推动该方面的研究工作,其中全国知识图谱与语义计算大会作为中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议每年发布主题测评任务,促进国内知识图谱领域的技术发展,以及学术成果与产业需求的融合和对接。此外,美国伦斯勒理工学院Tetherless World Constellation研究所围绕知识图谱质量评估正在研制知识图谱测评系统,以检测和评估大规模异构知识图谱中存在的不连续性及潜藏错误标签。目前,该测评系统架构图如图6.1所示,并在一项大规模生物学知识图谱上完成了测试。整体而言,知识图谱的测试认证相关研究仍处于起步阶段,面临以下挑战:

图片名称
美国伦斯勒理工学院知识图谱测评系统架构图

    知识图谱测试与评估不仅涉及知识图谱输入数据、整体性能、平台功能等,还涉及知识图谱构建过程中知识获取、知识表示、知识存储、知识融合、知识建模、知识计算等各环节。其中,知识获取与知识融合环节测试评估获得的关注度较高,知识融合环节中的质量评估主要是对知识的可信度进行量化,保留置信度较高的并舍弃置信度较低的,有效确保知识的质量。此外,2019年全国知识图谱与语义计算大会就面向中文短文本的实体链指任务、人物关系抽取、面向金融领域的事件主体抽取、公众公司公告信息抽取等多个方面发布了评测任务。

    知识图谱测试与评估方法较少,且集中在知识图谱构建的特定环节或特定问题,尚未形成完整测评体系,无法指导当前各企业及相关用户的使用。美国伦斯勒理工学院发布的研究报告中针对实体类型不匹配、事件类型不匹配、实体事件二元性、上下文约束等知识图谱不一致性测评进行了探讨;德国Philipp Cimiano等专家针对知识图谱优化的现有评估方法从回顾性评估、计算性能等方面进行了总结,但数量有限;针对知识融合中质量评估问题,Mendes等人在LDIF框架基础上提出了一种新的质量评估方法(Sieve方法),支持用户根据自身业务需求灵 活定义质量评估函数,也可以对多种评估方法的结果进行综合考评以确定知识的最终质量评分。

    当前知识图谱相关标准较少,且尚无测试与评估标准发布,缺少获得业内一致认可的共性测评指标与方法。德国Philipp Cimiano等专家在文献中对知识图谱相关优化算法性能基于DBpedia、Zhishi.me、Open Cyc等数据库从精度、召回率、准确性、精度与召回率曲线下面积、ROC曲线下面积、均方根误差等指标进行了比较。在全国知识图谱与语义计算大会组织的评测任务中,增加了F1-Measure相关指标,并给出了具体的计算公式。但各项指标是否能够覆盖知识图谱测评需求还有待论证,而且知识图谱构建过程中各环节指标也待明确。

    标准测试数据集作为知识图谱测评的重要基础,高质量的测试数据集不仅有利于降低知识图谱相关系统的开发成本,也有利于多知识图谱产品间的横向对比,提升测评结果的公平性。DBpedia、Open Cyc、NELL等国外开源数据库及Zhishi.me、PKU-PIE、THUOCL、CN-DBpedia等国内开源数据库对知识图谱的发展起到了重要支撑作用。此外,TAC-KBP、MUC、全国知识图谱与语义计算大会等发布的测评任务中也会附相应的测评数据集。同时,OpenKG作为中国中文信息学会语言与知识计算专业委员会所倡导的开放知识图谱项目目前也已公布92项开源数据集。但各项数据集多是相关公司或组织独立开发所得,而且并非面向知识图谱测试而开发,有待进一步融合与发展。而且随着知识图谱相关产品在各领域的逐步落地与应用,未来面向特定领域的测试数据集需求将不断提升,如何在现有基础上构建相应领域的标准测试数据集也将是一大挑战。

    知识图谱测试人员需要同时掌握良好的知识图谱构建相关知识及软件测试相关能力。对于第三方测试机构而言,在具备相应测试人员基础上,还需要配备良好的测试环境和检测设备、完备的管理机制,而且测试实验室及测试人员需获得检测认证相关资质,才能够确保出具有公信力的检测报告。目前,由于知识图谱测评相关测试床及测试用例匮乏,而且现有测试人员及机构资质和测试环境多针对其他技术领域,其能否完全覆盖知识图谱测试中的特殊需求缺乏验证基础,未来有待进一步加强该方面技术突破及研究。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1833132.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【代码随想录】【算法训练营】【第41天】 [416]分割等和子集

前言 思路及算法思维,指路 代码随想录。 题目来自 LeetCode。 day 40,休息,休息一下~ day 41,艰难的周一~ 题目详情 [416] 分割等和子集 题目描述 416 分割等和子集 解题思路 前提:是否可以将数组分为和相等的…

cloud_enum:一款针对不同平台云环境安全的OSINT工具

关于cloud_enum cloud_enum是一款功能强大的云环境安全OSINT工具,该工具支持AWS、Azure和Google Cloud三种不同的云环境,旨在帮助广大研究人员枚举目标云环境中的公共资源,并尝试寻找其中潜在的安全威胁。 功能介绍 当前版本的cloud_enum支…

VBA学习(2):Excel VBA初学者编写第一个宏

要在Excel中编写宏程序,首先需要了解VBA语言,而快速入门的技巧就是使用宏录制器。 宏录制器就像一台录音机,可以使用VBA监听和记录你在Excel中所做的一切操作。对于初学者来说,你可能不了解VBA,这里,我们会…

如何利用被动DNS(Passive DNS)加强网络安全

通过收集和分析被动DNS数据,可以帮助识别恶意站点,打击钓鱼和恶意软件,本文将介绍如何利用被动DNS(Passive DNS)加强网络安全。 在过去的一些年里,我们目睹了对DNS基础设施的攻击日益增多:对权…

【S32K 进阶之旅】 将 EB 配置生成的 MCAL 代码集成到 S32DS 中

本文介绍如何使用 S32DS 进行 AUTOSAR MCAL 工程的编译和调试,重点在于将 EB 配置生成的 MCAL 代码集成到 S32DS 中。 虽然配置过程较为繁琐,实操过一遍就会熟悉整个工程的框架。以后每次在 EB 中更新配置,生成代码的文件夹已经集成在 S32DS…

Selenium+Pytest自动化测试框架能碰撞出什么样的火花

前言 selenium自动化 pytest测试框架 本章你需要 一定的python基础——至少明白类与对象,封装继承 一定的selenium基础——本篇不讲selenium,不会的可以自己去看selenium中文翻译网 一、测试框架简介 测试框架有什么优点呢: 代码复用率高…

从多线程设计模式到对 CompletableFuture 的应用

大家好,我是 方圆。最近在开发 延保服务 频道页时,为了提高查询效率,使用到了多线程技术。为了对多线程方案设计有更加充分的了解,在业余时间读完了《图解 Java 多线程设计模式》这本书,觉得收获良多。本篇文章将介绍其…

《C++ Primer》导学系列:第 4 章 - 表达式

4.1 基础 4.1.1 基本概念 组合运算符和运算对象 组合运算符是指将两个或多个操作数结合在一起进行运算的符号。在C中&#xff0c;常见的组合运算符包括算术运算符&#xff08;如, -, *, /, %&#xff09;、关系运算符&#xff08;如<, >, <, >, , !&#xff09;…

docker-compose jira、bugzilla、zentao

参见文章&#xff0c;这里是对之前的内容进行了改动&#xff0c;主要讲怎么将zentao容器融入到已有的docker-compose.yml中 一、zentao镜像 从官网上拉取&#xff1a;https://hub.docker.com/r/easysoft/zentao/tags 可以选择自己想要的版本&#xff0c;这里我选择的是开源版…

工厂物料管理系统(数据库课设)

1.课设要求描述 ●实现物料的分类管理; ●实现部门和员工信息管理; ●实现物料的入库和领用管理; ●实现物料的转仓管理; ●创建触发器&#xff0c;实现物料入库和领用时相应物料库存的自动更新; ●创建触发器&#xff0c;实现转仓时转入仓库物料增加、转出仓库物料减少…

线性卷积(相关)和圆周卷积(相关)以及FFT之间的关系(AEC举例)

时域自适应滤波算法中的线性卷积和线性相关运算量较大&#xff0c;导致计算复杂度升高&#xff0c;我们更愿意把这两个信号变换到频域&#xff0c;通过频域相乘的方式来取代时域复杂度相当高的卷积或相关运算。 预备知识&#xff1a;线性卷积&#xff08;相关&#xff09;和圆…

单一管理平台 - Enterprise Global Console

大约三年前&#xff0c;当我们向客户和社区推出控制台时&#xff0c;MinIO 的世界发生了变化。这是可访问性的巨大飞跃。可靠的 CLI 和 MC 命令很快让位于我们新的基于浏览器的 GUI 的速度和直观可用性。对于开发人员和企业 IT 管理员来说&#xff0c;这是一个游戏规则的改变者…

单片机建立自己的库文件(4)

文章目录 前言一、新建自己的外设文件夹1.新建外设文件夹&#xff0c;做项目好项目文件管理2.将之前写的.c .h 文件添加到文件夹中 二、在软件中添加项目 .c文件2.1 编译工程保证没问题2. 修改项目列表下的名称 三、在软件项目中添加 .h文件路径四、实际使用测试总结 前言 提示…

使用 C# 进行面向对象编程:第 10 部分

封装和抽象之间的区别 对于 OOP 初学者来说&#xff0c;封装和抽象之间存在非常基本的区别。他们可能会对此感到困惑。但如果你详细了解这两个主题&#xff0c;就会发现它们之间存在巨大差异。 抽象意味着向用户隐藏不必要的数据。用户只需要所需的功能或根据其需求的输出。例…

遵循法规,科学检测:可燃气体报警器多久检测一次?

在工业生产和日常生活中&#xff0c;可燃气体报警器作为一种重要的安全设备&#xff0c;能够实时监测并预警潜在的可燃气体泄漏风险&#xff0c;对于防范火灾和爆炸事故至关重要。 在这篇文章中&#xff0c;佰德将围绕可燃气体报警器的检测频率展开探讨&#xff0c;包括其功能…

基于WPF技术的换热站智能监控系统15--实时读取PLC数据

1、创建PLC实时数据 1、添加数据块 2、创建6个变量 用来表示水泵1和水泵2的参数&#xff0c;可以根据现场实际情况添加更多的变量参数 3、设置块属性并编译 4、下载该程序到PLC中 5、添加监控表 2、读取设备数据 S7协议下的tcp直接通讯&#xff0c;配置简单&#xff0c;一般P…

大模型泡沫退去,谁能活到下半场?

前言 从今年3月开始&#xff0c;国内企业纷纷下场大模型&#xff0c;铆足劲秀肌肉&#xff0c;如今转向垂直行业淘金&#xff0c;试图争霸行业大模型。我们的心态也逐渐从看乐子&#xff0c;到严肃讨论。 在人工智能的世界&#xff0c;我们经历了众多的概念游戏&#xff0c;在…

泛微开发修炼之旅--18泛微OA节点后操作代码自动退回流程的代码示例

文章链接&#xff1a;17泛微OA节点后操作代码自动退回流程的代码示例

短视频压缩与编码技术在短剧APP小程序开发中的应用

在短剧APP小程序开发中&#xff0c;短视频压缩与编码技术是实现高效视频处理的关键。本文将对这两项技术在短剧APP中的应用进行深入分析。 一、短视频压缩技术的重要性 节省存储空间&#xff1a;通过压缩技术&#xff0c;可以减小视频文件的大小&#xff0c;从而节省服务器和用…

【普中】基于51单片机的电子秒表数码管显示( proteus仿真+程序+设计报告+讲解视频)

这里写目录标题 设计资料内容清单&&下载链接资料下载链接&#xff1a;讲解视频&#xff1a;1.主要功能&#xff1a;2.仿真3. 程序代码4. 设计报告 【普中】基于51单片机的电子秒表数码管显示 ( proteus仿真程序设计报告讲解视频&#xff09; 仿真图proteus8.16(有低版…