软信天成:今天的企业比以往任何时候都更需要「数据编目」

news2024/11/25 10:31:51

在当今的组织中,数据是多样的,分布在许多不同的部门、应用系统、数据仓库和数据湖(一些在内部,其他在云中),因此,准确地知道您拥有哪些数据和它们在哪里是一个挑战。此外,另外一个挑战是,数据在整个数据供应链上的移动缺乏可见性。随着数据源、类型和格式的增加,数据格局变得更加复杂。考虑由于这种情况而出现的下列挑战:

  • 对组织数据分布数据的有限视图,使得获取组织的完整视图很难;单个应用往往只呈现业务活动的零碎画面。因此,您最终会丢失隐藏在数据中的宝贵业务洞察力。
  • 数据完整性受损——数据仓库创建数据碎片,从而导致数据质量的潜在损失。而这种数据的弱点会导致分析问题,甚至造成昂贵的损失。例如,加拿大电力公司TransAlta在使用电子表格存储、分析和移动数据时,犯了一个简单的剪切粘贴错误,从而浪费了2400万美元。
  • 数据泄露——在自助分析环境中,意外数据泄露风险高,可能会给企业造成损失,例如当员工离开联邦存款保险公司(FDIC)时意外下载了44000到个人系统,使这些数据脱离了与企业的关联。
  • 成本增加——数据也会带来财务成本——存储数据会导致基础设施成本,移动数据会产生运输成本,甚至收集和使用数据、成本。在这种情况下,数据冗余、维护和复制等因素将需要更多的资源。
  • 验证数据管道——合规要求需要确保所有经批准的数据资产都是从授权数据源独家获取数据,且数据管道不会错误地使用未经授权的数据。越来越需要知道敏感和个人数据资产在哪里,以及它们如何在组织中移动。
  • 受阻的协作——数据仓库从组织分离形成的组织烟囱中出现。由于这些分离层相互建立在一起,既创造了文化边界,又造成了技术上的不兼容性,因此,组织内部的协作变得更加困难。

一、如何解决上述问题?

在软信天成看来,可以建立组织数据的单一真实来源——数据目录来解决上述所有问题。

数据目录通过发现、描述和组织分布式数据集来创建和维护数据资产的清单。

数据目录提供了上下文,使数据工程师、数据科学家、数据管理员、数据/业务分析师和其他业务线数据使用者能够找到并理解相关数据集,从而提取业务价值。

数据目录对于业务用户和决策者来说是必不可少的,因为它通过将组织的数据资产组织成一种简单易用的格式,从而综合了跨多个数据字典的组织数据资产的所有细节。

将企业数据转化为竞争优势需要业务用户能够在整个企业中轻松访问、理解和使用可信、干净、高质量的数据。

二、如何评估数据目录

在开始进行数据目录评估之前,您必须弄清楚您想用它完成什么。

数据目录工具可以使整个组织的数据民主化。然而,只有当数据丰富了来自人和元数据的上下文时,数据才对决策者有意义。将数据与其上下文联系起来是用数据做出正确或错误决策的区别。例如,使用英制和公制时,使用错误的单位定义似乎不是什么大问题。然而,对美国宇航局来说,这一认识上的差距在1999年花费了1.25亿美元。

为了解决这样的复杂性,今天越来越多的组织采用人工智能(AI)和机器学习模型,借助云的力量帮助他们做出明智的商业决策,创造竞争优势,加速数字化转型。据一家领先的分析公司称,人们对云功能、互联数据架构、元数据以及通过应用人工智能实现常规和非常规任务自动化的需求日益增长。

三、5大数据目录功能帮助企业充分利用数据

智能自动化:数据目录中的自动化过程,结合了机器学习和人工智能,有助于避免手动数据标记、分类和组织。这些技术还可以利用数据使用和查询将业务上下文链接或分配给大规模的数据资产。

数据民主化:可访问的数据目录甚至允许非技术用户定位和利用数据,实现跨企业的协作数据使用。

数据发现和沿袭分析:这是任何数据目录的两大支柱。它们共同帮助您建立对用于获取业务见解的数据的信任和信心。

数据治理/保护:将自动化数据治理解决方案与数据目录集成,确保数据用户能够根据自己的需要,安全、合规地访问数据。因此,尽管每个人都可以访问相同的数据目录,但只有具有相应权限的用户才能访问某些数据集,从而保护敏感数据。

元数据管理:随着组织越来越多地采用混合多云环境,可以连接到多个数据库(数据仓库/湖、ETL和BI工具)并从中提取元数据的数据目录工具,是在集中目录中扩展数据访问的关键。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1097686.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux系统中如何开启和配置OpenGauss数据库的远程连接

文章目录 前言1. Linux 安装 openGauss2. Linux 安装cpolar3. 创建openGauss主节点端口号公网地址4. 远程连接openGauss5. 固定连接TCP公网地址6. 固定地址连接测试 前言 openGauss是一款开源关系型数据库管理系统,采用木兰宽松许可证v2发行。openGauss内核深度融合…

基于变电站自动化系统中的安全措施分析及应用

摘要:阐述变电运行中的问题,电气自动化系统与安全运行措施,包括自动控制设备的投入,电气自动 化与计算机技术相、设备数据的采集与处理、自动化系统的升级、人工智能技术的应用。 关键词:自动控制;数据采…

浅谈安科瑞多回路仪表在德国数据中心的应用

摘要:数据中心是一个聚集了大量服务器、存储设备、网络设备及配套UPS、空调等设备的IT设备场所,是实现数据信息的集中处理、存储、传输、交换和集中管理等业务的服务平台。 数据中心供电电源质量的好坏直接影响到IT设备的安全运行,因此对数据…

SQ4840EY-T1_GE3具有低导通电阻和低电压降 汽车级 N沟道功率MOSFET

SQ4840EY-T1_GE3是一款高性能的车规级电子IC芯片,它具有多种功能和特点,适用于各种电子设备和应用领域。采用了先进的工艺技术,具有高性能和稳定的特点。它采用了先进的封装技术,能够在广泛的温度范围内正常工作,适应各…

Jmeter接口自动化测试 —— Jmeter下载安装及入门

jmeter简介 Apache JMeter是Apache组织开发的基于Java的压力测试工具。用于对软件做压力测试,它最初被设计用于Web应用测试,但后来扩展到其他测试领域。 下载 下载地址:Apache JMeter - Download Apache JMeter 安装 由于Jmeter是基于Java的…

146.LRU缓存

双向链表哈希表 class LRUCache { public://1、定义双向链表结构、容量、哈希表等LRU数据成员struct Node{int key,value;Node *left,*right;Node(int _key,int _value):key(_key),value(_value),left(NULL),right(NULL){}}*L,*R;int n;unordered_map<int,Node*> ump;//…

基于Debian12打造的LMDE 6 “Faye” 正式发布

导读LMDE 6 已正式发布&#xff0c;代号 "Faye"&#xff1b;新版本基于 Debian 12 Bookworm。 LMDE 6 已正式发布&#xff0c;代号 "Faye"&#xff1b;新版本基于 Debian 12 Bookworm。 LMDE 是 "Linux Mint Debian Edition" 的缩写&#xff0c…

进来“抄作业”!示例代码、操作手册,尽在华为云Codelabs!

1 Codelabs 简介 1.1 什么是 Codelabs&#xff1f; Codelabs 是华为云开发者工具&#xff0c;提供互动式的&#xff0c;以实践为主的教程&#xff0c;这些教程旨在指导开发者通过实际操作来学习新的编程技能、工具、框架。华为云 Codelabs 提供丰富的华为云产品代码示例/操…

2023年中国半导体检测仪器设备销售收入、产值及市场规模分析[图]

半导体测试设备是一种用于电子与通信技术领域的电子测量仪器。随着技术发展&#xff0c;半导体芯片晶体管密度越来越高&#xff0c;相关产品复杂度及集成度呈现指数级增长&#xff0c;这对于芯片设计及开发而言是前所未有的挑战&#xff0c;随着芯片开发周期的缩短&#xff0c;…

使用解构赋值简化axios返回对象属性元素的提取

axios返回的response通常都会进行一层封装&#xff0c;把响应的数据封装到了data这个对象&#xff0c;所以提取数据起来不太方便&#xff0c;往往需要res.data.xxx这样获取里面的数据&#xff0c; 具体可以参考下面的数据结构&#xff1a; 假如data的数据是下面的结构&#xf…

一个项目多个工程实现方法

一个项目中&#xff0c;往往会有多个工程&#xff0c;以便管理不同的代码。通常情况是面向不同客户或者debug调试才需要这样使用。 下面笔者通过一个简单的demo来说明一下使用方法 步骤&#xff1a; 1.增加工程&#xff0c;分别命名为&#xff1a; Client_A&#xff0c;Clien…

数据结构题型18-哈夫曼树和哈夫曼编码

文章目录 1 哈夫曼树定义2 哈夫曼树构造3 哈夫曼编码4 并查集 1 哈夫曼树定义 2 哈夫曼树构造 3 哈夫曼编码 4 并查集 暂不做补充。

Spring framework Day16:@PropertySource注解使用

前言 在开发应用程序过程中&#xff0c;经常需要使用外部的属性文件来配置应用程序的行为。Spring框架提供了PropertySource注解&#xff0c;它可以方便地加载外部的属性文件&#xff0c;并将其中定义的属性值注入到Spring配置中。使用PropertySource注解&#xff0c;我们可以…

华为OD机试【优选核酸检测点】【2022.11 Q4 新题】

图片出自&#xff1a;华为机试真题 Java 实现【优选核酸检测点】【2022.11 Q4 新题】_寻找核酸检测点java_MISAYAONE的博客-CSDN博客 首先这是一道很恶心的题目。题目信息量大&#xff0c;逻辑分支多&#xff0c;还有各种细节上的坑。 本着死磕精神&#xff0c;耗时2h&#xf…

港联证券:四上市险企 前三季保费近1.8万亿

近日&#xff0c;跟着今年前9个月保费数据相继发表&#xff0c;各上市险企前三季度成果表现也得以一窥终究。数据闪现&#xff0c;我国人寿、我国人保、我国安全、众安在线4家上市险企共完结原保险保费收入&#xff08;下同&#xff09;1.78万亿元&#xff0c;同比添加6.09%。 …

预约按摩app软件开发定制足浴SPA上们服务小程序

同城按摩小程序是一种基于地理位置服务的小程序&#xff0c;它可以帮助用户快速找到附近的按摩师&#xff0c;并提供在线预约、评价、支付等功能。用户可以通过手机或者其他移动设备访问同城按摩小程序&#xff0c;实现足不出户就能预约到专业的按摩服务。 一、同城按摩小程序的…

2023年中国无创呼吸机产销量、竞争现状及行业市场规模分析[图]

医用呼吸机也被称之为机械通气&#xff0c;又能细分为无创机械通气&#xff08;NIV&#xff09;和有创机械通气&#xff08;IMV&#xff09;两种&#xff0c;即无创呼吸机和有创呼吸机。无创呼吸机又称气道正压通气呼吸机&#xff0c;它是一种以非创伤方式通过口鼻为使用者提供…

智能化安全巡更巡查系统—提升安全管理效率

传统的巡检都是手工完成&#xff0c;记录、拍照&#xff0c;回到办公室打印表单再交给作业队伍整改&#xff0c;再去现场核实复查&#xff0c;流程繁琐&#xff0c;效率低。而且大部分工地为了减少麻烦&#xff0c;人员往往都是口头沟通&#xff0c;存在很大质量风险&#xff0…

计网第六章(应用层)(四)(电子邮件)

目录 1、三个构成 2、基本过程 3、具体实现过程 4、 电子邮件 4.1 简单邮件传送协议SMTP 4.2电子邮件的信息格式 4.3多用途因特网邮件扩展MIME 4.4邮件读取协议 4.5基于万维网的电子邮件 电子邮件采用客户/服务器的方式。 1、三个构成 电子邮件系统的三个组成构件&a…

echarts 柱状折线图(折叠柱状图)月年汇总

echarts柱状折线图 前几项是按月计算&#xff0c;最后一列是年份这种情况如何实现呢&#xff1f; 如下图 或者 代码如下&#xff1a; 图一代码&#xff1a; <e-charts :option"option5" class"chart7"></e-charts>const option5 {tool…