云原生时代数据治理的变革与创新

news2024/11/16 19:31:57

随着数字化进程的深入,企业对数据的依赖日益加深,数据资源的重要性愈发凸显。如何管好、用好数据,做好数据治理工作,发挥数据资源价值,成为企业提质增效过程中的重要议题。

在本次直播中,我们介绍了数据治理体系、技术框架及云原生数据平台在数据治理领域的优势。以下内容根据直播文字整理成稿。

传统数据治理体系及框架

在数字化转型中,战略驱动是根本,数据治理是基础,数据智能是方向。

数据治理就是从组织、管理、技术的角度持续改变数据使用行为的过程,贯穿整个数据生命周期。数据治理的根本目标是确保数据安全,提升数据价值。

同时,数据治理更是一个体系,其关注于信息系统的执行层面,以整合信息科技部门与业务部门的知识和意见为目的,通过数据治理组织对企业的信息化建设进行全方位的监管,从而迭代数据资产价值,赋能业务发展,达成业务战略,保障数据安全,降低隐私泄露的风险。

数据治理体系涉及企业的组织、管理、技术等多个层面,和业务部门关系紧密。通常,企业的数据治理工作都是由业务部门牵头,IT部门辅助执行。 

图1 数据治理体系架构图 

如上图所示,数据治理体系分为三个层级,分别是数据治理对象、数据治理任务和数据治理支撑。

  • 数据治理的对象围绕主题进行划分,不同企业的数据主题不尽相同,与企业自身组织和部门设置密切相关,这里不再展开描述。
  • 数据治理支撑包括企业的组织架构、在数据治理过程中的角色、企业内部基于数据治理相关的制度与流程以及IT 技术架构与平台。
  • 数据治理任务,主要包含主数据管理、数据标准管理、数据质量管理、数据资产管理、数据安全管理、数据生命周期等。其中,主数据管理、元数据管理和数据质量管理是重点所在。

主数据管理

主数据是指描述核心业务实体的数据,如客户、产品、员工、账户等,具有高业务价值的、可在跨越各个业务部门被重复使用的数据,并且存在于多个异构的应用系统中。

主数据管理将从企业多个业务系统中整合最核心、最需要共享的数据(即主数据)集中进行清洗和丰富,并以服务的方式把主数据分发给企业范围内的操作型和分析型应用。

主数据管理的目的是为了保证在跨系统和跨平台使用数据的时候,主数据能够保持一致。

数据质量管理

数据质量管理体系包括数据质量的判断以及所有对数据质量起到保证提升作用的活动、流程,力求实现全方位数据质量管理。

其中,数据质量优化提升是面向存量数据,按业务系统或者主题分批对数据进行分析、清洗,提高既有数据质量的数据质量管理活动。

数据质量管理的管控,首先需要企业内部制订相关的规章制度,并将数据按照不同的主题域指定相应的归口部门,确保数据质量是的持续提升。

图2 数据质量问题归因溯源 

通过上方的鱼骨图可以看出,数据质量问题产生的原因有很多,其中人员、流程、业务系统前段录入属于原生数据质量问题;业务系统后端数据库设计、数据抽取、数据加载等属于次生数据质量问题。

针对原生数据质量问题,可以通过提高录入的自动化和易用性等手段,降低前端输入时出错的机率。

对于次生数据质量问题,通过在数据流转过程中加入一些埋点校验,进行数据比对,避免数据出错。

元数据管理

元数据用来描述数据的数据,相当于书籍的目录,是数据的解释说明信息,使数据的使用者可以了解数据的特征、内容、作用,以及获取方式等信息,并对数据是否能满足使用需求做出适当的评价。

在数据治理体系中,元数据可分为业务元数据、技术元数据、操作元数据和管理元数据四种类型。

元数据管理分为采集、管理、分类、服务四个层面,涉及标准制订、补充维护、管理分类、血缘分析、查询统计等诸多环节。

对于大型企业,元数据的规模比较庞大,要实现元数据管理需要投入大量的人力和时间,工程周期往往以年为单位。

此外,企业数据治理还涉及数据标准、数据安全、数据生命周期等,这里不再展开赘述。

 数据治理面临的难题

随着新技术的不断涌现和数据量的极速增长,传统数据治理体系在实施时面临着以下挑战:

  • 元数据管理成本高:业务元数据的实施需要业务人员的介入与识别,每个数据平台都要录入,数据流转的操作元数据也需要进行录入,导致记录成本高。
  • 数据质量难以保障:数据在平台间流转的过程中会产生次生数据质量问题,需要进行大量的埋点校验工作。
  • 数据标准落标复杂:每个数据平台都要进行数据标准的检查,跨平台的数据标准一致性难以保障。
  • 数据同步策略复杂:主数据平台必须向多个数据平台同步主数据,需要复杂的同步策略,否则可能面临主数据的版本不一致问题。
  • 敏感数据难以集中治理:需要定期对每个数据平台的敏感数据进行识别,数据跨平台流转还需要加密解密,维护困难。
  • 数据服务响应周期长:数据服务要经过多个数据平台进行加工和etl,拉长了数据服务的响应时间。

云原生数据平台下的数据治理

当前,云计算对企业IT架构产生了深刻影响和变革,云原生平台能够在很大程度减轻上述数据管理与治理负担,缩短响应周期,基于云原生平台的数据治理应运而生。

 图3 云原生平台体系与数据治理 

如上图所示,与传统数据体系相比,云原生数据平台体系具有以下特点:

  • 一站式敏捷数据服务:通过一站式的数据门户,快速检索数据资产,敏捷开发新的数据服务与产品,快速发布上线,和用户互动迭代更新,滚动沉淀企业的数据资产价值。
  • 云原生数据平台:采用存算分离架构,原生支持OneData,保证企业核心数据的一致性,降低数据治理的复杂度;根据业务形态,实现资源弹性伸缩、动态调度与高并发,满足各种业务场景的灵活要求。同时具备自愈能力,提高系统可用性。
  • 云原生大数据支撑平台:为云原生化的数据平台提供稳定支撑,实现存算分离、弹性调度、更好的资源隔离等能力,同时也支持混合云等多种异构环境部署,保障业务的灵活性,帮助企业快速实现业务目标。

随着新技术的不断成熟,应用场景不断增加,业务模式不断复杂化,全域数据治理的理念日益受到企业的重视。全域数据涵盖了企业相关的内外部数据,与企业的业务和商业性质息息相关。

云原生数据平台的“存算分离”,实现了企业内的全域数据融合,整合了分散的数据平台,彻底消除了数据孤岛现象,并且可以集中进行数据安全管理,减少安全漏洞产生环节,同时也减少了次生数据质量问题;针对全域数据一站式地管理主、元数据、数据标准、数据架构与模型,大幅降低数据治理的复杂度;同时,云原生的数据资产服务也使业务变得更加敏捷,适应市场的瞬息万变,不断迭代数据资产,从而达成数字化转型。

目前,HashData作为国内领先的云原生数据平台,已在金融、电信、政务、能源、交通等众多领域实现大规模商用,帮助企业高效、便捷地开展全域数据治理工作。

图4 HashData在国有大行生产落地实例

以某国有大行为例,使用HashData云原生数据平台整合了所有P9分析平台,将全域数据按照主题域进行划分,实现了数据集中管控,数据架构融合统一。

同时,上收所有分公司的数据平台,统一提供全域数据与计算资源。基于共享存储管理着全行统一的、面向分析的企业级数据视图,按应用场景的不同建立多个计算集群,任意计算集群在授权后均可访问共享存储中的任意数据,以完成业务加工计算或在线查询分析。

由于数据平台统一,可以在全行内使用统一的数据模型最佳实践,避免不同技术栈产生的模型差异,减少了次生数据质量问题和元数据操作,大幅降低了数据管理成本。

未来我们期待为各行各业带来最新的云原生技术实践,赋能企业实现OneData,轻装上阵释放数据价值!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/687709.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

leetcode:191. 位1的个数

难度:简单 编写一个函数,输入是一个无符号整数(以二进制串的形式),返回其二进制表达式中数字位数为 1 的个数(也被称为汉明重量)。 提示: 请注意,在某些语言(…

qt 最小文件系统 交叉编译qt源码

busybox qt源码下载后,需要交叉编译,在开发板上生成相应的库,才能在开发板上使用 我用qt制作了一个计时器,有相应的按钮功能。在windows上我大概知道鼠标点击按钮能够触发相应事件。把该程序移植到linux开发板上,开发…

Qt QSqlTableModel详解

背景知识: Qt SQL的API分为不同层: 驱动层 驱动层 对于QT是基于C来实现的框架,该层主要包括QSqlDriver、QSqlDriverCreator、QSqlDriverCreatorbase、QSqlDriverPlugin and QSqlResult。这一层提供了特定数据库和SQL API层之间的底层桥梁…

AutoSAR系列讲解(入门篇)3.2-RTE对Runnables的运行支撑

目录 一、作为运行环境的主要功能点 二、Runnables的触发条件 一、作为运行环境的主要功能点 通过RTE给runnable提供触发事件。 之前说过了runnable是可以被触发的,就是需要通过RTE来实现这个触发和调用runnable,具体在下面讲解 通过RTE给runnable提供…

STM32外设系列—DHT11

文章标题 一、DHT11简介二、数据手册分析2.1 接口说明2.2 串行通信说明2.2.1 单总线通信2.2.2 单总线传输数据位定义2.2.3 时序图 三、DHT11程序设计3.1 初始化GPIO3.2 发送起始信号3.3 接收一个字节数据3.4 接收温湿度信息并校准 四、总结 一、DHT11简介 DHT11是一款常用的数…

Qt生成安卓工程运行闪退分析

提示找不到库 jin目录下库是存在的 提示下列库没有找到 libopencv_java4.so libtiff.so libboost_filesystem.so.1.71.0 libboost_chrono.so.1.71.0 libboost_regex.so.1.71.0 导致无法加载符号 最终导致应用无法启动,而退出 重新编译为静态库,并以静态库方式链…

技术管理第三板斧招聘与解聘-升级汰换

1.开除人“心要慈,刀要快” No Surprise: 不要突然Fire一个人(离职一定不是一个突发行为),没有任何征兆告诉员工 A“你被开除了”,这是典型的管理失职。如果A存在问题,你应该先告知&#xff0…

数据结构--顺序表的基本操作--插入 and 删除

数据结构–顺序表的基本操作–插入 顺序表的插入操作 实现目标 ListInsert(&L,i,e):插入操作。在表L中的第i个位置上插入指定元素e。 typedef struct {int data[MaxSize];int len; }Sqlist;代码实现&#xff1a; #include <stdio.h> #include <stdlib.h> …

前端JavaScript入门-day03

(创作不易&#xff0c;感谢有你&#xff0c;你的支持&#xff0c;就是我前行的最大动力&#xff0c;如果看完对你有帮助&#xff0c;请留下您的足迹&#xff09; 目录 1、循环-for 1. for 循环-基本使用 1. for循环语法 2. 退出循环 2. for 循环嵌套 2、数组 1 数组是…

易点易动设备管理平台:为制药厂提升设备管理效率保驾护航

在高度竞争的制药行业中&#xff0c;设备管理对企业的生产效率和产品质量起着至关重要的作用。如何在保证设备安全、高效运行的同时&#xff0c;降低成本和提高设备利用率呢&#xff1f;易点易动设备管理平台为您提供了完美的解决方案。本文将详细阐述易点易动设备管理平台如何…

Linux搭建sqli-labs(sql注入实战)

目录 一、安装phpstudy 二、更改配置文件 三、加载数据库 一、安装phpstudy 需要php、mysql、httpd环境&#xff0c;phpstudy可以做到快速部署。 cd /opt yum install -y wget wget -O install.sh https://notdocker.xp.cn/install.sh && sudo bash install.sh wget…

Podman安装nacos使用(默认最新版)

一,命令熟悉 --name : 命名容器的名称. -d:表示在后台运行容器. -p:指定端口映射。如: 左边的8848是宿主机的端口,右边的8848是nacos容器内部的端口。 docker.io/nacos/nacos-server:表示根据docker.io/nacos/nacos-server镜像运行容器。 --restart=always 表示启…

【MySQL】看完这篇不信你学不会如何使用数据处理函数

&#x1f3ac; 博客主页&#xff1a;博主链接 &#x1f3a5; 本文由 M malloc 原创&#xff0c;首发于 CSDN&#x1f649; &#x1f384; 学习专栏推荐&#xff1a;LeetCode刷题集&#xff01; &#x1f3c5; 欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指…

JDK的生成keytool证书

JDK的生成keytool证书 首先安装jdk环境 地址: https://www.oracle.com/downloads/ 点击页面下方的java 选择Java (JDK) for Developers 选择你的环境安装包&#xff0c;我的电脑是windows64位&#xff0c;选择x64 MSI Installer 下载完成后安装 进入jdk根路径执行命令 keytoo…

PaddleOCR #使用PaddleOCR进行光学字符识别 - OCR模型对比

PaddleOCR 在其工具包中提供了多种模型&#xff0c;并且非常易于应用。根据准确性和速度比较模型始终是一个好习惯。在本节中&#xff0c;我们将比较 PaddleOCR 提供的四种模型&#xff0c;即 SRN、PP-OCRv2、PP-OCRv3 和 NRTR。比较将在 COCO-text 数据集上进行&#xff0c;该…

【每日编程Day30】最难的问题 因子个数

目录 一、选择题 二、编程题 1、最难的问题 2、因子个数 一、选择题 &#xff08;1&#xff09;当包装类与基本数据类型比较&#xff0c;包装类会自动茶香变为基本数据类型再比较&#xff1b; &#xff08;2&#xff09;包装数据类直接赋值&#xff0c;默认调用其对用的val…

项目经理提高影响力的6大原则

在很多临时组建的项目团队中&#xff0c;项目经理往往处于权、责、利不匹配的尴尬状态&#xff0c;即有责无权。项目经理既需要对项目目标的实现负责&#xff0c;又没有相匹配的权利。 在这种情况下&#xff0c;项目经理不能通过权利进行团队管理&#xff0c;只能通过个人影响力…

cmd 108个常用命令,看看你知道多少

背景 一、CMD是什么 在不同的操作系统环境下&#xff0c;命令提示符各不相同&#xff0c;在Windows环境下&#xff0c;命令行程序为cmd.exe&#xff0c;是一个32 位的命令行程序。 cmd是指命令提示符&#xff0c;是在操作系统中&#xff0c;提示进行命令输入的一种工作提示符…

SpringBoot处理实际开发中常见的七种全局异常详解(全面详细+Gitee源码)

前言&#xff1a;在日常的开发工作中&#xff0c;项目在运行过程中多多少少是避免不了报错的&#xff0c;对于报错信息肯定不可以把全部信息都抛给客户端去显示&#xff0c;这里就需要我们对常见的七种异常情况统一进行处理&#xff0c;让整个项目更加优雅。 目录 一、基本介绍…

别迷茫!电子与通信相关专业,详细就业方向!

一、通信领域 1、算法工程师 算法工程师对我们来说&#xff0c;有两种可选择的方向&#xff0c;一种是通信算法工程师&#xff0c;一种是信号处理算法工程师。 通信算法工程师&#xff1a;需要对通信目标、干扰、杂波和信道模拟进行算法研究与数学仿真。了解4G和5G的相关技术。…