如何成功实施一个数据治理项目?实施步骤有哪些?

news2024/10/6 4:11:20

企业数字化转型以数据为中心,通过数据驱动业务发展、管理协同和运营。因此,数字化转型关键在于数据,数据治理则需先行。从而更好激发数据生产要素潜能,实现业务数据化、数据价值化,助力企业数字化转型。

那么何为数据治理?

国际数据管理协会(DAMA)在其《DAMA数据管理知识体系指南(第2版)》一书中将数据治理进行了定义,即数据治理是对数据资产管理行使权力、控制和共享决策(规划、监测和执行)的系列活动。此外,DAMA还将数据治理作为数据管理十大知识领域的中心,负责知识领域的平衡和一致性。 file

DAMA提到数据治理的目标有三点:提升企业数据资产管理能力;定义、批准、沟通和实施数据管理的原则、政策、程序、指标、工具和责任;监控和指导政策合规性、数据使用和管理活动。

可以看出,DAMA给出了比较全面的解释,但是距离企业可落地的数据治理还是距离较远,更像是纲领性的介绍,因此对于如何进行数据标准的制定以及如何进行数据资产的评估都缺少具体的描述。

2020年,信通院牵头制定数据治理服务商成熟度模型(DGS),这一评估模型填补了数据治理服务领域的空白。模型以数据治理服务项目实施运维的流程为主线,融合数据治理核心能力,包括6大能力域、21个能力项,其中6大能力域遵循一般性数据治理项目流程,具体如下:

1.需求管理能力域:提供方通过采集需求方的业务需求、数据需求、技术需求等,明确数据治理目标和范围,并评估实施数据治理可行性;

2.资源评估能力域:提供方通过对数据来源、数据规模、数据分类、数据关系、数据时效性、专业软件工具、存储计算环境以及硬件资源等主要影响因素进行分析,以提升数据治理项目任务分解的准确性,指导识别项目中的潜在风险;

3.实施保障能力域:提供方通过制定实施规划,建立组织保障,开展风险管理,确保数据治理项目的顺利实施,降低风险和成本;

4.方案设计能力域是数据治理项目的核心环节,提供方通过制定相关规范体系和设计文档,形成满足甲方需求的数据治理体系;

5.方案实施能力域提供方通过依托相关平台工具,实现方案的落地;

6.成果交付能力域包括试运行、成果验收2个能力项。 file

当前企业对于数据治理服务的关注点已逐渐从平台产品扩展至方案设计、实施交付、持续运营的全访问服务体系。专业的团队,是项目成功的关键,依托于专业的数据治理服务团队和知识沉淀,开展项目实施工作。

数据治理组织建议

首先CIO或CDO是项目顺利进行的关键角色,可以更高效地推动实施团队与业务的融合。其次是项目的项目经理,负责项目的管理和资源调度,各阶段人员及工作安排,项目计划制定、进度控制、项目风险管理、项目质量把关等;技术负责人、系统架构师、项目管理专员是项目团队的智囊团和质量保障;根据项目需求,安排不同岗位职能人员开展实施及售后工作,包括但不限于业务架构师、业务分析师、数据架构师、数据开发工程师、测试工程师、技术支持、运维工程师、产品专家、产品经理、客户成功专员等。

file

数据治理步骤

项目交付主要分为4个步骤,以需求调研为切入点,以方案设计为规划核心,以开发实施为交付重点,以上线运维为服务保障,依次稳步开展保证项目的顺利实施。

第一步是需求调研:通过业务调研切入,以收集资料和访谈调研为抓手,了解业务流程和痛点,深挖根本原因。以数据调研作为后续方案设计的开端,结合业务调研的痛点与根本原因,了解数据系统的现状后,以数据角度切入整体解决方案。

第二步是方案设计:以数据标准方案为基石,以场景规划方案为需求原点,以数据架构方案为纲领,进行整个数据治理方案设计;以实际需求为主,形成规范的组织架构、管理制度,参考国标及行标,形成数据标准方案,为后续实施打下坚实基础;通过需求调研整理客户实施的场景范围,输出原型设计及指标清单,确认后输出场景规划文档,以此确定整体需求范围;根据整体需求范围和数据系统现状,搭建数据架构,划分业务域及数据域,规划后续开发实施的整体框架。

第三步是开发实施:确定整体方案后,进行产品部署、数据探查、数据同步工作,根据场景规划和架构设计方案,遵循数据标准方案,进行数据开发与数据治理。

第四步是上线运维:整体开发完成后进行试运行,同步开展产品测试工作,均通过后进行产品验收及正式上线,后续由运维部门进行巡检及售后工作。

file

DGS对数据治理的方方面面进行了解释,给出了模型规范和评估标准。对于企业来说,不管是想自己做数据治理,还是通过服务商来实现部分数据治理工作,DGS都提供了一套相对全面的参考指南。

目前,袋鼠云已通过DGS三级评估。整体来看,目前数据治理提供商的数据工程服务能力优势集中于数据资源评估、数据质量、数据标准等能力项。 file

《数栈产品白皮书》:https://www.dtstack.com/resources/1004?src=szsm

《数据治理行业实践白皮书》下载地址:https://www.dtstack.com/resources/1001?src=szsm

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szcsdn

同时,欢迎对大数据开源项目有兴趣的同学加入我们,一起交流最新开源技术信息,号码:30537511,项目地址:https://github.com/DTStack

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/642771.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

零代码产品新秀敲敲云与明星产品简道云、轻流对比

零代码产品正在成为当今技术领域的热门话题。随着人们对更快、更简单的开发流程的需求不断增加,零代码产品正在作为一种解决方案得到越来越多的关注。 零代码技术源于低代码技术,与低代码不同的是,零代码不需要任何代码编写。这意味着即使是普…

让人头疼的时序数据预测,这个方案居然三步就搞定了?

数字化时代,时序数据预测已经从一种理论研究转变为各行业实际运营中的关键工具,这种预测可以覆盖广泛的业务领域,比如: 利用历史销售数据进行未来销售趋势的预测 根据既往的电力消耗数据预估未来电力需求 基于过去的股市行情预测未…

释放 OpenAI 和 ESP-BOX 的力量:ChatGPT 与乐鑫 SoC 融合指南

当前,我们正见证着一场技术革命,而 OpenAI 正处于这场变革的最前沿。其中最激动人心的创新之一就是ChatGPT,它运用自然语言处理的力量,打造出更加引人入胜、直观的用户体验。而将 OpenAI 的 API 与物联网设备相结合,更…

Spring Cloud Kubernetes配置使用详情

目录 一、 为什么你需要 Spring Cloud Kubernetes? 二、 Starter 三、 用于 Kubernetes 的 DiscoveryClient 四、Kubernetes 原生服务发现(service discovery) 五、Kubernetes PropertySource 的实现 1、使用 ConfigMap PropertySource …

Unreal Engine 5.1 AI行为树基础入门

ai行为树理解起来其实是npc根据自身一些情况进行一些逻辑执行,而这些逻辑是我们使用ai行为树去实现的。 ai行为树需要一个寻路网格体边界体积,在ue引擎中,体积Actor分为多种,寻路网格体边界体积只是其中的一种。 关于其它的体积&a…

leetcode:448. 找到所有数组中消失的数字(python3解法)

难度:简单 给你一个含 n 个整数的数组 nums ,其中 nums[i] 在区间 [1, n] 内。请你找出所有在 [1, n] 范围内但没有出现在 nums 中的数字,并以数组的形式返回结果。 示例 1: 输入:nums [4,3,2,7,8,2,3,1] 输出&…

初识网络之https的加密与解密

目录 一、https协议的概念 二、加密的概念 三、为什么需要加密 四、常见的加密方式 1. 对称加密 2. 非对称加密 五、数据摘要(数据指纹) 六、数据签名 七、加密方案 1. 方案一:只使用对称加密 2. 方案二:只使用非对称加…

院士大咖齐聚蓉城,论道“疑难眼眶病学术论坛”

“全国疑难眼眶病诊疗带教基地”成立,力促“病有所医 ” 大咖云集,这是一场眼科界领军人汇聚一堂,聚焦疑难眼眶病突破性学术成果及前沿技术的高规格论坛; 规模空前,这是一场围绕眼眶病诊疗技术议题深入探讨交流,为我国…

行为型设计模式08-职责链模式

🧑‍💻作者:猫十二懿 ❤️‍🔥账号:CSDN 、掘金 、个人博客 、Github 🎉公众号:猫十二懿 职责链模式 1、职责链模式介绍 责任链模式(Chain of Responsibility Pattern)…

seatunnel入门案例,集群模式

目录 安装部署 解压 环境变量 安装plugin 添加资源jar包 SEATUNNEL 配置文件 env:环境设置 source:数据源设置 sink:数据去向设置 transform: 数据转换设置 运行方式 seatunnel 引擎(zeta) 本地模式 集群模式 安装部署 解压 tar…

Centos7在Nginx中配置SSL证书

我的环境 阿里云轻量应用服务器(Linux, Centos7.9 x64) 一、申请免费SSL证书 一年可以创建20个 下载证书(我是Nginx服务器) 下载到本地后,打开有两个文件: 二、将SSL证书文件上传至服务器 通过WinScp拖…

图像sensor的特性和驱动解析

1、更换OV9712并且做配置更改和测试 1.1、更改配置脚本 修改Hi3518E_SDK_V1.0.3.0\package\mpp\sample\Makefile.param 1.2、测试运行 运行官方SDK sample的测试版本(打包到本地) 运行ORTP传输的测试版本(RTP实时预览) 1.3、更…

如何高效合理规划每天的工作?

如何高效合理规划每天的工作? 〇、基本原则 梳理工作,明确目标。(SMART法则)轻重缓急,排优先级。(四象限管理法则)要事第一,尽管去做。(GTD 理论)限时deadl…

新买的电脑怎么用U盘重装系统?新买的电脑用U盘重装系统教程

新买的电脑怎么用U盘重装系统?用户新买了电脑,想知道怎么用U盘来重装新买的电脑,用U盘来重装电脑其实非常简单,用户需要准备一个U盘,然后完成U盘启动盘的安装,接着按照以下分享的新买的电脑用U盘重装系统教…

[Hadoop安装配置 ]

目录 前言: 执行步骤: 1 创建好目录文件,上传Hadoop版本压缩包,一般都是tar.gz 结尾包 1.1这里压缩包可以直接拖拽到指定虚拟机目录下, 例如xshell连接指定虚拟机, 然后可以拖拽,如果拖拽不了,那就需要设置一下配置, 或者 使用 xftp工具 连接xshell 然后上传文件 2 解压…

pandas---数据合并(concat、append、merge)

1. concat函数 pd.concat([data1, data2], axis1) 按照行或列进行合并,axis0为列索引,axis1为行索引。 df1 make_df([1, 2], [A, B]) df2 make_df([3, 4], [A, B]) display(df1, df2) # 默认上下合并,垂直合并 pd.concat([df1, df2]) …

【机器学习】——学习的基本分类:算法模拟的根本出发点!

目录 引入 一、分类 1、基于学习策略的分类 2、基于所获取知识的表示形式分类 3、按应用领域分类 4、综合分类 二、研究领域 引入 机器学习是继专家系统后人工智能的又一重要研究领域!机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新…

前端面试经验技巧分享

👩 个人主页:不爱吃糖的程序媛 🙋‍♂️ 作者简介:前端领域新星创作者、CSDN内容合伙人,专注于前端各领域技术,成长的路上共同学习共同进步,一起加油呀! ✨系列专栏:前端…

NVIDIA的StyleGAN、StyleGAN2、StyleGAN3系列论文解读,梳理基于风格的生成器架构

通俗来讲就是,张三造假币(Generator生成器),然后用验钞机去验证真假(Discriminator辨别器),如果是假的就继续提高造假技术,直到验钞机检验不出来为止,也就是说一个造假一个验假(验钞机也需升级),两者互相学…

Redis集群部署

Redis集群部署 1.单机安装Redis2.Redis主从集群2.1.集群结构2.2.准备实例和配置2.3.启动2.4.开启主从关系2.5.测试 3.搭建哨兵集群3.1.集群结构3.2.准备实例和配置3.3.启动3.4.测试 4.搭建分片集群4.1.集群结构4.2.准备实例和配置4.3.启动4.4.创建集群4.5.测试4.5.测试 本章是基…