[数据概念]一分钟弄懂数据治理

news2024/10/6 22:26:20

 数据治理是数据资产化的起点。

数据资产化的趋势正愈演愈烈。然而,我们必须清醒地认识到,资产化的前提条件是拥有实际的数据资产。那么,这些宝贵的数据资产究竟源自何处呢?答案显而易见,它们源自企业日常运营中积累的丰富数据。

但是,如何将这些海量的数据转化为真正的数据资产呢?这并非一蹴而就的过程。首先,我们需要迈出关键的第一步——数据治理。数据治理是对数据进行有效管理、保护和利用的基础,它涵盖了数据的收集、清洗、整合、存储、分析和应用等各个环节。

通过严谨的数据治理,我们可以确保数据的准确性、一致性和完整性,提高数据的质量和可靠性。同时,数据治理还能够帮助我们发现数据中的潜在价值,为企业的决策提供有力支持。

数据治理是数据资产化的重要基石。只有在数据治理的基础上,我们才能将数据转化为真正有价值的数据资产,为企业的长远发展提供源源不断的动力。

今天我们就带大家快速理解何为数据治理,如何开展数据治理,对数据治理形成初步的概念,以便于理解其在数据资产化全流程中如何发挥作用。

01   何为数据治理

——————————————————

在日常与同行交流的过程中,时常会感觉到数据治理这一概念往往难以被准确而清晰地传达。

一方面,对于传统行业的客户而言,“数据治理”似乎是一个遥不可及且抽象的词汇,即便我们尝试用各种方式解释,也常常难以触及他们真正的理解点,仿佛隔着一层难以逾越的屏障。

另一方面,数据治理本身确实是一个涉及多个复杂数据能力领域的综合性概念,它不仅包括了源数据的管理、数据质量的控制,还涉及数据编目、数据隐私保护、数据科学的应用以及数据的整合等多个方面。这些领域的复杂性和多样性使得数据治理的阐述变得更为困难。

那么,我们首先明确一下概念。

数据治理的目的:将数据视为组织的宝贵资产,通过系统性的管理和控制,确保数据的质量上乘、安全可靠,并随时可供使用,以支持业务决策和战略发展。

数据治理的本质:数据治理是一种综合性的管理体系,它涵盖了流程、角色分配、政策制定、标准设定以及关键绩效指标等多个方面。这些要素共同协作,确保组织内部信息的准确性、一致性、及时性和安全性,从而优化数据的使用效率,助力组织高效达成其业务目标和战略愿景。

02   概念详解

——————————————————

单单前边两个定义还显得太单薄了一些。大家都知道,我们在IT领域的架构Architecture一词,其实是来自于古老的建筑行业的。下边我们就以建筑行业中的一些概念为例,解释数据治理的概念。

数据资产(Data Asset):数据资产,就像房产管理中的建筑物或财产,是数据治理的核心。数据资产,包括数据产品或数据集,在妥善的治理和培育下能产生巨大价值,而管理不当则可能导致风险和损失。

数据(产品)所有权(Data (Product) Ownership):在数据管理中,所有权是关键。尽管责任可能分散,但数据的最终所有者应是明确的,类似于房产中的所有者或房东。

数据管理员(Data Steward):数据管理员类似于物业管理员,负责将数据资产的管理责任分配给特定个体或团队,确保数据的质量、完整性和安全性。

数据消费者/用户(Data Consumers / Users):数据的使用者,无论是组织内部还是外部,都可以类比为房产的租户,他们为各种目的使用数据。

数据货币化(Data Monetization):数据货币化,即将数据资产转化为收入,如数据销售,与房产管理中的租赁收入、广告位销售等类似,都是资产价值化的体现。

数据合同(Data Contract):数据合同是数据提供方与使用方之间的正式协议,明确数据内容、格式和质量要求,类似于房产租赁协议,确保双方权益。

价值量化(Value Quantification):在数据治理和房产管理中,评估资产价值都至关重要。数据价值取决于其准确性、相关性和可获取性,而房产价值则受位置、面积和状况等因素影响。

数据安全和访问控制(Data Security and Access Controls):数据安全是保护数据资产不受未授权访问、使用和泄露的关键。这与房产管理中的安全设施、报警系统和门锁等安全措施相似。

数据架构(Data Architecture):数据架构定义了数据存储和检索系统的设计和结构,类似于建筑设计蓝图。它为数据资产提供了结构化和标准化的管理。

数据领域(Data Domains):数据领域类似于城市的不同街区,每个领域都有其特定的主题和要求。数据管理员需要确保每个领域的数据都得到妥善管理。

数据政策、标准和监管合规(Data Policies & Standards and Regulatory Compliance):这与房产管理中的法规、分区规定和建筑标准相似,数据政策和标准定义了组织内数据管理的规则,确保合规性。

 元数据管理(Metadata Management):元数据描述了数据资产的各种属性,如所有者、访问权限、时间戳等。这与房产的详细信息(如面积、位置、所有者等)类似,为数据提供了全面的描述。

数据质量(Data Quality):数据质量是评估数据适用性的关键指标,包括准确性、完整性和一致性。这与房产的状况和维护情况类似,都是确保资产价值的基础。

数据使用(Data Usage):跟踪和量化数据的使用情况有助于评估其潜在价值。这与房产的占用率和使用记录类似,都是评估资产价值的重要指标。

03   数据治理要解决什么问题

——————————————————

随着组织不断推进数字化进程和数据资源的不断累积,数据领域内的挑战也日益凸显,主要集中在以下几个方面:

1.在数据质量层面,缺乏准确性、完整性和一致性的数据往往成为分析和决策失误的根源,进而对业务成果产生负面影响。

2.谈及数据安全,未经妥善管理的数据极易成为安全漏洞和数据泄露的隐患,给组织带来严重的安全风险。

3.在数据合规性上,若缺乏有效的数据治理机制,组织可能会面临日益严格的数据保护法规的挑战,进而产生合规风险,甚至可能面临法律制裁。

4.数据使用方面,若缺乏明确的数据所有权和访问控制机制,数据滥用和未经授权的访问问题便难以避免。

5.数据存储方面,冗余数据和无效的存储管理会显著增加存储成本,同时降低数据管理的效率。

6.从数据利用的角度来看,缺乏有效数据治理的组织可能无法充分利用其数据资产,错失重要的业务洞察和价值。此外,可靠数据的缺乏也可能导致决策过程变得缓慢和低效,从而错失宝贵的业务机会。

7.最后,技术更新方面,缺乏统一的数据治理框架可能会阻碍组织采用新技术和工具,如大数据分析和人工智能,来最大化数据的价值。

因此,数据治理成为解决上述问题的关键,旨在确保数据的质量、安全、合规、有效利用以及技术更新的顺畅进行。

04   数据治理的步骤

——————————————————

对组织进行数据治理通常遵循一些基本流程。为了更清晰地理解,我们可以将数据治理的流程与图书馆管理流程进行类比,具体步骤如下:

  1. 明确数据治理目标与范围 - 确定图书馆的使命和服务范围:

    • 图书馆需要明确其服务目标(如教育、娱乐、研究)和服务对象(如学生、研究人员、公众)。

    • 数据治理也需要明确其目标(如提高数据质量、保证数据安全)和涉及的数据类型与业务领域。

  2. 组建数据治理团队 - 成立图书馆管理团队:

    • 图书馆需要一个由不同专业背景(如馆藏管理、信息科技、行政管理)的团队来运营。

    • 数据治理也需要跨部门的专业团队共同参与,以确保数据治理的顺利进行。

  3. 制定数据治理政策与标准 - 制定图书馆规则和服务标准:

    • 图书馆会制定借阅规则、分类标准、开放时间等。

    • 数据治理同样需要制定关于数据质量、安全、隐私和共享的政策和标准,以确保数据的合规使用。

  4. 确定数据治理架构与工具 - 选择合适的图书馆布局和管理系统:

    • 图书馆会选择合适的图书分类系统和管理软件。

    • 数据治理需要选择合适的数据治理架构(如数据仓库、数据湖)和工具,以支持数据治理的实施。

  5. 执行数据清理和整合 - 图书整理和编目:

    • 图书馆会对书籍进行整理、分类和编目,以便读者查找和使用。

    • 数据治理中也需要进行数据的清理和整合,以消除重复、错误和不一致的数据,提高数据的一致性和质量。

  6. 监测和改进数据质量 - 定期检查图书馆藏书:

    • 图书馆会定期检查图书的完整性和条件,对损坏的书籍进行维修或更换。

    • 数据治理需要定期监测数据质量,并采取措施进行改进,以确保数据的准确性和可靠性。

  7. 员工培训和文化建设 - 图书馆员工培训和文化建设:

    • 图书馆会培训员工遵守规则和提高服务质量。

    • 数据治理也需要培训员工理解和遵守数据治理政策,形成积极的数据治理文化。

  8. 确保合规性和应对法规变化 - 遵守版权法和其他法规:

    • 图书馆需要遵守版权法和其他相关法规,以确保其运营的合法性。

    • 数据治理也需要确保数据的使用和存储符合法律法规要求,并及时应对法规变化。

  9. 持续监控和评估 - 定期评估图书馆服务:

    • 图书馆会定期评估其服务效果,如读者满意度和服务使用情况。

    • 数据治理也需要进行持续监控和评估,以评估数据治理的效果,并根据评估结果进行调整和优化。

05   小结

——————————————————

数据治理是一项复杂而重要的任务,它涉及到组织内部数据的全生命周期管理,从数据的收集、存储、处理、分析到利用,都需要有严谨的数据治理体系来确保数据的质量、安全、合规和有效利用。虽然前文对数据治理的基本流程进行了简要的介绍,但实际上,数据治理的内容远比这更为丰富和复杂。

为了深入理解和掌握数据治理的知识和技能,国际组织DAMA(Data Management Association)提供了完整的知识体系。DAMA作为全球领先的数据管理组织,一直致力于推动数据治理和数据管理领域的最佳实践和标准制定。DAMA的数据治理知识体系包括了数据治理的定义、目标、原则、流程、技术、工具以及实践案例等多个方面,为数据治理的学习和实践提供了全面的指导和支持。

对于对数据治理感兴趣的读者来说,了解DAMA的知识体系将是一个很好的起点。DAMA中国作为DAMA在中国的分支机构,也提供了相应的培训内容和资源。通过参加DAMA中国的培训课程,读者可以系统地学习数据治理的理论和实践知识,了解最新的数据治理技术和工具,并与其他数据治理领域的专业人士进行交流和分享。

如果您对数据治理感兴趣,想要深入了解DAMA的知识体系,或者想要参加DAMA中国的培训课程,可以联系鼹鼠哥(或其他相关机构)了解更多的信息和资源。鼹鼠哥作为数据治理领域的专家,将为您提供专业的指导和帮助,让您在数据治理的道路上更加从容和自信。

数据资产化,鼹鼠哥与你一起。

图片

任何问题,欢迎大家公众号后台留言沟通。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1855025.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

车载以太网权威指南阅读笔记

总体思路: 要基于车载以太网做出相应的机器人以太网神经中枢,需要按照以下步骤: 了解车载以太网,包括但不限于 车载以太网是如何基于汽车需求定义的车载以太网的工作模式车载以太网工作所需要的硬件车载以太网中的数据交互模式 …

Chrome插件: Octotree让你GitHub代码浏览速度飙升

在GitHub上浏览和管理项目代码时,您是否曾为复杂的目录结构感到困惑?如果有一种工具能够让您轻松浏览项目的文件和目录,会不会大大提升您的工作效率?这正是Octotree浏览器插件所能做到的。 不过说实话,GitHub自带的代码…

WordPress视频主题Qinmei 2.0

WordPress视频主题Qinmei 2.0,简单漂亮的WP视频站源码 主题功能 可以根据豆瓣ID直接获取到其他详细信息,省去慢慢填写的痛苦;播放器支持直链,解析,m3u8格式,同时解析可匹配正则自动更改;新增动…

【建设方案】基于gis地理信息的智慧巡检解决方案(源文件word)

传统的巡检采取人工记录的方式,该工作模式在生产中存在很大弊端,可能造成巡检不到位、操作失误、观察不仔细、历史问题难以追溯等现象,使得巡检数据不准确,设备故障隐患得不到及时发现和处理。因此建立一套完善的巡检管理系统是企…

Flutter TIM 项目配置

目录 1. 设计说明 2. 参考资料索引 Flutter SDK 服务端 Rest API 腾讯后台 其他 3. TIM 整体架构 第一部分:APP 端 第二部分:腾讯服务器 第三部分:三方服务 第四部分:你自己的服务器 4. TIM SDK 集成 TUIK 含 UI 集成…

pywebview打包本地的html

51.安装 pip install pywebview 2.新建start.py import webview import timeclass API:def say_hello(self, name):time.sleep(2) # 模拟一个耗时操作return fHello, {name}!def main():api API()webview.create_window(pywebview Example, index.html, js_apiapi)webview.…

构建家庭NAS之二:TrueNAS Scale规划、安装与配置

首先声明一下,我用的版本是TrueNAS SCALE 24.04.1.1(目前的最新版本),其它版本的界面和操作方式或有不同。我安装使用过程中网上的一些教程里的操作方式和这个版本不一样,造成了一些困扰。 TrueNAS SCALE的最低硬件需…

DC/AC电源模块:提高太阳能发电系统的效率和稳定性

BOSHIDA DC/AC电源模块:提高太阳能发电系统的效率和稳定性 DC/AC电源模块是太阳能发电系统中的一个重要组成部分,其作用是将太阳能转化为交流电以供家庭或工业使用。它可以提高太阳能发电系统的效率和稳定性,使得太阳能发电系统更加可靠和持…

Pikachu靶场--CRSF

借鉴参考 CSRF跨站请求伪造(CTF教程,Web安全渗透入门)_bilibili pikachu靶场CSRF之TOKEN绕过_csrf token绕过的原理-CSDN博客 CSRF(get) 发现需要登录 查看提示,获取username和password 选择一个用户进行登录 选择修改个人信息 …

Applied Spatial Statistics(七):Python 中的空间回归

Applied Spatial Statistics(七):Python 中的空间回归 本笔记本演示了如何使用 pysal 的 spreg 库拟合空间滞后模型和空间误差模型。 OLS空间误差模型空间滞后模型三种模型的比较探索滞后模型中的直接和间接影响 import numpy as np impor…

Vue.js 自定义组件的三种用法

1.创建项目 创建项目,你可以参考我以前的博文,这里省略了 项目的目录结构如下: 接着,我们在 src/components 目录下创建一个自定义的组件 SplashHello.vue,示例代码如下所示: <template><div><p>{{ title }}</p><p>{{ message }}</p&…

深入探索 Nuxt3 Composables:掌握目录架构与内置API的高效应用

title: 深入探索 Nuxt3 Composables&#xff1a;掌握目录架构与内置API的高效应用 date: 2024/6/23 updated: 2024/6/23 author: cmdragon excerpt: 摘要&#xff1a;“本文深入探讨了Nuxt3 Composables&#xff0c;重点介绍了其目录架构和内置API的高效应用。通过学习本文&…

Leetcode 2713. 矩阵中严格递增的单元格数(DFS DP)

Leetcode 2713. 矩阵中严格递增的单元格数 DFS 容易想到&#xff0c;枚举每个点作为起点&#xff0c;向同行同列的可跳跃点dfs&#xff0c;维护全局变量记录可达的最远距离 超时&#xff0c;通过样例193 / 566 class Solution {int res 0;public void dfs(int[][] mat, in…

网络编程之XDP、TC和IO_URING以及DPDK

一、网络编程常见的技术 在前面已经分析过了XDP、TC和eBPF。也基本把三者间的关系理清了&#xff0c;但现在又有一个疑惑涌了上来。在前面提到过的IO_URING和DPDK与这些技术有什么关系呢&#xff1f;其实只要认真的看过分析文章可能大家心里都已经基本清楚了。 正如在前面不断…

视频格式怎么转换?9 个免费视频转换工具

前 9 款免费视频转换器有哪些&#xff1f;在此视频转换器评论中&#xff0c;我们收集了一些有用的提示并列出了顶级免费视频转换器软件&#xff0c;还找出了适合所有级别&#xff08;从初学者到专家&#xff09;的最佳免费视频转换器。 1. Geekersoft免费在线视频转换 最好的免…

【HTTPS云证书部署】SpingBoot部署证书

这里以华为云证书为例。 1. 下载证书 2. 解压 3. 选择.top_Tomcat复制到SpringBoot的Resource/source下 4. 在.properties文件中进行配置 修改key-store和key-store-password

vue3源码(五)ref、toRef、toRefs、proxyRefs

1.ref 功能 ref与reactive功能类似,都是将数据变为响应式&#xff0c;ref通常用来定义基本类型数据&#xff0c;如字符串、数字、布尔值等。而reactive用来定义对象&#xff08;或数组&#xff09;类型数据。虽然ref也可以用来定义对象或数组类型的数据&#xff0c;但内部会通…

Rxjava2最全面的解析

说到区别&#xff0c;可能有的小伙伴会问&#xff0c;我没看过rxjava1。可以直接看rxjava2么。个人觉得不必要&#xff0c;因为 rxjava2.x 是按照 Reactive-Streams specification 规范完全的重写的&#xff0c;完全独立于 rxjava1.x 而存在&#xff0c;它改变了以往 rxjava1的…

Springboot 项目启动时扫描所有枚举并存入缓存(redis)

为什么这么做? 为了springboot 注解属性转换字典方便一点(使用缓存的方式在Springboot 启动时获取字典数据) 在启动时会扫描com.vehicle.manager.core.enumerate包下的所有枚举(包括类中的内部枚举),并取出对应属性以json的方式存入redis 目录结构如下: RedisUtil可以在Red…

已解决javax.management.BadStringOperationException异常的正确解决方法,亲测有效!!!

已解决javax.management.BadStringOperationException异常的正确解决方法&#xff0c;亲测有效&#xff01;&#xff01;&#xff01; 目录 问题分析 出现问题的场景 报错原因 解决思路 解决方法 分析错误日志 检查字符串值合法性 确认字符串格式 优化代码逻辑 增加…