宾军志:数据管理能力成熟度模型建设历程

news2024/11/23 15:10:28

4月27日在2023数据治理新实践峰会上,中国电子信息行业联合会数据资产管理专委会秘书长宾军志先生为大家分享了《数据管理能力成熟度模型建设历程》主题演讲。

以下为宾军志先生的演讲实录,为了方便阅读,小编做了一些字句修改和文本优化。大家上午好!非常荣幸受邀参加2023数据治理新实践峰会,为大家分享我们在数据管理能力成熟度模型建设和推广过程中的思路和进展。

一、数据管理的发展历程

▶ 从 IT时代到DT时代

数据20条发布以后,我们可以明显感受到数据管理人员的春天来了,现在大家对数据管理都是很重视,这得益于从IT时代到DT时代的发展。从IT到DT最早是由马云先生在2010年左右提出来的。首先我们回顾一下在1979年提出的诺兰模型,它将整个信息化建设分成六个阶段,前三个阶段我们可以理解成是IT阶段,后三个阶段是DT阶段,DT阶段更多关注数据集成、管理和应用相关内容。其实,在我们的DCMM数据管理能力成熟度评估模型中,DCMM3级——稳健级非常重要,它代表我们已经意识到数据管理对企业的重要性,并可以开展整体的数据管理等工作。
在这里插入图片描述
▶ 从数据到资产

什么是数据管理?数据管理和数据治理的内涵和外延,也在不断发生变化。最早期做数据治理基本上都是围绕数据质量,后来发现数据质量只是数据治理的冰山一角,导致数据质量问题产生的原因是各种各样的:有可能是数据标准缺失,有可能是治理机制不健全,或者有可能是信息系统能力欠缺等,因此,数据质量管理需要从多个维度去开展相关工作。如2018年银监会发布的《银行业金融机构数据治理指引》,强调全面的数据治理体系不仅仅是适用数据质量,同时还要开展数据架构、数据标准、数据安全等一系列的工作。

随着信息化的不断发展,数据俨然已经成为资产,此时数据需要被管理,因此我们需要有CDO,需要有数据战略同时还需要关注隐私、责任、数据文化等。最近大家都在谈数据素养怎么提升全民的数据文化,这就是数据管理进一步的外延,涉及到组织方面、文化方面、安全方面的建设。在2020年、2021年左右,数据已经成为基本生产要素,围绕数据资产首先关注它的确权,这个资产到底属于谁的?怎么去登记?应该是多少钱?所以我们要做数据的定价,要做数据资产估值等相关的工作。包括最近大家比较关注的数据跨境包括数据银行、数据信托等一系列概念的不断延伸。所以说数据管理这个概念虽然提了有十多年,但它的内涵和外延在不断地发生变化,从早期的质量到标准到安全到架构到估值,因此,从数据到资产其实要走的路还是蛮长的。在这过程中我们看看一些典型相关的理论。
在这里插入图片描述

二、经典数据管理理论

▶ 全面数据质量管理体系

我们早期关注数据质量,在质量层面比较典型的理论是由MMP在90年代初提出的全面数据质量管理体系,把管理产品的方法应用于数据质量管理,全面数据质量管理体系提到三个“全面”。

第一个全员性,企业内部进行数据管理不应该只是IT部门或者数据管理部门的责任。而是企业所有人参与,如华为的数据owner,包括现在国网、南网也在做的数据主人制。那数据主人制是什么?就是要确定哪些人到底应该管理哪些数据,他们的管理职责是什么?全员性对于数据管理是非常重要的一点。

第二个是全面性,全面性就要将整个组织的所有数据进行统一的对待,不能只管数仓的数据,源端的数据也需去管理,正如上文我们提到的《银行业金融机构数据治理指引》强调的是全覆盖,所有数据就要统一覆盖,遵循统一的管理。

最后是全过程,国内的数据治理基本上是先乱后治,先是出现了数据质量问题,然后再说怎么去进行管理,这是典型的亡羊补牢,其实最好的数据治理是预防,从设计、生产到使用各环节数据质量问题防检结合、以防为主。

在这里插入图片描述
▶ 数据质量工程十步法

数据质量工程十步法是由美国学者Danette McGilvray提出的,形成了一套独有的、与业务无关的信息质量管理系统方法论,其中最重要的也是最值得关注的是「根本原因的分析」。数据质量问题产生的根本原因到底是什么?只有分析到根本原因之后,才能去真正的解决类似问题。同时在数据质量管理过程中,包括在数据治理过程中,沟通是非常重要的。我认为数据治理团队其实就是一个Marketing团队,需要经常不断地去宣贯。Danette McGilvray之前有一篇文章叫《数据质量管理十年随想》,总结他对数据质量管理的关键思考,第一个思考就是Communication is Reading Work,就是说数据治理沟通是一个非常非常重要的工作。

在这里插入图片描述
▶ DMBOK

DMBOK是国际上非常权威的知识体系,也是我们非常推崇的。DMBOK2.0在数据管理框架上增加了“数据建模和设计”、“数据集成和互操作”两部分,但它没有涵盖到数据标准和数据应用相关内容,这与国内数据治理的现状适配度还是有差异的。

在这里插入图片描述

▶ DGI 数据治理框架

DGI数据管理框架在2004年被提出,DGI治理框架比较好的点在于:在数据治理过程中要明确关注点。前面我们提到数据治理是全覆盖数据,要统一对待,但在有限的资源、有限的时间的情况下,所有的数据不可能被统一对待。因此需要明确数据治理的关注点到底是什么?我们一直也在强调,数据治理需要在范围和效率中平衡,没有明确的范围,效率就很低,价值也会很低,所以在数据治理过程中要去明确关注点,这是非常关键的。

在这里插入图片描述
▶ DMM数据管理能力成熟度评估模型

DMM模型是国际上第一个是比较规范化、体系化的数据治理成熟度评估模型。

首先,它是把数据战略当做一个独立的能力引入到数据管理体系中;其次,大数据时代,企业会引入很多外部的数据,如何对外部数据进行管理?DMM率先提示出了数据供应商的任务管理,这是DMM模型中一个很重要的创新点。

在这里插入图片描述

三、数据资产的交易

▶ 数据资产入表

数据资产入表是行业目前比较关注的问题。企业有这么多种数据,这些数据到底值多少钱?投入产出比到底要怎么去计算?2022年财政部发布了《企业数据资源相关会计处理暂行规定(征求意见稿)》对数据资产入表给出了一些指导意见。

在这里插入图片描述

▶ 数据资产交易

我们说数据资产的核心是价值,那它如何进行交易?目前国内大概有四五十家数据交易所,据了解,这些数据交易所的数据供给方还不是特别的丰富,这也是我们在《数据20条》里面提到的如何解决数据供给侧的问题。对此,要压实企业的责任,丰富数据供给,对于如何去丰富数据的供给,《数据20条》提出三权分制:数据的控制权、使用权和收益权,从这个角度上企业有意愿去参与到数据交易等建设过程中,这是丰富数据供给一个很重要的点。此外,在整个数据交易过程中还是会存在可信问题,数据供给方提供的数据要用于哪些地方及如何收益,在整个交易机制没有健全之前,还是存在很多问题。

在这里插入图片描述

▶ 数据交易新模式:数据信托

2021年,我们和信托公司做了一个数据信托方面的探索,数据信托的核心是信任。其实数据信托最早期在国际上是用于保护隐私的,也就是保证个人所有者和大型数据控制者的权力平衡,以此更好地保护个人隐私,后来它开始适用于公共数据运营,或数据交易模式,可以帮助我们去构建一个互信和互利的数据交易的环境。在这个过程中首先是信任,通过信任关系把信用体系建立起来,在此基础上保证数据收益机制的灵活性。它是整个数据交易中一种很新的模式。

在这里插入图片描述

四、数据管理能力程度评估模型

数据管理能力程度评估模型(DCMM)这两年在国内得到了高度的认证,我们当初编制DCMM的第一个出发点是把它做成具有中国特色的数据管理的参考模型。中国特色主要体现在:第一是有数据标准;第二是有数据应用,数据应用里强调了数据对外的价值变现,数据是要素,这个数据要素怎么产生价值?在数据应用之中我们提到了数据服务;最后有生存周期,就是在数据生存周期各个阶段应该如何去开展数据管理。同时我们也强调了数据战略,国内的数据管理一定是战略驱动的,一定会明确在战略层面怎么去提升数据价值。第二个出发点是我们是把它定义成评价模型,通过DCMM评价模型的8个能力域、 28个能力项、 445项评价指标,可以评价企业数据管理处于什么能力程度等。同时DCMM也得到国家各个部门的重视和不同行业的认可。

在这里插入图片描述

以上是今天的演讲的全部内容,感谢大家聆听!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/662105.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JDK安装2023最完整教程与配置(零基础)

一、JDK简介 学习Java,需要下载并安装JDK,即Java Development Kit、Java开发工具包,为了能够打开java程序,就需要按照操作系统的要求进行环境变量的配置。 二、JDK下载 要想运行java开发的程序,必须先下载jdk&#…

io.netty学习 (一)Netty入门

目录 前言 Java原生API之痛 Netty的优势 非阻塞 I/O 丰富的协议 异步和事件驱动 精心设计的API 丰富的缓冲实现 高效的网络传输 Netty 核心概念 核心组件 传输服务 协议支持 Netty简单应用 总结 前言 关于Netty的学习,最近看了不少有关视频和书籍&am…

【git】VSCode 上的文件夹如何上传到 github 上?

一、重要意义 VSCode 上的文件夹上传到github有什么意义? 版本控制:通过将文件夹上传到GitHub,您可以使用Git进行版本控制。这意味着您可以记录每个文件的修改历史,并轻松地切换到以前的版本。如果您犯了错误或需要回滚更改&…

数据结构与算法·第10章【内部排序】

概念 排序问题可以分为内部排序和外部排序。若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序;反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序。…

成为一名成功的项目经理,你需要了解这些

作为一名有抱负的项目经理,你需要了解自己的职责和任务。你的职责不仅仅是确保项目的成功,更要负责带领团队制定可靠的执行计划,并确保所有工作按计划有序进行。因此,你必须具备身兼多职的能力,以确保项目能够顺利完成…

机器视觉初步5-2:图像增强专题

图像增强是一种提高图像质量和信息量的技术,常用于图像处理、计算机视觉和机器学习中。常见的图像增强方法包括直方图均衡化、高斯滤波、锐化、对比度拉伸、图像平滑、图像锐化、图像滤波、图像金字塔等。 以下是一些常见的图像增强方法的示例代码,使用H…

数据结构——顺序表(文字+代码+带图详细讲解)

在 C 语言中,顺序表可以使用数组来实现。顺序表是一种线性表,其中的元素在物理上连续存储,可以通过下标访问任意元素。 顺序表的基本操作包括插入、删除、查找、遍历和初始化等。 这段代码定义了一个顺序表的结构体,其中包括三个…

《C++多态》

文章目录 思维导图一、多态的概念二、多态的定义及其实现1.多态的构成条件2.虚函数3.虚函数的重写不构成多态的情况展示4.虚函数重写的两个例外4.1 协变4.2析构函数的重写 5.C11 override和final5.1. final5.2.override 三、抽象类1.概念2、对比纯虚函数与override3.接口继承和…

suse linux安装介质下载

在suse官网注册一个账号,就可以免费在上面下载软件的安装介质。 SUSE HAE介质下载和安装说明:

工作十年还不知道数字化转型工具?别等老板问你时才去查资料!

在职场中,到底有什么比较好上手又能轻易提升数字化的工具? 应粉丝邀请,我来给出一个回答。 对于企业来说,你可以选择大屏。对于个人来说,你可以选择仪表板。 工作汇报已经越来越卷,对于个人来说&#xff0c…

Windows远程桌面(mstsc)不能复制粘贴的解决办法

最近突然发现Windows远程桌面(mstsc)不能在远程端和本地端之间自由的复制和粘贴了,这还是非常影响使用体验的;因此记录一下解决方法,以便后续再遇到此类问题时查看如何解决; 文章目录 一、背景二、解决办法2.1 方法1 重启rdpclip.…

ChatGPT或致全球3亿人失业,人工智能时代下教育会发生什么样的变革?

不久前,谷歌教育发布了一份关于未来教育的研究报告。该报告由谷歌公司和 Canvas8合作,对来自世界24个国家的94位教育专家进行了历时长达2年的调研,探讨了未来教育形态、教育在未来的作用、教育公平、全球人才需求、教学方式、学习生态、工作技…

Attentive Moment Retrieval in Videos论文笔记

Attentive Moment Retrieval in Videos论文笔记 0.论文地址1.摘要2.引言3.模型结构3.1Memory Attention Network3.2Cross-Modal Fusion Network 4.训练4.1对齐损失4.2定位回归损失4.3合并 5.实验5.1数据集5.2效果5.3ACRN的研究 6未来工作 0.论文地址 2018 Attentive Moment Re…

验证码客户端回显测试-业务安全测试实操(15)

验证码客户端回显测试,验证码绕过测试,验证码自动识别测试 往期文章: 验证码暴力破解测试-业务安全测试实操(13)_luozhonghua2000的博客-CSDN博客 验证码客户端回显测试 测试原理和方法 当验证码在客户端生成而非服务器端生成时,就会造成此类问题。当客户端需要和服务器进行…

【正点原子STM32连载】第三十五章 IIC实验 摘自【正点原子】STM32F103 战舰开发指南V1.2

1)实验平台:正点原子stm32f103战舰开发板V4 2)平台购买地址:https://detail.tmall.com/item.htm?id609294757420 3)全套实验源码手册视频下载地址: http://www.openedv.com/thread-340252-1-1.html# 第三…

2023年NPDP产品经理认证线上班,到这里

产品经理国际资格认证NPDP是新产品开发方面的认证,集理论、方法与实践为一体的全方位的知识体系,为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。 【认证机构】 产品开发与管理协会(PDMA)成立于1979年,是…

docker 镜像制作 与 CI/CD

目录 镜像到底是什么? 使用docker创建镜像 步骤: 1、编辑Dockerfile(Dockerfile是docker制作镜像的配方文件) 2、编辑requirements.txt文件 3、编辑app.py文件,我们的程序文件 4、生成镜像文件 5、查看生成的镜…

这些软件,你知道几个呢?

软件分享一:情绪指压 情绪指压(MoodPress)是一款记录心情的应用,也是一款非常简单的减压游戏。可以根据自己现在的心情来决定指压的力度和时间(压力越大或者时间越长越生气),适时释放,来判断和记录自己的心…

Oracle19c安装和远程访问设置

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强&#xff0c…

cron表达式 字符含义 详细解释

cron表达式的组成 cron表达式是一个字符串,由6到7个字段组成,用空格分隔。 其中前6个字段是必须的,最后一个年是可选填的。 cron表达式的字段含义 字段允许值通用字符秒0-59* , - /分0-59时0-23日期1-31 ? L C W月1-12 JAN-DEC星期1-7 SU…