4月27日在2023数据治理新实践峰会上,中国电子信息行业联合会数据资产管理专委会秘书长宾军志先生为大家分享了《数据管理能力成熟度模型建设历程》主题演讲。
以下为宾军志先生的演讲实录,为了方便阅读,小编做了一些字句修改和文本优化。大家上午好!非常荣幸受邀参加2023数据治理新实践峰会,为大家分享我们在数据管理能力成熟度模型建设和推广过程中的思路和进展。
一、数据管理的发展历程
▶ 从 IT时代到DT时代
数据20条发布以后,我们可以明显感受到数据管理人员的春天来了,现在大家对数据管理都是很重视,这得益于从IT时代到DT时代的发展。从IT到DT最早是由马云先生在2010年左右提出来的。首先我们回顾一下在1979年提出的诺兰模型,它将整个信息化建设分成六个阶段,前三个阶段我们可以理解成是IT阶段,后三个阶段是DT阶段,DT阶段更多关注数据集成、管理和应用相关内容。其实,在我们的DCMM数据管理能力成熟度评估模型中,DCMM3级——稳健级非常重要,它代表我们已经意识到数据管理对企业的重要性,并可以开展整体的数据管理等工作。
▶ 从数据到资产
什么是数据管理?数据管理和数据治理的内涵和外延,也在不断发生变化。最早期做数据治理基本上都是围绕数据质量,后来发现数据质量只是数据治理的冰山一角,导致数据质量问题产生的原因是各种各样的:有可能是数据标准缺失,有可能是治理机制不健全,或者有可能是信息系统能力欠缺等,因此,数据质量管理需要从多个维度去开展相关工作。如2018年银监会发布的《银行业金融机构数据治理指引》,强调全面的数据治理体系不仅仅是适用数据质量,同时还要开展数据架构、数据标准、数据安全等一系列的工作。
随着信息化的不断发展,数据俨然已经成为资产,此时数据需要被管理,因此我们需要有CDO,需要有数据战略同时还需要关注隐私、责任、数据文化等。最近大家都在谈数据素养怎么提升全民的数据文化,这就是数据管理进一步的外延,涉及到组织方面、文化方面、安全方面的建设。在2020年、2021年左右,数据已经成为基本生产要素,围绕数据资产首先关注它的确权,这个资产到底属于谁的?怎么去登记?应该是多少钱?所以我们要做数据的定价,要做数据资产估值等相关的工作。包括最近大家比较关注的数据跨境包括数据银行、数据信托等一系列概念的不断延伸。所以说数据管理这个概念虽然提了有十多年,但它的内涵和外延在不断地发生变化,从早期的质量到标准到安全到架构到估值,因此,从数据到资产其实要走的路还是蛮长的。在这过程中我们看看一些典型相关的理论。
二、经典数据管理理论
▶ 全面数据质量管理体系
我们早期关注数据质量,在质量层面比较典型的理论是由MMP在90年代初提出的全面数据质量管理体系,把管理产品的方法应用于数据质量管理,全面数据质量管理体系提到三个“全面”。
第一个全员性,企业内部进行数据管理不应该只是IT部门或者数据管理部门的责任。而是企业所有人参与,如华为的数据owner,包括现在国网、南网也在做的数据主人制。那数据主人制是什么?就是要确定哪些人到底应该管理哪些数据,他们的管理职责是什么?全员性对于数据管理是非常重要的一点。
第二个是全面性,全面性就要将整个组织的所有数据进行统一的对待,不能只管数仓的数据,源端的数据也需去管理,正如上文我们提到的《银行业金融机构数据治理指引》强调的是全覆盖,所有数据就要统一覆盖,遵循统一的管理。
最后是全过程,国内的数据治理基本上是先乱后治,先是出现了数据质量问题,然后再说怎么去进行管理,这是典型的亡羊补牢,其实最好的数据治理是预防,从设计、生产到使用各环节数据质量问题防检结合、以防为主。
▶ 数据质量工程十步法
数据质量工程十步法是由美国学者Danette McGilvray提出的,形成了一套独有的、与业务无关的信息质量管理系统方法论,其中最重要的也是最值得关注的是「根本原因的分析」。数据质量问题产生的根本原因到底是什么?只有分析到根本原因之后,才能去真正的解决类似问题。同时在数据质量管理过程中,包括在数据治理过程中,沟通是非常重要的。我认为数据治理团队其实就是一个Marketing团队,需要经常不断地去宣贯。Danette McGilvray之前有一篇文章叫《数据质量管理十年随想》,总结他对数据质量管理的关键思考,第一个思考就是Communication is Reading Work,就是说数据治理沟通是一个非常非常重要的工作。
▶ DMBOK
DMBOK是国际上非常权威的知识体系,也是我们非常推崇的。DMBOK2.0在数据管理框架上增加了“数据建模和设计”、“数据集成和互操作”两部分,但它没有涵盖到数据标准和数据应用相关内容,这与国内数据治理的现状适配度还是有差异的。
▶ DGI 数据治理框架
DGI数据管理框架在2004年被提出,DGI治理框架比较好的点在于:在数据治理过程中要明确关注点。前面我们提到数据治理是全覆盖数据,要统一对待,但在有限的资源、有限的时间的情况下,所有的数据不可能被统一对待。因此需要明确数据治理的关注点到底是什么?我们一直也在强调,数据治理需要在范围和效率中平衡,没有明确的范围,效率就很低,价值也会很低,所以在数据治理过程中要去明确关注点,这是非常关键的。
▶ DMM数据管理能力成熟度评估模型
DMM模型是国际上第一个是比较规范化、体系化的数据治理成熟度评估模型。
首先,它是把数据战略当做一个独立的能力引入到数据管理体系中;其次,大数据时代,企业会引入很多外部的数据,如何对外部数据进行管理?DMM率先提示出了数据供应商的任务管理,这是DMM模型中一个很重要的创新点。
三、数据资产的交易
▶ 数据资产入表
数据资产入表是行业目前比较关注的问题。企业有这么多种数据,这些数据到底值多少钱?投入产出比到底要怎么去计算?2022年财政部发布了《企业数据资源相关会计处理暂行规定(征求意见稿)》对数据资产入表给出了一些指导意见。
▶ 数据资产交易
我们说数据资产的核心是价值,那它如何进行交易?目前国内大概有四五十家数据交易所,据了解,这些数据交易所的数据供给方还不是特别的丰富,这也是我们在《数据20条》里面提到的如何解决数据供给侧的问题。对此,要压实企业的责任,丰富数据供给,对于如何去丰富数据的供给,《数据20条》提出三权分制:数据的控制权、使用权和收益权,从这个角度上企业有意愿去参与到数据交易等建设过程中,这是丰富数据供给一个很重要的点。此外,在整个数据交易过程中还是会存在可信问题,数据供给方提供的数据要用于哪些地方及如何收益,在整个交易机制没有健全之前,还是存在很多问题。
▶ 数据交易新模式:数据信托
2021年,我们和信托公司做了一个数据信托方面的探索,数据信托的核心是信任。其实数据信托最早期在国际上是用于保护隐私的,也就是保证个人所有者和大型数据控制者的权力平衡,以此更好地保护个人隐私,后来它开始适用于公共数据运营,或数据交易模式,可以帮助我们去构建一个互信和互利的数据交易的环境。在这个过程中首先是信任,通过信任关系把信用体系建立起来,在此基础上保证数据收益机制的灵活性。它是整个数据交易中一种很新的模式。
四、数据管理能力程度评估模型
数据管理能力程度评估模型(DCMM)这两年在国内得到了高度的认证,我们当初编制DCMM的第一个出发点是把它做成具有中国特色的数据管理的参考模型。中国特色主要体现在:第一是有数据标准;第二是有数据应用,数据应用里强调了数据对外的价值变现,数据是要素,这个数据要素怎么产生价值?在数据应用之中我们提到了数据服务;最后有生存周期,就是在数据生存周期各个阶段应该如何去开展数据管理。同时我们也强调了数据战略,国内的数据管理一定是战略驱动的,一定会明确在战略层面怎么去提升数据价值。第二个出发点是我们是把它定义成评价模型,通过DCMM评价模型的8个能力域、 28个能力项、 445项评价指标,可以评价企业数据管理处于什么能力程度等。同时DCMM也得到国家各个部门的重视和不同行业的认可。
以上是今天的演讲的全部内容,感谢大家聆听!