通俗理解数据治理之主数据

news2024/10/5 16:31:09

1. 定义

1)国家标准GB/T 36073-2018 《数据管理能力成熟度评估模型》中对主数据的定义:主数据是组织中需 要跨系统、跨部门进行共享的核心业务实体数据。

2)IBM 公司在其有关主 数据管理的红皮书《Master Data Manangement:Rapid Deployment Package for MDM》中主数据:有关客户、供应商、产品和账户的企业关键信息。

3)国际数据管理协会(DAMA)发布的DMBOK1.0中主数据定义:以与业务活动相关的通用和抽象概念形式提供业务活动语境的数据,包括业务交易中涉及的内部和外部对象的详细信息(定义和标识符),如客户、产品、雇员、供应商和受控域(代码值)。

2. 主数据与其他数据

2.1 六层数据分类法

齐泽姆(Malcom Chisholm)提出六层的数据分类法,包括元数据、参考数据、企业结构数据、交易结构数据和交易审计数据,他将主数据定义为参考数据、企业结构数据和交易结构数据的聚合。

1)参考数据:代码表或描述表。2)企业结构数据:例如会计科目表。3)交易结构数据:例如客户标识符,描述了交易过程中必须出现的一些要素(供应商、产品等)

2.2 DAMA(DMBOK2.0)主数据与参考数据

二者相似点:两者都为交易数据的创建和使用提供重要的上下文信息(参考数据也为主数据提供上下文),都是应该在企业层面上被管理的共享资源。

二者区别:参考数据不易变化,通常比交易数据集或主数据集小、复杂程度低,拥有的行和列更少。

二者管理的重点不同:

参考数据管理(Reference Data Management,RDM)。需要对定义的域值及其定义进行控制。参考数据管理的目标是确保组织能够访问每个概念的一整套准确且最新的值。

主数据管理(Master Data Management,MDM)。需要对主数 据的值和标识符进行控制,以便能够跨系统地、一致地使用核心业务实 体中最准确、最及时的数据。主数据管理的目标包括确保当前值的准确 性和可用性,同时降低由那些不明确的标识符所引发的相关风险。

老码理解:高校的老师分级,其中教授岗位分一至七级,其中正教授岗位包括一至四级,副教授岗位包括五至七级;中级岗位分3个等级,即八至十级;初级岗位分为3个等级,即十一至十三级。这个不咋会变化的数据,可以理解为参考数据。教职工姓名可以理解为主数据(工会发东西、财务发工资都得知道有谁,而且不会经常变动)。

2.3 核心主数据与配置型主数据(主数据管理实战白皮书,文末附件)

核心主数据:核心主数据指用来描述企业核心业务实体的主数据,是企业核心业务 对象、交易业务的执行主体,如产品、物资、设备、组织机构、员工、供 应商、客户、会计科目等。核心主数据是企业信息系统的神经中枢,是业 务运行和决策分析的基础。核心主数据是相对“固定”的,变化缓慢。

配置主数据:配置型主数据是描述业务或核心主数据属性分类的参考信息,会在整 个组织内共享使用。一般依据国际标准、国家标准、行业标准或企业标准和相关规范等,在系统中一次性配置使用的基础数据,例如国家、民族、性别等规范性表述。配置型主数据相对稳定,不易变化。

老码理解:同上主数据与参考数据的关系,不同学者的不同分类描述。

2.4 主数据与元数据

元数据最简单的描述:数据的数据。没有元数据,就没有办法对单位的数据资产进行管理,在DMBOK2.0中,将元数据分为技术元数据、业务元数据、操作元数据,技术元数据主要来自跟数据库相关,表头的字段都属于技术元数据。这一句重点理解:元数据表示数据的数据,也是数据。

老码理解:应用到数据库层面,主数据表征的是行,元数据表征的是列

2.5 为什么需要进行主数据管理

1)消除数据冗余

2)提升数据处理效率

3)提高公司战略协同力

老码理解:各部门都用到的数据,大家统一管一下,拿取方便

2.6 不管理主数据会怎么样?

1)数据不一致,数据质量堪忧,导致不必要的麻烦

2)数据集成困难,以前是烟囱,以后还是烟囱

3)资产、物料一码多物或多物一码

4)导致同单位不同部门的理解歧义

2.7 规划主数据管理(DMBOK2.0)

1)识别能提供主数据实体全面视图的候选数据源。

2)为精确匹配和合并实体、实例制定规则。

3)建立识别和恢复未恰当匹配或合并的数据的方法。

4)建立将可信数据分发到整个企业的系统中的方法。

2.8 主数据管理常见问题及挑战

        1)不重视主数据的总体规划,缺乏顶层设计,无法在单位决策层、管理层和业务层等各层级统一思路;

        2)各职能部门各自为政,难以在标准和规则层面达成一致,致使主数据代码标准 难统一;

        3)通用标准主数据(国际标准、国家标准和行业标准产生的主数据)管理分散,缺乏便捷可靠的数据获取渠道,数据获取困难;

        4)单位内部已经存在且分散管理的主数据,由于缺乏统一标准和数据关联,大量的数据清洗依靠人为判断,数据清洗难度和风险都很大;

        5)一些单位,特别是大型集 团化企业,系统众多、年代跨度久远,一些早期的系统数据标准化程度不 高,改造难度大、成本高,给主数据应用集成带来较大的困难

3. 主数据管理实施

主数据实施要点主要包含

1)主数据规划(做凡事都得先想一想,俗称规划)

2)制定主数据标准(统一标准,都得这么干)

3)建立主数据代码库(按标准干活)

4)搭建主数据管理工具(主数据的全生命周期得有工具管理)

5)构建运维体系(主数据的全生命周期得有运维,新增删减,保证质量等)

6)推广贯标(喜大普奔,告诉各部门同事可以放大胆子用数据了)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/78387.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件测试web自动化测试

今天目标 1、自动化相关概念 2、自动化相关环境搭建 3、元素定位 课程大纲 1.核心重点(第二章) 2,提高代码质量,自动化水平(第三、四、五、六章) 3.项目实战(第七章) 4.理论及环境与定位(第一章&am…

Linux服务器读写python环境变量

在公司项目开发过程中,代码都是放在服务器中进行运行的,使用本地的idea工具连接到服务器。 如python开发中,将使用pycharm工具连接服务器,如下图所示: 在项目中有线上正式环境、测试环境等,都是用不同环境变…

[附源码]计算机毕业设计计算机相关专业考研资料管理系统Springboot程序

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

【Keras+计算机视觉+Tensorflow】实现基于YOLO和Deep Sort的目标检测与跟踪实战(附源码和数据集)

需要源码和数据集请点赞关注收藏后评论区留言私信~~~ 一、YOLO目标检测算法 YOLO是端到端的物体检测深度卷积神经网络,YOLO可以一次性预测多个候选框,并直接在输出层回归物体位置区域和区域内物体所属类别,而Faster R-CNN仍然是采用R-CNN那种…

Windows 下Zookeeper 配置参数解读 和查看注册了哪些服务

zookeeper 配置文件解读 本地配置文件奉上: # The number of milliseconds of each tick tickTime2000 # The number of ticks that the initial # synchronization phase can take initLimit10 # The number of ticks that can pass between # sending a request and gett…

图像处理学习笔记-10-图像分割与边缘检测

图像分割的三大类方法:根据区域间灰度不连续搜寻区域之间的边界,在奇异性检测、边缘连接和边界检测介绍;以像素性质的分布进行阈值处理,在阈值处理介绍;直接搜寻区域进行分割,在基于区域的分割中介绍 奇异…

数据库、计算机网络,操作系统刷题笔记8

数据库、计算机网络,操作系统刷题笔记8 2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开 测开的话,你就得学数据库,sql,oracle&…

网站各个功能基本实现

1.前面已经介绍前后端的交互 2.今天实现网站功能的基本实现 也就是查询数据库。 网站类型为展示型网站。 页面如下: 点击政府公告显示: 点击机构设置显示: 后面不一一展示,主要实现六大功能的展示功能。 后续就实现管理员维…

PostgREST的安装部署(Windows和Linux环境)

下载地址:https://github.com/PostgREST/postgrest/releases 官方文档地址:Overview of Role System — PostgREST 9.0.0 documentation Windows 先下载对应系统的安装包: 下载之后解压会得到一个postgrest.exe可执行文件 创建配置文件&a…

解决 Android 开发过程中 出现 Duplicate class(包冲突)

1、现在大部分的项目都是支持 Androidx 的,所以出现 Duplicate 的时候 先把 gradle.properties 文件中添加参数,支持使用AndroidX android.useAndroidXtrue android.enableJetifiertrue 2、有些 *.jar/*.aar 不支持 AndroidX 的时候,将上面…

抽取_内插_半带滤波器_多相滤波器

文章目录半带滤波器多相抽取滤波器多相内插滤波器半带抽取器和半带内插器参考资料:Xilinx FIR Compiler v7.2 LogiCORE IP Product Guide PG149半带滤波器 半带滤波器的阶数为偶数,系数长度为奇数,且除了中间系数为0.5外,其余偶数…

mybatisplus 使用mybatis中的配置、mapper配置文件

1、在application.properties中配置mybatis的配置文件路径,例如: #指定mybatis-config.xml的位置 mybatis-plus.config-location classpath:mybatis/mybatis-config.xml 即在和application.properties同级目录下的mybatis目录中创建mybatis的配置文件m…

数制编码详解:二进制八进制十六进制的转换,原码、补码、反码、移码的定义

参考资料:《深入理解计算机网络(王达)》 文章目录一,数制1.1 基本数制1.2 不同数制之间的相互转换二,编码一,数制 1.1 基本数制 “数制”是“数据进制”的简称,也就是表示数据逢几进位的意思&a…

chatGPT的体验,是不是真智能?

目录 🏆一、前言 🏆二、安装 🏆三、普通对话 🚩1、chatGPT的ikun性 🚩2、chatGPT的日常对话 🏆四、实用能力 🏆五、代码改正 🏆六、写代码 🏆七、讲解代码 🏆…

ESXI精简thin磁盘迁移存储位置保留磁盘类型不变-无vc方式

运行2年了ESXI的SSD存储上很多VM并带多层快照,最近磁盘速度异常,迁移到新存储,都是thin磁盘;如有vCenter条件,采用“迁移”即可完美解决,既使磁盘类型thin不变又保留快照结构。如无vCenter条件的操作方式细…

Unity-iOS工程导出Xcode自动构建方法

Unity-iOS发布基本流程首先在Unity中导出Xcode工程,然后在Xcode工程中设置IOS打包的一些流程,诸如引入lib、framework或其他资源、设置签名及其他编译设置、加入编译脚本等等操作。 这些操作如果每次都是在导出Xcode后手动操作,一来浪费时间…

【C++ STL】-- 红黑树的插入实现

目录 红黑树的概念 二叉树搜索树的应用 红黑树节点的定义 红黑树结构 insert 需调整的多情况的核心思维: 需调整的多情况分类讲解: 情况一: 情况二: 情况三: 总结: 代码实现: 对于红黑树是否建立成功的检查 升序打印…

C++--类型转换--1128

1.C语言中的类型转换 分为隐式类型转化、显示强制类型转化。 隐式类型转化用于意义相近的类型,比如int,double,short都是表示数值的类型 int i1; double di; //编译、结果无问题 这里是隐式类型转换。 显示强制类型转换 显示强制类型用于意义不相近的类型&…

Redis Sentinel

高可用架构-Redis Sentinel Replication 缺点 接着之前的Redis Replication 主从复制架构,看似解决了主节点并发过大时,master节点处理繁忙的问题。将一部分读数据的请求交给从节点处理,从而将请求进行分散处理。但是该架构却存在很明显的缺…

基于LEACH的随机网络生成无线传感器网络路由协议的仿真比较(Matlab代码实现)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…