杜威说过“所有知识都是分类”!很好理解,分类是认知经济,任何有效分类,都可以极大地节省我们的认知精力。谈到数据就必须做个分类,谈到数据分类可以从多个维度出发,比如按业务维度、这是财务数据、那是人力数据…按行业维度,比如电力数据、民航数据…按统计维度,比如数值数据、分类数据…面如果搞得太大就没法聊了,我们聚焦数据的效用维度分类,来聊聊元数据、参考数据、主数据…
数据类型定义
元数据:元数据是一切数据的数据,他是数据的说明书;
参考数据:参考数据代表了权威以及规范。
主数据:指满足跨部门业务协同需要的、反映核心业务实体状态属性的组织机构的基础信息。我们也叫“基础数据”,。
交易数据和指标数据:这是由元数据和参考数据或主数据生成的数据,“一生二,二生三,三生万物”,一就是元数据,二就是主数据,三就是交易数据,万物即指标数据。主数据有元数据,交易数据有元数据,一切数据都有元数据。
顾客 | 金额 |
---|---|
张三 | 199 |
李四 | 20 |
王五 | 101 |
拿上表最简单交易流水表来说:
主数据:顾客、金额,他描述下面数据是什么意思,就是个数据的说明书。
主数据:顾客,这个数据代表着一个业务实体,说白了就是“黄金数据”、“基础数据”,他们体量一定,业务行为发生时他们构成了交易数据或业务数据的。
交易数据:金额,很好理解,交易过程中发生的。
一个更加生动的例子
我们拿电商系统为例,我们有参考数据比如性别表,主数据有顾客表、商家表、商品表,交易数据或叫业务数据有交易表,指标数据有销售额表。可以看到交易数据就是每发生一次业务就产生一条数据,每条数据组成上看有主数据中的顾客信息、卖家信息、商品信息等,此外还有这次交易产生的数据,如购买商品数量、时间等信息。
我们为什么要弄清这些数据分类,有什么具体好处呢。举个很简单的例子,让你进行数据治理,提高数据质量,你总得知道哪些数据重要吧,好钢用在刀刃上,有的放矢是关键啊,我们就要花精力在哪方面数据上吧,把主数据识别出来吧,这是交易数据的根基啊。
文档参考
- Definitions of Data Categories
- What’s the difference between master data and metadata?
- What is data in statistics?
- 证券期货业数据分类分级指引.pdf
- [中国信通院:主数据管理实践白皮书.pdf](