定义
元数据,定义和描述其它数据的数据。
类型
业务元数据、技术元数据和操作元数据。在图书馆或信息科学中,可分为描述元数据、结构元数据、管理元数据。
业务元数据
主要关注数据的内容和条件,另包括与数据治理相关的详细信息。业务元数据包括主题域、概念、实体、属性的非技术名称和定义、属性的数据类型和其他特征,如范围描述、计算公式、算法和业务规则、有效的阈值及其定义。示例:
- 数据集、表和字段的定义和描述;
- 业务规则、转换规则、计算公式和推导公式;
- 数据模型;
- 数据质量规则和检核结果;
- 数据更新计划;
- 数据溯源和数据血缘;
- 数据标准;
- 特定的数据元素记录系统;
- 有效值约束;
- 利益相关方联系信息(如数据所有者、数据管理专员);
- 数据的安全/隐私级别;
- 已知的数据问题;
- 数据使用说明。
技术元数据
提供有关数据的技术细节、存储数据的系统以及在系统内和系统之间数据流转过程的信息。示例:
- 物理数据库表名和字段名;
- 字段属性;
- 数据库对象的属性;
- 访问权限;
- 数据CRUD(增删改查)规则;
- 物理数据模型,包括数据表名、键和索引;
- 记录数据模型与实体资产之间的关系;
- ETL作业详细信息;
- 文件格式模式定义;
- 源到目标的映射文档;
- 数据血缘文档,包括上游和下游变更影响的信息;
- 程序和应用的名称和描述;
- 周期作业(内容更新)的调度计划和依赖;
- 恢复和备份规则;
- 数据访问的权限、组、角色。
操作元数据
描述了处理和访问数据的细节,例如:
- 批处理程序的作业执行日志;
- 抽取历史和结果;
- 调度异常处理;
- 审计、平衡、控制度量的结果;
- 错误日志;
- 报表和查询的访问模式、频率和执行时间;
- 补丁和版本的维护计划和执行情况,以及当前的补丁级别;
- 备份、保留、创建日期、灾备恢复预案;
- 服务水平协议(SLA)要求和规定;
- 容量和使用模式;
- 数据归档、保留规则和相关归档文件;
- 清洗标准;
- 数据共享规则和协议;
- 技术人员的角色、职责和联系信息。