数据链路
血缘关系
应用场景:数据资产,数据开发,数据治理,数据安全等等
(绿色箭头上面是数据治理)
场景:
数据链路的高效盘点与理解
数仓模型的长效优化机制
风险影响的及时全面分析
重复指标的发现和持续治理
血缘级别
业务模块级别(自己定义)
表级别
算子级别
列级别
获取方式
实时
API: 实时调用血缘相关API,实时拉取血缘关系数据
离线
MQ: 消费MQ中的血缘改动任务。
离线导出血缘相关数据,进行业务分析。
模型
一般存储 节点(node)和 边(edge)关联关系。
要注意的点
- 准确度
- 时效性
- 覆盖率
Reference
详解数据血缘的「整体设计」与「评价方案」-云社区-华为云 (huaweicloud.com)