目录
几个相关概念
数据血缘与数据关系
数据血缘与数据分类
数据血缘与数据出处
数据血缘与知识图谱
数据库血缘
数据表血缘
数据字段血缘
算法原理
什么是数据血缘
数据血缘分析的价值:
元数据在数据血缘分析中的作用
血缘收集方法
数据血缘组成
2.1 数据节点
2.2 节点属性
2.3 流转路径
2.4 流转规则-属性
数据血缘的特征
稳定性
归属性
多源性
可追溯性
层次性
血缘分析分类
数据血缘分类的原因
数据血缘分析的分类
数据血缘分析怎么做
一、数据来源识别
二、数据流转路径追踪
三、数据依赖关系梳理
四、数据变更记录管理
数据仓库血缘分析常见的方案
如何构建数据血缘系统
6.1 明确需求,确定边界
6.2 构建元数据管理系统
6.3 技术选型:图数据库
6.4 血缘关系录入:自动解析and手动登记
6.5 血缘可视化
6.6 血缘统计分析
数据血缘分析工具
应用场景
数据血缘存在的挑战及发展趋势
存在的挑战
发展趋势
帆软血缘分析应用案例
1. 概述
1.1 版本
1.2 应用场景
1.3 功能简介
2. 血缘分析功能介绍
2.1 查看血缘分析
2.2 点击跳转到对应位置
3. 避免创建血缘层级深的数据表
3.1 深血缘层级的危害
3.2 如何优化(浅化)血缘
3.2.1 公共数据库中的数据尽量由 IT 准备
3.2.2 避免发布深血缘层级的数据
3.2.3 尽量使用公共数据中的数据进行分析
4. 注意事项
4.1 血缘中数据集无权限无法点击
4.2 血缘层级超出限制
几个相关概念
数据血缘与数据关系
数据关系(Data Relationships)描述了数据实体之间的关联和相互作用。数据血缘与数据关系密切相关,因为数据血缘记录了数据在不同实体和系统之间的流动和变更过程。例如,在一个数据处理链中,数据血缘可以显示从一个数据库表到另一个表的转换关系,而数据关系则描述这些表之间的关联性。数据血缘为理解和分析数据关系提供了基础和支持。
数据关系通常包括实体间的层级关系、引用关系、依赖关系等,这些关系构成了数据在系统中流动和交互的基础。数据血缘则进一步细化这些关系,描述了数据在这些关系中的具体流动路径。例如,数据血缘可以显示某个数据字段是如何从一个表中派生出来并最终存储到另一个表中的,这种细致的记录帮助企业更好地理解数据关系的具体实现方式。