1、问:什么是数据模型?
数仓领域中的模型指的是数据模型,要和商业分析中的模型不同
数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用的角度合理的存储数据
2、问:模型和表的区别?
表是数据物理的载体
模型在表的基础是赋予了业务含义,对业务过程的抽象,承接了底层业务系统和上层分析需求
3、问:为什么要数据建模?
数仓的目的是为了整合和管理企业中的数据,建模是整合和管理数据的具体手段
将数据进行有序、有结构地分类组织和存储
如果把数据看做 图书馆里书,希望书籍是按类别放置
城市的建筑,希望城市规划更合理
电脑中的文件,希望文件更好的放置
4、问:良好的数据模型 能够给数据仓库带来那些好处?
5、问:什么是维度模型/维度建模?
维度模型是一种经典的 数据仓库建模方法论,它指导我们应该如何去构建数据模型
它从 分析决策的需求出发来构建模型,为分析需求服务
它关注的重点是 用户如何快速的完成分析需求,同时具有较好的大规模复杂查询的响应性能
它的典型模型有:星型模型、雪花模型
6、如何使用维度模型来构建数据模型?
1、选择 要分析的 业务过程
2、选择粒度
3、选择维度
4、选择事实
5、选择要退化的维度
7、什么是`OneData`?
OneData概念出现在《大数据之路:阿里巴巴大数据实践》中,是阿里提出的一套
集团数据整合及管理的方法体系(也就OneData),包括三个部分
一致性的指标体系、模型设计方法体系、配套的工具