5 . 7 数据仓库技术
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。近年来,人们对数据仓库技术的关注程度越来越尚,其原因是过去的几十年中,建设了无数的应用系统,积累了大量的数据,但这些数据没有得到很好的利用,有时反而成为企业的负担。图 5-9为数据仓库体系结构图。
备注:
电气化的必然结果是自动化。
大数据是数字化、信息化的必然结果!!!!
对大数据的分析与智能化是大数据的必然结果!!!
虚拟化是智能化的必然结果!!!
在图5-9中,数据源是数据仓库系统的基础,是整个系统的数据源泉; O L A P ( O n - Line
Analytical Processing , 联机分析处理)服务器对分析需要的数据进行有效集成,按多维
模型予以组织,以便进行多角度、多层次的分析,并发现趋势;前端工具主要包括各种
报表工具、査询工具、数据分析工具和数据挖掘工具,以及各种基于数据仓库或数据集
市的应用开发工具。其中数据分析丁具主要针对 O L A P 服务器,报表工具、数据挖掘工
具主要针对数据仓库。
5.7.1 联机分析处理
数据处理大致可以分成两大类,分 别 是 联 机 事 务 处 理 ( On-Line Transaction
Processing , O L T P ) 和 O L A P 。 O L T P 是传统数据库的主要应用,支持基本的、日常的事
务处理; O L A P 是数据仓库系统的主要应用,支持复杂的分析操作,侧甫决策支持,并且提供直观易懂的查询结果。表 5-12列出了 O L T P 与 O L A P 之间的比较。
从 表 5-12中可以看出,在 O L T P 中,数据是以二维表的形式来进行组织的,但在O L A P 中,数据通常是多维的。这里的“维”是人们观察客观世界的角度,是一种高层次的类型划分。