数据架构:
待定
数据模型:
数据模型是对现实世界数据特征的抽象,用于描述一组数据的概念和定义。数据模型从抽象层次上描述了数据的静态特征、动态行为和约束条件。数据模型所描述的内容有三部分,分别是数据结构、数据操作和数据约束。这三部分形成了数据架构的基本蓝图,也就是企业数据资产的战略地图。按不同的应用层次,数据模型可分为概念数据模型、逻辑数据模型、物理数据模型3种类型,如图下图所示:
- 概念模型:是一种面向用户、面向客观世界的模型,主要用于描述现实世界的概念化结构,与具体的数据库管理系统(DataBase Management System, DBMS)无关。
- 逻辑模型:是一种以概念模型的框架为基础,根据业务条线、业务事项、业务流程、业务场景的需要而设计的面向业务实现的数据模型。逻辑模型包括网状数据模型、层次数据模型等。
- 物理模型:是一种面向计算机物理表示的模型,描述了数据在存储介质上的组织结构。物理模型的设计应基于逻辑模型的成果,以保证实现业务需求。它不但与具体的DBMS有关,还与操作系统和硬件有关,同时要考虑系统性能的相关要求。
概念模型最常用的表示方法是E-R图,entity-relationship model。实体及其属性+实体间的关系。概念模型只是表达了涉及的实体和联系。
逻辑模型反映的是系统分析设计人员对数据存储的观点,是对概念模型的进一步分解和细化。逻辑模型是根据业务规则确定的,是关于业务对象、业务对象的数据项及业务对象之间联系的基本蓝图。
逻辑模型的内容包括所有的实体和联系,确定每个实体的属性,定义每个实体的主键,指定实体的外键,进行范式化处理。逻辑数据模型的目标是尽可能详细地描述数据,但并不考虑数据在物理上如何实现。
在逻辑模型中,层次模型和网状模型是早期的数据模型,统称为非关系模型。20世纪70年代至80年代初,非关系模型的数据库系统非常流行,在数据库系统产品中占据了主导地位,后来逐渐被关系模型的数据库系统取代。但在美国等地,由于早期开发的应用系统都是基于层次或网状数据库系统的,因此层次数据库或网状数据库的系统仍然很多。
逻辑模型有层次模型、网状模型和关系模型3种类型。这3种逻辑模型的根本区别在于数据结构不同,即数据之间联系的表达方式不同,层次模型用“树结构”来表示数据之间的联系,网状模型用“图结构“来表示数据之间的联系,关系模型用“二维表”来表示数据之间的联系。
物理模型在逻辑模型的基础上,考虑各种具体的技术实现因素,设计数据库体系结构,真正实现了在数据库中存储数据。
物理模型的内容包括确定所有的表和列,定义外键用于确定表之间的关系,基于用户的需求可能需要进行范式化,考虑性能优化可能需要进行反范式化。从物理数据库的实现上来看,物理模型和逻辑模型可能会有较大的不同。
物理模型的目标是指定用数据库模式来实现逻辑模型,以及真正存储数据。最常用的物理模型有统一模型、框架存储模型。
物理模型的主要功能如下。
(1)将数据库的物理设计结果从一种数据库移植到另一种数据库。
(2)通过反向工程将已经存在的数据库物理结构重新生成物理模型或概念模型。
(3)定制生成标准的模型报告。
(4)用面向对象方法(Object Oriented Method, OOM)进行代码设计与开发。
(5)完成多种数据库的详细物理设计(涵盖常用的各种DBMS),并生成数据库对象的.sql脚本
总结来说,概念模型定er图,逻辑模型定义数据字段和范式,物理模型定义SQL。
数据建模:
数据建模是指创建数据模型的行为,包括定义和确定组织的数据需求及其目标。数据建模行为不仅定义了数据元素,还定义了它们形成的结构及它们之间的关系。开发数据模型需要数据建模师或数据架构师与企业的其他部门密切合作,建立目标,并与信息系统的最终用户建立流程。
通常情况下,面对需求,我们直接就设计物理模型了,直接建表,这个开发流程弱化了概念模型和逻辑模型。
二、企业架构构成