文章目录
- 数据库系统基础知识
- 6.1 基本概念
- 6.1.1 DBMS的特征与分类
- 6.2 数据库三级模式两级映像
- 6.3 数据库的分析与设计过程
- 6.4 数据模型
- 6.4.1 ER模型
- 6.4.2 关系模型
数据库系统基础知识
基本概念 数据库三级模式两级映像 数据库的分析与设计过程 数据模型 关系代数 数据库完整性约束
关系型数据库SQL简介 关系数据库的规范化 数据库的控制功能 数据仓库与数据挖掘基础 大数据基本概念
6.1 基本概念
- 数据库
- 数据库(Database,缩写为DB)是指长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
- 数据库管理系统
- 数据库管理系统(Database Management System,DBMS)是数据库系统的核心软件,要在操作系统支持下工作,解决如何科学地组织和存储数据、如何高效地获取和维护数据的系统软件问题。其主要功能包括数据定义功能、数据操纵功能、数据库的运行管理、数据组织、存储、管理和数据库的建立与维护。
6.1.1 DBMS的特征与分类
- DBMS的特征
- 数据结构化且统一管理。
- 有较高的数据独立性。
- 提供数据控制功能。
- DBMS的分类
- 关系数据库系统:是支持关系模型的数据库系统。
- 面向对象的数据库系统:是支持以对象形式对数据建模的数据库系统。
- 对象关系数据库系统:在传统的关系数据模型基础上,提供元组、数组、集合等更丰富的数据类型以及处理新的数据类型操作的能力,这样形成的数据模型称为对象关系数据模型。基于对象关系数据模型的DBS称为对象关系数据库系统。
6.2 数据库三级模式两级映像
- 用户级数据库
外模式A 和 外模式B:用户视图,表示不同用户看到的数据视图。 - 概念级数据库
概念模式:概念模式是数据库的整体逻辑结构,包含了所有数据的定义和关系。
外模式-概念模式映射:将用户视图(外模式)映射到概念模式。 - 物理级数据库
内模式:物理存储结构,包括存储设备、文件组织方式等。
概念模式-内模式映射:将概念模式映射到物理存储结构(内模式)。 - 映射关系
外模式-概念模式映射:确保用户视图与整体逻辑结构的一致性。
概念模式-内模式映射:确保逻辑结构与物理存储结构的一致性。 - 操作系统
操作系统:管理物理数据库的底层操作。
数据库系统采用三级模式结构,这是数据库管理系统内部的系统结构。
- 外模式:也称用户模式或子模式,是用户与数据库系统的接口,是用户用到的那部分数据的描述,由若干个外部记录类型组成。描述外模式的数据定义语言称为外模式DDL。
- 概念模式:也称模式,是数据库中全体数据的逻辑结构和特征的描述,它由若干个概念记录类型组成,只涉及行的描述,不涉及具体的值。概念模式的一个具体值称为模式的一个实例,同一个模式可以有很多实例。
- 内模式:也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式,定义所有的内部记录类型、索引和文件的组织方式,以及数据控制方面的细节。描述内模式的数据定义语言称为内模式DDL。
外模式/模式映像:该映像存在于外部级和概念级之间,实现了外模式到概念模式之间的相互转换。
模式/内模式映像:该映像存在于概念级和内部级之间,实现了概念模式到内模式之间的相互转换。
DBMS的两级映像功能保证了数据的独立性。
6.3 数据库的分析与设计过程
- 当前和未来应用的数据要求
需求分析:根据当前和未来应用的数据要求进行需求分析。
数据流图
数据字典
需求说明书 - 概念结构设计
概念结构设计:基于需求分析的结果,设计概念结构。
用户的逻辑模型(即与DBMS无关的概念模型)
ER模型:实体关系模型 - 逻辑结构设计
逻辑结构设计:将概念结构转换为逻辑结构。
转换规则、规范化理论
关系模式 - 物理设计
物理设计:基于逻辑结构设计和DBMS特性进行物理设计。
视图、完整性约束及应用处理说明书
硬件、OS特性
6.4 数据模型
- 模型:是对现实世界特征的模拟和抽象。
- 数学模型:是对现实世界数据特征的抽象。
- 数据模型:是用来描述数据的一组概念和定义。
数据模型的三要素
- 数据结构:是所研究的对象类型的集合,是对系统静态特性的描述。
- 数据操作:是对数据库中各种对象的实例(值)允许执行的操作的集合,包括操作及操作规则。数据操作是对系统动态特性的描述。
- 数据的约束条件:是一组完整性规则的集合。对于具体的应用数据必须遵循特定的语义约束条件,以保证数据的正确、有效、相容。
实体-联系模型简称E-R模型,所采用的3个主要概念是实体、联系和属性。
6.4.1 ER模型
ER 图例说明 ER 模型的三个主要概念 实体 联系 属性
实体:表示现实世界中的对象或事物。
示例:学生、课程
属性:描述实体的特征。
示例:姓名、性别、年龄
联系:表示实体之间的关系。
示例:选课
E-R图示例
学生实体
属性:学号、姓名、性别、年龄
课程实体
属性:课程号、课程名
联系:选课
属性:成绩
关系:M:N(多对多)
6.4.2 关系模型
关系数据库系统采用关系模型作为数据的组织方式,在关系模型中用表格结构表达实体集以及实体集之间的联系,其最大特色是描述的一致性。
- 关系模型是由若干个关系模式组成的集合。一个关系模式相当于一个记录型,对应于程序设计语言中类型定义的概念。
- 关系模型的优点是:
- 概念单一
- 存储路径对用户是透明的
- 所以具有更好的数据独立性和安全保密性
- 简化了程序的开发和数据库的建立工作
教学数据库的4个关系模式如下:
S (Sno, Sname, SD, Sage, Sex)
学生S关系模式,属性为学号、姓名、系、年龄和性别
T (Tno, Tname, Age, Sex)
教师T关系模式,属性为教师号、姓名、年龄和性别
C (Cno, Cname, Pcno)
课程C关系模式,属性为课程号、课程名和先修课程号
SC (Sno, Cno, Grade)
学生选课SC关系模式,属性为学号、课程号和成绩
一个实体型转换为一个关系模式
- 1:1联系
- 1:n联系
- m:n联系
三个以上实体间的一个多元联系 n + 1
- 在数据库逻辑结构的设计中,将E-R模型转换为关系模型应遵循相关原则。对于三个不同实体集和它们之间的多对多联系m:n:p,最可转换为 __C__个关系模式。
A. 2 B. 3 C. 4 D. 5
当处理涉及三个或更多实体的多对多联系时,通常需要为每一个实体以及它们之间的联系各创建一个关系模式。这样可以确保联系能够被准确地表示,并维持数据的一致性和完整性。