教材为数据库系统概论第五版（王珊）
这一章概念比较多。最重点就是7.4节。

7.1 数据库设计概述

数据库设计定义：

数据库设计是指对于一个给定的应用环境，构造（设计）优化的数据库逻辑模式和物理结构，并据此建立数据库及其应用系统，使之能够有效地存储和管理数据，满足各种用户的应用需求，包括信息管理要求和数据操作要求。

信息管理要求：在数据库中应该存储和管理哪些数据对象。
数据操作要求：对数据对象需要进行哪些操作，如增删改查

目标：为用户和各种应用系统提供一个信息基础设施和高效率的运行环境

高效率的运行环境

数据库数据的存取效率高;
数据库存储空间的利用率高;
数据库系统运行管理的效率高。

7.1.1 数据库设计的特点

三分技术，七分管理，十二分基础数据
管理
- 数据库建设项目管理
- 企业（即应用部门）的业务管理
基础数据
- 收集、入库
- 更新新的数据
结构（数据）设计和行为（处理）设计相结合
- 将数据库结构设计和数据处理设计密切结合

7.1.2 数据库设计方法

大型数据库设计是涉及多学科的综合性技术又是一项庞大的工程项目。它要求多方面的知识和技术。主要包括:

①计算机的基础知识;

②软件工程的原理和方法;

③程序设计的方法和技巧;

④数据库的基本知识;

⑤数据库设计技术;

⑥应用领域的知识。

手工与经验相结合方法

存在问题：

设计质量与设计人员的经验和水平有直接关系
缺乏科学理论和工程方法的支持，工程的质量难以保证。
数据库运行一段时间后常常不同程度地发现各种问题，增加了维护代价

规范设计法

基本思想：过程迭代和逐步求精

典型方法：

新奥尔良（New Orleans）方法：将数据库设计分为若干阶段和步骤
基于E-R模型的数据库设计方法：概念设计阶段广泛采用
3NF（第三范式）的设计方法：逻辑阶段可采用的有效方法
ODL（Object Definition Language）方法：面向对象的数据库设计方法
计算机辅助设计：ORACLE Designer，SYBASE PowerDesigner

7.1.3 数据库设计的基本步骤

数据库设计分6个阶段(记住)

需求分析
概念结构设计
逻辑结构设计
物理结构设计
数据库实施
数据库运行和维护

需求分析和概念设计独立于任何数据库管理系统

逻辑设计和物理设计与选用的DBMS密切相关

1.需求分析阶段

准确了解与分析用户需求（包括数据与处理）
最困难、最耗费时间的一步

2.概念结构设计阶段

整个数据库设计的关键
通过对用户需求进行综合、归纳与抽象，形成一个独立于具体DBMS的概念模型

3.逻辑结构设计阶段

将概念结构转换为某个DBMS所支持的数据模型
对其进行优化

4.数据库物理设计阶段

为逻辑数据模型选取一个最适合应用环境的物理结构（包括存储结构和存取方法）

5.数据库实施阶段

运用DBMS提供的数据库语言（如SQL）及宿主语言，根据逻辑设计和物理设计的结果

建立数据库
编制与调试应用程序
组织数据入库
进行试运行

6.数据库运行和维护阶段

数据库应用系统经过试运行后即可投入正式运行
在数据库系统运行过程中必须不断地对其进行评价、调整与修改

设计一个完善的数据库应用系统往往是上述六个阶段的不断反复

7.1.4 数据库设计过程中的各级模式

7.2 需求分析

7.2.1 需求分析的任务

详细调查现实世界要处理的对象（组织、部门、企业等）
充分了解原系统（手工系统或计算机系统）
明确用户的各种需求
确定新系统的功能，新系统需要充分考虑今后可能的扩充和改变

调查的重点是“数据”和“处理”，获得用户对数据库要求，包括信息要求，处理要求，安全性与完整性要求

7.2.2 需求分析的方法

目的：调查清楚用户的实际需求并进行初步分析最终与用户达成共识。

调查用户需求的具体步骤

调查组织机构情况
调查各部门的业务活动情况
在熟悉业务活动的基础上，协助用户明确对新系统的各种要求
确定新系统的边界

常用调查方法

跟班作业
开调查会
请专人介绍
询问
设计调查表请用户填写
查阅记录

结构化分析方法（Structured Analysis，简称SA方法），自顶向下、逐层分解分析系统

7.2.3 数据字典

数据字典是关于数据库中数据的描述，即元数据，不是数据本身。数据字典是在需求分析阶段建立，是进行详细的数据收集和数据分析所获得的，并在数据库设计过程中不断修改、充实、完善。

内容：数据项，数据结构，数据流，数据存储，处理过程

1.数据项：数据项是不可再分的数据单位

数据项描述＝｛数据项名，数据项含义说明，别名，
数据类型，长度，取值范围，取值含义，
与其他数据项的逻辑关系，数据项之间的联系｝

2.数据结构：数据结构反映了数据之间的组合关系

数据结构描述＝｛数据结构名，含义说明，
组成:｛数据项或数据结构｝｝

一个数据结构可以由若干个数据项组成，也可以由若干个数据结构组成，或由若干个数据项和数据结构混合组成

3.数据流：数据流是数据结构在系统内传输的路径

数据流描述＝｛数据流名，说明，数据流来源，
数据流去向，组成:｛数据结构｝，
平均流量，高峰期流量｝

4.数据存储：数据存储是数据结构停留或保存的地方，也是数据流的来源和去向之一

数据存储描述＝｛数据存储名，说明，编号，
输入的数据流，输出的数据流，
组成:｛数据结构｝，数据量，存取频度，存取方式｝

5.处理过程：具体处理逻辑一般用判定表或判定树来描述

处理过程描述＝｛处理过程名，说明，输入:｛数据流｝，输出:｛数据流｝，处理:｛简要说明｝｝

小结：

设计人员应充分考虑到可能的扩充和改变，使设计易于更改，系统易于扩充
必须强调用户的参与

7.3 概念结构设计

7.3.1 概念结构

概念结构设计

将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计
概念结构是各种数据模型的共同基础，它比数据模型更独立于机器、更抽象，从而更加稳定
概念结构设计是整个数据库设计的关键

概念结构设计的特点

能真实、充分地反映现实世界
易于理解
易于更改
易于向关系、网状、层次等各种数据模型转换

7.3.2 概念结构设计

概念设计的第一步就是对需求分析阶段收集到的数据进行分类、组织，确定实体、实体属性、实体间联系类型，形成E-R图,

1．实体与属性的划分原则

为了简化E-R图的处置，现实世界的事物能作为属性对待的,尽量作为属性对待。

两条准则:

作为属性,不能再具有需要描述的性质。属性必须是不可分的数据项，不能包含其他属性。
属性不能与其他实体具有联系，即E-R图中所表示的联系是实体之间的联系。

p225举有例子

2.E-R图的集成

E-R图的集成一般需要分两步:

第一步:合并。解决各分E-R图之间的冲突，将分E-R图合并起来生成初步E-R图。
第二步:修改和重构。消除不必要的冗余,生成基本E-R图。

1）合并分E-R图，生成初步E-R图

各分E-R图存在冲突，各个分E-R图之间必定会存在许多不一致的地方（浅浅记一下）

属性冲突
命名冲突
结构冲突

1.属性冲突

属性域冲突
属性值的类型
取值范围
取值集合不同

属性取值单位冲突

2.命名冲突

同名异义：不同意义的对象在不同的局部应用中具有相同的名字（如网络）
异名同义（一义多名）：同一意义的对象在不同的局部应用中具有不同的名字（如工程、课题、项目）

3.结构冲突

同一对象在不同应用中具有不同的抽象
同一实体在不同分E-R图中所包含的属性个数和属性排列次序不完全相同
实体之间的联系在不同局部视图中呈现不同的类型

基本任务：消除不必要的冗余，设计基本E-R图

1.冗余

冗余的数据是指可由基本数据导出的数据
冗余的联系是指可由其他联系导出的联系
冗余数据和冗余联系容易破坏数据库的完整性，给数据库维护增加困难
消除不必要的冗余后的初步E-R图称为基本E-R图

消除冗余的方法

分析方法
以数据字典和数据流图为依据
根据数据字典中关于数据项之间的逻辑关系

效率VS冗余信息
需要根据用户的整体需求来确定

若人为地保留了一些冗余数据，则应把数据字典中数据关联的说明作为完整性约束条件
规范化理论
函数依赖的概念提供了消除冗余联系的形式化工具（略）

验证整体概念结构

视图集成后形成一个整体的数据库概念结构，对该整体概念结构还必须进行进一步验证，确保它能够满足下列条件：

整体概念结构内部必须具有一致性，不存在互相矛盾的表达
整体概念结构能准确地反映原来的每个视图结构，包括属性、实体及实体间的联系
整体概念结构能满足需要分析阶段所确定的所有要求

整体概念结构最终还应该提交给用户，征求用户和有关人员的意见，进行评审、修改和优化，然后把它确定下来，作为数据库的概念结构，作为进一步设计数据库的依据。

7.4 逻辑结构设计

逻辑结构设计的任务

把概念结构设计阶段设计好的基本E-R图转换为与选用DBMS产品所支持的数据模型相符合的逻辑结构

逻辑结构设计的步骤

将概念结构转化为一般的关系、网状、层次模型
转换来的关系、网状、层次模型向特定DBMS支持下的数据模型转换
对数据模型进行优化

7.4.1 E-R图向关系模型的转换

实体型间的联系有以下不同情况：

（1）一个1:1联系可以转换为一个独立的关系模式，也可以与任意一端对应的关系模式合并。

转换为一个独立的关系模式
与某一端实体对应的关系模式合并（比如车队和司机之间有联系“聘用”，然后这个联系的属性可以和司机或者车队的属性合并起来，比如在司机的属性加上“聘期”）

（2）一个1:n联系可以转换为一个独立的关系模式，也可以与n端对应的关系模式合并。

转换为一个独立的关系模式
与n端对应的关系模式合并

（3）一个m:n联系转换为一个关系模式

（4）三个或三个以上实体间的一个多元联系转换为一个关系模式。

（5）具有相同码的关系模式可合并

目的：减少系统中的关系个数
合并方法：将其中一个关系模式的全部属性加入到另一个关系模式中，然后去掉其中的同义属性（可能同名也可能不同名），并适当调整属性的次序

一定要看这篇文章，直接弄懂！！！

http://t.csdn.cn/KEZMN

要弄懂这题

http://t.csdn.cn/TVPO7

7.4.2 数据模型的优化

得到初步数据模型后，还应该适当地修改、调整数据模型的结构，以进一步提高数据库应用系统的性能，这就是数据模型的优化

关系数据模型的优化通常以规范化理论为指导

优化数据模型的方法

确定数据依赖
按需求分析阶段所得到的语义，分别写出每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间数据依赖
消除冗余的联系
对于各个关系模式之间的数据依赖进行极小化处理，消除冗余的联系。
确定所属范式
按照数据依赖的理论对关系模式逐一进行分析
考查是否存在部分函数依赖、传递函数依赖、多值依赖等
确定各关系模式分别属于第几范式
按照需求分析阶段得到的各种应用对数据处理的要求，分析对于这样的应用环境这些模式是否合适，确定是否要对它们进行合并或分解。

并不是规范化程度越高的关系就越优，一般说来，第三范式就足够了

按照需求分析阶段得到的各种应用对数据处理的要求，对关系模式进行必要的分解，以提高数据操作的效率和存储空间的利用率
- 常用分解方法：水平分解，垂直分解
- 水平分解：把(基本)关系的元组分为若干子集合，定义每个子集合为一个子关系，以提高系统的效率
  - 水平分解的适用范围：满足“80/20原则”的应用并发事务经常存取不相交的数据
- 垂直分解：把关系模式R的属性分解为若干子集合，形成若干子关系模式
  - 垂直分解的适用范围：取决于分解后R上的所有事务的总效率是否得到了提高