🏆今日学习目标:
🍀数据库三范式与反范式详解
✅创作者:林在闪闪发光
⏰预计时间:30分钟
🎉个人主页:林在闪闪发光的个人主页🍁林在闪闪发光的个人社区,欢迎你的加入: 林在闪闪发光的社区
目录
范式
1NF(第一范式)
特征:无重复列
2NF(第二范式)
特征:完全依赖
3NF(第三范式)
特征:传递依赖
反范式
即使再穷,总会有梦。
Even if poor, there will always be dreams.
范式
范式就是数据库的构建规则,目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、第四范式(4NF)、第五范式(5NF)和第六范式(6NF)。满足最低要求的范式是第一范式(1NF)。在第一范式的基础上进一步满足更多要求的称为第二范式(2NF),其余范式以次类推。一般说来,数据库只需满足第三范式(3NF)就行了。
以下用图文并茂的方式带大家了解
1NF(第一范式)
特征:无重复列
官方解释:在关系模式R中的每一个具体关系r中,如果每个属性值 都是不可再分的最小数据单位,则称R是第一范式的关系
目的:消除实体中列中的重复值或实体的重复属性
例:如职工号,姓名,电话号码组成一个表(一个人可能有一个办公室电话 和一个家里电话号码) 规范成为1NF有三种方法:
一是重复存储职工号和姓名。这样,关键字只能是电话号码。
二是职工号为关键字,电话号码分为单位电话和住宅电话两个属性
三是职工号为关键字,但强制每条记录只能有一个电话号码。
以上三个方法,第一种方法最不可取,按实际情况选取后两种情况。
2NF(第二范式)
特征:完全依赖
官方解释:如果关系模式R(U,F)中的所有非主属性都完全依赖于任意一个候选关键字,则称关系R 属于第二范式
目的:消除非主属性对主码的部分函数依赖
例:选课关系 SCI(SNO,CNO,GRADE,CREDIT)其中SNO为学号, CNO为课程号,GRADEGE 为成绩,CREDIT 为学分。 由以上条件,关键字为组合关键字(SNO,CNO)
在应用中使用以上关系模式有以下问题:
a.数据冗余,假设同一门课由40个学生选修,课程号就 重复40次。
b.更新异常,若调整了某课程的学分,相应的元组CREDIT值都要更新,有可能会出现同一门课学分不同。
c.插入异常,如计划开新课,由于没人选修,没有学号关键字,只能等有人选修才能把课程和学分存入。
d.删除异常,若学生已经结业,从当前数据库删除选修记录。某些门课程新生尚未选修,则此门课程及学分记录无法保存。
原因:
非关键字属性CREDIT仅函数依赖于CNO,也就是CREDIT部分依赖组合关键字(SNO,CNO)而不是完全依赖。
解决方法
分成两个关系模式 SC1(SNO,CNO,GRADE),C2(CNO,CREDIT)。新关系包括两个关系模式,它们之间通过SC1中的外关键字CNO相联系,需要时再进行自然联接,恢复了原来的关系
3NF(第三范式)
特征:传递依赖
官方解释:如果关系模式R(U,F)中的所有非主属性对任何候选关键字都不存在传递依赖,则称关系R是属于第三范式的。
目的:消除传递依赖
例:如S1(SNO,SNAME,DNO,DNAME,LOCATION) 各属性分别代表学号,
姓名,所在系,系名称,系地址。
关键字SNO决定各个属性。由于是单个关键字,没有部分依赖的问题,肯定是2NF。但这关系肯定有大量的冗余,有关学生所在的几个属性DNO,DNAME,LOCATION将重复存储,插入,删除和修改时也将产生类似以上例的情况。
原因
关系中存在传递依赖造成的。即SNO -> DNO。 而DNO -> SNO却不存在,DNO -> LOCATION, 因此关键字 SNO 对 LOCATION 函数决定是通过传递依赖 SNO -> LOCATION 实现的。也就是说,SNO不直接决定非主属性LOCATION。
解决目地
每个关系模式中不能留有传递依赖。
解决方法
分为两个关系 S(SNO,SNAME,DNO),D(DNO,DNAME,LOCATION)
注意
关系S中不能没有外关键字DNO。否则两个关系之间失去联系。
反范式
- 反范式化设计数据库,是为了提高查询效率,采用空间换时间的实现思路
- 一些情况下
比如 存在频繁查询时,可以容忍适当的冗余设计,目的是减少多表关联查询,提高效率
例如:订单表中冗余了商品信息和用户相关信息,避免查询订单时关联用户表和商品表去查询相关信息,提高效率- 好查不好改
但是冗余意味着,好查不好改,修改数据时
冗余设计造成需要同时修改多张表中的某些字段
容易出现业务上的Update遗漏现象(毕竟SQL是人写的~)