数据库系统(六)数据库范式 | 函数依赖,一二三范式,BCNF,属性集闭包和正则覆盖

news2025/1/10 3:15:44

文章目录

  • 1 好的关系设计的特征
  • 2 函数依赖关系
  • 3 Normal Forms 规范形式
    • 3.1 一二三范式
      • 3.1.1 基本概念
      • 3.1.2 判断是否满足3NF
    • 3.2 BCNF
      • 3.2.1 基本概念
      • 3.2.2 判断是否满足BCNF
      • 3.2.3 分解得到BCNF
  • 4 属性集闭包和正则覆盖
    • 4.1 属性集闭包求法
    • 4.2 属性集闭包应用
      • 4.2.1 测试某个属性集是否为超键
      • 4.2.2 测试一个属性是否无关属性
    • 4.3正则覆盖Canonical Cover

1 好的关系设计的特征

好的设计

​ 要避免冗余

​ 要避免更新、删除或者插入异常

那么为了在设计中进行好的设计

就应该合理的分解表格

但是有些时候分解会造成一些不好的影响——会产生有损分解或者无损分解

所什么是无损分解,什么是有损分解?

判断方式一

对于关系R,分解为R1和R2

讲两个分解后的表R1,R2做自然连接,如连接后和原来表R相等,则是无损分解。

如果自然连接后产生了原理表R没有的元组,则为有损分解

判断方式二

对于关系R,分解为R1和R2

如果R1和R2的交集是R1或者R2其中之一的超键则为无损分解,否则为有损分解

2 函数依赖关系

函数依赖 Functional Dependencies,就是初中高中学习的判断一个对应关系是否为函数

很简单,就是一个x对应唯一一个y

需要先着重理解两个概念

平凡函数依赖 Trivial Functional Dependencies

如果x->y,即y是x的函数,同时y又是x的子集,那么就说x到y是平凡函数依赖

平凡的含义就是显而易见的,为什么叫显而易见呢?子集我们可以理解为信息的一部分,信息相对原来变少了,那么因为知道更多的信息肯定可以推出更少的信息的,所以这个x-》y的函数依赖关系是显而存在的

举这样一个例子

(学生ID,姓名)->(姓名)

其中x是(学生ID,姓名),y是(姓名)

那么如果知道了学生ID,姓名,肯定可以得到唯一的姓名

非平凡函数依赖

而如果y不是x的子集,那么就不那么明显了,所以是非平凡函数依赖

再理解两个概念,部分函数依赖和完全函数依赖

理解部分函数依赖和完全函数依赖

部分函数依赖(Partial Functional Dependency)(候选码): 部分函数依赖是指在关系中,

比如x->y的函数依赖,y只依赖x的一部分,那么则是部分函数依赖,x还可以再拆分

举个例子,假设有一个包含以下属性的关系表:

  • 学生ID(StudentID)
  • 课程号(CourseID)
  • 学生姓名(StudentName)

(学生ID,课程号)是可以推出学生姓名的

而只有学生ID也可以推出决定学生姓名,所以可以继续拆分,为部分函数依赖,换句话说x的子集也能推出决定右边

完全函数依赖(Full Functional Dependency)(超码):完全函数依赖是指在关系中,

比如x->y的函数依赖,y依赖x的全部,那么则是全部函数依赖,x不可以再拆分

换句话说x的子集不能推出决定右边

包含在任何一个候选码中的属性 ,称为主属性(Prime attribute)
不包含在任何候选码中的属性称为非主属性(Nonprime attribute)

在这里插入图片描述

总结来看:我们更期望非平凡函数依赖和完全函数依赖

函数依赖的闭包 Closure of Functional Dependencies

函数依赖闭包表示为 F + F^+ F+

函数依赖的闭包是一个属性集合,它包含了一个给定的属性集合关于另一个属性集合的所有可能依赖,所有的可能的函数关系

如何求函数依赖的闭包

利用

Armstrong’s Axioms 阿姆斯特朗公理

阿姆斯特公理有三条

  1. 自反率(Reflexivity Axiom): 如果X是一个属性集合,那么X的任何子集都可以推出X,表示为X → X。这意味着一个属性集合的所有子集都具有相同的函数依赖。
  2. 扩展律(Augmentation Axiom): 如果X → Y,并且Z是一个属性集合,那么XZ → YZ。这个公理表示如果一个属性集合X决定另一个属性集合Y,那么在X的基础上添加属性Z也会决定Y。
  3. 传递律(Transitivity Axiom): 如果X → Y和Y → Z,那么X → Z。这个公理表示如果一个属性集合X决定另一个属性集合Y,同时Y又决定另一个属性集合Z,那么X也会决定Z。

另外的

  1. Union Rule(并集规则): Union Rule 允许我们将两个函数依赖合并成一个更大的函数依赖。规则表述如下:

    如果 X → Y1 和 X → Y2,那么 X → (Y1 ∪ Y2)。

    这意味着如果属性集合 X 决定属性集合 Y1,同时 X 也决定属性集合 Y2,那么 X 也决定属性集合 (Y1 ∪ Y2),也就是 Y1 和 Y2 的并集。

  2. Splitting Rule(拆分规则): Splitting Rule 允许我们拆分函数依赖,将一个函数依赖分成两个更小的函数依赖。规则表述如下:

    如果 X → (Y1 ∪ Y2),那么 X → Y1 和 X → Y2。

    这意味着如果属性集合 X 决定属性集合 (Y1 ∪ Y2),那么 X 也分别决定属性集合 Y1 和属性集合 Y2。这可以用于将一个大的函数依赖分解成多个小的函数依赖。

  3. Pseudotransitivity Rule(伪传递规则): Pseudotransitivity Rule 允许我们在两个已知的函数依赖关系之间推导出一个新的函数依赖。规则表述如下:

    如果 X → Y1 和 Y1Z → Y2,那么 XZ → Y2。

    这意味着如果属性集合 X 决定属性集合 Y1,同时 Y1Z 决定属性集合 Y2,那么属性集合 XZ 也决定属性集合 Y2。这个规则有点类似于传递性,但不完全相同,因此称为伪传递规则。

通过上面的,我们可以求得一个函数依赖关系的闭包,我从网上找到了一道题,但感觉求这个意义不大

image-20231228170252613

3 Normal Forms 规范形式

3.1 一二三范式

3.1.1 基本概念

规范形式(Normalization Forms,通常缩写为NF)是数据库设计中的一组标准,用于确保数据库表的结构满足一定的标准,以提高数据的一致性、避免数据冗余,并提高数据库性能。最常见的规范形式包括第一范式(1NF)、第二范式(2NF)和第三范式(3NF)。

  1. 第一范式(1NF)
    • 第一范式要求数据库表中的每个列都包含不可分割的、原子的数据,也就是每个单元格只包含一个值。此外,表中的每个行都应具有唯一的标识,通常通过一个主键来实现。1NF消除了重复的列和组合列。
  2. 第二范式(2NF)
    • 第二范式要求在1NF的基础上,确保非主键属性完全依赖于主键。这意味着非主键属性不会部分依赖主键,也就是没有部分函数依赖。如果存在部分函数依赖,需要将表进行拆分,以确保每个非主键属性都依赖于整个主键。通常,2NF适用于具有复合主键的表。
  3. 第三范式(3NF)
    • 第三范式要求在2NF的基础上,消除传递依赖。传递依赖指的是非主键属性依赖于主键以外的非主键属性。如果一个非主键属性依赖于另一个非主键属性,而这个属性又依赖于主键,就存在传递依赖。为了满足3NF,需要将数据库表进行拆分,以确保每个非主键属性只依赖于主键。

实际上3NF达到的效果就是 尽可能保证 非主键属性完全依赖于主建且只依赖于主键

规范形式的目标是减少数据冗余、提高数据一致性,并简化数据库结构,以便更容易维护和查询数据。虽然1NF、2NF和3NF是最常见的规范形式,但还有更高级别的规范形式,如巴斯-科德范式(BCNF)和第四范式(4NF),它们进一步强化了数据库设计的要求。

总结

第一范式:简单说 列不能再分

第二范式:简单说 建立在第一范式基础上,消除部分依赖

第三范式:简单说 建立在第二范式基础上,消除传递依赖。

BCNF是对3NF的改进,消除了对主键子集的依赖

3.1.2 判断是否满足3NF

在这里插入图片描述

3.2 BCNF

3.2.1 基本概念

Boyce-Codd Normal Form(巴斯-科德范式(BCNF))是Third Normal Form 的一种扩展,因此有时候也被称为3.5范式

  • Boyce-Codd Normal Form(巴斯-科德范式)
  • 在3NF基础上,任何非主属性不能对主键子集依赖(在3NF基础上消除对主码子集的依赖)
  • 巴斯-科德范式(BCNF)是第三范式(3NF)的一个子集,即满足巴斯-科德范式(BCNF)必须满足第三范式(3NF)。通常情况下,巴斯-科德范式被认为没有新的设计规范加入,只是对第二范式与第三范式中设计规范要求更强,因而被认为是修正第三范式,也就是说,它事实上是对第三范式的修正,使数据库冗余度更小。这也是BCNF不被称为第四范式的原因。某些书上,根据范式要求的递增性将其称之为第四范式是不规范,也是更让人不容易理解的地方。

3.2.2 判断是否满足BCNF

判断每一个是否是超码,有一个不是就不是

a is a superkey for R

在这里插入图片描述

因为Sno→Sdept中Sno不是超码
Sdept→Mname中Sdept不是超码

3.2.3 分解得到BCNF

怎么分解得到呢?

对于x->y

分解为x并y和R-(y-x)

4 属性集闭包和正则覆盖

4.1 属性集闭包求法

ps:可以理解为X+表示所有X可以决定的属性

求取属性集闭包的步骤:

设要求的闭包属性集是Y,把Y初始化为X.
检查函数依赖集F中的每个函数依赖A->B,如果属性集A中的所有属性都在Y中,而B中有属性不在Y中,则将其加入到Y中。
重复第二步,直到没有属性可以添加到Y中为止。最后得出的Y就是X+。
*例子:*设有关系模式R(M,N,X,Y,Z)其依赖集F={M->H,H->Z,Y->Z,N->Y,Z->M}。求M+,MH+
第一步:设要求的闭包属性集是Y,把Y初始化为X.
令X={M},我们先看M->H,由于函数依赖M->H左边的所有属性都在X中,而右边H不在X中,所以可以把H添加到X 中,此时X={M,H}

然后按照顺序我们再看H->Z,我们不难发现函数依赖H->Z左边的所有属性都在X中,右边的属性Z又不在X中,仍旧添加,这时X={M,H,Z}

下一个

Y->Z,可以发现Y属性不在X中,条件不满足
N->Y,可以发现N属性不在X中,条件不满足
Z->M,Z属性在X中条件满足,但右边M也在X中条件不满足。

属性判断完 ,那么属性M的闭包:M+=MHZ。

4.2 属性集闭包应用

4.2.1 测试某个属性集是否为超键

他的闭包如果包含所有属性,则为超集

4.2.2 测试一个属性是否无关属性

右边多余

如果前面的属性集闭包可以包括后面的,即可以删除无关的

在这里插入图片描述

左边多余

还可以计算函数依赖闭包,测试函数依赖是否成立

范式判断的三个步骤以及各个范式标准(1NF,2NF,3NF,BCNF,4NF)_如何判断1nf2nf3nf和bcnf-CSDN博客

4.3正则覆盖Canonical Cover

一.使用合并律将所有左部相同的函数依赖合并成一个

设有一函数依赖集F,其中有{A→B,A→E,……},则将这两个函数依赖合并为{A→BE,……}

二.在合并后的函数依赖集中寻找一个无关属性,将它删除

重复一二,直到每个元素都不是无关元素,无法再删,故解得正则覆盖

例题可以参考

正则覆盖的求法与判断属性是否冗余-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1343272.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

借助 Google Play 游戏电脑版新功能,加速业务增长

作者 / Google Play 游戏总监 Arjun Dayal Google Play 游戏电脑版测试版自去年发布以来,取得了巨大的发展。Google Play 游戏电脑版现在提供 3,000 多种游戏,覆盖 120 多个国家/地区的用户,为玩家提供各种类型的游戏。我们的热门移动游戏目录…

4-链表-合并两个有序链表

这是链表的第4题,来个简单算法玩玩。力扣链接。 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 示例 1: 输入:l1 [1,2,4], l2 [1,3,4] 输出:[1,1,2,3,4,4]示例 2&#xff…

Kindle使用USB数据线传书封面无法显示问题

以下内容只针对USB传书(非越狱版本,越狱了有相关插件,这里不谈),不包括邮件传书。 恶心图如下: 直接把mobi/azw3/azw (epub模式不能直接拷贝,kindle无法读取)格式的电子…

99. 恢复二叉搜索树

#中序遍历,寻找插值位置并交换 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # self.left left # self.right right class Solution:def recoverTree…

基于MINIST的手写数字体识别

一、算法简述 网络结构设计 通过创建MnistNet类,定义了包含两个卷积层和两个全连接层的深度神经网络。这个网络的设计灵感来自于经典的CNN结构,其中卷积层用于提取图像特征,而全连接层则用于将这些特征映射到最终的类别。 卷积与池化 卷…

新能源汽车高性价比电驱系统设计技术

版权声明:此资源由用户收集整理于网络,只用于交流学习,请勿用作它途。除非确实无法确认,我们都会注明作者和来源,无法确认情况我们标注来自网络。若涉及版权问题,烦请原作者联系我们,与您共同协…

【软件工程】漫谈增量过程模型:软件开发的逐步之道

🍎个人博客:个人主页 🏆个人专栏: 软件工程 ⛳️ 功不唐捐,玉汝于成 目录 前言: 正文 增量过程模型(Incremental Process Model) 主要特点和阶段: 优点&#xff1…

第五课:集成电路与摩尔定律(硬件的发展)、操作系统、内存和储存介质(存储技术的发展)、文件系统、压缩、命令行界面及屏幕与 2D 图形显示

第五课:集成电路与摩尔定律(硬件的发展)、操作系统、内存和储存介质(存储技术的发展)、文件系统、压缩、命令行界面及屏幕与 2D 图形显示 第十七章:集成电路与摩尔定律(硬件的发展)1…

爬虫工作量由小到大的思维转变---<第三十四章 Scrapy 的部署scrapyd+Gerapy>

前言: scrapy-redis没被部署,感觉讲起来很无力;因为实在编不出一个能让scrapy-redis发挥用武之地的案子;所以,索性直接先把分布式爬虫的部署问题给讲清楚!! 然后,曲线救国式地再在部署的服务器上,讲scrapy redis我感觉这样才好! 正文: 现在还有不少人在用scrapy web进行爬虫管…

Springboot启动流程-持续记录中

注:转载请携带本文链接及公众号信息 公众号:codelike 基于springboot2.6.x 源码 Springboot启动之第一篇 SpringApplication构造器 启动入口方法是new SpringApplication.run(),一切的开始都从这里 这里做了什么呢 分为初始化SpringApplication实体、执行run()…

rime中州韵 自定义词典

在使用 rime 输入法的过程, 我们往往会需要增加一些个个性化的词条,这些词条我们可能通过自定义词典的方式来管理和使用。 Custom_phrase.txt 首先,我们需要有一个词典文档,这里我们把 Custom_phrase.txt 文档作为我们的自定义文…

c语言-string.h库函数初识

目录 前言一、库函数strlen()1.1 strlen()介绍1.2 模拟实现strlen() 二、库函数strcpy()2.1 strcpy()介绍2.2 模拟实现strcpy() 三、库函数strcmp()3.1 strcmp()介绍3.3 模拟实现strcmp() 总结 前言 本篇文章介绍c语言<string.h>头文件中的库函数&#xff0c;包含strlen…

汽车电子喇叭,预计未来几年全球市场将以显着的速度增长

根据最近的市场研究报告&#xff0c;预计未来几年全球汽车电子喇叭市场将以显着的速度增长。这种增长是由对汽车高级安全系统的需求不断增加以及电动汽车 (EV) 和混合动力电动汽车 (HEV) 的日益普及所推动的。此外&#xff0c;智慧城市的发展和对车对车&#xff08;V2V&#xf…

CEC2017(Python):五种算法(HHO、RFO、OOA、PSO、GWO)求解CEC2017

一、5种算法简介 1、哈里斯鹰优化算法HHO 2、红狐优化算法RFO 3、鱼鹰优化算法OOA 4、粒子群优化算法PSO 5、灰狼优化算法GWO 二、CEC2017简介 参考文献&#xff1a; [1]Awad, N. H., Ali, M. Z., Liang, J. J., Qu, B. Y., & Suganthan, P. N. (2016). “Problem d…

Python 操作 MySQL:使用 mysql-connector-python 操作 MySQL 数据库

大家好&#xff0c;我是水滴~~ 当涉及到使用 Python 操作 MySQL 数据库时&#xff0c;mysql-connector-python 库是一个强大而常用的选择。该库提供了与 MySQL 数据库的交互功能&#xff0c;使您能够执行各种数据库操作&#xff0c;如连接数据库、执行查询和插入数据等。在本文…

余弦相似度算法

余弦相似度算法 是什么 余弦距离&#xff0c;也称为余弦相似度&#xff0c;是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。 余弦值越接近1&#xff0c;就表明夹角越接近0度&#xff0c;也就是两个向量越相似&#xff0c;这就叫"余弦相似性&q…

PBR纹理贴图类型详解

在线工具推荐&#xff1a; 3D数字孪生场景编辑器 - GLTF/GLB材质纹理编辑器 - 3D模型在线转换 - Three.js AI自动纹理开发包 - YOLO 虚幻合成数据生成器 - 三维模型预览图生成器 - 3D模型语义搜索引擎 PBR 纹理是一种帮助 3D 艺术家使他们的 3D 渲染看起来更逼真的技术。…

k8s搭建(四、k8s集群创建)

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

ROS仿真R2机器人之安装运行及MoveIt的介绍

R2(Robonaut 2)是NASA美国宇航局与GM通用联合推出的宇航人形机器人&#xff0c;能在国际空间站使用&#xff0c;可想而知其价格是非常昂贵&#xff0c;几百万美刀吧&#xff0c;还好NASA发布了一个R2机器人的Gazebo模型&#xff0c;使用模型就不需要花钱了&#xff0c;由于我们…

Kubernetes网络-VXLAN

一. 网络基础 1. 计算机网络的分层 如今连接方式也越来也丰富&#xff0c;网线、WiFi、蓝牙、光纤&#xff0c;甚至我们普通的电线、照明所用的灯光&#xff0c;都可以作为接入网络的介质。如此庞大的网络&#xff0c;丰富多样的设备&#xff0c;计算机网络技术能把它们统一起…