Mysql高级篇(下)——数据库设计范式

news2024/12/28 3:58:22

Mysql高级篇(下)——数据库设计范式

  • 一、键和相关属性概念
  • 二、关系型数据库中常见的六种设计范式
    • 1. 第一范式(1NF)- 消除重复列,保证每列都是原子值
    • 2. 第二范式(2NF)- 消除部分依赖
    • 3. 第三范式(3NF) - 消除传递依赖
    • 4. BCNF(巴斯-科德范式)- 消除候选键的部分依赖
    • 5. 第四范式 (4NF) - 消除多值依赖
    • 6. 第五范式 (5NF) - 消除连接依赖
    • 🎈 总结:
  • 三、反范式化(Denormalization)
    • 1. 概述
    • 2. 示例
    • 3. 反范式化的优缺点:
    • 🎈总结:
  • 四、范式设计案例
    • 案例实战
    • 🎈总结:

一、键和相关属性概念



球员表 (player):

  • 包含字段:球员编号姓名身份证号年龄球队编号。这些字段记录了关于每个球员的详细信息
  • 其中,"球员编号"是每个球员的唯一标识,用来区分不同球员。


球队表 (team):

  • 包含字段:球队编号主教练球队所在地。这些字段记录了每个球队的信息
  • "球队编号"是球队表的主键,用来唯一标识球队


在这里插入图片描述

二、关系型数据库中常见的六种设计范式

数据库设计中的六种范式(1NF5NFBCNF)是逐步递进的每个范式都基于前一个范式的基础,进一步提高了数据库设计的规范化程度。它们的关系可以理解为一种渐进式的约束机制,每一层范式都解决了上一层没有处理好的数据冗余或异常问题。


1. 第一范式(1NF)- 消除重复列,保证每列都是原子值

  • 要求数据库中的所有字段都是原子值,即数据不可再分。每个字段都只包含单一的值,不能是 集合、列表兄弟值

示例:

违反1NF的情况:

学生表 (Student)
-----------------------------
学生编号 | 姓名  | 电话号码
-----------------------------
101      | 张三  | 123456, 789012
102      | 李四  | 345678
-----------------------------
这里的“`电话号码`”字段包含了多个值(即`数组``集合`),违反了`1NF`

符合1NF的表:

学生表 (Student)
-----------------------
学生编号 | 姓名  | 电话号码
-----------------------
101      | 张三  | 123456
101      | 张三  | 789012
102      | 李四  | 345678
-----------------------
通过将电话号码分成多行,每行只包含一个号码,表就符合1NF。

2. 第二范式(2NF)- 消除部分依赖

  • 在满足1NF的基础上,还 要求表中的每个非主键属性完全依赖于主键。即消除部分依赖(部分依赖是指某些属性只依赖于主键的一部分,而不是整个主键)。

示例:

违反2NF的情况:

选课表 (Student_Course)
----------------------------------------------
学生编号 | 学生姓名 | 课程编号 | 课程名称 | 成绩
----------------------------------------------
101      | 张三    | 201      | 数学    | 90
101      | 张三    | 202      | 物理    | 85
102      | 李四    | 201      | 数学    | 88
102      | 李四    | 203      | 化学    | 92
----------------------------------------------
这里的 复合主键 是 学生编号 + 课程编号
,但 学生姓名 依赖于 学生编号,而与 课程编号 无关;
同理 课程名称 依赖于 课程编号,而与 学生编号 无关;
这种部分依赖违反了2NF。

符合2NF的表:

学生表 (Student)
-----------------------
学生编号 | 学生姓名
-----------------------
101      | 张三
102      | 李四
-----------------------



选课表 (Student_Course)
------------------------------
学生编号 | 课程编号 | 成绩
------------------------------
101      | 201      | 90
101      | 202      | 85
102      | 201      | 88
102      | 203      | 92
------------------------------




课程表 (Course)
------------------------
课程编号 | 课程名称
------------------------
201      | 数学
202      | 物理
203      | 化学
------------------------
通过将学生信息和课程信息拆分为独立的表,消除了部分依赖,符合2NF。

3. 第三范式(3NF) - 消除传递依赖

  • 满足2NF的基础上,要求消除供应依赖。即非主键属性不能依赖于其他非主键属性,必须直接依赖于主键。

示例:

违反3NF的情况:

雇员表 (Employee)
---------------------------
雇员编号 | 雇员姓名 | 部门编号 | 部门名称
---------------------------
001      | 张三    | 101      | 销售部
002      | 李四    | 102      | 财务部
003      | 王五    | 101      | 销售部
---------------------------
这里,部门名称 依赖于 部门编号,
而 部门编号 又依赖于 雇员编号(主键),
这属于传递依赖,违反了3NF。

符合3NF的表:

雇员表 (Employee)
------------------------
雇员编号 | 雇员姓名 | 部门编号
------------------------
001      | 张三    | 101
002      | 李四    | 102
003      | 王五    | 101
------------------------




部门表 (Department)
-----------------------
部门编号 | 部门名称
-----------------------
101      | 销售部
102      | 财务部
-----------------------
通过将部门信息拆分为单独的表,消除了传递依赖,符合3NF。

4. BCNF(巴斯-科德范式)- 消除候选键的部分依赖

BCNF是对第三范式的加强,它消除了在某些情况下主属性主键之间的异常依赖。BCNF要求:

  • 表中的每个决定因素(determining factor)都必须是候选键

BCNF的主要目的是避免在某些特殊情况下(如复合键冗余的候选键)出现的依赖关系问题,即使表满足第三范式,也有可能会因为复杂的依赖关系而导致冗余。

示例:

违反BCNF的情况:

课程分配表 (Course_Assignment)
---------------------------------------
课程编号 | 教师编号 | 教室编号
---------------------------------------
201      | 001      | Room 101
202      | 002      | Room 102
201      | 001      | Room 101
---------------------------------------
在这个表中,教师编号 决定 教室编号(即 教师编号 → 教室编号),
但 教师编号 不是超键,因为它不能唯一标识整个表的记录。
这违反了BCNF。

符合BCNF的表:

课程表 (Course)
------------------------
课程编号 | 教师编号
------------------------
201      | 001
202      | 002
------------------------



教师教室表 (Teacher_Room)
------------------------
教师编号 | 教室编号
------------------------
001      | Room 101
002      | Room 102
------------------------
通过分解表结构,消除了不符合BCNF的依赖。

5. 第四范式 (4NF) - 消除多值依赖

在满足BCNF的基础上,消除多值依赖。即 表中不能存在一个属性依赖于多个不相关的属性

示例:

违反4NF的情况:

学生活动表 (Student_Activity)
---------------------------
学生编号 | 活动   | 语言
---------------------------
101      | 篮球   | 英语
101      | 篮球   | 中文
101      | 音乐   | 英语
101      | 音乐   | 中文
---------------------------
这里,活动 和 语言 是彼此独立的多值依赖,导致数据冗余,违反了4NF。

符合4NF的表:

学生活动表 (Student_Activity)
---------------------------
学生编号 | 活动
---------------------------
101      | 篮球
101      | 音乐
---------------------------



学生语言表 (Student_Language)
---------------------------
学生编号 | 语言
---------------------------
101      | 英语
101      | 中文
---------------------------
通过将活动和语言分开存储,消除了多值依赖,符合4NF。

6. 第五范式 (5NF) - 消除连接依赖

在满足4NF的基础上,确保表的任何信息都不能通过自然连接来重构,即消除连接依赖

示例:

违反5NF的情况:

供应商零件项目表 (Supplier_Part_Project)
--------------------------------------------
供应商 | 零件 | 项目
--------------------------------------------
A      | P1   | J1
A      | P2   | J1
B      | P1   | J2
B      | P2   | J2
--------------------------------------------
这里可能存在一种情况,即 供应商、零件 和 项目 之间的关系
可以通过自然连接拆分重构,这违反了5NF。

符合5NF的表:

供应商项目表 (Supplier_Project)
-------------------------------
供应商 | 项目
-------------------------------
A      | J1
B      | J2
-------------------------------



供应商零件表 (Supplier_Part)
-----------------------------
供应商 | 零件
-----------------------------
A      | P1
A      | P2
B      | P1
B      | P2
-----------------------------



零件项目表 (Part_Project)
-------------------------
零件 | 项目
-------------------------
P1   | J1
P2   | J1
P1   | J2
P2   | J2
-------------------------
通过将关系拆分为多个表,消除了连接依赖,符合5NF。

🎈 总结:

  • 1NF:确保每列都是原子值
  • 2NF:消除部分依赖
  • 3NF:消除传递依赖
  • BCNF:每个决定因素都是超键
  • 4NF:消除多值依赖
  • 5NF:消除连接依赖

三、反范式化(Denormalization)

1. 概述

反范式化(Denormalization)是 指在数据库设计中,故意违反范式规则,来提升查询性能或满足实际应用的需求。虽然范式化可以减少数据冗余、提高数据一致性,但高度规范化的表结构可能会导致较多的表连接操作,从而影响查询效率。在一些实际应用中,为了避免复杂的表连接查询,数据库设计者可能会选择反范式化,以提高读取性能,尤其是在查询频繁且读取效率比写入要求更高的场景


2. 示例

假设在球员表(player)和球队表(team)的设计中,有这样一种需求: 我们需要频繁查询球员的详细信息,包括球员所属球队的主教练球队所在地

在范式化设计中,球员表球队表是分开的,查询球员的详细信息时,需要对两个表进行连接操作,如下所示:

SELECT player.球员编号, player.姓名, player.年龄, team.主教练, team.球队所在地
FROM player
JOIN team ON player.球队编号 = team.球队编号;

这种设计遵循第三范式 (3NF),避免了冗余。但是,随着数据量增大,频繁的表连接可能会导致查询性能下降。

反范式化的方式:

为了提高查询性能,我们可以选择将球队的"主教练"和"球队所在地"直接存储在球员表中,而不是通过球队表来查找。这就引入了冗余数据,但可以减少表连接的次数,提升查询速度。新的球员表可能设计如下:

反范式化后的球员表

球员编号姓名年龄身份证号球队编号主教练球队所在地
001张三25123456001李教练北京
002李四22654321002王教练上海

在这种设计下,查询球员及其所属球队的相关信息时,不需要连接球队表,直接从球员表中就可以获取到所有需要的数据:

SELECT 球员编号, 姓名, 年龄, 主教练, 球队所在地
FROM player;

3. 反范式化的优缺点:

  • 优点:反范式化减少了查询时的表连接,提升了查询性能,尤其是在查询频繁的情况下效果明显。

  • 缺点:反范式化引入了数据冗余,比如如果某个球队更换了主教练或所在地,所有球员表中的相关记录都需要更新,增加了数据维护的成本和一致性风险。


🎈总结:

反范式化是一种为了实际查询性能而做出的折中方案,它通过引入冗余数据来减少表连接操作。尽管这会违反范式化设计的规范,但在查询频率较高、性能要求较高的场景中,反范式化是一种常用的优化手段。使用时应结合实际需求,平衡性能提升与数据冗余、维护成本之间的关系。


四、范式设计案例

案例实战

MySQL中,范式的设计主要是为了减少数据一致性,保证数据一致性。下面是一个三级范式3NF)设计的实际例子,展示如何从非范式到第三范式逐步优化数据库结构。

场景描述

  • 你在设计一个简单的在线购物系统,初始设计中只有一个表Orders,存储订单信息。初始设计如下:

非范式设计:

CREATE TABLE Orders (
    order_id INT PRIMARY KEY,
    customer_name VARCHAR(100),
    customer_address VARCHAR(200),
    product_name VARCHAR(100),
    product_price DECIMAL(10, 2),
    order_date DATE
);

在这种设计中,存在重复数据,比如每次下一个订单时都需要存储customer_namecustomer_address,还可能重复存储相同的product_nameproduct_price


1NF (第一范式)

为了满足第一范式,每个字段都应该是原子性字段,不能包含多个值。上述表已经满足第一范式,因为每个字段都只包含一个值。


2NF (第二范式)

customer_name要达到第二式,消除必须部分依赖。具体来说,所有非主键字段必须完全依赖于主键。在上述设计中,customer_address只依赖于order_id,但并不属于订单信息,应该分离到一个单独的客户表中。

优化后期的设计(达到 2NF)

CREATE TABLE Customers (
    customer_id INT PRIMARY KEY,
    customer_name VARCHAR(100),
    customer_address VARCHAR(200)
);

CREATE TABLE Orders (
    order_id INT PRIMARY KEY,
    customer_id INT,
    order_date DATE,
    FOREIGN KEY (customer_id) REFERENCES Customers(customer_id)
);

现在Orders表只包含与订单直接相关的信息,customer_name并且customer_address依赖于customer_id,而不是order_id


3NF (第三范式)

第三式要求消除供给依赖,即非主键字段不能依赖于其他非主键字段。在Orders表中,product_nameproduct_price各处之间是相关的,不应该存在于同一个表中。你可以将产品信息分离到一个单独的字段的Products表中。

优化后期的设计(达到3NF)

CREATE TABLE Products (
    product_id INT PRIMARY KEY,
    product_name VARCHAR(100),
    product_price DECIMAL(10, 2)
);

CREATE TABLE Orders (
    order_id INT PRIMARY KEY,
    customer_id INT,
    product_id INT,
    order_date DATE,
    FOREIGN KEY (customer_id) REFERENCES Customers(customer_id),
    FOREIGN KEY (product_id) REFERENCES Products(product_id)
);

🎈总结:

通过将Orders表串联为CustomersOrdersProducts三个表,去掉了数据并提高了数据的一致性。这种设计不仅符合第三范式,还简化了更新操作。如果某些产品的价格变化,只需要更新Products表在一条记录中,不是所有包含该产品的订单。

这样,你的数据库就遵循了三级范式,避免了数据出现和异常问题。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2212494.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构 ——— C语言实现带哨兵位双向循环链表

目录 前言 无哨兵位单向不循环链表的缺陷 带哨兵位双向循环链表的概念 带哨兵位双向循环链表的结构 带哨兵位双向循环链表逻辑结构示意图​编辑 实现带哨兵位双向循环链表的准备工作 实现带哨兵位双向循环链表 1. 创建新节点 2. 初始化哨兵位 3. 定义哨兵位指针 4. …

【最新华为OD机试E卷-支持在线评测】考勤信息(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 💻 ACM金牌🏅️团队 | 大厂实习经历 | 多年算法竞赛经历 ✨ 本系列打算持续跟新华为OD-E/D卷的多语言AC题解 🧩 大部分包含 Python / C / Javascript / Java / Cpp 多语言代码 👏 感谢大家的订阅➕ 和 喜欢�…

SCI论文快速排版:word模板一键复制样式和格式【重制版】

关注B站可以观看更多实战教学视频:hallo128的个人空间SCI论文快速排版:word模板一键复制样式和格式:视频操作视频重置版2【推荐】 SCI论文快速排版:word模板一键复制样式和格式【重制版】 模板与普通文档的区别 为了让读者更好地…

软考系统分析师知识点十:软件工程

前言 今年报考了11月份的软考高级:系统分析师。 考试时间为:11月9日。 倒计时:27天。 目标:优先应试,其次学习,再次实践。 复习计划第一阶段:扫平基础知识点,仅抽取有用信息&am…

苹果AI科学家研究证明基于LLM的模型存在缺陷 因为它们无法推理

苹果公司人工智能科学家的一篇新论文发现,基于大型语言模型的引擎(如 Meta 和 OpenAI 的引擎)仍然缺乏基本的推理能力。该小组提出了一个新的基准–GSM-Symbolic,以帮助其他人衡量各种大型语言模型(LLM)的推…

【C++贪心 DFS】2673. 使二叉树所有路径值相等的最小代价|1917

本文涉及知识点 C贪心 反证法 决策包容性 CDFS LeetCode2673. 使二叉树所有路径值相等的最小代价 给你一个整数 n 表示一棵 满二叉树 里面节点的数目,节点编号从 1 到 n 。根节点编号为 1 ,树中每个非叶子节点 i 都有两个孩子,分别是左孩子…

QD1-P7 HTML 容器和布局标签(div、span)

本节学习&#xff1a;div 和 span 标签。 本节视频 www.bilibili.com/video/BV1n64y1U7oj?p7 ‍ 一、div 标签 用途 ​<div>​ 标签在 HTML 中是一个通用容器&#xff0c;用于将 HTML 文档中的内容分组并在文档中划分区域。<div>​ ​元素本身不具有特定的含…

深入探索Spring Cloud Gateway:微服务网关的最佳实践

优质博文&#xff1a;IT-BLOG-CN Spring Cloud Gateway作为Spring Cloud框架的第二代网关&#xff0c;在功能上要比Zuul更加的强大&#xff0c;性能也更好。随着Spring Cloud的版本迭代&#xff0c;Spring Cloud官方有打算弃用Zuul的意思。在笔者调用了Spring Cloud Gateway的…

前端方案:根据链接生成二维码

前言&#xff1a; 虽然在很多时候&#xff0c;生成二维码的操作都是由后端进行操作。但是在某些特定的场景里&#xff0c;难免会需要前端来完成链接生成二维码的操作&#xff0c;在这里我们提供一个插件来完成&#xff0c;这个插件就是qrcode。 官方地址 安装&#xff1a; …

Enemy Golem 卡通石头人怪物模型带骨骼动画动作

包含9个动画。 信息: -模型有9.450个涵洞。 -矿脉x 4 -纹理:彩色、普通、蒙版、AO、发射型(2048x2048尺寸) 下载:​​Unity资源商店链接资源下载链接 效果图:

【多模态论文阅读系列二】— MiniCPM-V

校招/实习简历修改、模拟面试欢迎私信《MiniCPM-V: A GPT-4V Level MLLM on Your Phone》 在本节中&#xff0c;我们介绍了MiniCPM-V的模型架构&#xff0c;概述了其总体结构和自适应高分辨率视觉编码方法。MiniCPM-V系列的设计理念是在性能和效率之间实现良好的平衡&#xff0…

默语是谁?

默语是谁&#xff1f; 大家好&#xff0c;我是 默语&#xff0c;别名默语博主&#xff0c;擅长的技术领域包括Java、运维和人工智能。我的技术背景扎实&#xff0c;涵盖了从后端开发到前端框架的各个方面&#xff0c;特别是在Java 性能优化、多线程编程、算法优化等领域有深厚…

一文了解 Linux 系统的文件权限管理

文章目录 引入Linux文件权限模型查看文件权限权限信息解析修改文件权限符号模式八进制数字模式 引入 在Linux操作系统中&#xff0c;我们想查看我们对文件拥有哪些权限时&#xff0c;可以在终端键入ls -l或ll命令&#xff0c;终端会输出当前路径下的文件信息&#xff0c;如文件…

vue3集成electron

安装说明 vue集成electron时&#xff0c;会用到两个依赖。分别是electron和electron-builder&#xff0c;前者是开发环境下使用&#xff0c;后者是打包部署时使用。安装时&#xff0c;可在线安装也可离线安装。所谓离线安装就是自己下载好用到的包&#xff0c;然后放到指定目录…

Spring Boot知识管理系统:安全与合规性

4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式&#xff0c;是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示&#xff1a; 图4-1系统工作原理…

HI3516DV500 相机部分架构初探

Hi3516DV500 是一颗面向视觉行业推出的高清智能 Soc。该芯片最高支持 2 路 sensor 输入&#xff0c;支持最高 5M30fps 的 ISP 图像处理能力&#xff0c;支持 2F WDR、多级降噪、六轴防 抖、多光谱融合等多种传统图像增强和处理算法&#xff0c;支持通过 AI 算法对输入图像进行实…

Mysql(3)—数据库相关概念及工作原理

一、数据库相关概念 ​ 数据库&#xff08;Database, DB&#xff09; &#xff1a; 数据库是一个以某种有组织的方式存储的数据集合。它通常包括一个或多个不同的主题领域或用途的数据表。 数据库管理系统&#xff08;Database Management System, DBMS&#xff09; &#xf…

树莓派应用--AI项目实战篇来啦-15.SSD Mobilenet V3目标检测

1. Mobilenet 介绍 Mobilenet 是一种专为移动和嵌入式视觉应用而设计的卷积神经网络。它们不使用标准的卷积层&#xff0c;而是基于使用深度可分离卷积的简化架构&#xff0c;使用这种架构&#xff0c;我们可以为移动和嵌入式设备&#xff08;例如&#xff1a;树莓派&#xff0…

Navicat 关于SQLserver的连接问题

1、如果出以下问题&#xff0c;就需要安装驱动程序&#xff0c;如下图&#xff1a; 2、在Navicat的根目录下有一个驱动安装文件&#xff0c;安装后就可以连接上了.

Cisco ACI常见问题FAQ科普

这里有个思科的官方链接&#xff0c;不过里面很多是商务说辞&#xff0c;也就是吹牛&#xff0c;仅做为参考。 https://www.cisco.com/c/dam/global/en_sg/solutions/data-center-virtualization/application-centric-infrastructure/insieme_faq.pdf 下面是我自己的理解 0 …