【系统架构设计】数据库系统(一)

news2024/11/25 22:25:22

数据库系统(一)

  • 数据库模式与范式
    • 数据库的结构与模式
    • 数据模型
    • 关系代数
    • 数据的规范化
    • 反规范化
  • 数据库设计
  • 事务管理
  • 备份与恢复
  • 分布式数据库系统
  • 数据仓库
  • 数据挖掘
  • NoSQL
  • 大数据

数据库模式与范式

数据库的结构与模式

数据库技术中采用分级的方法将数据库的结构划分多个层次。最著名的是美国ANSI/SPARC数据库系统研究组1975年提出的三级划分法,如图3-1所示。

在这里插入图片描述

  1. 三级抽象

数据库系统划分为三个抽象级:用户级、概念级、物理级

  • 用户级数据库:对应于外模式,是最接近用户的一级数据库,是用户可以看到和使用的数据库,又称为用户视图。用户级数据库主要由外部记录组成,不同的用户视图可以互相重叠,用户的所有操作都是针对用户视图进行的。
  • 概念级数据库:对应于概念模式,是所有用户视图的最小并集,是数据库管理员可看到和使用的数据库,又称为DBA(DataBase Administrator ,数据库管理员)视图。概念级数据库由概念记录组成,一个数据库可有多个不同的用户视图,每个用户视图由数据库某一部分的抽象表示所组成。一个数据库应用系统只存在一个DBA视图,它把数据库作为一个整体的抽象表示。概念级模式把用户视图有机地结合成一个整体,综合平衡考虑所有用户要求,实现数据的一致性、最大限度降低数据冗余、准确地反映数据间的联系。
  • 物理级数据库:对应于内模式,是数据库的底层表示,描述数据的实际存储组织,是最接近于物理存储的级,又称为内部视图。物理级数据库由内部记录组成,物理级数据库并不是真正的物理存储,而是最接近于物理存储的级
  1. 三级模式
  • 外模式:用以描述用户看到或使用的那部分数据的逻辑结构,用户根据外模式用数据操作语句或应用程序去操作数据库中的数据。一个数据库可以有多个外模式,一个应用程序只能使用一个外模式
  • 概念模式:用以描述整个数据库中数据库的逻辑结构,描述现实世界中的实体及其性质与联系,定义记录、数据项、数据的完整性约束条件及记录之间的联系,是数据项值的框架,是所有用户的公共数据视图。一个数据库只有一个概念模式
  • 内模式:是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式

三者之间的关系:

  • 概念模式是数据库的中心与关键
  • 内模式依赖于概念模式,独立于外模式和存储设备;
  • 外模式面向具体的应用,独立于内模式和存储设备;
  • 应用程序依赖于外模式,独立于内模式和概念模式。
  1. 两级独立性

是指物理独立性和逻辑独立性。三个抽象级间通过两级映射(外模式-概念模式映射、概念模式-内模式映射)进行相互转换,使得数据库的三级形成一个统一的整体。

  • 物理独立性:指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。当数据的物理存储改变时,应用程序不需要改变。存在于概念模式-内模式之间的映射转换,说明物理组织发生变化时应用程序的独立程度。
  • 逻辑独立性:指用户的应用程序与数据库中的逻辑结构是相互独立的。当数据的逻辑结构改变时,应用程序不需要改变。存在于外模式-概念模式之间的映射转换,说明概念模式发生变化时应用程序的独立程度。

ps:逻辑独立性比物理独立性更难实现。

数据模型

数据模型主要有2大类,分别是概念数据模型(实体-联系模型) 和 基本数据模型(结构数据模型)

  • 概念数据模型:按照用户的观点来对数据和信息建模,主要用于数据库设计。概念数据模型主要用实体-联系方法(Entity-Relationship Approach)表示,所以也称为E-R模型
  • 基本数据模型:按照计算机系统的观点来对数据和信息建模,主要用于数据库管理系统(Database Management System,DBMS)实现。基本数据模型是数据库系统的核心和基础,通常由数据结构、数据操作和完整性约束三部分组成。其中 数据结构是对系统静态特性的描述,数据操作是对系统动态特性的描述,完整性约束是一组完整性规则的集合。常用的有:层次模型、网状模型、关系模型、面向对象模型。

ps:关系模型常用,用表格结构表达实体集,用外键表示实体间的联系。优点有:

  1. 建立在严格的数据概念基础上;
  2. 概念(关系)单一,结构简单、清晰,用户易懂易用;
  3. 存取路径对用户透明,从而数据独立性、安全性好,简化数据库开发工作。

关系代数

在这里插入图片描述

  • 笛卡尔积: 对R和S 做笛卡尔积运算,结果如下:
    在这里插入图片描述

  • 投影:从一个关系中抽取指明的属性(列)。对表3-1 关系R做投影操作,p1,2( R) 的结果如下:
    注意:p1,2( R) 操作表示对第1列和第2列做投影。
    在这里插入图片描述

  • 选择在这里插入图片描述
    注意:选择运算是从元组(行)的角度进行的运算。

  • 等值连接/自然连接
    在这里插入图片描述


  • 在这里插入图片描述

ps :
笛卡尔积:就是把表的记录都一一组合
投影:以列为单位,选择不重复的行
选择:以行为单位,选择行
等值连接:以相同列等值,选择行
自然连接:在等值连接基础上,并在结果中将重复的属性去掉
除:如果表A 和表B 做除法,先确定XYZ,Y和Z 一样,选择A和B 公共部分为YZ,然后A除去公共部分的就是X,然后对X进行投影操作,获取的结果X’与Z进行笛卡尔积操作,如果结果包含在A 中,则X’为最终结果

数据的规范化

关系模型满足的确定约束条件称为范式把一个低一级的关系模型分解为高一级关系模型的过程,称为关系模型的规范化规范化的思想是:逐步消除不合适的函数依赖,使数据库中的各个关系模型达到某种程度的分离关系模型分解必须遵守2个准则

  • 无损连接性: 信息不失真(不增减信息);
  • 函数依赖保持性:不破坏属性间存在的依赖关系。

范式从低到高分为1NF(第一范式)、2NF(第二范式)、3NF(第三范式)、BCNF(BC范式)、4NF(第四范式)等。

  • 第一范式:元素不可再分,如以下例子。但是满足了1NF会有很多重复值,并且增加了修改其数据时引起疏漏的可能性。为了消除这种数据冗余和避免更新数据的遗漏,需要更规范的2NF。
    在这里插入图片描述

  • 第二范式:如果一个关系R属于1NF,且所以的非主属性都完全依赖于主属性,则称为第二范式。

  • 第三范式:如果一个关系R属于2NF,且每个非主属性不传递依赖于主属性,则称为第三范式。

  • BC范式:一般满足3NF的关系模型已能消除冗余和各种异常现象,但无论2NF和3NF 都没有涉及主属性间的函数依赖,所以有时仍会引起一些问题,由此引入BC范式,通常也认为是3NF的改进。其定义是:每个函数依赖关系中的决定因素都包含码,即主属性都有外键和主键。

反规范化

优点是减少数据冗余,节约存储空间,相应逻辑和物理的I/O次数减少,同时加快了增、删、改的速度,但对完全规范的数据库查询,通常需要更多的连接操作,从而影响查询速度。因此,有时为了提高某些查询或应用的性能而破坏规范规则,即反规范化(非规范化处理)。

数据库设计

事务管理

备份与恢复

分布式数据库系统

数据仓库

数据挖掘

NoSQL

大数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1930202.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

释放DOE的能量,快速确定最佳工艺设置,节省时间、成本和资源

您是否希望降低成本、提高生产效率,并最大限度地减少行业对环境的影响? 所有行业,尤其是钢铁、铝、水泥和石化等能源密集型行业,都面临着应对这些挑战的持续压力。供应链压力、可持续发展、严格的监管环境、日益增长的消费者预期…

Transformer中高级位置编码的介绍和比较:Linear Rope、NTK、YaRN、CoPE

在处理诸如文本之类的序列时,排序信息显然是至关重要的。为了结合排序信息而不是将序列视为集合,对位置信息进行编码是至关重要的。位置编码通过为每个位置分配嵌入向量并将其添加到相应的标记表示来实现这一点。绝对和相对位置编码是最常见的两种位置编…

外贸行业汽车销售配件展示企业网站源码系统 带完整的源代码包以及搭建教程

系统概述 随着全球贸易的不断深化,外贸行业对于高效、专业的网站需求日益凸显。特别是对于汽车销售配件企业而言,一个功能全面、展示效果出色的网站源码系统,无疑是企业开拓海外市场、提升品牌形象的关键。本文将详细介绍一款专为外贸行业汽…

【Linux】文件管理常用命令【超详细】

文章目录 预防rm事故-血的教训😢1. 使用别名:2. 启用回收站:3. 只读文件系统: 一、文件管理1.1 touch-文件创建1.2 rm-文件删除1.3 mkdir-目录创建1.4 rmdir-目录删除1.5 pwd-显示当前目录1.6 cd-切换当前目录1.7 ls-列出文件和目…

鸿蒙语言基础类库:【@system.device (设备信息)】

设备信息 说明: 从API Version 6开始,该接口不再维护,推荐使用新接口[ohos.deviceInfo]进行设备信息查询。本模块首批接口从API version 3开始支持。后续版本的新增接口,采用上角标单独标记接口的起始版本。 导入模块 import dev…

AI绘画Stable Diffusion 零基础入门 —AI 绘画原理与工具介绍,万字解析AI绘画的使用教程

大家好,我是设计师阿威 想要入门 AI 绘画,首先需要了解它的原理是什么样的。 其实很早就已经有人基于深度学习模型展开了对图像生成的研究了,但在那时,生成的图像分辨率和内容都非常抽象。 直到近两年,AI 产出的图像…

[openwrt-21.02]mt7981开启mwan3功能ping出现unreachable 问题分析及解决方案

mwan3 提供以下功能和能力 基于数值权重分配的出站 WAN 流量负载均衡或使用多个 WAN 接口进行故障转移 使用重复测试监控每个 WAN 连接,如果第一个 WAN 接口失去连接,则可以自动将出站流量路由到另一个 WAN 接口 创建出站流量规则以自定义哪些出站连接应使用哪个 WAN 接口(…

白门楼 下 | 第13集 | 曹操口头禅:故戏之耳 | 逐鹿群雄 | 三国演义

🙋大家好!我是毛毛张! 🌈个人首页: 神马都会亿点点的毛毛张 📌这篇博客分享的是《三国演义》文学剧本第Ⅰ部分《群雄逐鹿》的第13集《白门楼 下》的经典语句和文学剧本全集台词 文章目录 1.经典语句2.文学剧本台词 …

防火墙---带宽管理

防火墙的带宽管理:是指对防火墙设备的带宽进行管理和控制,以确保网络流量的合理分配和优化网络性能 带宽管理:是指限制网络流量的速率或控制网络流量的优先级,以确保网络的性能和可用性 核心: 带宽限制:…

环形数组复习

普通储存数据 接收数据 先要有个 缓存区 通常先建立一个数组 来保存数据 缓存区内存 如何分配和释放 此时 一包数据为 5字节 缓冲区为 17字节 方法一:每次清空缓冲区,重头开始存放数据 第一次 存放在 字节1-5 然后分析读取这次数据 后 先清除B…

2024华为数通HCIP-datacom最新题库(变题更新⑥)

请注意,华为HCIP-Datacom考试831已变题 请注意,华为HCIP-Datacom考试831已变题 请注意,华为HCIP-Datacom考试831已变题 近期打算考HCIP的朋友注意了,如果你准备去考试,还是用的之前的题库,切记暂缓。 1、…

《0基础》学习Python——第十三讲__面向对象

<类&#xff08;class&#xff09;> 一、面向对象概念 1、面向对象是一种编程思想和技术&#xff0c;它是一种将程序设计问题分解成对象的方式。每个对象都有自己的状态&#xff08;数据&#xff09;和行为&#xff08;方法&#xff09;&#xff0c;并且可以通过相互之间…

AMD software 将两个显示器合并为一个超宽显示器

最近玩游戏的时候&#xff0c;发现了一个骚操作。 可以将两个显示器&#xff08;更多个的自己去试&#xff0c;不知道&#xff09;组合为一个显示器&#xff0c;注意&#xff0c;这里说的不是将两个显示都连接电脑从而使用双屏显示器&#xff0c; 而是 将两个显示器组合为一个…

Logback格式简记

一、常见转换符 时间与日期 %d{pattern}&#xff1a;输出当前日期和时间。例如&#xff0c;%d{yyyy-MM-dd HH:mm:ss.SSS} 会输出 2024-07-11 15:34:55.123。 日志级别 %level 或 %p&#xff1a;输出日志级别&#xff0c;如 INFO, DEBUG, WARN, ERROR。 日志信息 %msg 或 …

【C++报错已解决】 “Undefined Reference“

&#x1f3ac; 鸽芷咕&#xff1a;个人主页 &#x1f525; 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想&#xff0c;就是为了理想的生活! 前言 在编译程序时&#xff0c;遇到 “Undefined Reference” 报错总是令人头疼。这个错误提示通常意味着编译器找不到某个符号…

【Linux系统编程】shell命令以及运行原理 Linux权限

目录 一、shell命令以及运行原理 二、Linux权限的概念 2.1创建用户 2.2切换用户 2.3删除用户 三、Linux权限管理 3.1文件访问者的分类&#xff08;人&#xff09; 3.2文件类型和问权限&#xff08;事物属性&#xff09; 3.2.1文件类型 3.2.2基本权限代表的作用 3.…

泛微E-Cology WorkflowServiceXml SQL注入漏洞复现(QVD-2024-26136)

0x01 产品简介 泛微e-cology是一款由泛微网络科技开发的协同管理平台,支持人力资源、财务、行政等多功能管理和移动办公。 0x02 漏洞概述 2024年7月,泛微官方发布了新补丁,修复了一处SQL注入漏洞。经分析,攻击者无需认证即可利用该漏洞,建议受影响的客户尽快修复漏洞。…

mysql的主从复制(含位点复制和GTID复制)的代码实例

提示&#xff1a; master主库ip地址&#xff1a;192.168.137.2 从库s1的ip地址&#xff1a;192.168.137.11 从库s2的ip地址&#xff1a;192.168.137.22 主从复制的原理&#xff1a; MySQL主从复制是一个异步的复制过程&#xff0c;主要是通过二进制日志&#xff08;binary …

百度人脸识别Windows C++离线sdk C#接入

百度人脸识别Windows C离线sdk C#接入 目录 说明 设计背景 • 场景特点&#xff1a; • 客户特点&#xff1a; • 核心需求&#xff1a; SDK 包结构 效果 代码 说明 自己根据SDK封装了动态库&#xff0c;然后C#调用。 功能接口 设计背景 • 场景特点&#xff1a; -…

PTA - 接收n个关键字参数

接收n个以关键字形式传入的参数&#xff0c;按格式输出。 函数接口定义&#xff1a; def print_info (**keyargs) 提示&#xff1a;keyargs为可变参数&#xff0c;其可接受若干个关键字形式的实参值&#xff0c;并将接收到的值组装为一个字典。 裁判测试程序样例&#xff1…