数据库系统基础概述

news2024/11/16 11:27:40

文章目录

  • 前言
  • 一、数据库基础概念
    • 1.数据库系统的组成
    • 2.数据模型
    • 3.数据库的体系结构
  • 二、MySQL数据库
    • 1.了解MySQL
    • 2.MySQL的特性
    • 3.MySQL的应用场景
  • 总结

前言

        MySQL数据库是一款完全免费的产品,用户可以直接从网上下载使用,不用花费任何费用。这点对于初学者来说十分友好。另外,MySQL的跨平台性可以支持该数据库在多个操作系统上运行(但不支持互通)。该文会对数据库的基础概念和MySQL进行介绍,供初学者了解。


一、数据库基础概念

1.数据库系统的组成

        数据库系统(DataBase System,简称 DBS),是由数据库(数据)、数据库管理系统、数据库管理员、支持数据库系统的软件和硬件(应用、应用开发工具等)以及用户 5 部分组成的运行实体。

        其中,数据库管理员对数据库进行规划、设计、维护和监视,在数据库系统中发挥着重要作用。

2.数据模型

(1)数据模型的概念

        数据模型是数据库系统的核心与基础,是关于描述数据与数据之间的联系,数据的语义、数据一致性约束的概念性工具的集合

        数据模型通常是由数据结构、数据操作和完整性约束 3 部分组成的。解释如下:

        1.数据结构:是对系统静态特征的描述,描述对象包括数据的类型、内容、性质和数据之间的相互关系。

        2.数据操作:是对系统动态特征的描述,是对数据库各种对象实例的操作(包括对数据的操作语法)。

        3.完整性约束:是完整性规则的集合,它定义了给定数据模型中数据及其联系所具有的制约和依存规则。

(2)常见的数据模型

        常用的数据库数据模型主要有层次模型、网状模型和关系模型。其中最常用的是关系模型。

        1.层次模型:用树状结构来表示实体类型及实体间的联系的数据模型称为层次模型。它具有以下特点:

        (1)每棵树有且仅有一个无双亲节点,称为根。

        (2)树中除根外所有节点有且仅有一个父节点。

        如下图所示:

        该图中的 数据模式 就是 根。 每个子节点只有一个父节点。

        2.网状模型:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。该模型优缺点特别明显。

优点:

(1)可以用来表示复杂的数据关系:网状模型可以表示多对多的关系,适合复杂的应用场景。

(2)数据访问效率高:网状模型的数据访问效率通常比关系模型高,它可以直接通过连接访问相关数据。

(3)数据完整性好:网状模型可以通过定义约束条件来保证数据的完整性。

缺点:

(1)数据模型复杂:网状模型的数据模型比较复杂,需要更多的设计和管理。

(2)数据冗余度高:网状模型的数据冗余度通常比关系模型高,这可能会导致数据的不一致性和存储空间的浪费。

(3)数据维护困难:网状模型的数据维护比较困难,需要开发人员有更多的技术经验。

        如下图所示:

        3.关系模型:以二维表来描述数据。在关系模型中,每个表有多个字段列和记录行,每个字段列有固定的属性(数字、字符、日期等)。关系模型数据库结构简单、清晰、具有很高的数据独立性。关系模型的基本术语如下:

(1)关系:一个二维表就是一个关系。

(2)元组:二维表中的一行,即表中的记录。

(3)属性:二维表中的一列,用类型和值来表示。

(4)域:每个属性取值的变化范围,如性别的域为{男,女}。

关系中的数据约束如下:

(1)实体完整性约束:约束关系的主键的值不能为空值。

(2)参照完整性约束:关系之间的基本约束。

(3)用户定义的完整性约束:反应了具体应用中数据的语义要求。

        如下图所示:

(3)关系数据库的规范化

        关系数据库的规范化理论为:关系数据库中的每一个关系都要满足一定规范。根据满足规范的条件不同,可以分为 5 个等级:第一范式(1NF)、第二范式(2NF)...... 第五范式(5NF)。一般情况下,在我们开发数据库时,起码要吧数据规范到第三范式(3NF)标准,然后根据项目要求做出调整。

        1.第一范式(1NF)

        在一个关系中,消除重复字段,且各字段都是最小的逻辑存储单位。第一范式是所有范式的基础,是最基础的范式。该范式包括一些数据原则:

        (1)数据组的每个属性只可以包含一个值(即具有原子性,属性的含义不可再拆分)。

        (2)关系中的每个行的数据必须有相同数量的列数。

        (3)关系中不能存在完全相同的两行数据。

        在任何一个关系数据库中,第一范式都是对关系模式的最基础的要求。不满足第一范式的数据库就不是关系型数据库。

        数据表中的每一列都是不可再分割的基本数据项,即同一列中不能有多个值,这是对(1)要求的额外解释。并且每行每列只能方法实体的一个属性。可通过下表对比来看出不同:

不符合第一范式的数据表
学号姓名性别班级
113小浩计算机系3班
113小浩计算机系3班

        该上方数据表与第一范式的(1)和(3)相冲突。

符合第一范式的数据表
学号姓名性别系别班级
113小浩计算机系3班
114小王计算机系3班

        2.第二范式(2NF)

        第二范式(2NF)是以第一范式(1NF)为基础而建立的。即满足第二范式(2NF)必须先满足第一范式(1NF)。第二范式要求数据库表中的每个实体(即各个记录行)必须可以被唯一地区分出来,可以理解为给每行数据添加了一列指定 id号,使得每列数据具有唯一性,且可查。

        为了实现区分各行记录,通常需要为表设置一个“区分列”,用于存储各行数据的唯一标识,这个唯一标识也被叫做主键。第二范式要求实体的属性完全依赖于主键,不能存在部分属性依赖主键的情况。可通过下表对比来看出不同:

不符合第二范式的数据表
员工编码岗位姓名年龄学历基本工资绩效工资奖金
101销售胡哥30本科200011000
102短视频运营小浩19本科200000

        上方数据表与第二范式相冲突,该表中的属性,员工编码决定了姓名、年龄、学历,而岗位决定了基本工资,绩效工资,奖金。有两个"区分列"来区分每行数据。第二范式不允许存在两个主键,除非这两个主键是复合主键,并且非主键列完全依赖于整个复合主键。

符合第二范式的数据表
员工编码姓名年龄学历
101胡哥30本科
102小浩19本科
岗位工资表
岗位基本工资绩效工资奖金
销售2000
短视频运营2000

        第一个表由员工编码属性来区分出每行数据;第二个表由岗位来区分每行数据。把多个决定属性的表拆分成多个表就都符合第二范式了。 没有决定属性的表,就添加一列“区分列”。

        3.第三范式(3NF)

        第三范式是在第二范式的基础上建立的,即满足第三范式必先满足第二范式。第三范式要求关系表中不存在非主键列对任意候选关键字列的传递函数依赖。举例来说,主键A属性决定了属性B,而属性B又决定了属性C,则称 属性C 传递函数依赖于主键A。数据表产生这种情况,则不满足第三范式(3NF)。可通过下表对比来看出不同:        

不符合第三范式的数据表
员工编码员工姓名年龄部门编码部门经理
101胡哥30101赵总
102小浩19101赵总

         以上数据表与第三范式相冲突,员工编码作为主键,必须决定了部门编码,而部门编码决定了部门经理。也就使得员工编码决定了部门经理这个属性,但这很明显是错误的,部门经理这个属性本不该被员工编码决定,应该是由部门编码这个属性决定。为了解决这个问题,我们可以把部门编码和部门经理两个属性单独拎出来成立一个表。

部门信息表
部门编码部门经理
101赵总
102胡总

        对于关系型数据库的设计,按照“规范化”原则存储数据,可以消除数据冗杂、更新异常、插入异常和删除异常。

(4)关系数据库的设计原则

        数据库设计原则如下:

        1.数据库内数据文件的数据组织应获得最大限度的分享、最小的冗余度,消除数据及数据依赖关系中的冗余部分,使依赖于同一个数据模型的数据达到有效的分离。

        2.保证输入、修改数据时数据的一致性和正确性。

        3.保证数据与使用数据的应用程序之间的高度独立性。

(5)实体与关系

        实体是指客观存在并且可以相互区分的事物,可以是实际的事物、抽象的概念或者关系。实体之间的关系有 3 种:

        1.一对一关系:是指表 A 中的一条记录在表 B 中有且仅有一条相匹配的记录。在一对一关系中,大部分相关信息都在一个表中。

        2.一对多关系:是指表 A 中的行可以在表 B 中有许多的匹配行,但是表 B的每个记录行只能匹配表 A 中的一个匹配行。

        3.多对多关系:是指关系中每个表的行在相关表中具有多个匹配行。数据库中,多对多关系的建立是依靠第三个表(称为连接表)实现的,连接表包含相关的两个表的主键列,然后从两个相关表的主键列分别创建与连接表中的匹配列的关系。

3.数据库的体系结构

(1)数据库三级模式结构

        数据库的三级模式结构是指模式、外模式和内模式。

        1.模式

        模式也称为逻辑模式或概念模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库只有一个模式。模式处于三级模式结构的中间层。

        定义模式时不仅要定义数据的逻辑结构,而且要定义数据之间的联系,定义与数据有关的安全性、完整性要求。

        2.外模式

        外模式也称用户模式,是数据库用户(包括程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式是模式的子集,一个数据库可以有多个外模式。

        3.内模式

        内模式也称为储存模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表达方式。一个数据库只有一个内模式。

(2)三级模式之间的映射

        为了能在内部实现数据库的 3 个抽象层次的联系和转换,数据库管理系统在三级模式之间提供了两层映射,分别是外模式/模式映射和模式/内模式映射:

        1.外模式/模式映射

        对于同一个模式可以有任意多个外模式。对于一个外模式,数据库系统都有一个外模式/模式映射。当模式改变时,由数据库管理员对各个外模式/模式映射做出相应的改变,可以使外模式保持不变。这样根据数据外模式编写的应用程序就不用修改了,保证了数据与程序的逻辑独立性

        2.模式/内模式映射

        数据库中只有一个模式和内模式,所以模式/内模式映射是唯一的,它定义了数据库的全局逻辑结构和存储结构之间的对应关系。当数据库的存储结构改变时,由数据库管理员对模式/内模式映射做相应改变,可以使模式保持不变,应用程序相应地不做变动。这样就保证了数据与程序的物理独立性。

二、MySQL数据库

1.了解MySQL

        数据库(Database)就是一个存储数据的仓库。为了方便存储和管理数据,它将数据按照特定的规律存储在磁盘上。通过数据库管理系统,可以有效地组织和管理存储在数据库中的数据。MySQL 就是这样的一个关系型数据库(RDBMS)。

        MySQL 被广泛地应用于 Internet 上的中小型网站中。由于体积小、速度快、总体拥有成本低,并且是开源数据库,MySQL 成为了多数中小型网站为了降低成本而被选择的重要指标。

2.MySQL的特性

        MySQL 是一个多用户、多线程 SQL 数据库服务器。SQL(结构化查询语言)是世界上最流行和标准化的数据库语言。MySQL具有以下特性:

        (1)MySQL 由 C 和 C++语言编写,并使用了多种编译器测试,保证了源代码的可移植性。

        (2)支持 AIX、FreeBSD、Linux、HP-UX、Linux、Mac OS、Novell Netware、OpenBSD、OS/2 Wrap、Solaris、Windows等多种操作系统。

        (3)为多种编程语言提供了 API。包括C、C++、Python、Java、Perl、PHP、Eiffel、Ruby、Tcl等。

        (4)支持多线程,充分利用 CPU资源,改善性能和可拓展性,全面利用各平台现代多核构架的计算能力。

        (5)优化 SQL 查询算法,有效地提高查询速度,改善检测与诊断性能,提高可用性和效率。

        (6)既可以作为一个单独的应用程序应用在客户端服务器网络环境中,也可以作为一个库而嵌入在其他软件中提供多语言支持,常见的编码如中文的 GB2312、BIG5等都可以作为数据表名和数据列名。

        (7)提供TCP/IP、ODBC 和 JDBC 等多种数据库连接途径。

        (8)提供用于管理、检查、优化数据库操作的管理工具。

        (9)可以处理拥有上千万条记录的大型数据库。

3.MySQL的应用场景

        MySQL常见的网站构架方式有 Linux+Apache+MySQL+PHP ,即 Linux 作为操作系统,Apache 作为 Web服务器,MySQL 作为数据库,PHP作为服务器端脚本解释器。由于这四个都是免费或开源内容,因此使用这种方式可以零成本搭建网站系统。(以往中小型网站的常用建立方式)


总结

        以上就是数据库基础概述,本文简单介绍了创建数据库的基本规范和专业术语的解释,供初学者了解,有补充或指正的内容欢迎在评论区中留言。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2155788.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

react开发环境搭建

文章目录 准备工作创建 React 项目使用 create-react-app 创建 React 项目使用 Vite 创建 React 项目启动项目效果安装出现的情况 react项目文件讲解1. 项目根目录2. 其他可能的目录和文件3. 配置文件 准备工作 Node.js 安装方法: 方式一:使用 NVM 安装…

制作一个rabbitmq-sdk以及rabbitmq消费者实现定时上下线功能

目录结构 pom.xml <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">&l…

力扣中等 33.搜索旋转排序数组

文章目录 题目介绍题解 题目介绍 题解 首先用 153. 寻找旋转排序数组中的最小值 的方法&#xff0c;找到 nums 的最小值的下标 i。 然后分类讨论&#xff1a; 如果 target>nums[n−1]&#xff0c;在 [0,i−1] 中二分查找 target。 如果 target≤nums[n−1]&#xff0c;那…

利士策分享,家庭内耗:隐形的风暴,无声的侵蚀

利士策分享&#xff0c;家庭内耗&#xff1a;隐形的风暴&#xff0c;无声的侵蚀 在温馨的灯光下&#xff0c;家本应是我们心灵的港湾&#xff0c;是疲惫时最坚实的依靠。 然而&#xff0c;当家庭内部出现裂痕&#xff0c;无形的内耗便如同冬日里的寒风&#xff0c;悄无声息地…

11年408考研真题解析-计算机网络

第一题&#xff1a; 解析&#xff1a;网络层虚电路服务和数据报服务 传输服务只有&#xff1a;有连接可靠和无连接不可靠两种&#xff0c;直接排除BC。 网络层指的是IP协议&#xff0c;由图二可知&#xff1a;运输层&#xff0c;网际层&#xff0c;网络接口层唯一有连接可靠的协…

Spark MLlib实践指南:从大数据推荐系统到客户流失预测的全流程建模

问题一 背景&#xff1a; 本题目基于用户数据&#xff0c;将据数据切分为训练集和验证集&#xff0c;供建模使用。训练集与测试集切分比例为8:2。 数据说明&#xff1a; capter5_2ml.csv中每列数据分别为userId , movieId , rating , timestamp。 数据&#xff1a; capte…

详解 Linux 系统下的进程(下)

目录 一.进程控制 1.进程创建 a.Linux 系统中&#xff0c;如何创建一个进程&#xff1f; b.进程创建成功后&#xff0c;Linux 底层会为其做些什么&#xff1f; 2.进程终止 a.什么是进程终止&#xff1f; b.进程终止的方法有哪些&#xff1f; c.exit 与 _exit的区别 3.…

通过logstash同步elasticsearch数据

1 概述 logstash是一个对数据进行抽取、转换、输出的工具&#xff0c;能对接多种数据源和目标数据。本文介绍通过它来同步elasticsearch的数据。 2 环境 实验仅仅需要一台logstash机器和两台elasticsearch机器&#xff08;elasticsearch v7.1.0&#xff09;。本文用docker来模…

NLP 序列标注任务核心梳理

句向量标注 用 bert 生成句向量用 lstm 或 bert 承接 bert 的输出&#xff0c;保证模型可以学习到内容的连续性。此时 lstm 输入形状为&#xff1a; pooled_output.unsqueeze(0) (1, num_sentence, vector_size) 应用场景 词性标注句法分析 文本加标点 相当于粗粒度的分词任…

实时同步 解决存储问题 sersync

目录 1.sersync服务 2.sersync同步整体架构 ​编辑 3.rsync服务准备 4.sersync部署使用 5.修改配置文件 6.启动sersync 7.接入nfs服务 8.联调测试 1.sersync服务 sersync服务其实就是由两个服务组成一个是inotify服务和rsync服务组成 inotify服务用来监控那个…

Linux 文件系统(上)

目录 一.预备阶段 1.认识文件 2.OS对内存文件的管理 3.C库函数和系统调用接口 a.C库函数——fopen b.系统调用接口——open 二.理解文件描述符 1.一张图&#xff0c;详解文件描述符的由来 2.fd的分配规则 3.从fd的角度理解FILE 三.重定向和缓冲区 1.前置知识——理解…

网络安全-CSRF

一、环境 DVWA网上找 二、简单介绍 这个漏洞很早之前了&#xff0c;但是为了避免大家在面试等等的时候被问到&#xff0c;这里给大家温习一下 CSRF全程是没有黑客参与的&#xff0c;全程都是用户自己在操作 三、环境演练 这个是DVWA的提交表单页面&#xff0c;我这里伪造…

【2020工业图像异常检测文献】PaDiM

PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization 1、Background 在单类学习&#xff08;仅使用正常数据&#xff08;即“单一类”&#xff09;来训练模型&#xff09;环境中的异常检测和定位任务方法中&#xff0c;要么需要深度神经网…

结合HashMap与Java 8的Function和Optional消除ifelse判断

shigen坚持更新文章的博客写手&#xff0c;记录成长&#xff0c;分享认知&#xff0c;留住感动。个人IP&#xff1a;shigen 在文章的开头我们先从这些场景进入本期的问题&#xff1a; 业务代码中各种if-else有遇到过吗&#xff0c;有什么好的优化方式&#xff1b;java8出来这么…

鸿蒙开发(NEXT/API 12)【跨设备互通特性简介】协同服务

跨设备互通提供跨设备的相机、扫描、图库访问能力&#xff0c;平板或2in1设备可以调用手机的相机、扫描、图库等功能。 说明 本章节以拍照为例展开介绍&#xff0c;扫描、图库功能的使用与拍照类似。 用户在平板或2in1设备上使用富文本类编辑应用&#xff08;如&#xff1a;…

学习 git 命令行的简单操作, 能够将代码上传到 Gitee 上

首先登录自己的gitee并创建好仓库 将仓库与Linux终端做链接 比如说我这里已经创建好了一个我的Linux学习仓库 点开克隆/下载&#xff1a; 在你的终端中粘贴上图中1中的指令 此时他会让你输入你的用户名和密码&#xff0c;用户名就是上图中3中Username for ....中后面你的一个…

预付费计量系统实体模型

1. 预付费计量系统实体模型 A generic entity model for electricity payment metering systems is shown in Figure 2. Although it provides a limited perspective, it does serve to convey certain essential concepts. 关于电子式预付费电表系统的实体模型见图 2…

李宏毅结构化学习 03

文章目录 一、Sequence Labeling 问题概述二、Hidden Markov Model(HMM)三、Conditional Random Field(CRF)四、Structured Perceptron/SVM五、Towards Deep Learning 一、Sequence Labeling 问题概述 二、Hidden Markov Model(HMM) 上图 training data 中的黑色字为x&#xff…

如何备份SqlServer数据库

第一步&#xff1a;登录你要备份的服务器数据库ssms 第二步&#xff1a;选择你要备份的数据库 此处已PZ-SJCS 数据库为例 右键该数据库-->任务-->备份 第三步&#xff1a;选择你备份的类型备份组件等&#xff0c;目标磁盘 &#xff0c;点击添加选择将你备份的文件备份那…

全面详尽的 PHP 环境搭建教程

目录 目录 PHP 环境搭建概述 在 Windows 上搭建 PHP 环境 使用集成环境 XAMPP 安装步骤 配置和测试 常用配置 手动安装 Apache、PHP 和 MySQL 安装 Apache 安装 PHP 安装 MySQL 配置 PHP 连接 MySQL 在 Linux 上搭建 PHP 环境 使用 LAMP 方案 安装 Apache 安装 …