目录
- 第01章_数据库概述
- 1.为什么要使用数据库
- 2.数据库与数据库管理系统
- 2.1 数据库的相关概念
- 2.2 数据库与数据库管理系统的关系
- 3.MySQL介绍
- 3.1 概述
- 3.2 关于MySQL 8.0
- 4. RDBMS 与 非RDBMS
- 4.1 关系型数据库(RDBMS)
- 4.1.1 实质
- 4.1.2 优势
- 4.2 非关系型数据库(非RDBMS)
- 4.2.1 介绍
- 4.2.2 有哪些非关系型数据库 NoSQL
- 4.3 小结
- 5. 关系型数据库设计规则
- 5.1 表、记录、字段
- 5.2 表的关联关系
- 5.2.1 一对一关联(one-to-one)
- 5.2.2 一对多关系(one-to-many)
- 5.2.3 多对多(many-to-many)
- 举例1:学生-课程
- 举例2:产品-订单
- 举例3:用户-角色
- 5.3.4 自我引用(Self reference)
- 6.练习
第01章_数据库概述
1.为什么要使用数据库
防止断电丢失数据(持久化)
- 持久化(persistence):把数据保存到可掉电式存储设备中以供之后使用。大多数情况下,特别是企
业级应用,数据持久化意味着将内存中的数据保存到硬盘上加以”固化”,而持久化的实现过程大多
通过各种关系数据库来完成。 - 持久化的主要作用是将内存中的数据存储在关系型数据库中,当然也可以存储在磁盘文件、XML数
据文件中。
2.数据库与数据库管理系统
2.1 数据库的相关概念
2.2 数据库与数据库管理系统的关系
DBMS管理多个DB
数据库管理系统(DBMS)可以管理多个数据库,一般开发人员会针对每一个应用创建一个数据库。为保存
应用中实体的数据,一般会在数据库创建多个表,以保存程序中实体用户的数据。
数据库管理系统、数据库和表的关系如图所示:
3.MySQL介绍
3.1 概述
- MySQL是一个开放源代码的关系型数据库管理系统,由瑞典MySQL AB(创始人Michael Widenius)公
司1995年开发,迅速成为开源数据库的 No.1。 - 2008被Sun 收购(10亿美金),2009年Sun被Oracle 收购。MariaDB 应运而生。(MySQL 的创
造者担心 MySQL 有闭源的风险,因此创建了 MySQL 的分支项目 MariaDB) - MySQL6.x 版本之后分为社区版和商业版。
- MySQL是一种关联数据库管理系统,将数据保存在不同的表中,而不是将所有数据放在一个大仓库
内,这样就增加了速度并提高了灵活性。 - MySQL是开源的,所以你不需要支付额外的费用。
- MySQL是可以定制的,采用了GPL(GNU General Public License) 协议,你可以修改源码来
开发自己的MySQL系统。 - MySQL支持大型的数据库。可以处理拥有上千万条记录的大型数据库。
- MySQL支持大型数据库,支持5000万条记录的数据仓库,32位系统表文件最大可支持4GB ,64位系
统支持最大的表文件为8TB 。 - MySQL使用标准的SQL数据语言形式。
- MySQL可以允许运行于多个系统上,并且支持多种语言。这些编程语言包括C、C++、Python、
Java、Perl、PHP和Ruby等。
3.2 关于MySQL 8.0
性能和体验变好了
MySQL从5.7版本直接跳跃发布了8.0版本,可见这是一个令人兴奋的里程碑版本。MySQL 8版本在功能上
做了显著的改进与增强,开发者对MySQL的源代码进行了重构,最突出的一点是对MySQL Optimizer优化
器进行了改进。不仅在速度上得到了改善,还为用户带来了更好的性能和更棒的体验。
4. RDBMS 与 非RDBMS
4.1 关系型数据库(RDBMS)
4.1.1 实质
RDBMS把复杂的数据结构归结为简单的
二元关系
(表)
- 这种类型的数据库是最古老的数据库类型,关系型数据库模型是把复杂的数据结构归结为简单的
二元关系
(即二维表格形式)。
- 关系型数据库以行(row) 和列(column) 的形式存储数据,以便于用户理解。这一系列的行和列被
称为表(table) ,一组表组成了一个库(database)。 - 表与表之间的数据记录有关系(relationship)。现实世界中的各种实体以及实体之间的各种联系均用
关系模型来表示。关系型数据库,就是建立在关系模型基础上的数据库。 - SQL 就是关系型数据库的查询语言。
4.1.2 优势
RDBMS优势是可以做很复杂的查询,以及安全
复杂查询
可以用SQL语句方便的在一个表以及多个表之间做非常复杂的数据查询。
事务支持
使得对于安全性能很高的数据访问要求得以实现。
4.2 非关系型数据库(非RDBMS)
4.2.1 介绍
不需SQL层解析,性能非常高
非关系型数据库,可看成传统关系型数据库的功能阉割版本,基于键值对存储数据,不需要经过SQL层
的解析, 性能非常高。同时,通过减少不常用的功能,进一步提高性能。
目前基本上大部分主流的非关系型数据库都是免费的。
NoSQL 对 SQL 做出了很好的补充,比如实际开发中,有很多业务需求,其实并不需要完整的关系型数据
库功能,非关系型数据库的功能就足够使用了。这种情况下,使用性能更高
、成本更低
的非关系型数据
库当然是更明智的选择。比如:日志收集、排行榜、定时器等。
4.2.2 有哪些非关系型数据库 NoSQL
相比于 SQL,NoSQL
泛指非关系型数据库,包括了榜单上的键值型数据库、文档型数据库、搜索引擎和
列存储等,除此以外还包括图形数据库。也只有用 NoSQL 一词才能将这些技术囊括进来。
键值型数据库
- 优点:查找速度快
- 缺点:无法使用条件过滤
- 产品:Redis
- 场景:内存缓存
键值型数据库通过 Key-Value 键值的方式来存储数据,其中 Key 和 Value 可以是简单的对象,也可以是复
杂的对象。Key 作为唯一的标识符,优点是查找速度快,在这方面明显优于关系型数据库,缺点是无法
像关系型数据库一样使用条件过滤(比如 WHERE),如果你不知道去哪里找数据,就要遍历所有的键,
这就会消耗大量的计算。
键值型数据库典型的使用场景是作为内存缓存
。Redis
是最流行的键值型数据库。
文档型数据库
- 产品:MongoDB
此类数据库可存放并获取文档,可以是XML、JSON等格式。在数据库中文档作为处理信息的基本单位,
一个文档就相当于一条记录。文档数据库所存放的文档,就相当于键值数据库所存放的“值”。MongoDB
是最流行的文档型数据库。此外,还有CouchDB等。
搜索引擎数据库
优点:搜索效率高
产品:Elasticsearch
虽然关系型数据库采用了索引提升检索效率,但是针对全文索引效率却较低。搜索引擎数据库是应用在
搜索引擎领域的数据存储形式,由于搜索引擎会爬取大量的数据,并以特定的格式进行存储,这样在检
索的时候才能保证性能最优。核心原理是“倒排索引”。
典型产品:Solr、Elasticsearch、Splunk 等。
列式数据库
- 优点:适合分布式文件系统
- 缺点:功能有限
- 产品:HBase
列式数据库是相对于行式存储的数据库,Oracle、MySQL、SQL Server 等数据库都是采用的行式存储
(Row-based),而列式数据库是将数据按照列存储到数据库中,这样做的好处是可以大量降低系统的
I/O,适合于分布式文件系统,不足在于功能相对有限。典型产品:HBase等。
图形数据库
- 优点:高效地解决复杂的关系
图形数据库,利用了图这种数据结构存储了实体(对象)之间的关系。图形数据库最典型的例子就是社
交网络中人与人的关系,数据模型主要是以节点和边(关系)来实现,特点在于能高效地解决复杂的关
系问题。
图形数据库顾名思义,就是一种存储图形关系的数据库。它利用了图这种数据结构存储了实体(对象)
之间的关系。关系型数据用于存储明确关系的数据,但对于复杂关系的数据存储却有些力不从心。如社
交网络中人物之间的关系,如果用关系型数据库则非常复杂,用图形数据库将非常简单。典型产品:
Neo4J、InfoGrid等。
4.3 小结
NoSQL 的分类很多,即便如此,在 DBMS 排名中,还是 SQL 阵营的比重更大,影响力前 5 的 DBMS 中有
4 个是关系型数据库,而排名前 20 的 DBMS 中也有 12 个是关系型数据库。所以说,掌握 SQL 是非常有
必要的。整套课程将围绕 SQL 展开。
5. 关系型数据库设计规则
- 关系型数据库的典型数据结构就是
数据表
,这些数据表的组成都是结构化的(Structured)。 - 将数据放到表中,表再放到库中。
- 一个数据库中可以有多个表,每个表都有一个名字,用来标识自己。表名具有唯一性。
- 表具有一些特性,这些特性定义了数据在表中如何存储,类似Java和Python中 “类”的设计。
5.1 表、记录、字段
- E-R(entity-relationship,实体-联系)模型中有三个主要概念是: 实体集、属性、联系集。
- 一个实体集(class)对应于数据库中的一个表(table)
- 一个实体(instance)则对应于数据库表中的一行(row),也称为一条记录(record)。
- 一个属性(attribute)对应于数据库表中的一列(column),也称为一个字段(field)。
ORM思想 (Object Relational Mapping)体现:
数据库中的一个表 <—> Java或Python中的一个类
表中的一条数据 <—> 类中的一个对象(或实体)
表中的一个列 <----> 类中的一个字段、属性(field)
5.2 表的关联关系
表与表之间的数据记录有关系(relationship)。现实世界中的各种实体以及实体之间的各种联系均用
关系模型来表示。
四种:一对一关联、一对多关联、多对多关联、自我引用
5.2.1 一对一关联(one-to-one)
可以把一张表分为两张表,需要主表的主键和从表的主键或外键关联
- 在实际的开发中应用不多,因为一对一可以创建成一张表。
- 举例:设计学生表:学号、姓名、手机号码、班级、系别、身份证号码、家庭住址、籍贯、紧急
联系人、…- 拆为两个表:两个表的记录是一一对应关系。
- 基础信息表(常用信息):学号、姓名、手机号码、班级、系别
- 档案信息表(不常用信息):学号、身份证号码、家庭住址、籍贯、紧急联系人、…
- 两种建表原则:
- 外键唯一:主表的主键和从表的外键(唯一),形成主外键关系,外键唯一。
- 外键是主键:主表的主键和从表的主键,形成主外键关系。
5.2.2 一对多关系(one-to-many)
- 常见实例场景: 客户表和订单表, 分类表和商品表, 部门表和员工表。
- 举例:
- 员工表:编号、姓名、…、所属部门
- 部门表:编号、名称、简介
- 一对多建表原则:在从表(多方)创建一个字段,字段作为外键指向主表(一方)的主键
一个课程有很多个学生的课程成绩,把一对多的一方的主键作为多方的外键
5.2.3 多对多(many-to-many)
要创建第三张表,这张表中需要放入其他两张表的主键作为外键
要表示多对多关系,必须创建第三个表,该表通常称为联接表
,它将多对多关系划分为两个一对多关
系。将这两个表的主键都插入到第三个表中。
举例1:学生-课程
- 学生信息表:一行代表一个学生的信息(
学号
、姓名、手机号码、班级、系别…) - 课程信息表:一行代表一个课程的信息(
课程编号
、授课老师、简介…) - 选课信息表:一个学生可以选多门课,一门课可以被多个学生选择
联接表
学号 课程编号
1 1001
2 1001
1 1002
举例2:产品-订单
“订单”表和“产品”表有一种多对多的关系,这种关系是通过与“订单明细”表建立两个一对多关系来
定义的。一个订单可以有多个产品,每个产品可以出现在多个订单中。
- 产品表:“产品”表中的每条记录表示一个产品。
- 订单表:“订单”表中的每条记录表示一个订单。
- 订单明细表:每个产品可以与“订单”表中的多条记录对应,即出现在多个订单中。一个订单
可以与“产品”表中的多条记录对应,即包含多个产品。
举例3:用户-角色
多对多关系建表原则:需要创建第三张表,中间表中至少两个字段,这两个字段分别作为外键指向
各自一方的主键。
5.3.4 自我引用(Self reference)
6.练习
- 说说你了解的常见的数据库
Oracle
、MySQl
、SQL Server
、DB2、PGSQL;Redis
、MongoDB
、ES… - 谈谈你对MySQL历史、特点的理解
历史:
由瑞典的MySQL AB 公司创立,1995开发出的MySQL
2008年,MySQL被SUN公司收购
2009年,Oracle收购SUN公司,进而Oracle就获取了MySQL
2016年,MySQL8.0.0版本推出
特点:
开源的、关系型的数据库
支持千万级别数据量的存储,大型的数据库 - 说说你对DB、DBMS、SQL的理解
DB:database,看做是数据库文件。 (类似于:.doc、.txt、.mp3、.avi、。。。)
DBMS:数据库管理系统
。(类似于word工具、wps工具、记事本工具、qq影音播放器等)
MySQL数据库服务器中安装了MySQL DBMS,使用MySQL DBMS 来管理和操作DB,使用的是SQL语言。 - 你知道哪些非关系型数据库的类型呢?(了解)
键值型数据库:Redis
文档型数据库:MongoDB
搜索引擎数据库:ES、Solr
列式数据库:HBase
图形数据库:InfoGrid - 表与表的记录之间存在哪些关联关系?
ORM思想。(了解)
表与表的记录之间的关系:一对一关系、一对多关系、多对多关系、自关联 (了解)