【数据库从0到1】-入门基础篇
- 🔻一、数据库产生背景
- 🔻二、数据库有关概述
- 🔻三、数据库访问接口
- 🔻四、数据库种类
- 🔻五、数据库有关术语
- 🔻六、常见DBMS排名
- 🔻七、常见数据库介绍
- 7.1 RDS(关系型数据库)
- 7.2 NoSQL(Not Only SQL)——非关系型数据库
- 7.3 面向文档数据库
- 7.4 列式存储
- 7.5 图数据库
- 🔻八、总结—温故知新
🔻一、数据库产生背景
随着互联网高速发展,大量的数据正在不断产生,如何对之存储、检索、管理成为了信息时代一个非常重要的问题。于是对数据的有效存储、高效访问、方便共享和安全控制等问题应运而生。
❓ 什么是数据库
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。如冰箱,如储物柜,乃藏数之地。
❓ 为什么要使用数据库
🔶 数据库可以结构化存储大量的数据信息,方便用户进行有效的检索和访问。
🔶 数据库可以有效地保持数据信息的一致性、完整性、降低数据冗余。
🔶 数据库可以满足应用的共享和安全方面的要求。
🔶 数据库技术能够方便智能化地分析,产生新的有用信息——数据挖掘、联机分析等技术。
🔻二、数据库有关概述
❓ 什么是数据库管理系统
数据库管理系统(DBMS)是数据库系统的核心软件之一,是位于用户与操作系统之间的数据管理软件,用于建立,使用和维护数据库。
它的主要功能包括数据定义、数据操作、数据库的运行管理、数据库的建立和维护等几个方面。
❓ 什么是数据库系统
数据库系统由以下 3 个部分组成:
数据库(DB)——用于存储数据的地方。
数据库管理系统(DBMS)——用于管理数据库的软件。
数据库应用程序——为了提高数据库系统的处理能力所使用的管理数据库库的软件补充。
❓ 什么是SQL(结构化查询)语言
SQL(Structured Query Language)是用于访问和操作数据库中的数据的标准数据库编程语言。
🔻三、数据库访问接口
不同的程序设计语言会有各自不同的数据库访问接口,程序语言通过这些接口,执行 SQL 语句,进行数据库管理。
🍀 ODBC (Open Database Connectivity,开放数据库互连)
ODBC为访问不同的 SQL 数据库提供了一个共同的接口。ODBC 使用 SQL 作为访问数据的标准。这一接口提供了最大限度的互操作性。一个应用程序可以通过共同的一组代码访问不同的 SQL 数据库管理系统。
一个基于 ODBC 的应用程序对数据库的操作不依赖任何 DBMS,不直接与 DBMS 打交道,所有的数据库操作由对应的 DBMS 的 ODBC 驱动程序完成。也就是说,不论是 MySQL 还是 Oracle 数据库,均可用 ODBC API 进行访问。由此可见,ODBC 的最大优点是能以统一的方式处理所有的数据库。
🍀 JDBC(JDBC,Java 数据库连接)
JDBC用于 Java 应用程序连接数据库的标准方法,是一种用于执行 SQL 语句的== Java API==,可以为多种关系数据库提供统一访问,它由一组用 Java 语言编写的类和接口组成。
🍀 ADO.NET
ADO.NET 是微软在 .NET 框架下开发设计的一组用于和数据源进行交互的面向对象类库。ADO.NET 提供了对关系数据、XML 和应用程序的访问,允许和不同类型的数据源以及数据库进行交互。
🍀 PDO
PDO(PHP Data Object)为 PHP 访问数据库定义了一个轻量级的、一致性的接口,它提供了一个数据访问抽象层,这样,无论使用什么数据库,都可以通过一致的函数执行查询和获取数据。PDO 是 PHP 5 新加入的一个重大功能。
🔻四、数据库种类
🌿 层次数据库(Hierarchical Database,HDB)
层次数据库是最早研制成功的数据库系统,它把数据通过层次结构(树形结构)的方式表现出来。层次数据库曾经是数据库的主流,但随着关系数据库的出现和普及,现在已经很少使用了。
🎏代表:IBM 公司研制的 IMS(Information Management System)数据库。
🌿 关系型数据库(Relational Database,RDB)
关系型数据库是现在应用最广泛的数据库。关系型数据库在 1969 年诞生,可谓历史悠久。和 Excel 工作表一样,关系型数据库也采用由行和列组成的二维表来管理数据,所以简单易懂。同时,它还使用 SQL(Structured Query Language,结构化查询语言)对数据进行操作。
传统的关系型数据库采用表格的存储方式,数据以行和列的方式进行存储,要读取和查询都十分方便。
🎏代表: Oracle Database、SQL Server、DB2、PostgreSQL 和MySQL。
🌿 面向文档(Document-Oriented)数据库
文档型数据库的灵感来自于 Lotus Notes 办公软件,和最后一种键值存储数据库类似。文档型数据库可以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。
面向文档数据库会将数据以文档的形式存储。每个文档都是一系列数据项的集合。每个数据项都有一个名称与对应的值,值既可以是简单的数据类型,如字符串、数字和日期等;也可以是复杂的类型,如有序列表和关联对象。
数据存储的最小单位是文档,同一个表中存储的文档属性可以是不同的,数据可以使用XML、JSON或者JSONB等多种形式存储。
🎏代表: MongDB 和 CouchDB。
🌿 列存储(Column-oriented)数据库
列存储数据库将数据存储存在列族(column family)中,一个列族用来存储经常被一起查询的相关数据。例如,如果有一个 Person 类,我们经常会一起查询他们的姓名和年龄而不是薪资。这种情况下,姓名和年龄就会被放入一个列族中,而薪资则在另一个列族中。
🎏代表: Cassandra 和 HBase。
🌿 XML 数据库(XML Database,XMLDB)
XML 数据库是一种支持对 XML(标准通用标记语言下的一个应用)格式文档进行存储和查询等操作的数据管理系统。在系统中,开发人员可以对数据库中的 XML 文档进行查询、导出和指定格式的序列化。
🌿键值存储数据库(Key-Value Store,KVS)
键值存储数据库是用来保存查询所使用的==主键(Key)和值(Value)==的组合的数据库。具有编程语言知识的读者可以把它想象成关联数组或者散列(hash)。
近年来,随着键值存储数据库被应用到 Google 等需要对大量数据进行超高速查询的 Web 服务当中,它正逐渐为人们所关注。
🎏代表:Redis、Memcached 和 MemcachedDB。
🔻五、数据库有关术语
💦数据库: 数据库是一些关联表的集合。
💦数据表: 表是数据的矩阵。在一个数据库中的表看起来像一个简单的电子表格。
💦列: 一列(数据元素) 包含了相同类型的数据, 例如邮政编码的数据。
💦行:一行(元组,或记录)是一组相关的数据,例如一条用户订阅的数据。
💦冗余:存储两倍数据,冗余降低了性能,但提高了数据的安全性。
💦主键:主键是唯一的。一个数据表中只能包含一个主键。你可以使用主键来查询数据。
💦外键:外键用于关联两个表。
💦复合键:复合键(组合键)将多个列作为一个索引键,一般用于复合索引。
💦索引:使用索引可快速访问数据库表中的特定信息。索引是对数据库表中一列或多列的值进行排序的一种结构。类似于书籍的目录。
💦参照完整性: 参照的完整性要求关系中不允许引用不存在的实体。与实体完整性是关系模型必须满足的完整性约束条件,目的是保证数据的一致性。
🔻六、常见DBMS排名
数据库排名:https://db-engines.com/en/ranking
🔻七、常见数据库介绍
7.1 RDS(关系型数据库)
- 🍹 MySQL
MySQL 是最流行的关系型数据库管理系统之一,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。
MySQL6.X之后采用了双授权政策,分为社区版和商业版,特点:体积小、速度快、总体拥有成本低、开源、可定制,一般中小型和大型网站的开发都选择 MySQL 作为网站数据库。
- 🍹 MariaDB
是MySQL的一个分支,视为开源数据库MySQL的替代品。主要由开源社区在维护,由MySQL的创始人Michael Widenius主导开发,MariaDB名称来自Michael Widenius的女儿Maria的名字。
- 🍹 PostgreSQL
PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),是以加州大学计算机系开发的POSTGRES 4.2版本为基础的对象关系型数据库管理系统。
PostgreSQL,也称为 Postgres,支持非关系和关系数据类型。它被称为当今可用的最兼容、最稳定和最成熟的关系数据库之一,并且可以轻松处理复杂的查询。
- 🍹 SQL Server
SQL Server是大型企业软件的首选平台,主要面向使用.NET作为开发语言的开发人员,以前只能在Windows上运行,微软在2022年 3 月对外宣布了 Linux 版的 SQL Server。
- **🍹 Oracle **
是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小微机环境。它是一种高效率的、可靠性好的、适应高吞吐量的数据库方案。
7.2 NoSQL(Not Only SQL)——非关系型数据库
- 🍹 Redis
Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。
Redis的特点:单线程,基于内存,丰富的数据结构,支持持久化,分布式锁,简单事务
使用的场景包括:
1.缓存
2.点赞,签到,打卡
3.排行榜
4.消息队列
5.限流
…
- 🍹 Memcached
memcached是一套分布式的高速缓存系统,由LiveJournal的Brad Fitzpatrick开发,与redis相似。
特点:协议简单、基于libevent的事件处理、内置内存存储方式、memcached不互相通信的分布式。
7.3 面向文档数据库
- 🍹 MongoDB
MongoDB是一个基于分布式文件存储 [1] 的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。
特点:高性能、易部署、易使用,存储数据非常方便。
- 🍹 CouchDB
CouchDB是用Erlang开发的面向文档的数据库系统,2010年7月14日发布了1.0版本。
其数据存储方式有点类似lucene的index文件格式,CouchDB最大的意义在于它是一个面向web应用的新一代存储系统。
7.4 列式存储
列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于大批量的数据处理,常用于联机事务型数据处理。
- 🍹 Hbase
HBase是一个分布式的、面向列的开源数据库,是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
7.5 图数据库
- 🍹 GDB
GDB非常适合社交网络、欺诈检测、推荐引擎、实时图谱、网络/IT运营这类高度互连数据集的场景。
🔻八、总结—温故知新
❓ 什么是数据库,数据库产生及背景
❓ 数据库种类有哪些
❓ 数据库有关术语
❓ 常见数据库特点及使用场景
👈【上一篇】 |
--💖The End💖 点点关注,收藏不迷路💖--
| 【下一篇】👉 |