数据库存储引擎和数据类型详细介绍

news2024/12/27 13:57:16

目录

  • 一、数据库存储引擎(了解)
    • 1.了解MySQL体系结构
    • 2.存储引擎(了解)
      • 2.1.存储引擎的介绍
      • 2.2.存储引擎分类
      • 2.3.如何选择引擎?
    • 3.事务控制语言(TCL)
      • 事务的四个特性(ACID)
  • 二、数据类型(了解)
    • 1.整型(常用的是int)
    • 2.字符串类型
    • 3.枚举类型 enum (enumeration)
    • 4.日期类型

一、数据库存储引擎(了解)

1.了解MySQL体系结构

1
如上图所示,mysql结构总共分为4个层次,连接层/服务层/引擎层/存储层

  • 连接层:最上层是一些客户端和链接服务,主要完成一些类似于连接处理、授权认证、及相关的安全方案。服务器也会为安全接入的每个客户端验证它所具有的操作权限
  • 服务层:第二层架构主要完成大多数的MySQL的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化,部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如过程、函数等。
  • 引擎层:存储引擎真正负责了MySQL中数据的存储和提取,服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能。这样我们可以根据自己的需要。来选取合适的存储引擎
  • 存储层:主要是将数据存储在文件系统之上,并完成存储引擎的交互。

2.存储引擎(了解)

2.1.存储引擎的介绍

MySQL的存储引擎指MySQL中管理数据的方式。
存储引擎是基于表的,而不是基于库的,所以存储引擎也可被称为表类型。
数据库存储引擎是数据库底层软件组织,数据库管理系统(DBMS)使用数据引擎进行创建、查询、更新和删除数据。
不同的存储引擎提供不同的存储机制、索引、锁定等功能,使用不同的存储引擎,还可以 获得特定的功能。
现在许多不同的数据库管理系统都支持多种不同的数据引擎。MySQL数据库的核心就是存储引擎。
文件系统回顾: 操作系统组织和存取数据的一种机制。文件系统是一种软件。
文件系统类型:ext2 3 4 ,xfs
不管使用什么文件系统,数据内容不会变化,区别是不同的文件系统直接存储空间、大小、速度都不同
MySQL引擎:可以理解为 MySQL的“文件系统”,只不过功能更加强大。
MySQL引擎功能: 除了可以提供基本的存取功能,还有更多功能事务功能、锁定、备份和恢复、优化以及特殊功能。

2.2.存储引擎分类

MySQL存储引擎介绍:

  • InnoDB存储引擎:默认引擎,最常用的。
    InnoDB是事务型数据库的首选引擎,支持事务(ACID),支持行锁定和外键;InnoDB是默认的MySQL引擎

InnoDB特点:支持事务处理、支持外键、支持崩溃修复和并发控制。如果需要对事务的完整性要求比较高(比如银行),要求实现并发控制(比如12306售票),那选择InnoDB有很大的优势。如果需要频繁的更新、删除操作的数据库,也可以选择InnoDB,因为它支持事务的提交(commit)和回滚(rollback)。​

  • MyISAM存储引擎(了解)
    MyISAM基于ISAM存储引擎,并对其进行扩展。它是在Web、数据存储和其他应用环境下最常使用的存储引擎之一。MyISAM拥有较高的插入、查询速度,但不支持事务。

MyISAM特点: 插入数据快,空间和内存使用比较低。如果表主要是用于插入新记录和读出记录,那么选择MyISAM能实现处理高效率。如果应用程序对数据的完整性、并发性要求比较低,也可以使用。​

  • MEMORY内存型引擎(了解)
    MEMORY存储引擎将表中的数据存储到内存中,为查询和引用其他表数据提供了快速访问。

MEMORY特点: 所有的数据都在内存中,数据的处理速度快,但是安全性不高,因为数据极其容易发生丢失,服务器重启后,数据就丢失了。如果需要很快的读写速度,对数据的安全性要求较低,可以选择MEMOEY。但是它对表的大小有要求,不能建立太大的表。所以,这类数据库引擎只使用在相对较小的数据库表中。常见的应用场景有:需要高速缓存的表、经常被读但不被写的临时表
外键(foreign key):链接了两个表,确保数据的关系一致性。外键约束规定一个表中的数据必须匹配另一个表中的数据。
行锁定(Row locking):行锁定允许多个事务同时访问表中的不同行,只有访问同一行时才需要排队。这可以在更新数据时降低锁定的范围,提高并发效率。
事务:所有操作要么全部完成,要么全部不完成。

2.3.如何选择引擎?

具体情况具体分析,主要看业务场景,每个引擎适用不同的业务场景
如果要提供提交、回滚、并要求实现并发控制,InnoDB是一个好的选择;
如果数据表主要用来插入和查询记录,则MyISAM引擎能提供较高的处理效率;
如果只是临时存放数据,数据量不大,并且不需要较高的数据安全性,可以选择将数据保存在内存中的Memory引擎
使用哪一种引擎需要灵活选择,一个数据库中多张表可以使用不同引擎以满足各种性能和实际需求;使用合适的存储引擎,将会提高整个数据库的性能。

存储引擎查看
mysql> show engines;
或者 show engines\G;   也可以  \G是让结果更加人性化的显示,从而更易阅读

看你的mysql当前默认的存储引擎
mysql> show variables like '%storage_engine%';
+----------------------------------+--------+
| Variable_name                    | Value  |
+----------------------------------+--------+
| default_storage_engine           | InnoDB |
| default_tmp_storage_engine       | InnoDB |
| disabled_storage_engines         |        |
| internal_tmp_disk_storage_engine | InnoDB |
+----------------------------------+--------+
4 rows in set (0.00 sec)
如何查看Mysql服务器上的版本
mysql> select version();
+-----------+
| version() |
+-----------+
| 5.7.42    |
+-----------+
1 row in set (0.00 sec)

扩展了解知识
什么是外键:外键的主要作用是保持数据的一致性、完整性。
什么是索引:索引相当于书中的目录,可以提高数据检索的效率,降低数据库的IO。MySQL在300万条记录左右性能开始逐渐下降,虽然官方文档说500~800w记录,所以大数据量建立索引是非常有必要的
什么是行锁定与锁表:可以将一张表单独锁定和可以单独锁定一行的记录。为了防止你在操作的同时也有别人在操作。
什么是事务:事务是有一步或者几步数据库的操作。这系列操作要么全部执行,要么全部放弃执行。

3.事务控制语言(TCL)

事务控制语言 (Transation Control Language),是一组能对事务进行控制的SQL语句。
有时可能需要使用 DML 进行批量数据的删除,修改,增加。DML:数据操作语言,用于操作数据(Insert、Select等)
比如,在一个员工系统中,想删除一个人的信息。除了删除这个人的基本信息外,还应该删除与此人有关的其他信息,如邮箱,地址等等。
如:

--
BEGIN;开启一个新的事务
INSERT INTO …;插入操作
SAVEPOINT point1;设置事务的第一个保存点
UPDATE … ;更新操作
SAVEPOINT point2;设置事务的第二个保存点
DELETE FROM … ;删除操作
ROLLBACK TO point1;回滚到 point1 保存点
UPDATE … ;更新操作
COMMIT;提交事务

那么从开始执行到结束,就会构成一个事务。
对于事务,要保证事务的完整性。要么全部成功,要么全部不成功,则将操作撤回。

事务的四个特性(ACID)

原子性:事务是应用中最小的执行单位,就如原子是自然界最小颗粒,事务要么成功,要么不成功。具有不可再分的特征。事务是应用中不可再分的最小执行体。(最小了,不可再分了)

一致性:事务执行的结果,必须使数据库从一个一致性状态,变到另一个一致性状态,比如:转账前账号A和账号B的钱的总数为10000,转账后账号A和账号B的前的总数应该还是10000;当数据库中只包含事务成功提交的结果时,数据库处于一致性状态。一致性是通过原子性来保证的。

隔离性:并发执行的事务之间不能互相影响。当涉及到多用户操作同一张表时,数据库会为每一个用户开启一个事务。各个事务的执行互不干扰,任意一个事务的内部操作对其他并发的事务都是隔离的。也就是说:并发执行的事务之间不能看到对方的中间状态,并发执行的事务之间不相互影响。(说白了,就是你做你的,我做我的!)

持续性:持续性也称为持久性指事务一旦提交对数据所做的任何改变,都要记录到永久存储器中,通常是保存进物理数据库。即使数据库崩溃了,我们也要保证事务的完整性。即:一个事务一旦提交,它对数据库中数据的改变就是永久性的,即便发生系统故障也不会丢失。

二、数据类型(了解)

在MySQL数据库管理系统中,可以通过存储引擎来决定表的类型。
同时,MySQL数据库管理系统也提供了数据类型决定表存储数据的类型。
常见的数据类型

1.整型(常用的是int)

作用:用于存储用户的年龄、游戏的Level、经验值等。
分类:tinyint smallint mediumint int bigint
取值范围:

MySQL数据类型最小值最大值
tinyint(n)0255
smallint(n)-32,76832,767
mediumint(n)-83886088388607
int(n)-2,147,483,6482,147,483,647
bigint(n)-9,223,372,036,854,775,8089,223,372,036,854,7

结论:

  • 当整数值超过 int 数据类型支持的范围时,就可以采用 bigint。
  • 在 MySQL 中,int 数据类型是主要的整数的数据类型。
mysql> create table t4 (id int);
Query OK, 0 rows affected (0.00 sec)
​
mysql> desc t4;
+-------+---------+------+-----+---------+-------+
| Field | Type    | Null | Key | Default | Extra |
+-------+---------+------+-----+---------+-------+
| id    | int(11) | YES  |     | NULL    |       |
+-------+---------+------+-----+---------+-------+
1 row in set (0.00 sec)
​
mysql> insert into t4 values(1);
Query OK, 1 row affected (0.01 sec)
​
mysql> select * from t4;
+------+
| id   |
+------+
|    1 |
+------+
1 row in set (0.00 sec)

2.字符串类型

作用:用于存储用户的姓名、爱好、电话,邮箱地址,发布的文章等
字符类型 char varchar

  • char表示【定长字符串】,长度是固定的;如果插入数据的长度【小于】char的固定长度时,则用空格填充;因为长度固定,所以存取速度要比varchar快很多,甚至能快50%,但正因为其长度固定,所以会占据多余的空间。
    char(10)根据10来限制,一定会占10个,小于10个用空格补齐。
    列的长度是固定在为创建表时,声明的长度:0 ~ 255
    即:创建表时,在char类型后面使用小括号()指定最大长度。比如char(10)、char(100)等。
    该长度表示char能存储的最大字符数。它是固定的,不能变化。
    允许的长度从0到255个字符。也就是说char(0)到 char(255)都是允许的。

  • varchar表示【可变长字符串】,长度是可变的;插入的数据是多长,就按照多长来存储;varchar在存取方面与char相反,它存取慢,因为长度不固定,但正因如此,不占据多余的空间。
    varchar(10) 根据实际字符串长度占空间,最多10个
    列中的值为可变长字符串长度为:0 ~ 65535
    即:varchar 列中的值是可变长度的字符串,其长度可以在 0(空字符串)到 65535(最长字符串)个字符之间。

结合性能角度(char更快),节省磁盘空间角度(varchar更小),具体情况还需具体来设计数据库才是妥当的做法。

总结:
1、经常变化的字段用varchar
2、知道固定长度的用char
3、超过255字符的只能用varchar或者text
4、能用varchar的地方不用text(文本格式)

案例:

mysql> create table t8(c char(5),v varchar(12));
Query OK, 0 rows affected (0.42 sec)

mysql> insert into t8 values('abcde','abcdef');
Query OK, 1 row affected (0.38 sec)
​
mysql> insert into t8 values('abc','abcdef');  #char可以少于规定长度。
Query OK, 1 row affected (0.05 sec)
​
mysql> insert into t8 values('abc777','abcdef7');  #char不能大于规定的长度。
ERROR 1406 (22001): Data too long for column 'c' at row 1

3.枚举类型 enum (enumeration)

ENUM 是一个字符串对象,值为表创建时列规定中枚举的一列值,有限制的时候用枚举。其语法格式:<字段名> ENUM( ‘值1’, ‘值1’, …, ‘值n’ )
案例:

mysql> create table t101(name enum('tom','jim'));    #只能从tom,jim两个里面2选其1
mysql> INSERT INTO t101 VALUES('tom');    #插入数据
Query OK, 1 row affected (0.00 sec)

4.日期类型

时间和日期类型测试:year、date、time、datetime、timestamp
作用:用于存储用户的注册时间,文章的发布时间,文章的更新时间,员工的入职时间等
注意事项:
插入年份时,尽量使用4位值
插入两位年份时,<=69,以20开头,比如65, 结果2065
>=70,以19开头,比如82,结果1982
案例:

#创建表格
mysql> create table test_time(d date,t time,dt datetime);
Query OK, 0 rows affected (0.03 sec)#查看表结构
mysql> desc test_time;
+-------+----------+------+-----+---------+-------+
| Field | Type     | Null | Key | Default | Extra |
+-------+----------+------+-----+---------+-------+
| d     | date     | YES  |     | NULL    |       |
| t     | time     | YES  |     | NULL    |       |
| dt    | datetime | YES  |     | NULL    |       |
+-------+----------+------+-----+---------+-------+
3 rows in set (0.01 sec)#插入数据
mysql> insert into test_time values(now(),now(),now());
Query OK, 1 row affected, 1 warning (0.02 sec)#查询数据
mysql> select * from test_time;
+------------+----------+---------------------+
| d          | t        | dt                  |
+------------+----------+---------------------+
| 2023-07-04 | 03:26:01 | 2023-07-04 03:26:01 |
+------------+----------+---------------------+
1 row in set (0.00 sec)
​
​
#测试年:新建一个表格,指定字段是born_yesr,数据类型是year
mysql> create table t3(born_year year);
Query OK, 0 rows affected (0.40 sec)#查看表结构
mysql> desc t3;
+-----------+---------+------+-----+---------+-------+
| Field     | Type    | Null | Key | Default | Extra |
+-----------+---------+------+-----+---------+-------+
| born_year | year(4) | YES  |     | NULL    |       |
+-----------+---------+------+-----+---------+-------+
1 row in set (0.00 sec)#插入数据
mysql> insert into t3 values (12),(80);
Query OK, 2 rows affected (0.06 sec)
Records: 2  Duplicates: 0  Warnings: 0
mysql> select * from t3;
+-----------+
| born_year |
+-----------+
|      2012 |
|      1980 |
+-----------+
2 rows in set (0.00 sec)#插入数据
mysql> insert into t3 values (2019),(81);
Query OK, 2 rows affected (0.00 sec)
Records: 2  Duplicates: 0  Warnings: 0
mysql> select * from t3;
+-----------+
| born_year |
+-----------+
|      2012 |
|      1980 |
|      2019 |
|      1981 |
+-----------+
4 rows in set (0.00 sec)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1044212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【文献】TOF标定 Time-of-Flight Sensor Calibration for a Color and Depth Camera Pair

文章目录 Article info.Introduction处理TOF误差Take home messagesResourcesIDEAS Article info. Time-of-Flight Sensor Calibration for a Color and Depth Camera Pair IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 37, NO. 7, JULY 2015 Intr…

(一)连续随机量的生成-加权重采样

加权重采样 import numpy as np import matplotlib.pyplot as plt# Step 1: Generate 10,000 random theta values from U([0, 1]) n 10000 theta_values np.random.rand(n)# Define the function to compute weights for a given theta def compute_weight(theta):return (…

SQLAlchemy列参数的使用和query函数的使用

目录 Column常用参数 代码演示 代码刨析 query函数的使用 基本用法 常见用法示例 查询所有记录 根据条件查询 查询第一条符合条件的记录 查询特定列的值 添加排序规则 使用聚合函数 连接查询 使用filter_by Column常用参数 primary_key&#xff1a;True设置某个字…

当蛋白质成为儿童的敌人:应对蛋白过敏的挑战

儿童时期是充满欢笑和探索的时光&#xff0c;但对某些孩子来说&#xff0c;它可能伴随着一项不太受欢迎的挑战——蛋白过敏。在这篇文章中&#xff0c;我们将探讨蛋白过敏的现象、挑战以及如何在这个过程中为孩子提供支持。 蛋白质过敏&#xff1a;小儿的无情敌人 蛋白质过敏…

flink的序列化基准测试

背景&#xff1a; flink提供了在本地环境使用jmh测试不同序列化方法的性能差异&#xff0c;本文就是基于这个https://github.com/apache/flink-benchmarks这个性能测试&#xff0c;总结几个结论&#xff0c;以便后面使用时避免掉坑 基准测试 我们本次运行的是SerializationF…

2023 年解锁网络安全即服务

在当今快速发展的数字世界中&#xff0c;强大的网络安全机制的重要性怎么强调都不为过。对于越来越多地发现自己成为网络威胁焦点的小型企业来说尤其如此。 那么&#xff0c;“网络安全即服务”到底是什么&#xff1f;为什么它对小型企业至关重要&#xff1f; 网络安全即服务…

【RocketMQ】(八)Rebalance负载均衡

消费者负载均衡&#xff0c;是指为消费组下的每个消费者分配订阅主题下的消费队列&#xff0c;分配了消费队列消费者就可以知道去消费哪个消费队列上面的消息&#xff0c;这里针对集群模式&#xff0c;因为广播模式&#xff0c;所有的消息队列可以被消费组下的每个消费者消费不…

服务断路器_服务雪崩解决方案之服务限流

服务熔断和服务隔离都属于出错后的容错处理机制&#xff0c;而限流模式则可以称为预防模式。 限流模式主要是提前对各个类型的请求设置最高的QPS阈值&#xff0c;若高于设置的阈值则对该请求直接返回&#xff0c;不再调用后续资源。 注意&#xff1a; 限流的目的是通过对并发访…

【SQL server】数据库入门基本操作教学

个人主页&#xff1a;【&#x1f60a;个人主页】 系列专栏&#xff1a;【❤️初识JAVA】 前言 数据库是计算机系统中用于存储和管理数据的一种软件系统。它通常由一个或多个数据集合、管理系统和应用程序组成&#xff0c;被广泛应用于企业、政府和个人等各种领域。目前常用的数…

点击、拖拉拽,BI系统让业务掌握数据分析主动权

在今天的商业环境中&#xff0c;数据分析已经成为企业获取竞争优势的关键因素之一。然而&#xff0c;许多企业在面对复杂的数据分析工具时&#xff0c;却常常感到困扰。这些工具往往需要专业的技术人员操作&#xff0c;而且界面复杂&#xff0c;难以理解和使用。对业务人员来说…

java: 通过xml模板转成word文件

依赖: freemarker <dependency><groupId>org.freemarker</groupId><artifactId>freemarker</artifactId><version>2.3.31</version> <!-- 请根据您的需求选择最新版本 --></dependency> 代码展示 import freemarker.t…

关于ElementUI之动态树+数据表格+分页实例

目录 一.ElementUI动态树 二.实例 2.1.数据表 2.2.后端 2.3.前端 三.书籍管理 3.1.数据表 3.2.后端 3.2.前端 好啦今天就分享到这了&#xff0c;希望能帮到你哦&#xff01;&#xff01;&#xff01; 一.ElementUI动态树 ElementUI提供了一个动态树组件&#xff08;Dynami…

Kotlin小节(二)

1、安全索引取值函数&#xff1a;getOrElse和getOrNull getOrElse&#xff1a;如索引值存在&#xff0c;返回索引处数值&#xff1b;索引值不存在&#xff0c;返回lamada值 getOrNull&#xff1a;如索引值存在&#xff0c;返回索引处数值&#xff1b;索引值不存在&#xff0c…

Git与Repo:开源开发的得力工具组合

Git与Repo&#xff1a;开源开发的得力工具组合 1. 引言 开源开发在当今的软件行业中扮演着至关重要的角色。它不仅推动了技术的创新和进步&#xff0c;也促进了开发者之间的合作与共享。随着越来越多的开源项目的涌现&#xff0c;有效的代码管理和版本控制成为了必不可少的工…

【已解决】‘python‘ 不是内部或外部命令,也不是可运行的程序或批处理文件

【已解决】‘python‘ 不是内部或外部命令&#xff0c;也不是可运行的程序或批处理文件 环境变量配置 已经下载了安装包的情况下&#xff0c;这个问题就是环境变量没有配置的问题&#xff08;共两个&#xff09;。 分别是pythonx.x\Scripts\和pythonx.x\ 自定义安装环境变量…

算法与数据结构-字符串匹配算法

文章目录 主串和模式串BF 算法RK 算法BM算法1. 坏字符规则2. 好后缀规则 主串和模式串 在开始讲解这个算法之前&#xff0c;我先定义两个概念&#xff0c;方便我后面讲解。它们分别是主串和模式串。这俩概念很好理解&#xff0c;我举个例子你就懂了。 比方说&#xff0c;我们…

HTTP代理SSL连接:保障网络安全的重要协议

HTTP代理SSL连接是一种网络安全协议&#xff0c;它结合了HTTP代理和SSL/TLS协议&#xff0c;用于在客户端和服务器之间建立加密通信通道。HTTP代理SSL连接可以保护数据在传输过程中不被窃听、篡改或伪造&#xff0c;从而确保数据的完整性、保密性和可靠性。在本文中&#xff0c…

selenium使用已经获取的cookies登录网站报错unable to set cookie的处理方式

用selenium半手动登录github获取其登录cookies后&#xff0c;保存到一个文件gtb_cookies.txt中。 然后用selenium使用这个cookies文件&#xff0c;免登录上github。但是报错如下&#xff1a;selenium.common.exceptions.UnableToSetCookieException: Message: unable to set co…

如何实现服务器时间同步

为什么要做时间同步 在进行系统测试的时候&#xff0c;服务器时间同步很重要。例如web应用服务器与数据库服务器的时间同步&#xff0c;有一个定时任务&#xff0c;它的执行&#xff0c;如果服务器直接时间不通过&#xff0c;可能造成执行周期出现混乱。 ntp实现服务器时间同…

服务断路器_Resilience4j介绍

什么是Hystrix 我们耳熟能详的就是Netflix Hystrix,这个断路器是SpringCloud中最早支持的一种容错方案&#xff0c;现在这个断路器已经处于维护状态&#xff0c;已经不再更新了&#xff0c;你仍然可以使用这个断路器&#xff0c;但是呢&#xff0c;我不建议你去使用&#xff0…