读高性能MySQL(第4版)笔记06_优化数据类型(上)

news2024/11/16 20:49:16

1. 良好的逻辑设计和物理设计是高性能的基石

1.1. 反范式的schema可以加速某些类型的查询,但同时可能减慢其他类型的查询

1.2. 添加计数器和汇总表是一个优化查询的好方法,但它们的维护成本可能很

1.3. 将修改schema作为一个常见事件来规划

2. 让事情尽可能小而简单是一个好主意

2.1. 尽量避免在设计中出现极端情况

2.2. 使用小的、简单的、适当的数据类型,并避免使用NULL,除非确实是对真实数据进行建模的正确方法

2.3. 尝试使用相同的数据类型来存储相似或相关的值,尤其是在联接条件中使用这些值时

2.4. 注意可变长度字符串,它可能会导致临时表和排序的全长内存分配不乐观

2.5. 如果可能的话,尝试使用整数作为标识符

2.6. 小心使用ENUM和SET类型

2.7. 避免使用BIT类型

3. 选择正确的数据类型对于获得高性能至关重要

3.1. 更小的通常更好

3.1.1. 尽量使用能够正确存储和表示数据的最小数据类型

3.1.2. 更小的数据类型通常更快,因为它们占用的磁盘、内存和CPU缓存的空间更少,并且处理时需要的CPU周期也更少

3.1.3. 在schema中的多个地方增加数据类型范围是一个痛苦且耗时的操作

3.1.4. 如果无法确定哪个数据类型是最好的,请选择你认为不会超过的最小数据类型

3.2. 简单为好

3.2.1. 简单数据类型的操作通常需要更少的CPU周期

3.2.2. 整型数据比字符型数据的比较操作代价更低

3.2.2.1. 字符集和排序规则(collation)使字符型数据的比较更复杂

3.2.2.2. 应该将日期和时间存储为MySQL的内置类型而不是字符串类型

3.2.2.3. 应该用整型数据存储IP地址

3.3. 尽量避免存储NULL

3.3.1. 最好指定列为NOT NULL,除非明确需要存储NULL值

3.3.2. 如果查询中包含可为NULL的列,对MySQL来说更难优化,因为可为NULL的列使得索引、索引统计和值比较都更复杂

3.3.3. 可为NULL的列会使用更多的存储空间,在MySQL里也需要特殊处理

3.3.4. 可为NULL的列改为NOT NULL带来的性能提升比较小

4. 整数类型

4.1. 整数(whole number)

4.1.1. TINYINT、SMALLINT、MEDIUMINT、INT或BIGINT

4.1.1.1. 使用8、16、24、32和64位存储空间

4.1.2. 整数类型有可选的UNSIGNED属性,表示不允许负值,这大致可以使正数的上限提高一倍

4.1.3. 有符号和无符号类型使用相同的存储空间,并具有相同的性能,因此可以根据数据实际范围选择合适的类型

4.1.4. 整数计算通常使用64位的BIGINT整数

4.1.5. 对于存储和计算来说,INT(1)和INT(20)是相同的

4.1.6. 一些大容量的场景,可以考虑使用BIGINT代替DECIMAL,将需要存储的货币单位根据小数的位数乘以相应的倍数即可

4.1.7. 存储财务数据并精确到万分之一分,则可以把所有金额乘以一百万,然后将结果存储在BIGINT里

4.1.8. 同时避免浮点存储计算不精确和DECIMAL精确计算代价高的问题

4.2. 实数(real number,带有小数部分的数字)

4.2.1. 不仅适用于带小数的数字,也可以使用DECIMAL存储比BIGINT还大的整数

4.2.2. 浮点类型通常比DECIMAL使用更少的空间来存储相同范围的值

4.2.3. FLOAT列使用4字节的存储空间

4.2.4. DOUBLE占用8字节,比FLOAT具有更高的精度和更大的值范围

4.2.5. 应该尽量只在对小数进行精确计算时才使用DECIMAL

5. 字符串类型

5.1. 字符串长度定义的不是字节数,是字符数

5.2. VARCHAR

5.2.1. 用于存储可变长度的字符串,是最常见的字符串数据类型

5.2.2. 它比固定长度的类型更节省空间,因为它仅使用必要的空间

5.2.3. 更少的空间用于存储更短的值

5.2.4. 需要额外使用1或2字节记录字符串的长度

5.2.4.1. VARCHAR(1000)的列则需要1002个字节,因为需要2字节存储长度信息

5.2.5. 节省了存储空间,所以对性能也有帮助

5.2.5.1. 由于行是可变长度的,在更新时可能会增长,这会导致额外的工作

5.2.6. 推荐使用场景

5.2.6.1. 字符串列的最大长度远大于平均长度

5.2.6.2. 列的更新很少,所以碎片不是问题

5.2.6.3. 使用了像UTF-8这样复杂的字符集,每个字符都使用不同的字节数进行存储

5.3. CHAR

5.3.1. 总是为定义的字符串长度分配足够的空间

5.3.2. 当存储CHAR值时,MySQL删除所有尾随空格

5.3.3. 如果需要进行比较,值会用空格填充

5.3.4. 推荐使用场景

5.3.4.1. 存储非常短的字符串

5.3.4.1.1. 对于非常短的列,CHAR也比VARCHAR更高效
5.3.4.1.2. 设计为只保存Y和N的值的CHAR(1)在单字节字符集中只使用1字节,但VARCHAR(1)需要2字节,因为还有一个记录长度的额外字节

5.3.4.2. 所有值的长度都几乎相同的情况

5.3.5. 对于经常修改的数据,CHAR也比VARCHAR更好,因为固定长度的行不容易出现碎片

5.4. 二进制字符串与常规字符串非常相似,但它们存储的是字节而不是字符

5.5. 填充也不同:MySQL填充BINANRY用的是\0(零字节)而不是空格,并且在检索时不会去除填充值

5.6. 字节比较的优势

5.6.1. 大小写不敏感

5.6.2. 二进制比较比字符比较简单得多,因此速度更快

5.7. BLOB和TEXT类型

5.7.1. 存储很大的数据而设计的字符串数据类型,分别采用二进制和字符方式存储

5.7.2. 字符类型

5.7.2.1. TINYTEXT、SMALLTEXT、TEXT、MEDIUMTEXT和LONGTEXT

5.7.2.2. TEXT是SMALLTEXT的同义词。

5.7.2.3. 有字符集和排序规则

5.7.3. 二进制类型

5.7.3.1. TINYBLOB、SMALLBLOB、BLOB、MEDIUMBLOB、LONGBLOB

5.7.3.2. BLOB是SMALLBLOB的同义词

5.7.3.3. 二进制数据,没有排序规则或字符集

5.7.3.4. 如果需要在检索后保持值不变,请小心使用BINARY类型,MySQL会使用\0将其填充到需要的长度

5.7.4. 当BLOB和TEXT值太大时,InnoDB会使用独立的“外部”存储区域,此时每个值在行内需要1~4字节的存储空间,然后在外部存储区域需要足够的空间来存储实际的值

5.7.5. 只对这些列的最前max_sort_length字节而不是整个字符串做排序

5.7.6. 不能将BLOB和TEXT数据类型的完整字符串放入索引,也不能使用索引进行排序

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1002322.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM GC垃圾回收

一、GC垃圾回收算法 标记-清除算法 算法分为“标记”和“清除”阶段:标记存活的对象, 统一回收所有未被标记的对象(一般选择这种);也可以反过来,标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象 。它…

二分搜索树节点删除(Java 实例代码)

目录 二分搜索树节点删除 src/runoob/binary/BSTRemove.java 文件代码: 二分搜索树节点删除 本小节介绍二分搜索树节点的删除之前,先介绍如何查找最小值和最大值,以及删除最小值和最大值。 以最小值为例(最大值同理&#xff09…

在 Simscape Electrical 中对两区 MVDC 电动船的建模和仿真(Simulink实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

Linux Centos7内网服务器离线升级openssh9.3

内网服务器需要升级openssh,被折磨了一整天,觉得有必要记录一下,不然对不起这差点崩溃的一天,主要的几个难点就是不能yum一键安装,需要自己找到对应的依赖版本然后通过堡垒机上传到内网,还有就是服务器很干…

无涯教程-JavaScript - ISPMT函数

描述 ISPMT函数计算在特定投资期间支付的利息。提供此功能是为了与Lotus 1-2-3兼容。 语法 ISPMT (rate, per, nper, pv)争论 Argument描述Required/OptionalRateThe interest rate for the investment.RequiredPerThe period for which you want to find the interest, an…

vue-puzzle-vcode完成验证码拖拽

一、 vue-puzzle-vcode插件【推荐】 GitHub地址&#xff1a;beeworkshop/vue-puzzle-vcode 1、安装vue-puzzle-vcode cnpm i -S vue-puzzle-vcode2、实现代码 <template><div><Vcode :show"isShow" success"success" close"close&…

7年经验之谈 —— Web测试是什么,有何特点?

Web测试是指对Web应用程序进行验证和评估的过程&#xff0c;以确保其功能、性能和安全性符合预期。 Web测试具体包括以下几个方面的内容&#xff1a; 功能测试&#xff1a;验证Web应用程序是否按照需求规格说明书中定义的功能正常工作。功能测试包括输入验证、表单提交、页面…

【Flutter】Flutter 使用 pull_to_refresh 实现下拉刷新和上拉加载

【Flutter】Flutter 使用 pull_to_refresh 实现下拉刷新和上拉加载 文章目录 一、前言二、pull_to_refresh 包简介三、安装与基本使用四、高级功能与配置五、实际业务中的用法六、完整示例七、总结 一、前言 你好&#xff01;在移动开发中&#xff0c;下拉刷新和上拉加载是非常…

【数据结构】双向链表详解

当我们学习完单链表后&#xff0c;双向链表就简单的多了&#xff0c;双向链表中的头插&#xff0c;尾插&#xff0c;头删&#xff0c;尾删&#xff0c;以及任意位置插&#xff0c;任意位置删除比单链表简单&#xff0c;今天就跟着小张一起学习吧&#xff01;&#xff01; 双向链…

Pytorch Advanced(一) Generative Adversarial Networks

生成对抗神经网络GAN&#xff0c;发挥神经网络的想象力&#xff0c;可以说是十分厉害了 参考 1、AI作家 2、将模糊图变清晰(去雨&#xff0c;去雾&#xff0c;去抖动&#xff0c;去马赛克等)&#xff0c;这需要AI具有“想象力”&#xff0c;能脑补情节&#xff1b; 3、进行数…

JavaScript Promise 的真正工作原理

Promise 是处理异步代码的一种技术,也称为脱离回调地狱的头等舱门票。 3 承诺状态 待定状态 已解决状态 拒绝状态 理解 JavaScript Promis 什么是承诺? 通常,承诺被定义为最终可用的值的代理。 Promise 多年来一直是 JavaScript 的一部分(在 ES2015 中标准化并引入)。最…

【数据结构】前言概况 - 树

&#x1f6a9;纸上得来终觉浅&#xff0c; 绝知此事要躬行。 &#x1f31f;主页&#xff1a;June-Frost &#x1f680;专栏&#xff1a;数据结构 &#x1f525;该文章针对树形结构作出前言&#xff0c;以保证可以对树初步认知。 目录&#xff1a; &#x1f30d;前言:&#x1f3…

Python语义分割与街景识别(4):程序运行

前言 本文主要用于记录我在使用python做图像识别语义分割训练集的过程&#xff0c;由于在这一过程中踩坑排除BUG过多&#xff0c;因此也希望想做这部分内容的同学们可以少走些弯路。 本文是python语义分割与街景识别第四篇&#xff0c;关于程序的内容&#xff0c;也是差不多最…

【Unity编辑器扩展】| GameView面板扩展

前言【Unity编辑器扩展】| GameView面板扩展未运行时在Game视图进行绘制总结前言 前面我们介绍了Unity中编辑器扩展的一些基本概念及基础知识,还有编辑器扩展中用到的相关特性Attribute介绍。后面就来针对Uniity编辑器扩展中比较常用的模块进行学习介绍。本文就来详细介绍一下…

JAVA版的数据结构——链表

目录 1.单向不带头链表 1.1 链表的概念及结构 1.2 代码部分 1.3 完整的全部代码 2. 双向不带头链表 2.1 代码部分 2.2 完整的代码 3. MySingleList与MyLinkedList代码上的区别 4. LinkedList的使用 4.1 什么是LinkedList 4.2 LinkedList的使用 4.2.1 LinkedList的构…

【数据结构】堆的向上调整和向下调整以及相关方法

&#x1f490; &#x1f338; &#x1f337; &#x1f340; &#x1f339; &#x1f33b; &#x1f33a; &#x1f341; &#x1f343; &#x1f342; &#x1f33f; &#x1f344;&#x1f35d; &#x1f35b; &#x1f364; &#x1f4c3; 文章目录 一、堆的概念二、堆的性质…

github上创建分支并合并到master

github上创建分支并合并到master 目录概述需求&#xff1a; 设计思路实现思路分析1.创建分支2.commit changes3.create pull request按钮4.网页解析器5.数据处理器 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,ful…

[deeplearning]深度学习框架torch的概念以及数学内容

&#xff08;提前声明&#xff1a;这边的操作系统为ubuntn22.04,至于window上如何进行安装和导入按这边不是很理解&#xff09; &#xff08;另外代码样例基本不使用notebook&#xff0c;paddle等等在线工具&#xff0c;而是使用本机安装好的python环境&#xff0c;和pytorch框…

IDEA中maven的设置以及相关功能

Maven 项目介绍 学习前提 相对于传统的项目&#xff0c;Maven 下管理和构建的项目真的非常好用和简单&#xff0c;所以这里也强调下&#xff0c;尽量使用此类工具进行项目构建。 ## Maven 常用设置介绍 如上图标注 1 所示&#xff0c;我们可以指定我们本地 Maven 的安装目录…

模块化开发_groupby查询think PHP5.1

要求按照分类的区别打印出不同类别的数据计数 如张三&#xff0c;做了6件事情 这里使用原生查询先测试 SELECT cate_id, COUNT(*) AS order_count FROM tp_article GROUP BY cate_id;成功 然后项目中实现 public function ss(){$sql "SELECT cate_id, COUNT(*) AS orde…