后端存储实战课——高速增长篇

news2024/11/18 8:18:41

数据库超时

MySQL CPU 的利用率一直是 100% 的话,MySQL 基本属于不可用的状态,执行的 SQL 都会超时。

CPU 利用率高的情况,绝大多数是由于慢 SQL 引起的,可以通过分析慢 SQL 日志查找类似问题原因。由于数据库忙的时候,执行的 SQL 都很慢,所以慢 SQL 日志中的 SQL 不一定都是有问题的,不能简单通过执行次数和执行时长进行判断,但是要关注单词执行时间特别长的 SQL。

给编写 SQL 带来的启示:

  1. SQL 涉及的表是哪些,数据规模如何?
  2. SQL 遍历的数据量是多少?
  3. 避免写出慢 SQL

给系统设计带来的启示:

  1. 利用缓存减少数据库查询,使用缓存时注意缓存命中率(击穿、穿透、雪崩现象)
  2. 做好监控,及时处理
  3. 做好降级方案

慢 SQL

一个前提:查询的执行时长基本上是和遍历的数据行数正相关的。

影响 MySQL 处理能力的因素:服务器配置、数据量大小、参数配置、繁忙程度。一台 MySQL 数据库,处理能力的极限大概是每秒一万条简单的 SQL(根据主键查询不需要遍历很多条记录的 SQL),一般一台 MySQL 服务器,平均每秒中执行的 SQL 数量在几百左右就算繁忙了。

一些经验:

  1. 如果遍历行数在百万以内的,只要不是每秒钟都要执行几十上百次的频繁查询,可以认为是安全的。遍历数据行数在几百万的,查询时间最少也要几秒钟,你就要仔细考虑有没有优化的办法。遍历行数达到千万量级和以上的,这种查询就不应该出现在你的系统中。当然我们这里说的都是在线交易系统,离线分析类系统另说。
  2. 遍历行数在千万左右,是 MySQL 查询的一个坎儿。MySQL 中单个表数据量,也要尽量控制在一千万条以下,最多不要超过二三千万这个量级。原因也很好理解,对一个千万级别的表执行查询,加上几个 WHERE 条件过滤一下,符合条件的数据最多可能在几十万或者百万量级,这还可以接受。但如果再和其他的表做一个联合查询,遍历的数据量很可能就超过千万级别了。所以,每个表的数据量最好小于千万级别。

如果真需要遍历大量数据,两种方案:

  1. 使用索引避免全表扫描(增加索引的代价是降低数据插入、删除、更新的性能,对于更新频繁并且对更新性能要求高的表尽量少建索引),关联阅读:MySQL 索引入门、MySQL 查询优化
  2. 分析 SQL 的执行计划,关联阅读:MySQL explain 使用

缓存使用

更新策略简单贴图,雪崩、击穿、穿透问题不再赘述

Read/Write Through:
Read/Write Through
Cache Aside:
Cache Aside
Write Back:Write Back(写回)策略在更新数据的时候,只更新缓存,同时将缓存数据设置为脏的,然后立马返回,并不会更新数据库。对于数据库的更新,会通过批量异步更新的方式进行。

MySQL 读写分离

步骤

部署一主多从 MySQL 实例

参考 MySQL 官方文档

分离应用对数据库的读写请求

  1. 手动实现,在 DAO 层做修改
  2. 使用 Sharding-JDBC 组件(代码侵入少)
  3. 代理方式:在应用程序和数据库实例之间部署一组数据库代理实例,比如说 Atlas 或者 MaxScale。对应用程序来说,数据库代理把自己伪装成一个单节点的 MySQL 实例,应用程序的所有数据库请求被发送给代理,代理分离读写请求,然后转发给对应的数据库实例。(会加长请求的链路,有一定性能损失)

主从延迟

  1. 如果有插入后立马要求查询到的业务,可以直连主库查询
  2. MySQL 的并行复制
  3. 业务上规避(在应用程序和数据库实例之间部署一组数据库代理实例,比如说 Atlas 或者 MaxScale。对应用程序来说,数据库代理把自己伪装成一个单节点的 MySQL 实例,应用程序的所有数据库请求被发送给代理,代理分离读写请求,然后转发给对应的数据库实例)

MySQL 主从

大概步骤

MySQL 可以通过修改配置的方式来更改下述的时序。
主库需要执行的操作:

  1. 提交事务
  2. 更新存储的数据
  3. 写 binlog
  4. 向客户端返回响应
  5. 将 binlog 复制到所有从库

从库需要做的:

  1. 将上述的 binlog 暂存
  2. 回放 binlog
  3. 更新对应数据
  4. 向主库发送复制成功的响应

复制方式

默认情况下,MySQL 采用的是异步复制的方式,因此执行事务操作的线程不会等待复制 binlog 的线程。

异步复制:主库向客户端返回操作成功的响应后,从库中会有专门线程从主库接收 binlog,并将其保存到中继日志中。从库中还有专门用来回放 binlog 的线程,读取中继日志,回收 binlog,更新数据

同步复制:同步复制的时序和异步复制基本是一样的,唯一的区别是,什么时候给客户端返回响应。异步复制时,主库提交事务之后,就会给客户端返回响应;而同步复制时,主库在提交事务的时候,会等待数据复制到所有从库之后,再给客户端返回响应。

半同步复制:异步复制是,事务线程完全不等复制响应;同步复制是,事务线程要等待所有的复制响应;半同步复制介于二者之间,事务线程不用等着所有的复制成功响应,只要一部分复制响应回来之后,就可以给客户端返回了。

海量数据导致存储系统慢

拆,将一大坨数据拆分成 N 个小坨,学名「分片」。

归档历史数据

将大量的不常用的历史数据移到另外一张历史表中,大概流程:
在这里插入图片描述

批量删除大量数据

不能一次性直接删除,需要分批删除(并在每次删除之间停一会儿):

delete from orderswhere timestamp < SUBDATE(CURDATE(),INTERVAL 3 month)order by id limit 1000;

优化思路:先查出来符合条件的 id,然后根据 id 去删除:

select max(id) from orders
where timestamp < SUBDATE(CURDATE(),INTERVAL 3 month);


delete from orders
where id <= ?
order by id limit 1000;

删除数据后表空间没有被释放原因:虽然逻辑上每个表是一颗 B+ 树,但是物理上,每条记录都是存放在磁盘文件中的,这些记录通过一些位置指针来组织成一颗 B+ 树。当 MySQL 删除一条记录的时候,只能是找到记录所在的文件中位置,然后把文件的这块区域标记为空闲,然后再修改 B+ 树中相关的一些指针,完成删除。其实那条被删除的记录还是躺在那个文件的那个位置,所以并不会释放磁盘空间。

解决方案:可以执行一次 OPTIMIZE TABLE 释放存储空间。对于 InnoDB 来说,执行 OPTIMIZE TABLE 实际上就是把这个表重建一遍,执行过程中会一直锁表,也就是说这个时候下单都会被卡住,这个是需要注意的。前提条件是 MySQL 的配置必须是每个表独立一个表空间(innodb_file_per_table = ON),如果所有表都是放在一起的,执行 OPTIMIZE TABLE 也不会释放磁盘空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/63222.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入学习Android

我通过阅读邓凡平前辈的《深入理解Android》&#xff0c;为了加深学习作此学习笔记。虽然是邓老师2011著的书&#xff0c;但其中的安卓框架还是可以学习的。另老师的csdn地址在&#xff1a;阿拉神农的博客_CSDN博客-Android开发系列,深入理解Android,移动万态领域博主tips:阅读…

如何进阶一名有竞争力的程序员?

前言 这段时间&#xff0c;又互联网寒冬了&#xff0c;你看消息满天飞。一瞬间&#xff0c;裁员的&#xff0c;辟谣的&#xff0c;很是热闹。这搞得我们程序员很难受&#xff0c;本来压力就大&#xff0c;还动不动有人在你耳边煽风点火制造恐慌。我想说&#xff1a;难道就不能…

[附源码]Python计算机毕业设计SSM教师信息采集系统(程序+LW)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

APISIX 在君润人力云原生平台的架构实践

讲师&#xff1a;袁鹏&#xff0c;一页科技架构师 摘要&#xff1a; 君润人力采用多套 Apache APISIX 集群来满足自研服务平台的功能需求。 君润人力成立于 2019 年&#xff0c;是一家以科技驱动的人力资源解决方案服务商&#xff0c;依托行业领先的科技水平和服务能力&#xf…

透视投影函数的图像

因为有个需求是判断线是否被视锥体裁切&#xff0c;因为NDC比较好判断是否裁切&#xff0c;所以研究了一下透视投影变换的函数图像。 从透视投影矩阵可以看出&#xff0c;在同一个z上&#xff0c;x,y都是线性的&#xff0c;所以这里主要研究z的变换函数图像。 我用的是Vulkan&a…

[附源码]Python计算机毕业设计SSM健身网站平台(程序+LW)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

【SQL】锁机制

【SQL】锁机制锁的不同角度分类从数据操作的类型划分&#xff1a;读锁&#xff0c;写锁从数据操作的粒度划分&#xff1a;表级锁&#xff0c;页级锁&#xff0c;行锁表锁意向锁&#xff08;intention lock&#xff09;自增锁&#xff08;AUTO-INC锁&#xff09;元数据锁&#x…

Java --- Spring6对IoC的实现

目录 一、控制反转 二、依赖注入 三、set注入 四、构造注入 一、控制反转 1、控制反转是一种思想 2、控制反转是为了降低程序耦合度&#xff0c;提高程序扩展力&#xff0c;达到OCP原则&#xff0c;达到DIP原则。 3、控制反转主要有:①、将对象的创建权力交出去&#xff…

莱特飞行优化及其使用场景

莱特飞行优化及其使用场景 一&#xff0c;莱特飞行 但是产生一个莱特飞行分布的随机数是比较难的&#xff0c;莱特只给出了一个积分&#xff0c;所以后面就有人提出了如何制造这样分布的随机数。 Mantegna 在1994年提出的一种用正态分布求解随机数的方法&#xff0c;有时也叫…

nginx目录穿越漏洞(insecure-configuration)

该漏洞是由于配置错误导致的 漏洞原理&#xff1a;传送门 这个常见于Nginx做反向代理的情况&#xff0c;动态的部分被proxy_pass传递给后端端口&#xff0c;而静态文件需要Nginx来处理。 环境&#xff1a; vulhub靶场 进入nginx/insecure-configuration 运行docker-comp…

【编码】PHP中文路径问题详解

1. 问题 低版本的PHP可能会遇到不支持中文路径的情况&#xff1a; (1) require(‘http://localhost/中文路径/test.php’); (2) require(‘\中文路径\test.php’); (3) $file fopen(‘http://localhost/中文路径/test.php’); (4) $file fopen(‘\中文路径\test.php’);…

SpringCloud框架(一):环境搭建 生产和消费 RestTemplate,底层源码解读

环境搭建 生产和消费 RestTemplate&#xff0c;底层源码解读SpringCloud环境搭建&#xff1a;生产和消费 RestTemplateSpringCloud的服务调用SpringBootApplication业务调用方法一&#xff1a; 通过静态工厂去拿业务调用方法二&#xff1a; 通过注入依赖去拿Template的底层源码…

BI国产化,必须要弄懂的2个关键

自“十四五”以来&#xff0c;我国诸多政策开始推动信创产业的深入&#xff0c;实现关键数字技术自主研发和自主可控。我国信创产业竞争力不断突破&#xff0c;国产化进程稳步推进。2022年开始政策重点提及“数字经济”、“数字政府”和国家信息化。在此背景下&#xff0c;BI产…

造物数藏:以数字藏品为契机 不断完善应用场景探索

数字时代已至&#xff0c;文化艺术作品的表现形式、传播途径都发生了变化&#xff0c;中华民族上下五千年的文化瑰宝得以借助新的形式被传承弘扬。而数字技术在发展过程中&#xff0c;也逐渐与文化产业水乳交融&#xff0c;孕育出数字文化产业新业态。数字藏品在近两年的突然红…

MySQL高可用MHA

目录 一.MHA概述 1.1 什么是MHA 1.2 MHA的组成 1.3 MHA的特点 二.MHA的工作原理 2.1 MHA的优点总结 三、实现过程 3.1 准备实验 Mysql 的 Replication 环境 3.1.1 相关配置 3.1.2 初始主节点 master 的配置 3.1.3 所有 slave 节点依赖的配置 3.1.4 配置一主多从复制…

VINS学习04———Omni教程

1. 本文简介 本文依照港科大开源的代码和论文 文章主要内容&#xff1a;对无人机集群实现协同定位。参与融合的定位因子有以下4点 全向鱼眼相机的VIO定位&#xff1a;VINS-Fisheye基于地图定位&#xff1a;视觉特征点协同建图基于UWB协同定位&#xff1a;节点间测距视觉检测定…

爆款小游戏用的都是什么游戏开发引擎?

随着微信生态中&#xff0c;小程序应用指数级的增长&#xff0c;许多休闲游戏变成为了众多游戏厂商流量变现的新手段。以近期很火的“羊了个羊”为例&#xff0c;它便是我们常常所说的小游戏。 游戏和小游戏的区别 要盘点小游戏开发引擎之前&#xff0c;我们得先来了解下游戏和…

[附源码]计算机毕业设计基于Springboot校园招聘系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

jQuery 效果- 动画

jQuery animate() 方法允许您创建自定义的动画。 jQuery 动画实例 jQuery jQuery 动画 - animate() 方法 jQuery animate() 方法用于创建自定义动画。 语法&#xff1a; $(selector).animate({params},speed,callback); 必需的 params 参数定义形成动画的 CSS 属性。 …

如何优雅的排空节点上的pod?云服务商是如何回收机器的?

概述 在 Kubernetes 中&#xff0c;不仅容器和 Pod 可以更换&#xff0c;节点也可以更换。Kubernetes 中的节点是 VM、服务器和其他具有计算能力的实体 &#xff08;其实对k8s来说就是一个对象&#xff09;&#xff0c;在这些实体中运行 Pod 和容器。 节点耗尽是一种允许用户…