MySQL线程池

news2025/1/13 7:42:19

概述

池化技术,包括线程池、连接池、内存池、对象池等。作用就是提前保存大量的资源,或将用过的资源保存起来,等下一次需要使用该资源时再取出来重复使用。

线程池:通过预先创建一定数量的线程,当有请求达到时,线程池分配一个线程提供服务,请求结束后,该线程又去服务其他请求。避免线程和内存对象的频繁创建和释放,降低服务端的并发度,减少上下文切换和资源的竞争,提高资源利用效率。
在这里插入图片描述

线程池和连接池

连接池,主要是数据库连接池,参考JDBC与数据库连接池。

线程池和连接池是两个不同的概念。

连接池一般在客户端设置,指客户端创建预先创建一定的连接,利用这些连接服务于客户端所有的DB请求。如果某一个时刻,空闲的连接数小于DB的请求数,则需要将请求排队,等待空闲连接处理。通过连接池复用连接,避免连接的频繁创建和释放,减少请求的平均响应时间,在请求繁忙时,通过请求排队,可以缓冲应用对DB的冲击。

线程池实现在server端,通过创建一定数量的线程服务DB请求,相对于one-conection-per-thread的一个线程服务一个连接的方式,线程池服务的最小单位是语句,即一个线程可以对应多个活跃的连接。线程池,可以将 server 端的服务线程数控制在一定的范围,减少系统资源的竞争和线程上下文切换带来的消耗,同时也避免出现高连接数导致的高并发问题。线程池具有线程复用、控制最大并发数、管理线程、保护系统4个优点。保护系统:无论系统目前有多少连接或请求,超过最大设置的线程数的都需要排队,让系统保持高性能水平,从而防止DB出现雪崩,对底层DB起到保护作用。

通常来说,比较好的方式是将连接池和线程池结合起来使用。

原理

线程池是MySQL 5.6的一个核心功能。MySQL处理连接的方式有3种(在5.6以前只有前两种):

  • No-Threads,不额外创建线程,所有连接一个线程,一般用于调试
  • One-Connection-Per-Thread,即对于每一个数据库连接,MySQL-Server都会创建一个独立的线程服务,请求结束后,销毁线程。再来一个连接请求,则再创建一个连接,结束后再进行销毁。在高并发情况下,会导致线程的频繁创建和释放。通过 thread-cache,可以将线程缓存起来,以供下次使用,避免频繁创建和释放的问题,但是无法解决高连接数的问题。这种方式随着连接数暴增,导致需要创建同样多的服务线程,高并发线程意味着高的内存消耗,更多的上下文切换(cpu cache命中率降低)及更多的资源竞争,导致服务出现抖动
  • Thread-Pool,线程处理的最小单位是statement(语句),一个线程可以处理多个连接的请求。在保证充分利用硬件资源情况下(合理设置线程池大小),可避免瞬间连接数暴增导致的服务器抖动

MySQL Server通过thread_handling参数来选择使用哪种方式:

if (thread_handling <= SCHEDULER_ONE_THREAD_PER_CONNECTION)   
   one_thread_per_connection_scheduler(thread_scheduler,&max_connections, &connection_count);
else if (thread_handling == SCHEDULER_NO_THREADS)
     one_thread_scheduler(thread_scheduler);
else                                 
    pool_of_threads_scheduler(thread_scheduler, &max_connections,&connection_count);

框架

线程池被划分为多个group(组),每个组又有对应的工作线程,

在这里插入图片描述
每一个绿色的方框代表一个group,group数目由thread_pool_size参数决定。每个group包含一个优先队列和普通队列,一个listener线程和若干个工作线程,listener线程和worker线程可以动态转换,worker线程数目由工作负载决定,同时受到thread_pool_oversubscribe设置影响。此外,整个线程池有一个timer线程监控group,防止group停滞(stall)。

各个部分的作用:

  • 队列(高优先级队列和低优先级队列)
    用来存放待执行的IO任务,分为高优先级队列和低优先级队列,高优先级队列的任务会优先被处理。
    什么任务会放在高优先级队列呢?
    事务中的语句会放到高优先级队列中,比如一个事务中有两个update的SQL,有1个已经执行,那么另外一个update的任务就会放在高优先级中。这里需要注意,如果是非事务引擎,或者开启了Autocommit的事务引擎,都会放到低优先级队列中。
    还有一种情况会将任务放到高优先级队列中,如果语句在低优先级队列停留太久,该语句也会移到高优先级队列中,防止饿死。
  • listener线程
    listener线程监听该线程group的语句,并确定当自己转变成worker线程,是立即执行对应的语句还是放到队列中,判断的标准是看队列中是否有待执行的语句。
    如果队列中待执行的语句数量为0,而listener线程转换成worker线程,并立即执行对应的语句。如果队列中待执行的语句数量不为0,则认为任务比较多,将语句放入队列中,让其他的线程来处理。这里的机制是为了减少线程的创建,因为一般SQL执行都非常快。
  • worker线程
    worker线程是真正干活的线程。
  • Timer线程
    Timer线程是用来周期性检查group是否处于处于阻塞状态,当出现阻塞的时候,会通过唤醒线程或者新建线程来解决。
    具体的检测方法为:通过queue_event_count的值和IO任务队列是否为空来判断线程组是否为阻塞状态。
    每次worker线程检查队列中任务的时候,queue_event_count会+1,每次Timer检查完group是否阻塞的时候会将queue_event_count清0,如果检查的时候任务队列不为空,而queue_event_count为0,则说明任务队列没有被正常处理,此时该group出现了阻塞,Timer线程会唤醒worker线程或者新建一个wokrer线程来处理队列中的任务,防止group长时间被阻塞。

ThreadPool运作步骤

ThreadPool运作简单描述,省略大量的复杂逻辑:

  1. 请求连接到MySQL,根据thread_id % thread_pool_size确定落在哪个group;
  2. group中的listener线程监听到所在的group有新的请求以后,检查队列中是否有请求还未处理。如果没有,则自己转换为worker线程立即处理该请求,如果队列中还有未处理的请求,则将对应请求放到队列中,让其他的线程处理;
  3. group中的thread线程检查队列的请求,如果队列中有请求,则进行处理,如果没有请求,则休眠,一直没有被唤醒,超过thread_pool_idle_timeout后就自动退出,线程结束。当然,获取请求之前会先检查group中的running线程数是否超过thread_pool_oversubscribe + 1,如果超过也会休眠;
  4. timer线程定期检查各个group是否有阻塞,如果有,就对wokrer线程进行唤醒或者创建一个新的worker线程。

连接管理流程

通过poll监听MySQL端口的连接请求,收到连接后,调用accept接口,创建通信socket初始化thd实例,vio对象等。根据thread_handling方式设置,初始化thd实例的scheduler函数指针,调用scheduler特定的add_connection函数新建连接。scheduler_functions模板和线程池对模板回调函数的实现,是多种连接管理的核心:

struct scheduler_functions                        
{  
uint   max_threads;
uint   *connection_count;                          
ulong *max_connections;                          
bool (*init)(void);                              
bool (*init_new_connection_thread)(void);       
void (*add_connection)(THD *thd);
void (*thd_wait_begin)(THD *thd, int wait_type); 
void (*thd_wait_end)(THD *thd);                  
void (*post_kill_notification)(THD *thd);        
bool (*end_thread)(THD *thd, bool cache_thread);
void (*end)(void);
};
static scheduler_functions tp_scheduler_functions=
{ 
  0, // max_threads
  NULL,
  NULL, 
  tp_init, // init
  NULL, // init_new_connection_thread
  tp_add_connection, // add_connection
  tp_wait_begin, // thd_wait_begin            
  tp_wait_end, // thd_wait_end
  tp_post_kill_notification,  // post_kill_notification 
  NULL,   // end_thread
  tp_end  // end
};

配置参数

使用show variables like 'thread%'命令,可得到所有参数:

  • thread_handling:线程池模型,默认是one-thread-per-connection,即不启用线程池;pool-of-threads,即启用线程池
  • thread_pool_size:线程池group个数,一般设置为当前CPU核心数目。理想情况下,一个group一个活跃的工作线程,达到充分利用CPU的目的
  • thread_pool_max_threads:用来限制线程池最大线程数,超过该限制后将无法再创建更多的线程,默认为100000
  • thread_pool_stall_limit:用于timer线程定期检查group是否停滞异常的时间间隔,默认为500ms
  • thread_pool_idle_timeout:worker线程最大空闲时间,默认为60秒,超出timeout后会退出。保证线程池中的工作线程在满足请求的情况下,保持比较低的水平
  • thread_pool_oversubscribe:该参数用于控制,group中的最大线程数,CPU核心上超频的线程数。这个参数设置值不含listen线程计
  • threadpool_high_prio_mode:表示高优先队列的模式,可选项:
    • transactions:对于已经启动事务的语句放到高优先级队列中,还取决于thread_pool_high_prio_tickets参数
    • statements:所有的语句都会放到高优先级队列中,不会使用到低优先级队列
    • none:不使用高优先级队列
  • thread_pool_high_prio_tickets:控制每个连接最多语序多少次被放入高优先级队列中,默认为4294967295,只有在thread_pool_high_prio_mode为transactions时才有效

关键接口

tp_add_connection:处理新连接

  1. 创建一个connection对象
  2. 根据thread_id%group_count确定connection分配到哪个group
  3. 将connection放进对应group的队列
  4. 如果当前活跃线程数为0,则创建一个工作线程

worker_main:工作线程

  1. 调用get_event获取请求
  2. 如果存在请求,则调用handle_event进行处理
  3. 否则,表示队列中已经没有请求,退出结束

get_event:获取请求

  1. 获取一个连接请求
  2. 如果存在,则立即返回,结束
  3. 若此时group内没有listener,则线程转换为listener线程,阻塞等待
  4. 若存在listener,则将线程加入等待队列头部
  5. 线程休眠指定的时间(thread_pool_idle_timeout)
  6. 如果依然没有被唤醒,是超时,则线程结束,结束退出
  7. 否则,表示队列里有连接请求到来,跳转1

备注:获取连接请求前,会判断当前的活跃线程数是否超过thread_pool_oversubscribe+1,若超过,则将线程进入休眠状态。

handle_event:处理请求

  1. 判断连接是否进行登录验证,若没有,则进行登录验证
  2. 关联thd实例信息
  3. 获取网络数据包,分析请求
  4. 调用do_command函数循环处理请求
  5. 获取thd实例的套接字句柄,判断句柄是否在epoll的监听列表中
  6. 若没有,调用epoll_ctl进行关联
  7. 结束

listener:监听线程

  1. 调用epoll_wait进行对group关联的套接字监听,阻塞等待
  2. 若请求到来,从阻塞中恢复
  3. 根据连接的优先级别,确定是放入普通队列还是优先队列
  4. 判断队列中任务是否为空
  5. 若队列为空,则listener转换为worker线程
  6. 若group内没有活跃线程,则唤醒一个线程

备注:这里epoll_wait监听group内所有连接的套接字,然后将监听到的连接请求push到队列,worker线程从队列中获取任务,然后执行。

timer_thread:监控线程

  1. 若没有listener线程,并且最近没有io_event事件
  2. 则创建一个唤醒或创建一个工作线程
  3. 若group最近一段时间没有处理请求,并且队列里面有请求,则
  4. 表示group已经stall,则唤醒或创建线程
  5. 检查是否有连接超时

备注:timer线程通过调用check_stall判断group是否处于stall状态,通过调用timeout_check检查客户端连接是否超时。

tp_wait_begin:进入等待状态流程

  1. active_thread_count减1,waiting_thread_count加1
  2. 设置connection->waiting= true
  3. 若活跃线程数为0,并且任务队列不为空,或者没有监听线程,则
  4. 唤醒或创建一个线程
  5. tp_wait_end[结束等待状态流程]
    1. 设置connection的waiting状态为false
    2. active_thread_count加1,waiting_thread_count减1

备注:

  1. waiting_threads这个list里面的线程是空闲线程,并非等待线程,所谓空闲线程是随时可以处理任务的线程,而等待线程则是因为等待锁,或等待io操作等无法处理任务的线程。
  2. tp_wait_begin和tp_wait_end的主要作用是由于汇报状态,即使更新active_thread_count和waiting_thread_count的信息。

tp_inittp_end

  1. 分别调用thread_group_init和thread_group_close来初始化和销毁线程池

线程池优化

调度死锁解决

引入线程池可解决多线程高并发的问题,但也带来隐患。假设,A,B两个事务被分配到不同的group中执行,A事务已经开始且持有锁,但由于A所在的group比较繁忙,导致A执行一条语句后,不能立即获得调度执行;而B事务依赖A事务释放锁资源,虽然B事务可以被调度起来,但由于无法获得锁资源,导致仍然需要等待,这就是所谓的调度死锁。由于一个group会同时处理多个连接,但多个连接不是对等的。比如,有的连接是第一次发送请求;而有的连接对应的事务已经开启,并且持有部分锁资源。为了减少锁资源争用,后者显然应该比前者优先处理,以达到尽早释放锁资源的目的。因此在group里面,可以添加一个优先级队列,将已经持有锁的连接,或已经开启的事务的连接发起的请求放入优先队列,工作线程首先从优先队列获取任务执行。

大查询处理

假设一种场景,某个group里面的连接都是大查询,group里面的工作线程数很快就会达到thread_pool_oversubscribe设置值,对于后续的连接请求,则会响应不及时(没有更多的连接来处理),此时group就发生stall。

timer线程会定期检查这种情况,并创建一个新的worker线程来处理请求。如果长查询来源于业务请求,则此时所有group都面临这种问题,此时主机可能会由于负载过大,导致hang住的情况。这种情况线程池本身无能为力,因为源头可能是烂SQL并发,或SQL没有走对执行计划导致,通过其他方法,比如SQL高低水位限流或者SQL过滤手段可以应急处理。

还有另外一种情况,就是dump任务。很多下游依赖于数据库的原始数据,通常通过dump命令将数据拉到下游,而dump任务通常都是耗时比较长,所以也可以认为是大查询。如果dump任务集中在一个group内,并导致其他正常业务请求无法立即响应,这个是不能容忍的,因为此时数据库并没有压力,只是因为采用线程池策略,才导致请求响应不及时,为解决这个问题,将group中处理dump任务的线程不计入thread_pool_oversubscribe累计值,避免上述问题。

参考

  • MariaDB线程池源码分析
  • mariadb 5.5 threadpool 源码分析
  • 全面实用贴
  • 淘宝技术团队-MySQL线程池

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/42307.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

黑苹果之技嘉(GIGABYTE)主板BIOS设置篇

很多童鞋安装黑苹果的时候会卡住&#xff0c;大部分原因是cfg lock 没有关闭&#xff0c;以及USB端口或SATA模式设置错误。 为了避免这些安装阶段报错的情况发生&#xff0c;今天给大家分享一下超详细的BIOS防踩坑设置指南--技嘉&#xff08;GIGABYTE&#xff09;主板BIOS篇&am…

OpenGL官方文档中的入门教程源代码:在3维空间中自由移动

OpenGL官方文档中的入门教程源代码&#xff1a;在3维空间中自由移动项目总览&#xff1a;一、开发前的准备工作1.将以上链接中的三个文件分别放到自己硬盘的一个文件夹中&#xff1a;例如D盘/OpenGL/...2.打开VS2022创建一个项目&#xff0c;右击窗体选择属性3.配置这3个文件的…

SQL Server全套教程(基于SQL语句----预览版)

SQL Server全套教程全程干货1. 数据库的基础操作1.1.0 创建数据库1.1.1 查看及修改数据库1.1.3 分离、附加和删除数据库1.1.4 数据库的备份和还原2.数据库表的相关操作2.1.0 常用数据类型2.1.1 表结构的创建2.1.2 表结构的查看及修改2.1.3 表约束的创建2.1.4 表约束的修改2.1.5…

2013款别克凯越危险警告灯不亮故障诊断方案设计

目 录 一、预约与准备工作 1 &#xff08;一&#xff09;工作描述 1 &#xff08;二&#xff09;预约 1 &#xff08;三&#xff09;准备工作 1 1、分析故障可能原因 1 2、工具、量具准备 1 3、辅料准备 2 二、接车、问诊与制单 2 &#xff08;一&#xff09;接车、问诊 2 &am…

mysql笔记

幻读 概念 一个事务中的两次同样的查询不一致。 解决幻读&#xff1a; RR&#xff1a;使用select ... for update加排他锁 for update的引入是为了幂等性问题&#xff0c;如果不加for update可能出现并发问题。 【参考&#xff1a;MySQL幻读详解及解决方法_学而不思则忘的博…

Word处理控件Aspose.Words功能演示:从 Java 中的 Word 文档中提取图像

图像通常用于表示 Word 文档中的重要信息。在文本旁边包含图像使内容更具吸引力。在某些情况下&#xff0c;您可能需要以编程方式提取嵌入在 Word 文档中的图像。为此&#xff0c;本文介绍了如何使用 Java 从 Word 文档中提取图像。 Aspose.Words for . java 最新下载&#xf…

著名歌唱家大衣哥太豪横了,参加商演被主办方请到五星级酒店就餐

自从农民歌唱家大衣哥&#xff0c;被前好友谷传民起诉后&#xff0c;他的人气不降反升&#xff0c;各种商演邀约也都不断。就在前几天&#xff0c;农民歌唱家大衣哥在商演结束后&#xff0c;被主办方邀请到五星级大酒店&#xff0c;享受了一顿丰盛的晚餐。 作为普通老百姓来说&…

【场景化解决方案】北极星深度集成钉钉PaaS,让OKR管理更加敏捷高效

方案简介 北极星OKR作为一款企业数字化目标管理软件&#xff0c;致力于为企业客户提供专业高效的数字化系统和一站式服务支持&#xff0c;助力企业管理转型升级。如今通过与钉钉的深度融合&#xff0c;在信息的反馈与交互和团队的协作上&#xff0c;营造了更加敏捷的场景&…

leetcode93. 复原 IP 地址

文章目录题目思考代码和注释总结题目 有效 IP 地址 正好由四个整数&#xff08;每个整数位于 0 到 255 之间组成&#xff0c;且不能含有前导 0&#xff09;&#xff0c;整数之间用 ‘.’ 分隔。 例如&#xff1a;“0.1.2.201” 和 “192.168.1.1” 是 有效 IP 地址&#xff0…

Linux——Bash脚本基本用法总结

文章目录基本语法基于语法awk&#xff08;分割命令返回值&#xff09;sed&#xff08;处理行内容&#xff09;融合正则指令条件语句条件判断符1. if2. while额外方法在脚本中使用命令行指令并获取返回值延时打印当前时间基本语法 基于语法 awk&#xff08;分割命令返回值&…

用友YonSuite“数智飞轮”用场景化告别产品与客户间的“翻译”

我们无疑是幸运的。淘宝、美团、掌上银行APP……这些诞生不过10年左右的移动互联网产物&#xff0c;用简单便捷的操作改变了我们千百年来衣食住行的方式。 相对而言&#xff0c;企业多少有点“不幸”。信息化建设虽然已经开展了20余年&#xff0c;但依然没享受到科技的便捷&am…

Java基础-继承

子类继承父类后构造器的特点&#xff1a; 子类中所有的构造器默认都会先访问父类中的无参的构造器&#xff0c;再执行自己。 为什么&#xff1f; 子类在初始化的时候&#xff0c;有可能会使用到父类中的数据&#xff0c;如果父类没有完成初始化&#xff0c;子类将无法使用父类…

一维离散数据的分区均匀采样

原理 原理类似文章点云梯度下采样中提到的梯度下采样。 大致采样思路如下&#xff1a; Step1&#xff1a;计算出每个待采样点 pip_ipi​ 的梯度 GiG_iGi​&#xff0c;并计算节点点云整体的平均梯度作为梯度阈值 GtG_tGt​。 Step2&#xff1a;比较 GiG_iGi​ 与梯度阈值 G…

基于BP神经网络的轨迹跟踪(Matlab代码实现)

&#x1f468;‍&#x1f393;个人主页&#xff1a;研学社的博客 &#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜…

002.组合|||——回溯算法

1.题目链接&#xff1a; 216. 组合总和 III 2.解题思路&#xff1a; 2.1.题目要求&#xff1a; 给一个元素数量k和一个元素和n&#xff0c;要求从范围[1,2,3,4,5,6,7,8,9]中返回所有元素数量为k和元素和为n的组合。&#xff08;每个数字只能使用一次&#xff09; 比如输入k…

大话游戏循环Game Loop——PythonC++

目录 前言 什么是游戏循环&#xff1f; 游戏循环的意义 从结构上来看&#xff1a; 从功能上来看&#xff1a; 正文 一个简单的游戏循环 阻塞游戏循环 现代基础游戏循环 “时间” 固定帧率游戏循环 时间驱动不固定帧率游戏循环 灵活帧率更新 之后的新问题 总结 …

网络基础—网关、网段、子网掩码

接上个笔记&#xff0c;工作时发现看似在一个网段的2个IP地址却ping不通&#xff0c;这里就是子网掩码发挥了作用。 IP地址 首先从最熟悉的IP地址开始介绍&#xff0c;IP地址是唯一标识&#xff0c;由32个0和1构成&#xff0c;长度为32bit&#xff0c;如00001010000000000000…

序列模型之循环神经网络(二)

目录 一.语言模型和序列生成 二.新序列采样 三.带有神经网络的梯度消失 四.GRU单元 一.语言模型和序列生成 上图的例子就是咱们的手机上的语音转文字输入差不多&#xff0c;说一句话&#xff0c;可能有多种可能的句子&#xff0c;那么到底是哪一种呢&#xff0c;咱们的语言…

【EDA365电子论坛】硬件人经历南下、北上,回乡创业,后悔了吗?

南下&#xff1f;北上&#xff1f;留下来&#xff1f;亦或是回乡&#xff1f;这些问题或许是每个电子人都曾遇到过的&#xff0c;如果可以&#xff0c;谁不想留在自己所熟悉的地方呢&#xff0c;但生活&#xff0c;总会让你想要的更多&#xff0c;只能选择再前行一步。 前几天在…

LeetCode题目笔记——2486. 追加字符以获得子序列

文章目录题目描述题目难度——中等方法一&#xff1a;一次遍历代码/C总结这个是上周末的周赛题目&#xff0c;当时忘做了&#xff0c;晚上的时候才想起&#xff0c;可惜了&#xff0c;题目还挺有意思的&#xff0c;类似的好像在以前做过&#xff0c;题目联机在这题目链接 题目…