Percona Toolkit 神器全攻略(性能类)

news2024/12/23 20:43:39

Percona Toolkit 神器全攻略(性能类)

file

Percona Toolkit 神器全攻略系列共八篇,前文回顾:

前文回顾
Percona Toolkit 神器全攻略
Percona Toolkit 神器全攻略(实用类)
Percona Toolkit 神器全攻略(配置类)
Percona Toolkit 神器全攻略(监控类)
Percona Toolkit 神器全攻略(系统类)
Percona Toolkit 神器全攻略(开发类)
Percona Toolkit 神器全攻略(复制类)

全文约定:$为命令提示符、greatsql>为GreatSQL数据库提示符。在后续阅读中,依据此约定进行理解与操作

性能类

在Percona Toolkit中性能类共有以下工具

  • pt-index-usage:分析日志中索引使用情况,并出报告
  • pt-pmp:查询结果跟踪,并汇总跟踪结果
  • pt-table-usage:分析日志中查询并分析表使用情况
  • pt-visual-explain:格式化执行计划
  • pt-mongodb-index-check:MongoDB 索引执行检查
  • pt-mongodb-query-digest:通过聚合来自 MongoDB 查询分析器的查询来报告查询使用统计信息

pt-index-usage

概要

从慢查询日志中读取查询并分析它们如何使用索引

用法

  • pt-index-usage [OPTIONS] [FILES]

选项

该工具所有选项如下

参数含义
--ask-pass连接 MySQL/GreatSQL 提示输入密码
--charset默认字符集
--config读取这个逗号分隔的配置文件列表,如果指定,这必须是命令行上的第一个选项
--create-save-results-database如果--save-results-database不存在,则创建它
--[no]create-views--save-results-database示例查询创建视图
--database用于连接的数据库
--databases仅从此逗号分隔的数据库列表中获取表和索引
--databases-regex仅从数据库中获取名称与此 Perl 正则表达式匹配的表和索引
--defaults-file只从给定文件中读取 MySQL/GreatSQL 选项
--drop建议仅删除这些类型的未使用索引
--empty-save-results-tables删除并重新创建--save-results-database中所有预先存在的表
--help显示帮助
--host连接到主机
--ignore-databases忽略这个以逗号分隔的数据库列表
--ignore-databases-regex忽略名称与此 Perl 正则表达式匹配的数据库
--ignore-tables忽略这个以逗号分隔的表名列表
--ignore-tables-regex忽略名称与 Perl 正则表达式匹配的表
--password连接时使用的密码
--port连接的端口号
--progress将进度报告打印到 STDERR
--quiet不打印任何告警
--[no]report根据-–report-format报告格式打印报告
--report-format报告的格式,目前只有一种:drop_unused_indexes
--save-results-database将结果保存到该数据库中的表中
--set-vars在这个以逗号分隔的variable=value对列表中设置 MySQL/GreatSQL 变量
--socket用于连接的套接字文件
--tables仅从这个以逗号分隔的表列表中获取索引
--tables-regex仅从名称与此 Perl 正则表达式匹配的表中获取索引
--user登录的用户
--version显示版本
--[no]version-check版本检查

最佳实践

$ pt-index-usage /data/GreatSQL/slow.log --host='localhost' --user='root' --ask-pass
ALTER TABLE `tpch`.`lineitem` DROP KEY `lineitem_fk1`, DROP KEY `lineitem_fk2`; -- type:non-unique

该工具连接到GreatSQL数据库服务器,读取查询日志,并使用EXPLAIN询问GreatSQL将如何使用每个查询。当完成时,打印出一个关于查询没有使用的索引

也可以将打印出来的结果存入到数据库当中

$ pt-index-usage /data/GreatSQL/slow.log --no-report --save-results-database h=127.0.0.1,P=3306,u=root,p=,D=test_db

进入到数据库中就可以看到自动创建了四张表

greatsql> show tables;
+--------------------+
| Tables_in_test_db  |
+--------------------+
| index_alternatives |
| index_usage        |
| indexes            |
| tables             |
+--------------------+
4 rows in set (0.01 sec)
  • index_alternatives:此表记录了索引的替代方案。它包含了关于哪些索引可以替代其他索引的信息。

  • index_usage:这张表跟踪了索引的使用情况。它记录了哪些索引被查询使用,以及它们的效率和性能。

  • indexes:此表包含了数据库中所有表的索引信息。它记录了每个表的索引名称、列、类型等。

  • tables:这张表记录了数据库中的所有表。它包含了表的名称、行数、大小等信息。

额外补充

在MySQL/GreatSQL 5.7版本中,sys schema提供了以下几张表,有助于分析数据库索引使用情况

  • schema_index_statistics:此表显示有关索引的统计信息,包括索引的大小、行数、唯一性和其他相关指标。它对于优化查询和了解索引的使用情况非常有用
  • schema_redundant_indexes:这个表显示重复索引或被其他索引替代的索引。具体来说,它列出了哪些索引是多余的,以及哪些索引是主导索引(使多余索引变得多余)
  • schema_unused_indexes:这个表显示那些没有被使用的索引。如果某个索引长时间没有被查询,就可能是多余的。通过检查这个表,您可以找到可以删除或优化的未使用索引

在MySQL/GreatSQL 8.0版本中,也有几张表关于索引的

  • INFORMATION_SCHEMA.INNODB_INDEXES 表提供有关 InnoDB 索引的元数据
  • INFORMATION_SCHEMA.INDEX_STATISTICS 表提供了索引统计信息

pt-pmp

概要

查询结果跟踪,并汇总跟踪结果。获取进程的堆栈信息,并且对这些结果进行汇总

进程的堆栈信息是通过gdb获取的,所以在获取过程中,会对数据库的性能有一定的影响

用法

  • pt-pmp [OPTIONS] [FILES]

选项

该工具所有选项如下

参数含义
--binary要跟踪哪个二进制文件
--help显示帮助
--interval--iterations之间休眠的秒数
--iterations要收集和聚合的跟踪数
--lines仅聚合许多函数的第一个指定数量,默认值是0也就是无穷大
--pid要跟踪的进程的进程 ID
--save-samples聚合后将原始跟踪保留在此文件中
--version显示版本

最佳实践

根据进程名汇总堆栈信息
$ pt-pmp --binary mysqld
#......输出太长不展示

使用该工具需要安装gdb,否则报错 “gdb: command not found”

汇总pstack获取的结果
$ ps -ef |grep mysqld
mysql      29297       1  0 Apr24 ?        00:18:07 /usr/local/GreatSQL-8.0.32-25-Linux-glibc2.28-x86_64/bin/mysqld --defaults-group-suffix=@mgr01

$ pstack 29297 > /tmp/29297.info
$ pt-pmp /tmp/29297.info
#......输出太长不展示

pt-table-usage

概要

分析日志中查询并分析表使用情况通。过读取日志(例如:慢查询日志)中的查询语句,然后分析语句是如何使用表的,即:表之间的数据流向

用法

  • pt-table-usage [OPTIONS] [FILES]

选项

参数含义
--ask-pass连接MySQL/GreatSQL提示输入密码
--charset默认字符集
--config读取这个逗号分隔的配置文件列表,如果指定,这必须是命令行上的第一个选项
--constant-data-value作为常量数据(文字)源打印的表
--[no]continue-on-error出错时跳过错误继续运行
--create-table-definitions从此逗号分隔文件列表中读取CREATE TABLE定义
--daemonize后台运行
--database数据库名
--defaults-file只从给定文件中读取 MySQL/GreatSQL 选项
--explain-extended执行 EXPLAIN EXTENDED 查询的服务器
--filter丢弃此 Perl 代码不返回 true 的事件
--help显示帮助
--host连接到主机
--id-attribute使用此属性标识每个事件
--log后台运行时将所有输出打印到此文件
--password连接时使用的密码
--pid创建给定的 PID 文件
--port用于连接的端口号
--progress将进度报告打印到 STDERR
--query分析指定的查询,而不是读取日志文件
--read-timeout设置等待输入中的事件时间,默认为0即永远等待
--run-time运行时间,默认永远运行
--set-vars以逗号分隔的variable=value对列表中设置 MySQL/GreatSQL 变量
--socket用于连接的套接字文件
--user登录的用户
--version显示版本

最佳实践

分析语句结构
$ pt-table-usage --query="SELECT * FROM t1 INNER JOIN t2 ON t1.id = t2.id WHERE t1.code = 2;"
Query_id: 0xB11D21EDB7630E7E.1
SELECT t1
SELECT t2
JOIN t1
JOIN t2
WHERE t1

个人觉得比较鸡肋,还不如使用Explain

分析慢查询日志
$ pt-table-usage /data/GreatSQL/slow.log

Query_id: 0x98947CCF9160CAC9.1
SELECT information_schema.ROUTINES
WHERE information_schema.ROUTINES

Query_id: 0x459C4D56E071E4D7.1
SELECT performance_schema.threads
SELECT performance_schema.table_handles
JOIN performance_schema.table_handles
JOIN performance_schema.threads
  • Query_id:查询的ID
  • SELECT:从表中获取数据
  • JOIN:已连接的表
  • WHERE:用于过滤结果的表
  • TLIST:查询语句中访问的表,通常是产生笛卡尔积

pt-visual-explain

概要

用于格式化 MySQL/GreatSQL 执行计划

用法

  • pt-visual-explain [OPTIONS] [FILES]

选项

参数含义
--ask-pass连接MySQL/GreatSQL提示输入密码
--charset默认字符集
--clustered-pk假设 PRIMARY KEY 索引访问不需要对 检索行
--config读取这个逗号分隔的配置文件列表,如果指定,这必须是命令行上的第一个选项
--connect将输入视为查询,并通过连接到数据库实例并对查询运行 EXPLAIN 来获取输出
--databases数据库列表
--defaults-file只从给定文件中读取 MySQL/GreatSQL 选项
--format设置输出格式,有两种格式(tree、dump)默认为tree
--help显示帮助
--host连接到主机
--password连接时使用的密码
--pid创建给定的 PID 文件
--port用于连接的端口号
--set-vars以逗号分隔的variable=value 对列表中设置 MySQL/GreatSQL 变量
--socket用于连接的套接字文件
--user用于登录的用户
--version显示版本

最佳实践

直接使用即可

$ mysql -uroot -p -e "explain select * from test_db.test_t1" |pt-visual-explain --clustered-pk
Table scan
rows           9
+- Table
   table          test_t1

此时会输出该语句格式化后的执行计划

pt-visual-explain的信息有限,如果想获得更多详细信息,最好还是进入数据库查看执行计划


Enjoy GreatSQL :)

关于 GreatSQL

GreatSQL是适用于金融级应用的国内自主开源数据库,具备高性能、高可靠、高易用性、高安全等多个核心特性,可以作为MySQL或Percona Server的可选替换,用于线上生产环境,且完全免费并兼容MySQL或Percona Server。

相关链接: GreatSQL社区 Gitee GitHub Bilibili

GreatSQL社区:

image

社区有奖建议反馈: https://greatsql.cn/thread-54-1-1.html

社区博客有奖征稿详情: https://greatsql.cn/thread-100-1-1.html

(对文章有疑问或者有独到见解都可以去社区官网提出或分享哦~)

技术交流群:

微信&QQ群:

QQ群:533341697

微信群:添加GreatSQL社区助手(微信号:wanlidbc )好友,待社区助手拉您进群。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2130810.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

STM32+FATFS+SD卡+RTC(生成.CSV格式文件)

一、简介 实验目的:在SD卡上挂载文件系统,实时记录压力传感器采集到的数据;且在表格第一排记录采集时间; 因为前面文章包含了除RTC之外的所有的代码,此文章只放RTC代码。 二、工程源码 RTC.c #include "sys.h…

人工智能|集成学习——混合专家模型 (MoE)

随着 Mixtral 8x7B (announcement, model card) 的推出,一种称为混合专家模型 (Mixed Expert Models,简称 MoEs) 的 Transformer 模型在开源人工智能社区引起了广泛关注。在本篇博文中,我们将深入探讨 MoEs 的核心组件、训练方法,…

arcgisPro绘制平行线、垂直线段

1、绘制一条线 2、点击【创建要素】按钮,选择线,点一个点后,将鼠标移至需要对其的线上,并右击,选择【平行】 3、移动一段距离后,完成绘制,可得到一条平行线 4、得到平行线 5、绘制垂直线&#x…

一文读懂:区块链的原理、技术、应用领域

引言 在当今数字化时代,区块链技术已经成为全球范围内备受瞩目的话题。从金融到供应链,从物联网到数字身份,区块链正在以惊人的速度渗透到各个行业,并在重塑着我们的社会和经济格局。 区块链最初因其作为比特币背后技术的而引起…

OrionX vGPU研发测试场景下最佳实践之SSH模式

开发机场景概述 目前很多企业在做AI开发的场景时,对GPU资源的管理都是非常简单粗暴的。他们大多都是以开发小组为管理单位、由运维以台为单位分配给开发工程师使用。而在AI开发中涉及开发的场景和测试的场景,很多是将开发测试甚至训练任务都放在一起来使…

<<编码>> 第 11 章 逻辑门电路--门电路 示例电路

作为门电路的继电器开关电路 info::操作说明 鼠标单击开关切换开合状态 primary::在线交互操作链接 https://cc.xiaogd.net/?startCircuitLinkhttps://book.xiaogd.net/code-hlchs-examples/assets/circuit/code-hlchs-ch11-06-relay-as-gate.txt 作为反相器的继电器开关电路 …

EPON光模块介绍

EPON光模块在依靠光纤网络实现快速可靠的数据传输、增强带宽能力和提高网络效率的过程中发挥着至关重要的作用。在这篇文章中,我们将深入研究EPON光模块的基本概念、各种类型、优点和局限性,全面了解它们在现代电信中的重要性。 EPON光模块的定义 EPON…

ZYNQ 入门笔记(二):动态时钟

文章目录 1 概述1.1 DRP1.2 AXI4-Lite 2 示例2.1 单时钟输出2.2 多时钟输出 3 参考文档 1 概述 Clocking Wizard 可通过配置内部寄存器动态调整输出频率,配置接口可选 DRP 或 AXI4-Lite,其中 AXI4-Lite 实际上是对 DRP 接口的封装 1.1 DRP 通过 DRP 接…

Python文件操作:上下文管理器(with语句)②

文章目录 1. 上下文管理器概述1.1 什么是上下文管理器?1.2 为什么使用上下文管理器?1.3 with语句的基本语法 2. 文件操作中的上下文管理器2.1 使用with语句打开文件2.2 读取文件2.2.1 读取整个文件内容2.2.2 逐行读取文件 2.3 写入文件2.3.1 覆盖写入2.3…

JavaWeb使用web.xml配置Servlet路径映射的相关操作以及易错问题分析与解决

前言 我们在使用Servlet创建JavaWeb项目时,想要绑定url路径和Servlet的映射关系,需要在web.xml中配置映射关系。Servlet从2.5版本开始支持注解。具体来说,Servlet 2.5引入了注解配置方式,使得Servlet应用程序的配置更加简单、灵活…

文档智能:OCR+Rocketqa+layoutxlm

此次先记录LayoutLMv2,梳理相关论文,记录如下: 首先认识一下 visually-rich document understanding tasks → \to → VrDU 其次,the text fields of interest,与图像识别的感兴趣区域 region of Interest 类似&…

MySQL数据的增删改查(一)

目录 新增(create) 插入单条记录 插入多条记录 查询(retrieve) 查询所有列 查询特定列 查询字段为表达式 别名 去重 排序 按单列排序 按多列排序 使用表达式或别名排序 排序NULL值 条件查询 比较运算符 逻辑运算…

双向dfs,多次dfs

前言&#xff1a;这个答案给我们提供了一种多次dfs的思路&#xff0c;记录queue的size&#xff0c;每次只取size个&#xff0c;就刚刚好只处理了上一次的‘ 题目地址 #include<bits/stdc.h> using namespace std;//定义队列节点 struct node {int x,y; }rear,front; //Q[…

Leetcode面试经典150题-350.两个数组的交集II

题目比较简单&#xff0c;散散心吧 这个题竟然是349更简单的版本&#xff0c;可以先看看349题的解法&#xff1a; Leetcode面试经典150题-349.两个数组的交集-CSDN博客 349会了&#xff0c;这个也就会了 解法都在代码里&#xff0c;不懂就留言或者私信 class Solution {/…

C51单片机矩阵键盘输入数码管静态显示

【实验目的】 学会矩阵键盘的检测&#xff0c;掌握数码管静态显示原理。 【实验现象】 依次按下4*4矩阵键盘上从第1到第20个键&#xff0c;同时在六位数码管上依次显示0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F。 【实验说明】 本开发板上数码管为共阴极。静态数码管显示…

R与机器学习系列|15.可解释的机器学习算法(Interpretable Machine Learning)(下)

今天我们介绍可解释机器学习算法的最后一部分&#xff0c;基于XGBoost算法的SHAP值可视化。关于SHAP值其实我们之前的很多个推文中都介绍到&#xff0c;不论是R版本的还是Python版本的&#xff0c;亦不论是普通的分类问题还是生存数据模型的。在此推文中我们将基于XGBoost模型理…

付费进群付费入群流量掘金入群系统九牧云版源码系统搭建

适用于各类资源类付费进群领取&#xff0c;私域类项目经营等 简洁大气直观。流量掘金类必备。 前端展示视频&#xff1a; https://pan.baidu.com/s/1lqyGCOrfmE4LDXb1cm-eDQ?pwdvnk6 https://yun.ktbf.xyz/s/by6jIzghpb 大致功能&#xff1a; 支持域名防红模式 支持对接…

QT+OSG+OSG-earth如何在窗口显示一个地球

1、环境配置 系统&#xff1a;windows10系统 QT:版本5.15.2 编译器&#xff1a;MSVC2019_64bit 编辑器&#xff1a;QT Creator OSG版本&#xff1a;3.7.0 64位 为MSVC环境下编译 osgQt:为第三方编译的库&#xff0c;OSG因为版本不同已经不提供osgQt的…

【一文就懂】计算机视觉期刊和会议缩写

下面IEEE相关的期刊及其缩写&#xff0c;并重新整理为期刊和会议两个部分。 期刊缩写 期刊全称缩写IEEE Transactions on Pattern Analysis and Machine IntelligenceIEEE Trans. Pattern Anal. Mach. Intell.IEEE Transactions on Image ProcessingIEEE Trans. Image Proce…

用于大数据分析的数据存储格式:Parquet、Avro 和 ORC 的性能和成本影响

高效的数据处理对于依赖大数据分析做出明智决策的企业和组织至关重要。显著影响数据处理性能的一个关键因素是数据的存储格式。本文探讨了不同存储格式&#xff08;特别是 Parquet、Avro 和 ORC&#xff09;对 Google Cloud Platform &#xff08;GCP&#xff09; 上大数据环境…