MHA高可用实验(故障模拟+恢复)

news2024/12/27 10:55:30

实验前准备
MHA manager节点服务器:192.168.188.13    MHA node和manager组件
Master节点服务器:192.168.188.14     mysql5.7、MHA node组件
Slave节点服务器1:192.168.188.15     mysql5.7、MHA node组件
Slave节点服务器2:192.168.188.16     mysql5.7、MHA node组件
全都关闭防火墙
systemctl stop firewalld
setenforce 0

  1. Master、Slave1、Slave2服务器上安装mysql
  2. 修改Master、Slave1、Slave2节点服务器上的MySQL主配置文件
    1. Master节点
      vim /etc/my.cnf
      主要是在服务器中做如下设置

      重启服务
      systemctl restart mysqld
    2. Slave1节点
      vim /etc/my.cnf
      主要是在服务器中做如下设置

      重启服务
      systemctl restart mysqld
    3. Slave2节点
      vim /etc/my.cnf
      主要是在服务器中做如下设置


      重启服务
      systemctl restart mysqld
    4. 在三个节点上创建软链接,方便后续使用
      ln -s /usr/local/mysql/bin/mysql /usr/sbin/
      ln -s /usr/local/mysql/bin/mysqlbinlog /usr/sbin/
  3. 配置mysql一主两从
    1. 先在三台服务器上进行mysql授权,这一步三台服务器的操作相同,如下
      mysql -uroot -p
      grant replication slave on *.* to 'myslave'@'192.168.188.%' identified by '123456';
      grant all privileges on *.* to 'mha'@'192.168.188.%' identified by 'manager';
      flush privileges;

    2. 在master节点查看二进制文件和偏移量
      show master status;

      记好这两个值

    3. 在Slave1节点和Slave2节点执行同步操作
      change master to
      master_host='192.168.188.16',
      master_user='myslave',master_password='123456',
      master_log_file='master-bin.000001',
      master_log_pos=1047;


      检查一下
      show slave status\G
      如果下面这两个显示Yes就说明没问题
    4. 另外Slave1和Slave2必须设置成只读模式
      set global read_only=1;
    5. 测试一下有没有问题
      在Master上的数据库中新建数据
      create database test_db;
      use db_test;
      create table test(id int);
      insert into test(id) values (1);

      在Slave1和Slave2上的数据库中查询
      select * from db_test.test;
      能看到插入的数据,说明没问题

  4. 安装MHA
    1. 在所有服务器(四台)上安装MHA依赖环境
      先安装epel源
      yum -y install epel-release --nogpgcheck
      yum install -y perl-DBD-MySQL \
      perl-Config-Tiny \
      perl-Log-Dispatch \
      perl-Parallel-ForkManager \
      perl-ExtUtils-CBuilder \
      perl-ExtUtils-MakeMaker \
      perl-CPAN
    2. 在所有服务器(四台)上安装node组件,每个操作系统版本不一样,我用的CentOS7.6,选择的版本是0.57版本
      cd /opt
      tar zxvf mha4mysql-node-0.57.tar.gz
      cd mha4mysql-node-0.57
      perl Makefile.PL
      make && make install
    3. 在MHA Manager服务器上安装manager组件
      cd /opt
      tar zxvf mha4mysql-manager-0.57.tar.gz
      cd mha4mysql-manager-0.57
      perl Makefile.PL
      make && make install
  5. 在所有服务器上配置互信
    1. Manager服务器上配置和三台数据库节点服务器的互信:
      ssh-keygen -t rsa,一直回车就行,密码也空着
      ssh-copy-id 192.168.188.14,需要输入192.168.188.14的root密码
      ssh-copy-id 192.168.188.15,也要root密码
      ssh-copy-id 192.168.188.16,也要root密码
    2. Master节点上配置和Slave1、Slave2节点的互信:
      ssh-keygen -t rsa
      ssh-copy-id 192.168.188.15
      ssh-copy-id 192.168.188.16
    3. Slave1节点上配置和Master、Slave2节点的互信:
      ssh-keygen -t rsa
      ssh-copy-id 192.168.188.14
      ssh-copy-id 192.168.188.16
    4. Slave2节点上配置和Master、Slave1节点的互信:
      ssh-keygen -t rsa
      ssh-copy-id 192.168.188.14
      ssh-copy-id 192.168.188.15
  6. 在Manager服务器上配置MHA
    1. 拷贝一份manager的脚本到指定目录
      cp -rp /opt/mha4mysql-manager-0.57/samples/scripts /usr/local/bin


      拷贝后的四份文件作用如下:
      master_ip_failover:自动切换时VIP的管理脚本
      master_ip_online_change:在线切换时VIP的管理脚本
      power_manager:故障发生后关闭主机的脚本
      send_report:因故障切换后发送报警的脚本
    2. 复制自动切换时的脚本到/usr/local/bin目录,本实验将使用master_ip_failover脚本来管理VIP和故障切换
      cp /usr/local/bin/scripts/master_ip_failover /usr/local/bin/
    3. 修改一下这个脚本
      vim /usr/local/bin/master_ip_failover
      建议直接删光原本的配置然后复制以下内容,记得把VIP地址和VIP广播地址改成自己的:
      #!/usr/bin/env perl
      use strict;
      use warnings FATAL => 'all';
      
      use Getopt::Long;
      
      my
      $command, $ssh_user, $orig_master_host, $orig_master_ip,
      $orig_master_port, $new_master_host, $new_master_ip, $new_master_port
      );
      #############################添加内容部分#########################################
      my $vip = '192.168.188.188'; #指定vip的地址
      my $brdc = '192.168.188.255'; #指定vip的广播地址
      my $ifdev = 'ens33'; #指定vip绑定的网卡
      my $key = '1'; #指定vip绑定的虚拟网卡序列号
      my $ssh_start_vip = "/sbin/ifconfig ens33:$key $vip"; #代表此变量值为ifconfig ens33:1 192.168.188.188
      my $ssh_stop_vip = "/sbin/ifconfig ens33:$key down"; #代表此变量值为ifconfig ens33:1 192.168.188.188 down
      my $exit_code = 0; #指定退出状态码为0
      #my $ssh_start_vip = "/usr/sbin/ip addr add $vip/24 brd $brdc dev $ifdev label $ifdev:$key;/usr/sbin/arping -q -A -c 1 -I $ifdev $vip;iptables -F;";
      #my $ssh_stop_vip = "/usr/sbin/ip addr del $vip/24 dev $ifdev label $ifdev:$key";
      ##################################################################################
      GetOptions(
      'command=s' => \$command,
      'ssh_user=s' => \$ssh_user,
      'orig_master_host=s' => \$orig_master_host,
      'orig_master_ip=s' => \$orig_master_ip,
      'orig_master_port=i' => \$orig_master_port,
      'new_master_host=s' => \$new_master_host,
      'new_master_ip=s' => \$new_master_ip,
      'new_master_port=i' => \$new_master_port,
      );
      
      exit &main();
      
      sub main {
      
      print "\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n";
      
      if ( $command eq "stop" || $command eq "stopssh" ) {
      
      my $exit_code = 1;
      eval {
      print "Disabling the VIP on old master: $orig_master_host \n";
      &stop_vip();
      $exit_code = 0;
      };
      if ($@) {
      warn "Got Error: $@\n";
      exit $exit_code;
      }
      exit $exit_code;
      }
      elsif ( $command eq "start" ) {
      
      my $exit_code = 10;
      eval {
      print "Enabling the VIP - $vip on the new master - $new_master_host \n";
      &start_vip();
      $exit_code = 0;
      };
      if ($@) {
      warn $@;
      exit $exit_code;
      }
      exit $exit_code;
      }
      elsif ( $command eq "status" ) {
      print "Checking the Status of the script.. OK \n";
      exit 0;
      }
      else {
      &usage();
      exit 1;
      }
      }
      sub start_vip() {
      `ssh $ssh_user\@$new_master_host \" $ssh_start_vip \"`;
      }
      ## A simple system call that disable the VIP on the old_master
      sub stop_vip() {
      `ssh $ssh_user\@$orig_master_host \" $ssh_stop_vip \"`;
      }
      
      sub usage {
      print
      "Usage: master_ip_failover --command=start|stop|stopssh|status --orig_master_host=host --orig_master_ip=ip --orig_master_port=port --new_master_host=host --new_master_ip=ip --new_master_port=port\n";
      }

      记得把VIP地址和VIP广播地址改成自己的
    4. 创建MHA软件目录
      mkdir /etc/masterha
      拷贝一份配置文件过来,本实验使用app1.cnf配置文件来管理MySQL节点服务器
      cp /opt/mha4mysql-manager-0.57/samples/conf/app1.cnf /etc/masterha/
      修改配置文件
      vim /etc/masterha/app1.cnf
      依然建议删光原本内容直接复制以下内容:
      [server default]
      manager_log=/var/log/masterha/app1/manager.log
      manager_workdir=/var/log/masterha/app1
      master_binlog_dir=/usr/local/mysql/data
      master_ip_failover_script=/usr/local/bin/master_ip_failover
      master_ip_online_change_script=/usr/local/bin/master_ip_online_change
      password=manager
      ping_interval=1
      remote_workdir=/tmp
      repl_password=123456
      repl_user=myslave
      secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.188.15 -s 192.168.188.16
      shutdown_script=""
      ssh_user=root
      user=mha
      
      [server1]
      hostname=192.168.188.14
      port=3306
      
      [server2]
      candidate_master=1
      check_repl_delay=0
      hostname=192.168.188.15
      port=3306
      
      [server3]
      hostname=192.168.188.16
      port=3306

      有一些地方可能需要改的我已经标在了下面的图中
      每个设置具体的解释如下:
       
      [server default]
      manager_log=/var/log/masterha/app1/manager.log #manager日志
      manager_workdir=/var/log/masterha/app1            #manager工作目录
      master_binlog_dir=/usr/local/mysql/data/ #master保存binlog的位置,这里的路径要与master里配置的binlog的路径一致,以便MHA能找到
      master_ip_failover_script=/usr/local/bin/master_ip_failover #设置自动failover时候的切换脚本,也就是上面的那个脚本
      master_ip_online_change_script=/usr/local/bin/master_ip_online_change #设置手动切换时候的切换脚本
      password=manager #设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码
      ping_interval=1 #设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行failover
      remote_workdir=/tmp #设置远端mysql在发生切换时binlog的保存位置
      repl_password=123456     #设置复制用户的密码
      repl_user=myslave #设置复制用户的用户
      report_script=/usr/local/send_report #设置发生切换后发送的报警的脚本
      secondary_check_script=/usr/local/bin/masterha_secondary_check -s 192.168.188.15 -s 192.168.188.16 #指定检查的从服务器IP地址
      shutdown_script="" #设置故障发生后关闭故障主机脚本(该脚本的主要作用是关闭主机防止发生脑裂,这里没有使用)
      ssh_user=root #设置ssh的登录用户名
      user=mha #设置监控用户root
      
      [server1]
      hostname=192.168.188.14
      port=3306
      
      [server2]
      hostname=192.168.188.15
      port=3306
      candidate_master=1
      #设置为候选master,设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个从库不是集群中最新的slave
      
      check_repl_delay=0
      #默认情况下如果一个slave落后master 超过100M的relay logs的话,MHA将不会选择该slave作为一个新的master, 因为对于这个slave的恢复需要花费很长时间;通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
      
      [server3]
      hostname=192.168.188.16
      port=3306
    5. 第一次配置时需要在Master节点上手动开启VIP
      /sbin/ifconfig ens33:1 192.168.188.188/24
  7. 中间测试
    1. 在manager服务器上测试一下能不能用ssh免认证登录
      masterha_check_ssh -conf=/etc/masterha/app1.cnf
      如下没有报错就没问题
    2. 在manager服务器上测试一下mysql主从连接的情况
      masterha_check_repl -conf=/etc/masterha/app1.cnf
      不管中间出现了什么,最后能看到is OK就说明没问题,如果出现is not OK,那就是没好,慢慢改去吧
    3. 在manager服务器上启动MHA
      丢后台就行
      nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 &

      参数解释如下:
      --remove_dead_master_conf:该参数代表当发生主从切换后,老的主库的 ip 将会从配置文件中移除。
      --manger_log:日志存放位置。
      --ignore_last_failover:在缺省情况下,如果 MHA 检测到连续发生宕机,且两次宕机间隔不足 8 小时的话,则不会进行 Failover, 之所以这样限制是为了避免 ping-pong 效应。该参数代表忽略上次 MHA 触发切换产生的文件,默认情况下,MHA 发生切换后会在日志记录,也就是上面设置的日志app1.failover.complete文件,下次再次切换的时候如果发现该目录下存在该文件将不允许触发切换,除非在第一次切换后收到删除该文件,为了方便,这里设置为--ignore_last_failover。

      查看MHA状态
      masterha_check_status --conf=/etc/masterha/app1.cnf
      当前看到的是master说明没问题

      查看MHA日志
      cat /var/log/masterha/app1/manager.log | grep "current master"
      也可以看到当前的服务器是master节点

      去master服务器查看VIP地址存不存在
      ifconfig

      如果要关闭manager服务,用这个命令
      masterha_stop --conf=/etc/masterha/app1.cnf
  8. 故障模拟(上一步关闭了manager记得打开)
    1. 在manager节点上监视日志(动态查看)
      tail -f /var/log/masterha/app1/manager.log
    2. 在master节点上停止MySQL服务,模拟单点故障
      systemctl stop mysqld
      先观察一下Slave1有没有继承VIP
      ifconfig

      再看一下manager上的日志
      太多了,就看最后一段,能看到旧的master(14)断开后,经过选举产生了新的master(15),说明没问题

      故障切换备选主库的算法:
      1.一般判断从库的是从(position/GTID)判断优劣,数据有差异,最接近于master的slave,成为备选主。
      2.数据一致的情况下,按照配置文件顺序,选择备选主库。
      3.设定有权重(candidate_master=1),按照权重强制指定备选主。
      (1)默认情况下如果一个slave落后master 100M的relay logs的话,即使有权重,也会失效。
      (2)如果check_repl_delay=0的话,即使落后很多日志,也强制选择其为备选主。
  9. 故障修复
    1. 首先要先修好原master节点上的数据库服务,我们是直接关闭了服务,现在启动就行了
      systemctl restart mysqld
    2. 修复主从关系
      在现在的master节点也就是原Slave1节点上查看二进制文件和同步点
      show master status;


      在原master节点执行同步操作
      change master to
      master_host='192.168.188.15',
      master_user='myslave',
      master_password='123456',
      master_log_file='master-bin.000001',
      master_log_pos=895;

      别忘了开启节点
      start slave;
    3. 在manager服务器上修改配置文件
      vi /etc/masterha/app1.cnf
      打开后能发现原来的server1也就是原master不见了,是因为server1失效后这个节点会被直接删除掉


      现在我们把这个节点添加回去
    4. 在manager服务器上启动MHA
       
      nohup masterha_manager --conf=/etc/masterha/app1.cnf --remove_dead_master_conf --ignore_last_failover < /dev/null > /var/log/masterha/app1/manager.log 2>&1 &
    5. 再查看一下节点情况
      masterha_check_status --conf=/etc/masterha/app1.cnf
      MHA并没有抢占和非抢占的说法,即使原来的master节点恢复了,它也只能是一个Slave节点了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1310548.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp x 相比于其他的开发系统框架怎么样?

首先我们要知道niapp这是一种基于Vue.js开发的跨平台应用框架&#xff0c;可以将同一套代码同时运行在多个平台上&#xff0c;包括iOS、Android、H5等。相比其他开发系统框架&#xff0c;他有什么优点呢&#xff1f;让我们共同探讨一下吧&#xff01; 图片来源&#xff1a;unia…

python每日学10:关于python实用版本的选择

用python也有好几年了&#xff0c;也会经常安装python&#xff0c;因为有工作需要&#xff0c;可能在各个地方使用python&#xff0c;自己的电脑也经常重装&#xff0c;重装后会装python&#xff0c;还有的时候&#xff0c;装的包太多了&#xff0c;影响整个环境的使用&#xf…

Meta 开启 Ray-Ban人工智能眼镜多模态 AI 功能测试,可识别物体、翻译语言

Meta 公司宣布他们将向部分用户推送其 Meta Ray-Ban 智能眼镜的多模态 AI 功能。这项功能允许 AI 助手通过眼镜的摄像头和麦克风了解佩戴者所看到和听到的事物&#xff0c;并提供相关信息和帮助。 Meta CEO 马克・扎克伯格在 Instagram 上展示了这项功能&#xff0c;他让眼镜推…

【WSL】Windows下的Linux子系统使用方法指南

▒ 目录 ▒ &#x1f6eb; 导读需求开发环境 1️⃣ WSL安装启用或关闭windows功能安装分发命令行启动Linux 2️⃣ WSL 的基本命令显示帮助列出可用的 Linux 发行版列出已安装的 Linux 发行版检查 WSL 版本更新 WSL通过 PowerShell 或 CMD 运行特定的 Linux 发行版关闭WSL全部服…

Amazon SageMaker:让机器学习变得更简单、更强大

授权说明&#xff1a;本篇文章授权活动官方亚马逊云科技文章转发、改写权&#xff0c;包括不限于在 亚马逊云科技开发者社区, 知乎&#xff0c;自媒体平台&#xff0c;第三方开发者媒体等亚马逊云科技官方渠道。 前言&#xff1a; 在大数据时代的浪潮中&#xff0c;数据不再只…

期末数组函数加强练习

前言&#xff1a;由于时间问题&#xff0c;部分题解取自网友&#xff0c;但都是做过的好题。 对于有些用c实现的题目&#xff0c;可以转化成c实现&#xff0c;cin看成c的读入&#xff0c;可以用scanf&#xff0c;输出cout看作printf&#xff0c;endl即换行符 开胃菜&#xff…

多项创新技术加持,汉威科技危化品企业、化工园区两大智能化管控平台重磅发布

化工产业是我国支柱产业&#xff0c;化学品产值约占全球的40%&#xff0c;位列第一。石油化工、煤化工、化肥、制药、冶金、氢能源等产业持续升级迭代&#xff0c;化工园区作为重要载体&#xff0c;不断推动产业朝专业化、集约化方向发展。 近年来我国危险化学品领域重特大事故…

动手学深度学习-注意力机制

10.1注意力提示 自主性注意力机制 有意识的注意力机制。非自主性注意力机制 无意识的注意力机制。 小结: 人类的注意力是有限的&#xff0c;有价值和稀缺的资源。受试者使用非自主性和自主性提示有选择的引导注意力&#xff0c;前者基于突出性&#xff0c;后者则依赖于意识。…

【Spring教程28】Spring框架实战:从零开始学习SpringMVC 之 请求与请求参数详解

目录 1 设置请求映射路径1.1 环境准备 1.2 问题分析1.3 设置映射路径 2 请求参数2.1 环境准备2.2 参数传递2.2.1 GET发送单个参数2.2.2 GET发送多个参数2.2.3 GET请求中文乱码2.2.4 POST发送参数2.2.5 POST请求中文乱码 欢迎大家回到《Java教程之Spring30天快速入门》&#xff…

【操作系统导论】内存篇——分段

引入 利用基址和界限寄存器&#xff0c;操作系统很容易将不同进程重定位到不同的物理内存区域。 但是&#xff0c;对于一整个地址空间&#xff0c;在栈和堆之间存在一块空闲空间&#xff0c;如果将整个地址空间分配给进程&#xff0c;无疑造成了大量的内存浪费。 为了解决这…

软件测试面试八股文(答案解析+视频教程)

1、B/S架构和C/S架构区别 B/S 只需要有操作系统和浏览器就行&#xff0c;可以实现跨平台&#xff0c;客户端零维护&#xff0c;维护成本低&#xff0c;但是个性化能力低&#xff0c;响应速度较慢。 C/S响应速度快&#xff0c;安全性强&#xff0c;一般应用于局域网中&#xf…

场景化文案怎么来的?媒介盒子拆解写作技巧

为什么有时候你的软文营销起不到作用、用户不买单&#xff1f;可能是引起你没有做好场景提醒&#xff0c;没有切中用户的切身利益点。今天媒介盒子就来和大家聊聊&#xff1a;场景化文案怎么写。 一、 场景文案核心点 在了解场景化文案的写作技巧前&#xff0c;咱们先来理清场…

如何将3dMax重置为默认的“出厂”设置?

如何将3dMax重置为“出厂”设置&#xff1f; 我们在使用3dMax软件时&#xff0c;有时会遇到一些问题&#xff0c;比如&#xff1a;启动时或使用程序内的特定功能时崩溃&#xff1b;3dMax界面显示问题&#xff1b;视口操纵缓慢或不稳定&#xff1b;键盘快捷方式丢失&#xff1b;…

Re9 Attention is all you need

变形金刚&#xff0c;启动&#xff01; Abstract 主流序列转录模型基于复杂的循环神经网络和卷积神经网络&#xff0c;包括一个encoder和decoder&#xff0c;同时在这之中使用一个叫注意力机制attention的东西本文提出了一个简单的网络架构&#xff0c;仅仅使用注意力机制&am…

0基础学java-day19(IO流)

一、文件 1 什么是文件 2.文件流 3.常用的文件操作 3.1 创建文件对象相关构造器和方法 package com.hspedu.file;import org.junit.jupiter.api.DynamicTest; import org.junit.jupiter.api.Test;import java.io.File; import java.io.IOException;/*** author 林然* vers…

多模态融合slam技术学习

目录 前言 一、视觉-惯性SLAM算法 二、激光-惯性SLAM算法 三、激光与视觉融合算法 总结 前言 最近在找实习&#xff0c;又想着要怎么完成毕业论文&#xff0c;打算做下机器人导航实验&#xff0c;学习下相关算法。今天是多模态融合slam技术&#xff0c;课程链接&#xff1a;h…

严世芸龟法养生经

文章目录 严世芸理念荤素搭配&#xff0c;不偏嗜动静结合心平气和 龟息法 严世芸 严世芸&#xff0c;出生于1940年&#xff0c;现任上海中医药大学的主任医师&#xff0c;教授。他父亲是近代上海有名的中医&#xff0c;他又是著名医家张伯臾的亲传弟子。 从小就在父亲诊室里长…

ArkTS入门

代码结构分析 struct Index{ } 「自定义组件&#xff1a;可复用的UI单元」 xxx 「装饰器&#xff1a;用来装饰类结构、方法、变量」 Entry 标记当前组件是入口组件&#xff08;该组件可被独立访问&#xff0c;通俗来讲&#xff1a;它自己就是一个页面&#xff09;Component 用…

排序算法:【冒泡排序】、逻辑运算符not用法、解释if not tag:

注意&#xff1a; 1、排序&#xff1a;将一组无序序列&#xff0c;调整为有序的序列。所谓有序&#xff0c;就是说&#xff0c;要么升序要么降序。 2、列表排序&#xff1a;将无序列表变成有序列表。 3、列表这个类里&#xff0c;内置排序方法&#xff1a;sort( )&#xff0…

喜报丨迪捷软件入选2023年浙江省信息技术应用创新典型案例

12月6日&#xff0c;浙江省经信厅公示了2023年浙江省信息技术应用创新典型案例入围名单。本次案例征集活动&#xff0c;由浙江省经信厅、省密码管理局、工业和信息化部网络安全产业发展中心联合组织开展&#xff0c;共遴选出24个优秀典型解决方案&#xff0c;迪捷软件“基于全数…