【总结】hbase master重启恢复失败问题修复

news2025/1/17 1:02:04

问题现象

最近hbase master 莫名其妙宕机了,查看最后输出日志,也没有发现有效信息。

于是想着先重启一把,在hbase master 选主成active状态的过程中,发现重启多次都很漫长,且最终因重启时间过长,被hbase-daemon.sh 强杀掉。

从hbase-master.out 可查看到hbase master 被强杀,如下图:
在这里插入图片描述
以前也出现过类似情况,当时解决的办法是加大hbase master jvm 内存。
但最近再次宕机,一直加大jvm内存也不现实。只能想办法,从根本上解决。

原因分析

再次查看hbase master log,发现hbase 在恢复过程中,先是一直不断刷如下日志:
INFOorg.apache.hadoop.hbase.util.FSHDFSUtils: Recover lease on dfs filehdfs://nameservice1/hbase/MasterProcWALs/pv-00000000000000011601.log

然后开始不断刷gc回收暂停时间过长
2024-04-24 10:01:47,315 WARN [master/ark-73:16000] util.Sleeper: We slept 15775ms instead of 3000ms, this is likely due to a long garbage collecting pause and it’s usually bad, see http://hbase.apache.org/book.html#trouble.rs.runtime.zkexpired
在这里插入图片描述
再次查看gc 日志,gc.log-202404240937 发现如下日志:

2024-04-24T10:04:47.890+0800: 1630.478: [Full GC (Allocation Failure) 2024-04-24T10:04:47.890+0800: 1630.478: [CMS: 5183936K->5183935K(5183936K), 13.3839186 secs] 6180735K->6180727K(6180736K), [Metaspace: 52023K->52023K(1095680K)], 13.3840933 secs] [Times: user=13.39 sys=0.00, real=13.39 secs]

2024-04-24T10:05:01.275+0800: 1643.863: [Full GC (Allocation Failure) 2024-04-24T10:05:01.276+0800: 1643.863: [CMS

在这里插入图片描述
种种迹象表明,hbase已经因为内存爆了,导致垃圾回收也无法释放内存。

查阅了一番资料,最终定位到是MasterProcWals pv日志过多,在重启HBase Master 的过程中,HBase Master进入活动状态需要读取并实例化所有正在运行的程序当前记录在/apps/hbase/data/MasterProcWALs/目录下对应的文件。此文件夹太大,HBase Master将在完全变为活动状态之前超时并崩溃。

解决方法

查阅了相关资料,MasterProcWALs 目录下的文件是可以删除的,在删除之前,先备份。

于是执行了以下命令:

 # 查看MasterProcWALs 目录下文件存储总大小
 hdfs dfs -du -s -h /apps/hbase/data/MasterProcWALs
# 将该文件备份
hdfs dfs -mv /apps/hbase/data/MasterProcWALs /apps/hbase/data/bakMasterProcWALs
# 重新创建空文件夹
hdfs dfs -mkdir /apps/hbase/data/MasterProcWALs

最后重启hbase master,几乎很快hbase master就启动成功,并成功变成active 活跃状态。

至此,成功解决该问题。

参考资料:https://www.yisu.com/jc/564592.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1622961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于STM32的蓝牙小车(虚拟串口模拟)的Proteus仿真

文章目录 一、前言二、仿真图1.要求2.思路3.画图3.1 电源部分3.2 超声波测距部分3.3 电机驱动部分3.4 按键部分3.5 蓝牙部分3.6 显示屏部分3.7 整体 4.仿真5.软件 三、总结 一、前言 proteus本身并不支持蓝牙仿真,这里我采用虚拟串口的方式来模拟蓝牙控制。 这里给…

了解网卡、光猫、路由器

了解网卡、光猫、路由器 一、网卡二、光猫三、路由器四、光猫和路由器的联系和区别五、家庭正常上网的简单流程六、企业正常上网的简单流程 一、网卡 网卡:用来允许计算机在计算机网络上进行通讯的计算机硬件 一般来说,笔记本都有两种网卡,有…

栈和队列--数据结构

栈(Stsck) 概念 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作的一端称为栈顶,另一端称为栈底。栈中的数据元素遵循“后进先出”(LIFO)的原则。 …

性价比高超声波清洗机品牌有哪些?四款高性价比超声波清洗机安利

如果你经常不清洗眼镜,那么非常推荐你入手一台超声波清洗机在家清洗眼镜!因为,超声波清洗机清洗眼镜真的非常方便。如果你经常佩戴眼镜,但是常常忘记清洗的话,看完这篇文章后一定要改掉不清洗眼镜的坏习惯,…

ffmpeg的安装以及使用

1.FFmpeg 的主要功能和特性: 格式转换:FFmpeg 可以将一个媒体文件从一种格式转换为另一种格式,支持几乎所有常见的音频和视频格式,包括 MP4、AVI、MKV、MOV、FLV、MP3、AAC 等。视频处理:FFmpeg 可以进行视频编码、解…

数码相机数据恢复,3招找回珍贵照片!

“我有一部数码相机,存储了很多很重要的文件和数据。但是我一不小心就误删了里面的重要数据,有什么方法可以恢复相机里的文件吗?” 数码相机已成为我们日常生活中不可或缺的一部分,它帮助我们记录生活的点滴,留下美好的…

SSL证书一年要多少钱

经常会被人问道:“安装SSL证书一年得要多少钱?”其实证书的类型不同、功能不同、品牌不同,证书的价格也会不一样。SSL证书的价格因其类型、品牌、购买渠道以及所包含的服务和支持等因素而有所不同。通常一年的费用从几十元到几万元不等。 一…

ABAP Visual Code 新建sap系统连接

本文主要介绍如何新建SAP前端系统链接 前提是你已经都扩展完了 1.点击SAP fiori--》点击新建 2.选择 abap on premise 3.输入如下信息 4.这里介绍下URL 如何获取 SMICM-->点击service 明细里面可以看到你的host name 和 port 当然你也可以随便找一个你的odata 服务看下ur…

在vscode使用MATLAB

官方链接 首先安装好vscode、python 与 MATLAB,注意python与MATLAB的版本,参考链接 都安装好后 验证: 安装插件:matlab in vscode ,并进行如下设置,参考链接 至此就差不多OK了

Uvicorn+Gunicorn+FastAPI学习笔记

WSGI Web服务器网关接口(Python Web Server Gateway Interfeace,缩写WSGI)是为python定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口。 Gunicorn Gunicorn是一个基于Python的WSGI(Web服务器网关接口)HTTP服务器&#xff0…

看完马云的简历,我明白了为什么他对钱没有兴趣。。。

程序员的成长之路 互联网/程序员/技术/资料共享 关注 阅读本文大概需要 2.8 分钟。 来自:网路 马云的人生故事,如同一部传奇,充满着坎坷、奋斗和成功。 尽管他早年的高考经历并不顺利,但他的坚韧和梦想驱使着他不断前行&#xff…

算法-KMP算法

时间复杂度&#xff1a; public int strStr(String haystack, String needle) {int[] next new int[needle.length()];//next数组的生成next[0] 0;int prefixLen 0;//共同前后缀长度int i 1, j 1;//i,j复用while (i < needle.length()) {if (needle.charAt(prefixLen)…

可视化大屏的应用(16):智慧社区和网格化管理的价值

hello&#xff0c;我是大千UI工场&#xff0c;本篇分享智慧社区和网格化管理大屏设计&#xff0c;关注我们&#xff0c;学习N多UI干货&#xff0c;有设计需求&#xff0c;我们也可以接单。 实时监控和预警 可视化大屏可以将社区内各种数据、指标和信息进行实时监控和展示&…

Spring 注解开发详解

1. 注解驱动入门案例介绍 1.1 需求描述 1.需求&#xff1a;实现保存一条数据到数据库。 2.表结构&#xff1a;create table account(id int primary key auto_increment,name varchar(50),money double(7,2)); 3.要求&#xff1a;使用spring框架中的JdbcTemplate和DriverMana…

WEB攻防-.NET特性常见漏洞

目录 前置知识&#xff1a; DLL文件 .NET和DLL文件 C#和DLL文件 关系总结 .NET 配置调试-信息泄露 .NET 源码反编译-DLL 反编译与未授权访问 编译DLL文件 反编译DLL文件 注意事项 案例&#xff1a; 验证代码文件有没有可以绕过&#xff08;Cookie&Session&…

Web前端开发之HTML_2

HTML5简介与基础骨架标题标签标签之段落、换行、水平线标签之图片标签之超文本链接标签之文本列表标签之有序列表列表标签之无序列表 1. HTML5简介与基础骨架 1.1 HTML5简介 HTML5是用来描述网页的一种语言&#xff0c;被称为超文本标记语言。用HTML5编写的文件&#xff0c;后…

Linux——web基础实验

实验前的安装 [rootwebserver ~]# yum -y install httpd [rootwebserver ~]# systemctl enable --now httpd Created symlink /etc/systemd/system/multi-user.target.wants/httpd.service → /usr/lib/systemd/system/httpd.service. [rootwebserver ~]# echo test for apach…

2024技术巅峰:【研发效能·创享大会】精彩不容错过!

嗨享技术轰趴 【朋友们&#xff0c;5月25日&#xff0c;北京聚起来&#xff01;】 一场汇聚行业精英、聚焦AIGC、BizDevOps、ToB产品管理、B端产品运营、平台工程、研发效能、效能度量、职业画布、DevOps国标解读等前沿议题的研发效能创享大会即将开启&#xff01; 大会的讨论…

prometheus helm install 如何配置告警模版

对接企业微信 获取企业id 注册完成之后&#xff0c;通过企业微信官网登录后台管理&#xff0c;在【我的企业】的企业信息里面&#xff0c;获取到Alertmanager服务配置需用到的第一个配置&#xff1a;企业ID 获取部门id 部门ID 在【通讯录】中&#xff0c;添加一个子部门&a…

Keil出现警告:warning: #223-D: function “XXX“ declared implicitly

这个警告表明编译器在函数使用之前没有找到函数的显式声明或定义。这通常发生在函数被使用之前没有在当前文件中进行声明或定义&#xff0c;或者头文件未正确包含。 解决方式&#xff1a; 在当前文件中添加函数声明&#xff1a;在使用函数之前&#xff0c;在当前文件中添加函…