CDH Hive Metastore canary

news2025/1/15 8:14:21

现象:CDH平台突然报错,报错信息为:The Hive Metastore canary failed to create a database

排查一下两点都未发现问题:

  • 检查hiveServer2日志(hadoop-cmf-hive-HIVEMETASTORE.log.out)无异常
  • 检查元数据依赖的数据库(我安装是mysql),无异常发现

于是在网上搜索,发现很有可能是sentry和hive间通信出现问题,

看了sentry日志

2023-04-28 09:40:57,069 WARN org.apache.sentry.api.service.thrift.SentryPolicyStoreProcessor: timed out wait request for id 2990308
java.util.concurrent.TimeoutException
        at org.apache.sentry.provider.db.service.persistent.CounterWait$ValueEvent.waitFor(CounterWait.java:301)
        at org.apache.sentry.provider.db.service.persistent.CounterWait.waitFor(CounterWait.java:215)
        at org.apache.sentry.api.service.thrift.SentryPolicyStoreProcessor.syncEventId(SentryPolicyStoreProcessor.java:1682)
        at org.apache.sentry.api.service.thrift.SentryPolicyStoreProcessor.sentry_notify_hms_event(SentryPolicyStoreProcessor.java:1561)
        at org.apache.sentry.api.service.thrift.SentryPolicyService$Processor$sentry_notify_hms_event.getResult(SentryPolicyService.java:2137)
        at org.apache.sentry.api.service.thrift.SentryPolicyService$Processor$sentry_notify_hms_event.getResult(SentryPolicyService.java:2122)
        at org.apache.thrift.ProcessFunction.process(ProcessFunction.java:39)
        at org.apache.thrift.TBaseProcessor.process(TBaseProcessor.java:39)
        at org.apache.sentry.api.service.thrift.SentryProcessorWrapper.process(SentryProcessorWrapper.java:36)
        at org.apache.thrift.TMultiplexedProcessor.process(TMultiplexedProcessor.java:123)
        at org.apache.thrift.server.TThreadPoolServer$WorkerProcess.run(TThreadPoolServer.java:286)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
        at java.lang.Thread.run(Thread.java:748)
 

二、原因分析

HMS 会实时向 Sentry 同步 Notifications 请求,当需要大批同步消息需要处理,后台线程处理不过来,消息压滞就会出现这个异常。这个异常不影响集群正常使用,只是会导致create, drop 等操作慢,需要等待 200s,等待的目的也是为了追上最新的 id。

三、解决措施/建议

1、适当调小 sentry.notification.sync.timeout.ms 参数
该参数默认是 200s,调小该参数,可适当减小 create/drop/alter 等操作的等待时间,消息积压不多的情况可以选择这种方式让 sentry 自行消费处理掉。
Cloudera 修改 Sentry 服务的参数配置:


修改参数后重启 Sentry 服务,发现 HMS 出现 canary 异常后超时时间在 50s 多一点,说明参数生效。

2、监控 sentry 元数据 SENTRY_HMS_NOTIFICATION_ID 信息
直接获取 sentry 元数据 SENTRY_HMS_NOTIFICATION_ID 表的最新记录,如果没有更新则表示消息出现了滞后,此时 HMS 必会出现 canary 异常。

mysql>  select * from  SENTRY_HMS_NOTIFICATION_ID order by NOTIFICATION_ID desc limit 1;
+-----------------+
| NOTIFICATION_ID |
+-----------------+
|       184490926 |
+-----------------+
1 row in set (0.00 sec)

3、更新 sentry 消息同步记录
如果消息积压的太多,sentry 慢慢消费的时间太长的话,可能一直追不上 HMS 的最新 id,此时可以选择丢掉这些信息,具体操作在 sentry 元数据的 SENTRY_HMS_NOTIFICATION_ID 表中插入一条最大值(该最大值等于当前消息的 id 值,从 hive 元数据的 NOTIFICATION_SEQUENCE 表中获取 ),重启 sentry 服务

use sentry;
insert into SENTRY_HMS_NOTIFICATION_ID values(184472866);
更新后 create 操作时间正常

参考链接
Hive HMS Canary 时间较长异常分析 - 开发者博客
2022-09-28 大量删除hive分区导致hivemetastore canary - 简书

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/471126.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【CMake】2. 使用CMake添加一个库

2. 使用CMake添加一个库 1. 什么是 library(库)? 库 函数库,所谓库,就是将函数封装成库来供我们使用,包含静态库和动态库。 对于代码到可执行程序的过程,这里简单复习一下: 源文…

TMM 22 | 像拆玩具一样的点云预训练

文章题目:Self-supervised Point Cloud Representation Learning via Separating Mixed Shapes 作者:Chao Sun, Zhedong Zheng, Xiaohan Wang, Mingliang Xu and Yi Yang 论文链接:https://www.zdzheng.xyz/files/TMM_3D_Pre_Training.pdf …

openGauss DBMind自治运维系统的安装和部署

目录 1、安装准备 1.1 环境信息 1.2 安装包 1.3 数据库用户 2、安装DBMind 3、部署DBMind 3.1 自动部署--推荐 手动配置--推荐 交互式配置 3.2 手动部署 规划配置 4、启动DBMind DBMind作为openGauss数据库的一部分,为openGauss数据库提供了自动驾驶能力…

react由用index作为key进行增删查改引发的问题

现象描述:添加小王在第一个元素,在li元素可以看出来,但是在后面的输入框小张的位置占用了。因为添加小王在第一个元素,它的key是0,旧的dom的key0是小张。所以校长被顶上去了。看到这个现象特意去学了react虚拟dom的dif…

Ceph入门到精通-红帽 Ceph 存储 RGW 部署策略和规模调整指南

从红帽 Ceph 存储 3.0 开始,红帽增加了对 容器化存储守护进程 (CSD),允许软件定义的存储组件(Ceph MON、OSD、MGR、RGW 等)在容器内运行。CSD 避免了存储服务专用节点的需要,从而通过共置存储容…

Anaconda安装nbextensions

nbextensions 是 Jupyter 非常好的插件,它是将一系列 js 脚本嵌入到 Jupyter 中,增强 Jupyter 的交互式体验,可以让你的 Jupyter 变得非常强大。 Unofficial Jupyter Notebook Extensions 安装nbextensions 以管理员身份运行Anaconda Promp…

【Git 入门教程】第四节、Git冲突:如何解决版本控制的矛盾

Git是目前最流行的版本控制系统之一,它为团队协作开发提供了方便和高效的方式。然而,在多人同时修改同一个文件时,可能会出现代码冲突(conflict),导致代码无法正确合并。那么,如何解决Git冲突呢…

Imagination时昕:异构人工智能IP如何赋能数字化转型

4月26-28日,民生证券人工智能高峰论坛在北京举办,Imagination中国区战略市场及生态副总时昕博士受邀出席,并分享了“异构人工智能IP赋能数字化转型”的主题演讲。 全社会数字化转型大势所趋 毫无疑问,AI 已经渗透经济生产各个方面…

电赛校赛总结----一维板球系统【代码开源】

2022/4/21 搭建了整体的机械结构,最后因为经费问题,选择了用去年风力摆的架子去搭摄像头【openmv】,看当年的国赛题,选择的是ov7670,但我们讨论后觉得还是openmv的识别比较好,,下面的小球选用的是外径为3.2cm的水管&a…

设计模式——七大原则

目录 一、通过经典面试题掌握重点 二、设计模式的目的和核心原则 三、设计模式七大原则 3.1 单一职责原则(Single Responsibility Principle) 3.2 接口隔离原则(Interface Segregation Principle) 3.3 依赖倒转原则&#xf…

Mysql表索引(普通索引)

文章目录 一、创建表时定义索引二、已存在的表上创建索引 1.指向create语句2.指向alter table 语句三、查看索引执行情况总结 前言 所谓普通索引,就是在创建索引时,不附加任何限制条件(唯一、非空等限制)。该类型的索引可以创建…

C plus plus ——【面向对象编程】

系列文章目录 C plus plus 面向对象编程 文章目录 系列文章目录前言一、编程语言概述1.1低级语言概述1.2高级语言概述1.3面向过程、面向对象概述 二、面向过程编程的特性三、面向对象编程的特性四、类和对象4.1 类的概述4.2 类的声明与定义4.3 类的实现4.4 对象的生命 五、构造…

数字化转型导师坚鹏:BLM企业数字化转型战略

BLM企业数字化转型战略 ——以BLM模型为核心,实现知行果合一 课程背景: 很多企业存在以下问题: 不知道企业如何制定数字化转型战略? 不清楚其它企业数字化转型战略是如何制定的? 不知道其它企业数字化转型战略…

Spring-boot集成swagger以及MapStruct简单使用

1&#xff09;添加依赖&#xff0c;我使用3.0.0版本时会出现swagger-ui页面404的问题&#xff0c;所以改成2.9.2&#xff0c;使用默认版本swagger-model会出现判空异常。 <!-- swagger--><dependency><groupId>io.springfox</groupId><arti…

python+nodejs+php+springboot+vue 社区小区报修 -社区信息管理

客户可以对社区信息进行添加&#xff0c;修改&#xff0c;删除以及查询操作。界面如下图所示: 四、客户模块的实现 4.1车位租买支付 客户可以对车位信息进行租买后可以在个人后台进行支付操作。界面如下图所示: 4.2前台车位信息 客户登录之后&#xff0c;可以查看前台车位…

传输层 — UDP协议

目录 一、传输层 1.1 端口号 1.2 关于端口的常见问题 1.3 netstat && pidof 二、UDP协议 2.1 UDP协议格式 2.2 UDP协议特点 2.3 UDP缓冲区 2.4 基于UDP的应用层协议 一、传输层 在进行网络传输时&#xff0c;应用层需先将数据交给传输层&#xff0c;由传输层…

基于matlab仿真混合波束成形在多用户MIMO-OFDM系统中的使用

一、前言 本 例 说明 了 如何 在 大规模 MIMO 通信 系统 的 发射 端 采用 混合 波束 成形&#xff0c; 同时 使用 多 用户 和 单 用户 系统 的 技术。该示例采用全通道探测来确定发射机的通道状态信息。它将所需的预编码划分为数字基带和模拟RF组件&#xff0c;对多用户和单用户…

智能的PHP开发工具PhpStorm v2023.1全新发布——集成3v4l.org

PhpStorm是一个轻量级且便捷的PHP IDE&#xff0c;其旨在提高用户效率&#xff0c;可深刻理解用户的编码&#xff0c;提供智能代码补全&#xff0c;快速导航以及即时错误检查。可随时帮助用户对其编码进行调整&#xff0c;运行单元测试或者提供可视化debug功能。 PhpStorm v20…

商城订单模块实战 - 数据库设计、ABA问题处理、读写分离分库分表

引言 订单系统可以说是整个电商系统中最重要的一个子系统&#xff0c;因此订单数据可以算作电商企业最重要的数据资产。这篇文章我们来看看在我们的商城系统中订单服务是如何实现的&#xff0c;特别是在设计和实现一个订单系统的过程中有哪些问题是需要特别考虑的。 业务分析…

逾 200 家港企参与! GoGBA大湾区发展日(广州)圆满举行

2023年4月26日 – 由香港特别行政区政府政制及内地事务局粤港澳大湾区发展办公室、香港特别行政区政府驻粤经济贸易办事处&#xff08;驻粤办&#xff09;、香港贸易发展局&#xff08;香港贸发局&#xff09;广州办事处&#xff0c;以及香港贸发局GoGBA商贸支援合办的GoGBA大湾…