Doris Manager 24.0 版本正式发布!

news2024/12/24 20:42:13

Cluster Manager for Apache Doris(简称 Doris Manager)是 SelectDB 推出的管理运维 Apache Doris 集群的工具。用户可以轻松通过该工具部署和接管集群,实时查看集群的运行状态和详情,快捷地对集群进行扩缩容、升级及重启操作。同时,该工具还支持监控告警、参数配置、日志查看、任务审计、集群巡检等功能,让集群管理变得更加简单高效。目前, Doris Manager 已被上千家企业用户广泛认可并深度应用。经过持续不断的优化与打磨,我们终于迎来了 Doris Manager 24.0 这一重要版本的正式发布。

重大更新

  • 管控升级为 Agent 模式,Agent 和 Server 之间直接使用 HTTP 协议通信,保证安全性。
  • 新增任务审计,支持查看每个任务的详细信息,包括操作时间、操作人、操作内容等信息。
  • 监控模块新增主机维度的机器指标监控,通过node_exporter采集主机指标。
  • 部署及扩容支持新增计算节点,计算节点仅负责数据计算,不负责数据存储。
  • 集群巡检支持定期巡检,同时支持按需配置巡检周期并发送通知。
  • 按照业内最 佳实践,内置集群及主机维度的告警模版,可按需快速配置告警规则。

管控从 SSH 升级为 Agent 模式

Manager 23.x 系列是基于 SSH 互信的方式,实现向每一台管控机器上发送远程操作命令的功能。然而,对于高安全要求的客户,因其无法提供机器的登录密码或在内部环境使用 SSH 互信,这种方式并不适用。

基于上述原因,Doris Manager 24.0 版本管控升级为 Agent 模式,Agent 和 Server 之间直接使用 HTTP 协议通信,并结合 SSL 加密数据,保证安全性。 服务的整体架构如下图所示:

 Doris Manager 管控架构

Doris Manager Web Server

Doris Manager Web 服务是 Manager 网页服务器的服务端,同时也是整个 Doris Manager 实现自动运维管理 Apache Doris、SelectDB Doris 集群的核心模块。主要的功能包括:

  • 管控 Doris 集群,包括部署、托管、扩容、缩容、升级、配置修改、重启等管控操作;
  • 提供网页端访问的服务 API;
  • 存储 Doris Manager 所有业务功能的元数据;
  • 提供 Doris 集群运维监控告警组件功能;
  • 提供自然人访问 Doris Manager 的用户认证系统,同时实现了基于 Doris 集群功能管理的权限系统;
  • 通过 Agent 统一管理系统中的 Doris 集群节点,并下发管控指令到 Agent。

Doris Manager Agent

通过 Doris Manager 管控的 Doris 集群,需要在每个 Doris 集群节点上安装一个常驻的 Agent 进程,Agent 默认的端口是 8972, 跟 Doris Manager Web 服务所在的机器必须网络联通。Agent 主要的功能包括:

  • 接收 Doris Manager Web 服务侧下发的管控命令,执行并返回执行结果;
  • 收集 Doris Cluster 节点主机的监控指标,并主动汇报给 Doris Manager Web 服务侧的监控组件存储;
  • 定时向 Doris Manager Web 服务汇报 Doris Cluster 节点上主机和 Doris 进程的心跳信息。

Doris Manager 的功能与场景

经过近一年的社区深入打磨和对 Doris 用户需求的精准理解,我们为 Doris Manager 带来了一系列重要的优化升级和全新功能。这些改进不仅强化了集群部署与接管、集群重启和扩缩容、集群升级等核心功能,还新增了任务审计、日志管理等实用功能,旨在为用户提供更流畅、更高效的数据管理体验。操作演示:https://www.selectdb.com/blog/287

  • 集群部署和接管:简化了操作流程,提供了更加友好的用户界面和更加智能的自动化配置选项。无论是物理机还是虚拟机,均可以通过 Doris Manager 快速部署新的 Doris 集群,或者轻松接管已有的集群,可以同时管理多个集群,实现无缝集成和统一管理。同时,为了满足更多用户的需求,Kubernetes 和公有云的部署支持也正在积极开发中。

  • 集群重启和扩缩容:增强了操作的灵活性和可靠性。支持多种重启模式,包括全量重启和滚动重启,以满足不同场景下的需求。同时,我们也提供了更加便捷的扩缩容操作,用户可以根据业务需求动态调整集群规模,确保资源的高效利用。

  • 集群升级:轻松进行集群版本升级,享受便捷、安全的升级体验。我们提供了全量停服升级和在线滚动升级两种方式,以满足不同业务场景的需求。在升级前,Doris Manager 会对集群进行细致的环境检查,确保升级前的准备工作充分、无误。升级过程中,可以随时通过升级任务的日志查看升级的具体流程,从而实时掌握升级进度和状态,确保升级过程的安全可靠。完成升级后,您可以根据系统情况选择保留新版本或回滚到旧版本,从而彻底消除升级集群的后顾之忧。

  • 参数配置:可以根据业务需求和集群状态,通过修改配置文件对 FE 或 BE 参数做单个节点或多个节点的调整,从而优化集群表现,以获得最 佳的性能和资源利用效率。

  • 节点详情:全面了解您的集群节点实时运行状态和详情,包括节点的状态、指标和机器信息。这将帮助您更好地掌握集群的运行情况,及时做出响应。

  • 监控告警:我们为您预设了一系列的监控指标,并支持定制告警通知。同时集群初始化时 Doris Manager 按照最 佳实践内置了默认告警模版,在新建告警策略的时候可以选择模版中的指标进行快捷配置。通过告警阈值和通知的设置,以便在第一时间获取集群运行信息,提前预警和应对问题。

  • 日志查看: Doris Manager 提供了强大的日志查看功能。您可以轻松查看和查询 FE 和 BE 各节点的日志,这对于离线排查集群问题非常便利。

  • 任务审计: 记录了每个任务的详细信息,包括任务类型、ID、模块、状态、发起者、执行进度、开始时间及结束时间。通过审计功能,管理者能够追溯任务的执行过程,可以清晰地了解任务的执行情况和历史记录,从而进行有效的监管和追溯。

  • 巡检功能:我们为您提供详细的巡检检查功能,支持手动或定期一键检查机器状况、集群运行状态,及时发现并定位性能瓶颈,保证集群的稳定运行。

  • 其他功能:我们还提供了一系列其他功能,包括方便的用户管理、自动拉起、停止接管集群等,为您提供了全面、细致的管理工具。

体验新版本

  • 安装手册
  • 使用指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1602331.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

App Inventor 2 计时器组件,时间相关的用法都在这里

1、计时器在界面设计中的哪里? 2、计时器怎么启动? 默认计时器是自动启用的,也可程序控制它的属性“启用计时”和“不启用计时”。 3、怎么确定计时器执行没? 定一个数字全局变量,计时方法里面自增,然后输…

2024 CVPR AIGC集合

完全外行,不建议参考 一、3D重建 PointAvatar: Deformable Point-based Head Avatars from Videos 对原始颜色进行解纠缠,得到固有反射和相关阴影。 基于可变形点云对表情、颜色、位置等信息进行建模。 总结:可以看作是对局部像素的分解与扩…

gcc原理和使用

gcc gcc是什么 GCC,全称 GNU Compiler Collection(GNU 编译器套件),是一套功能强大的编程语言编译器,由自由软件基金会(Free Software Foundation, FSF)作为GNU项目的一部分开发和维护。它最初…

【文献分享】机器学习 + 分子动力学 + 第一性原理 + 电导率 + 微观结构

​【文献分享】机器学习 分子动力学 第一性原理 电导率 微观结构 分享一篇关于机器学习 分子动力学 第一性原理 电导率 微观结构的文章。 感谢论文的原作者! 关键词: 1. Machine learning force field 2. Molecular dynamics 3. Solid state …

刷题日记——质因数的个数

题目 分析(从质数的判断角度出发)(递归) 判断n是否是质数需要: 遍历,i从2开始到sqrt(n),每次判断n是否能整除i,若能则不是质数,若不能则是 思路: 先判断n…

你也许不知道的 Confluence 快捷操作

Confluence 是一种企业知识管理和协作平台,用于创建、共享和组织团队的文档、知识和想法。它支持团队成员进行实时协作、评论和编辑文档,提供了强大的搜索功能,方便用户快速找到需要的信息。 Confluence 快捷键解析,标注了对应的…

SpringBoot多数据源(二)

SpringBoot多数据源AbstractRoutingDataSource(二) 1.多数据源配置2.多数据源调用流程3.实现 1.多数据源配置 spring-jdbc模块提供AbstractRoutingDataSource,其内部可以包含了多个DataSource, 然后在运行时来动态的访问数据库 2.多数据源…

新型大数据架构之湖仓一体(Lakehouse)架构特性说明——Lakehouse 架构(一)

文章目录 为什么需要新的数据架构?湖仓一体(Lakehouse)——新的大数据架构模式同时具备数仓与数据湖的优点湖仓一体架构存储层计算层 湖仓一体特性单一存储拥有数据仓库的查询性能存算分离开放式架构支持各种数据源类型支持各种使用方式架构简…

1.总结串口的发送和接收功能使用到的函数2.总结DMA的作用,和DMA+空闲中断的使用方式3.使用PWM+ADC光敏电阻完成光控灯的实验

1.总结串口的发送和接收功能使用到的函数 串口发送函数:HAL_StatusTypeDef HAL_UART_Transmit(UART_HandleTypeDef *huart, const uint8_t *pData, uint16_t Size, uint32_t Timeout) UART_HandleTypeDef *huart:指定要使用的串口 const uint8_t *pData&…

数智时代的AI人才粮仓模型解读白皮书(2024版)

来源:极客邦 自 2023 年上半年起,ChatGPT 等大模型技术蓬勃发展,AI 技术不断突破边界,展现 出惊人的潜力和发展速度。从早期的逻辑推理、专家系统,到如今的深度学习、神经网络, AI 技术显著缩小了科学与实…

宝宝洗衣机买几公斤?四款精心挑选实用婴儿洗衣机推荐

家里有孩子的,条件允许的话,婴儿洗衣机还是非常有必要买的。由于宝宝的年纪还小,使得宝宝的皮肤比较娇嫩,与成人衣物分开洗护,可以为宝宝带来更加健康的生长环境,并且可以避免与大人衣物混洗所带来的细菌的…

线圈、寄存器、存储区代号、功能码 案例说明

线圈和寄存器 表示数据类型 线圈:表示Boolean数据类型 寄存器:表示非Boolean数据类型,用来暂时存放参与运算的数据和运算结果,具有接收数据、存放数据和输出数据的功能。 ModbusRTU 读输出线圈 存储区代号 0区 功能码 0x01 读输入…

【过程11】——教育被点燃的路上

这里写目录标题 一、背景二、过程1.两年四十万的认知改变2.三年打工仔的经历改变3.一年计算机的人生蜕变4.后面的展望 三、总结 一、背景 人生在世,对于一些事情的笃信笃行;背后真的会有莫大无以言表的波涛。 这个事情到现在已经五年半左右时间了&#…

数据的插入、修改和删除

一、 插入数据 1. 向表中所有字段插入数据 (1) 指定所有字段及其相对应的值 insert into 表名(字段1,字段2,……) values(字段值1,字段值2,……);**【案例】**向goods表中插入一条新记录 步骤1&#xff…

C语言【数组】

一、数组基本语法 1. 什么是数组 数组是c语言的一种数据结构,用于存储一组具有相同数据类型的数据; 数组中每个元素可以通过下标进行访问,索引从0开始,最大值为数组长度-1。 2. 数组的使用 类型 数组名[元素个数]; int arr[5]…

网络基础-TCP/IP和OSI协议模型

一、OSI和TCP/IP模型 二、OSI七层模型 三、TCP/IP模型 参考:https://www.cnblogs.com/f-ck-need-u/p/7623252.html

JS-42-Node.js01-Node.js介绍

一、浏览器大战 众所周知,在Netscape设计出JavaScript后的短短几个月,JavaScript事实上已经是前端开发的唯一标准。 后来,微软通过IE击败了Netscape后一统桌面,结果几年时间,浏览器毫无进步。(2001年推出…

最优贸易题解

图论学习总结-CSDN博客https://blog.csdn.net/smile__everydays/article/details/137881868?spm1001.2014.3001.5501点击上面连接根据目录即可找到最优贸易的题解

Python文件操作大全

1 文件操作 1.1 文件打开与关闭 1.1.1 打开文件 在Python中,你可以使用 open() 函数来打开文件。以下是一个简单的例子: # 打开文件(默认为只读模式) file_path example.txt with open(file_path, r) as file:# 执行文件操作…

系统代理与全局代理服务器的区别

系统代理与全局代理服务器的区别 嘿,朋友们!今天我来给大家讲解一下系统代理与全局代理服务器的区别。你知道吗?在我们使用互联网的时候,经常需要通过代理服务器来隐藏我们的真实网络身份。那么系统代理和全局代理服务器到底有什…