创建osd加入集群

news2024/10/10 0:13:17

故障原因:ceph节点一个磁盘损坏,其中osd69 down了,需要更换磁盘并重新创建osd加入ceph集群。

在这里插入图片描述


信息采集:


更换磁盘前,查询osd69对应的盘符:

在这里插入图片描述

将对应的故障磁盘更换后,并重做raid,然后查看新磁盘盘符,这里新盘符为sdl

在这里插入图片描述

查看空余的日志盘,发现sda13尚未使用,因此重新做osd的磁盘磁盘选用sda13为日志盘。

在这里插入图片描述

具体操作步骤:


  1. 修改root可登录(在故障节点点10.99.192.104操作)

    • 使用vi编辑器修改/etc/ssh/sshd_config文件,将PermitRootLogin no改为PermitRootLogin yes,允许root用户通过SSH登录。

    • 修改后,重启SSH服务(systemctl restart sshd),使配置生效。

      注: 该步骤是要开启root用户权限,用root用户去执行下述命令,如已开启,可忽略本步骤。

  2. 关闭osd69的服务(在故障节点点10.99.192.104操作)

    • 使用systemctl命令停止并禁用名为ceph-osd@69.service的Ceph OSD服务,防止它自动重启。

      systemctl stop ceph-osd@69.service
      systemctl disable ceph-osd@69.service
      
  3. 删除osd69的映射认证(在ceph的admin节点操作10.99.192.98)

    • 使用ceph osd crush remove osd.69从Ceph集群的CRUSH映射中移除OSD 69。
    • 使用ceph auth del osd.69删除OSD 69的认证密钥。
    • 使用ceph osd rm 69从Ceph集群中移除OSD 69的标识。

  4. 卸载挂载目录(在故障节点10.99.192.104操作)

    • 使用umount命令卸载/var/lib/ceph/osd/ceph-69目录,确保磁盘可以重新格式化。
    umount /var/lib/ceph/osd/ceph-69
    

  5. 格式化磁盘(在ceph的admin节点操作10.99.192.98)

    • 使用ceph-deploy disk zap命令在/etc/ceph目录下执行,准备磁盘/dev/sdl用于新的OSD,这里的chongqing7可能是节点名或主机名。
    ceph-deploy disk zap chongqing7 /dev/sdl
    

  6. 关闭流量状态(在ceph的admin节点操作10.99.192.98)

    • 使用一系列ceph osd set命令临时关闭OSD的多种状态,包括禁止进入(in)、上升(up)、恢复(recover)、再平衡(rebalance)、回填(backfill)以及暂停(pause)操作,这通常是为了在维护期间避免OSD影响集群状态。

      ceph osd set noin
      ceph osd set noup
      ceph osd set norecover
      ceph osd set norebalance
      ceph osd set nobackfill
      ceph osd set pause
      

  7. 创建osd(在ceph的admin节点操作10.99.192.98)

    • 使用ceph-deploy osd create命令在chongqing7节点上创建新的OSD,使用--filestore指定文件存储后端,--fs-type xfs指定文件系统类型为XFS,--data /dev/sdl指定数据磁盘,--journal /dev/sda13指定日志磁盘。
    ceph-deploy osd create --filestore --fs-type xfs --data /dev/sdl  --journal /dev/sda13 chongqing7
    

  8. 检查ceph-osd@69.service是否开启,如未开启则执行命令开启。

    systemctl start ceph-osd@69.service
    systemctl enable --runtime ceph-osd@69.service 或 systemctl enable ceph-osd@69.service 
    

    至于设置为永久开启自己还是临时开机自启,可以根据实际需求,若不知道,推荐选择和ceph集群中其他节点设置一样的即可。可以用下述命令查看

    [root@chongqing7 ~]# systemctl is-enabled ceph-osd@65.service
    enabled-runtime
    

  9. 开启(在ceph的admin节点操作10.99.192.98)

    • 使用一系列ceph osd unset命令重新开启之前关闭的OSD状态,使OSD能够正常参与集群操作。
    ceph osd unset noin
    ceph osd unset noup
    ceph osd unset norecover
    ceph osd unset norebalance
    ceph osd unset nobackfill
    ceph osd unset pause
    

  10. 检查(在ceph的admin节点操作10.99.192.98)

    • 使用ceph osd tree命令查看Ceph集群中OSD的当前树结构,确认新OSD已正确添加。
      注:当上方第8步骤开启后,此时执行ceph osd tree命令才会发现osd69为up

在这里插入图片描述


  1. 修改root不可登录(在故障节点10.99.192.104操作)

    • 再次使用vi编辑器修改/etc/ssh/sshd_config文件,将PermitRootLogin yes改回PermitRootLogin no,禁止root用户通过SSH登录。

    • 修改后,重启SSH服务(systemctl restart sshd),使配置生效。

      注:该步骤是恢复原有root的设置,该操作可选择执行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2200472.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SDK4(note下)

以下代码涉及到了很多消息的处理&#xff0c;有些部分注释掉了&#xff0c;主要看代码 #include <windows.h> #include<tchar.h> #include <stdio.h> #include <strsafe.h> #include <string> #define IDM_OPEN 102 /*鼠标消息 * 键盘消息 * On…

76.【C语言】perror函数介绍

1.cplusplus的官网介绍 cplusplus的介绍 点我跳转 2.翻译 函数 perror void perror ( const char * str ); 打印错误信息 将errno(最后一个错误数字)的值解释为错误信息,之后把它打印到stderr中(标准错误输出流,通常是控制台)(备注有关"流"的概念在75.【C语言】文件…

k8s-pod的管理及优化设置

Pod是Kubernetes&#xff08;k8s&#xff09;中最小的资源管理组件&#xff0c;也是最小化运行容器化应用的资源对象。以下是对Pod的详细介绍&#xff1a; 一、Pod的基本概念 定义&#xff1a;Pod是Kubernetes中可以创建和管理的最小单元&#xff0c;是资源对象模型中由用户创…

网站排名,让网站快速有排名的几个方法

要让网站快速获得并提升排名&#xff0c;需要综合运用一系列专业策略和技术&#xff0c;这些策略涵盖了内容优化、技术调整、外链建设、用户体验提升等多个方面。以下是让网站快速有排名的几个方法&#xff1a; 1.内容为王&#xff1a;创造高质量、有价值的内容 -深入…

geolocator插件的用法

文章目录 1. 概念介绍2. 使用方法3. 示例代码4 体验分享我们在上一章回中介绍了如何实现滑动菜单相关的内容,本章回中将介绍如何获取位置信息.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 我们在这里说的获取位置信息本质上是获取当前手机所在位置的gps坐标,就是我们…

【Chrome浏览器插件--资源嗅探猫抓】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、资源嗅探插件---猫抓二、使用步骤总结 一、资源嗅探插件—猫抓 猫抓是一个浏览器插件&#xff0c;可以检测当前网页中的一些资源文件&#xff0c;可设置嗅探的…

NVIDIA机密计算文档

NVIDIA 可信计算解决方案 文章目录 前言一、指南1. Intel TDX - 机密计算部署指南2. AMD SNP - 机密计算部署指南3. NVIDIA Hopper 机密计算证明文档4. nvtrust GitHub二、发行说明1. 550TRD3 - NVIDIA 可信计算解决方案发行说明2. 550TRD1 - NVIDIA 可信计算解决方案发行说明三…

The Android SDK location cannot be at the filesystem root

win11&#xff0c; 安装启动完Android Studio后&#xff0c;一直显示 The Android SDK location cannot be at the filesystem root因此需要下载SDK包&#xff0c;必须开启代理。 开启代理后&#xff0c;在System下开启自动检测代理&#xff0c;如图 重启Android Studio&a…

任务【浦语提示词工程实践】

0.1 环境配置 首先点击左上角图标&#xff0c;打开Terminal&#xff0c;运行如下脚本创建虚拟环境&#xff1a; # 创建虚拟环境 conda create -n langgpt python3.10 -y 运行下面的命令&#xff0c;激活虚拟环境&#xff1a; conda activate langgpt 之后的操作都要在这个环境…

基于LORA的一主多从监测系统_0.96OLED

关联&#xff1a;0.96OLED hal硬件I2C LORA 在本项目中每个节点都使用oled来显示采集到的数据以及节点状态&#xff0c;OLED使用I2C接口与STM32连接&#xff0c;这个屏幕内部驱动IC为SSD1306&#xff0c;SSD1306作为从机地址为0x78 发送数据&#xff1a;起始…

Windows环境安装CentOS7

【注意】安装CentOS需要先安装Vmware虚拟机 【下载前准备】 一、下载CentOS 7镜像文件阿里云镜像开源&#xff0c;点击跳转 二、安装VMware&#xff08;17&#xff09;&#xff1a; a. 官网&#xff0c;点击跳转 b. 许可证&#xff1a;JU090-6039P-08409-8J0QH-2YR7F 安装V…

Aegisub字幕自动化及函数篇(图文教程附有gif动图展示)(二)

目录 template行 template pre-line template line template syl template syl noblank template char template notext template pre-line notext template syl noblank notext template keeptags ​编辑 template loop number 内联变量 ​编辑 remeber函数 re…

提示工程、微调和 RAG

自众多大型语言模型&#xff08;LLM&#xff09;和高级对话模型发布以来&#xff0c;人们已经运用了各种技术来从这些 AI 系统中提取所需的输出。其中一些方法会改变模型的行为来更好地贴近我们的期望&#xff0c;而另一些方法则侧重于增强我们查询 LLM 的方式&#xff0c;以提…

【华为OD机试真题】95、最少面试官数

package mainimport ("fmt""sort" )type s struct {start intend intworkCount int }type duration struct {start intend int }// 查询时间段内是否有可用的面试官 func getFreeS(sList []*s, d *duration, workCountLimit int) (sIndex int)…

CanOpen转Profinet网关与钢成型机等机械集成时发挥的作用

在现代工业自动化领域&#xff0c;不同设备和系统之间的通信至关重要。CanOpen和Profinet是两种广泛应用于工业控制系统的通讯协议。CanOpen通常用于设备级别的通信&#xff0c;而Profinet则更常见于工业以太网&#xff0c;适用于更大范围的系统级控制。当型钢成型机等复杂机械…

@Service代替@Controller注解来标注到控制层的场景?

在SpringBoot开发中&#xff0c;Controller和Service基本上是日常开发中使用的最频繁的两个注解。但你有没考虑过Service代替Controller注解来标注到控制层的场景&#xff1f;换言之&#xff0c;经过Service标注的控制层能否实现将用户请求分发到服务层的功能&#xff1f; 前言…

视频智能分析/AI智能分析网关V4客流统计算法介绍及其在多领域多场景中的应用

随着人工智能技术的快速发展&#xff0c;AI智能分析网关V4作为一种集高性能、低功耗于一体的软硬一体AI边缘计算硬件设备&#xff0c;在工地、工厂、园区、消防、社区、校园等领域展现出强大的应用潜力。本文将详细介绍AI智能分析网关V4的客流统计算法原理及其在多个场景中的应…

[Python] 函数入参中的 *args和**kwargs 是什么意思

Python函数中*args和**kwargs的用法&#xff0c;它们允许接收任意数量的位置参数和关键字参数。*args用于非关键字的可变参数&#xff0c;而**kwargs则用于接受键值对的可变参数。在调用函数时&#xff0c;字典参数需置于单实例参数之后。示例代码展示了如何定义和使用这些可变…

上海马拉松2024年:城市律动,跑者狂欢

随着2024年的脚步日益临近&#xff0c;上海这座国际化大都市即将迎来一场体育盛事——上海马拉松。作为城市律动与跑者狂欢的完美结合&#xff0c;上海马拉松不仅吸引了来自世界各地的跑者&#xff0c;更成为了展现上海城市魅力和体育精神的重要窗口。 本次上海马拉松将于2024年…

每日OJ题_牛客_AB13【模板】拓扑排序_C++_Java

目录 牛客_AB13【模板】拓扑排序 题目解析 C代码 Java代码 牛客_AB13【模板】拓扑排序 【模板】拓扑排序_牛客题霸_牛客网 (nowcoder.com) 描述&#xff1a; 给定一个包含nn个点mm条边的有向无环图&#xff0c;求出该图的拓扑序。若图的拓扑序不唯一&#xff0c;输出任意合法…