Hadoop启动相关命令

news2024/9/23 5:29:55

Hadoop启动相关配置


文章目录

  • Hadoop启动相关配置
    • 格式化节点的情况
      • 什么情况下Hadoop需要进行格式化节点?
    • Hadoop启动步骤
      • Hadoop的启动步骤只是start-dfs.sh即可吗
    • *hdfs*的web管理页面参数说明
      • 参数的评价场景

格式化节点的情况

什么情况下Hadoop需要进行格式化节点?

Hadoop需要在以下情况下格式化NameNode:

  • 首次安装Hadoop:在第一次搭建和配置Hadoop集群时,需要对NameNode进行格式化。格式化操作会创建HDFS的元数据存储结构并初始化NameNode。注意,在之后的操作中,不需要再次格式化NameNode,除非要重置整个HDFS。
  • 重置HDFS:如果希望重置整个HDFS,删除所有数据和元数据,那么可以重新格式化NameNode。但是注意,这将导致所有HDFS上的数据丢失。

要格式化NameNode,运行以下命令:

$HADOOP_HOME/bin/hadoop namenode -format

Hadoop启动步骤

Hadoop的启动步骤只是start-dfs.sh即可吗

start-dfs.sh脚本仅用于启动Hadoop分布式文件系统(HDFS)相关的组件,如NameNode、Secondary NameNode(如果配置了)和DataNode。运行此脚本后,HDFS服务将启动并运行。

然而,Hadoop生态系统还包括其他组件,如YARN(用于资源管理和任务调度)。要启动YARN组件,需要运行以下命令:

$HADOOP_HOME/sbin/start-yarn.sh

这将启动ResourceManager和NodeManager。

因此,为了完全启动Hadoop集群,需要运行两个脚本:start-dfs.shstart-yarn.sh。这将启动HDFS和YARN组件。如果只关心HDFS功能,那么运行start-dfs.sh就足够了。

hdfs的web管理页面参数说明

image-20230417135631277

  • Configured Capacity: 配置容量是HDFS集群中所有DataNode的总存储容量。在这个例子中,配置容量为456.88 GB。
  • DFS Used: DFS已使用的存储空间。这是HDFS中已存储的数据量。在这个例子中,已使用56 KB。
  • Non DFS Used: 非DFS已使用的存储空间。这是DataNode上用于其他目的(非HDFS)的存储空间。在这个例子中,非DFS已使用189.99 GB。
  • DFS Remaining: DFS剩余的存储空间。这是HDFS集群中尚未使用的存储空间。在这个例子中,剩余243.61 GB(占配置容量的53.32%)。
  • Block Pool Used: 块池已使用的存储空间。这是HDFS中已分配给块池的存储空间。在这个例子中,已使用56 KB。
  • DataNodes usages% (Min/Median/Max/stdDev): DataNode使用率的统计信息,包括最小、中位数、最大和标准差。在这个例子中,所有这些值都是0.00%。
  • Live Nodes: 当前运行中的DataNode数量。在这个例子中,有1个活动的DataNode(未被停用或处于维护状态)。
  • Dead Nodes: 当前不可用或已宕机的DataNode数量。在这个例子中,没有死亡的DataNode。
  • Decommissioning Nodes: 正在停用的DataNode数量。在这个例子中,没有正在停用的DataNode。
  • Entering Maintenance Nodes: 正在进入维护状态的DataNode数量。在这个例子中,没有正在进入维护状态的DataNode。
  • Total Datanode Volume Failures: 数据节点磁盘故障的总数。在这个例子中,数据节点磁盘故障为0。
  • Number of Under-Replicated Blocks: 副本数量低于配置值的块数量。在这个例子中,没有低于配置值的副本。
  • Number of Blocks Pending Deletion: 待删除的块数量。在这个例子中,没有待删除的块。
  • Block Deletion Start Time: 块删除开始的时间。在这个例子中,块删除开始于2023年4月17日13:40:59(UTC+8)。
  • Last Checkpoint Time: 最近一次检查点的时间。在这个例子中,最近的检查点发生在2023年4月17日13:41:00(UTC+8)。

参数的评价场景

  • 集群健康监控:这些参数有助于监控HDFS集群的健康状况,以确保集群正常运行。例如,通过查看**"Live Nodes"和"Dead Nodes"参数,可以了解数据节点的运行状态**,从而判断集群是否正常运行
  • 存储空间管理:了解存储空间的使用情况对于集群管理至关重要。例如,通过查看"Configured Capacity"、“DFS Used”、"Non DFS Used"和"DFS Remaining"等参数,可以了解集群的存储空间使用情况,从而判断是否需要扩容或进行存储空间优化
  • 数据复制和一致性监控:某些参数有助于评估数据的复制和一致性状态。例如,"Number of Under-Replicated Blocks"表示副本数量低于配置值的块数量,这可能导致数据丢失风险增加。监控这些参数有助于确保数据的可靠性和一致性。
  • 性能优化:某些参数可以帮助了解集群的性能和负载情况,例如"DataNodes usages%",可以通过这个参数了解数据节点的使用率。这些信息有助于优化集群配置,提高集群性能。
  • 故障排查和恢复:在发生问题时,这些参数可以帮助识别问题的原因。例如,"Total Datanode Volume Failures"参数表示数据节点磁盘故障的总数,这可能导致数据丢失或集群性能下降。了解这些参数有助于快速诊断和解决问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/440240.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

赛效:怎么用改图鸭进行一键Logo设计?

改图鸭工具是一款在线图像处理工具,可以对图片进行大小调整、添加色彩、滤镜等,用户使用改图鸭可快速轻松地对多种图像进行处理操作,另外,改图鸭工具还支持一键进行Logo设计,很多人对改图鸭工具比较陌生,不…

rsync 服务器备份代码

rpm -qa | grep rsync #检查rsync软件是否存在 yum -y install rsync #安装rsync服务 systemctl start rsyncd #启动rsync服务 systemctl enable rsyncd #加入rsync开机启动 systemctl reload rsyncd #重新加载rsync netstat -lnp|grep 873 #检查是否已经成功启动 firewall…

【代码随想录】刷题Day2

1.左右指针比大小 977. 有序数组的平方 class Solution { public:vector<int> sortedSquares(vector<int>& nums) {vector<int> ret nums;int left 0;int right nums.size()-1;int end nums.size();while(left<right){if(abs(nums[left])>abs…

vue-element-admin-master编译异常记录

前言 最近一直在往大前端的方向转&#xff0c;不得不说前端的知识架构还真的很庞大&#xff0c;一步一个脚印吧&#xff0c;之前消化完极简版后台项目[vue-admin-template-master]后&#xff0c;开始想看下完整版的后台[vue-element-admin-master]项目&#xff0c;奈何clone项…

ChatGPT实战100例 - (08) 设计转化为SQL并获取ER图

文章目录 ChatGPT实战100例 - (08) 设计转化为SQL并获取ER图一、需求与思路二、SQL建表三、绘制四、 总结 ChatGPT实战100例 - (08) 设计转化为SQL并获取ER图 一、需求与思路 在你还在手撸SQL&#xff1f;ChatGPT笑晕在厕所 这篇博文中 针对经典3表设计&#xff1a; 学生表 S…

【我在CSDN成长】我的两周年创作纪念日

【我在CSDN成长】我的两周年创作纪念日 一、来到CSDN的大家庭二、在CSDN的收获1.在CSDN的感受2.在CSDN的收获 三、在CSDN的未来规划憧憬 一、来到CSDN的大家庭 当看到这个信息时&#xff0c;才发现不知不觉已经在CSDN创作两年了&#xff0c;今天才腾出时间来写下这篇博文。感叹…

绕开坑坑,申请高德地图安卓appKey的步骤

在申请高德地图 appkey的时候&#xff0c;我们会采用keytool的方法来生成sha1码。这里面有坑&#xff0c;请看 PS C:\Users\cuclife.android> keytool -v -list -keystore keystore keytool 错误: java.lang.Exception: 密钥库文件不存在: keystore java.lang.Exception: 密…

涨点技巧:IOU篇---Yolov5/Yolov7引入WIoU,SIoU,EIoU,α-IoU

1.IOU介绍 IoU其实是Intersection over Union的简称,也叫‘交并比’。IoU在目标检测以及语义分割中,都有着至关重要的作用。 首先,我们先来了解一下IoU的定义: 我们可以把IoU的值定为为两个图形面积的交集和并集的比值,如下图所示: 1.1 Yolov5自带IOU方法 GIoU, DIoU,…

Kubernetes(k8s 1.23.17) 基于docker 一主两从集群环境搭建

结合网上资料&#xff0c;利用k8s最后直接支持docker的版本1.23.17搭建&#xff0c;并本地验证完成。 1 虚拟机准备 1.1 规划 系统角色/hostnameIP地址配置CentOS 7.9 &#xff08;需要7.5&#xff09;master192.168.68.1002Core、4G内存、40GB磁盘CentOS 7.9 &#xff08;需…

一篇文章告诉你,为什么移动数据捕获对运输物流公司很重要?

随着世界走向数字化和智能手机的使用增加&#xff0c;移动数据采集正在成为大多数行业的新常态。航运物流也不例外。从捕获详细的订单和交付信息到跟踪货运和仓库位置&#xff0c;条形码技术用于运输物流世界的每一步。通过智能数据采集&#xff0c;运输和物流公司可以获得更好…

camunda的service task如何使用

在 Camunda 中&#xff0c;使用 Service Task 节点可以执行各种类型的业务逻辑&#xff0c;例如计算、数据转换、数据格式化等。在 Service Task 节点中&#xff0c;可以使用不同的编程语言来实现业务逻辑&#xff0c;例如 Java、JavaScript、Python 等。 下面是使用 Java 实现…

生产制造企业如何建立适合自身的数字化工厂,实现数字化转型?

“工业4.0”这一全新的术语受到全球的瞩目&#xff0c;它是继机械化、电气化和信息技术之后&#xff0c;以智能制造为核心的第四次工业革命。“工业4.0”最显著的特征是智能工厂的广泛普及。而智能工厂是在数字化工厂的基础上发展而来的&#xff0c;没有数字化就没有智能化。因…

如何在低代码平台上构建ERP软件

ERP软件是企业管理日常运营需求的关键组件。然而&#xff0c;对于许多企业&#xff0c;尤其是资源有限的企业来说&#xff0c;尝试构建和管理ERP平台可能要担负较高的成本的。幸运的是&#xff0c;低代码平台可以使这个过程变得容易得多。今天我们来解释如何在低代码平台上构建…

【IDEA】数据湖 Hudi 0.12.0 基础使用

文章目录 创建 Maven 项目插入数据查询数据更新数据增量查询删除数据 前言 集群系统&#xff1a;CentOS 7.5 服务器信息&#xff1a; 服务器角色IPhadoop104服务器Master192.168.0.104hadoop105服务器Slave1192.168.0.105hadoop106服务器Slave2192.168.0.106 使用的组件版本…

看完这篇文章你就彻底懂啦{保姆级讲解}-----(LeetCode刷题977有序数组的平方) 2023.4.20

目录 前言算法题&#xff08;LeetCode 977有序数组的平方&#xff09;—&#xff08;保姆级别讲解&#xff09;分析题目算法思想&#xff08;重要&#xff09;暴力解法代码&#xff1a;双指针法&#xff08;快慢指针法&#xff09;代码&#xff1a; 结束语 前言 本文章一部分内…

C++ Primer (第五版)-第九章 顺序容器

文章目录 一、概述二、内容9.1、顺序容器概述如何选择合适的容器 9.2、容器库概览迭代器容器类型成员列表初始化赋值和Swap容器的大小关系运算符 9.3 顺序容器操作9.3.1向顺序容器添加元素访问元素删除元素改变容器大小 9.4 Vector 对象如何增长9.5、额外的string 操作9.5.2、改…

【散文诗】单片机运行下和非运行下的 ROM 和 RAM

目录 一、两种处理器的结构体系1. 哈佛结构体系2. 冯诺依曼结构体系3. 两种结构的总结 二、单片机运行下和非运行下的内存分配1. 非运行时的单片机程序在ROM内的分布2. 运行时的单片机程序在RAM内的分布 三、单片机程序和操作系统应用程序的对比四、编译流程 一、两种处理器的结…

Java 8 中使用 Lambda 表达式和 Stream API 解决 LeetCode 的两数之和问题

Java 8 中使用 Lambda 表达式和 Stream API 解决 LeetCode 的两数之和问题 当我们在面对一个数列&#xff0c;需要查找其中两个元素的和为给定目标值时&#xff0c;可以使用两数之和&#xff08;Two Sum&#xff09;问题来解决。这个问题在 LeetCode 上有很高的重要性和普遍性&…

入行IC| 数字IC设计和验证哪个好?(内含薪资对比)

网上有一个很火的问题那就是数字IC设计和验证哪个好&#xff1f;接下来我们从以下几个维度来对比一下这两个岗位。 入行门槛 从上述对比就可以看出&#xff0c;IC设计要比验证门槛高。 具体工作内容有哪些&#xff1f; 数字IC前端设计 1.配合芯片架构的设计&#xff1b;一…

技术干货|直流电源自动测试系统功能介绍

直流电源是一种将交流电转换为恒定电压或电流输出的电子设备。在实际生产生活中&#xff0c;直流电源被广泛应用于各种场合。但由于各种原因&#xff0c;包括工艺、质量等因素&#xff0c;直流电源存在一定的出厂偏差。为了确保直流电源的精度和稳定性&#xff0c;在生产过程中…