Hadoop简介以及集群搭建详细过程

news2024/11/28 6:44:10

Hadoop简介以及集群搭建详细过程

  • hadoop集群简介
  • hadoop部署模式
  • Hadoop集群安装
    • 1.集群角色规划
    • 2.服务器基础环境准备
    • 3.上传安装包
    • hadoop安装包目录结构
    • 5.编辑hadoop配置文件
    • 6.分发安装包
    • 7.配置hadoop环境变量
    • 8.NameNode format(格式化操作)
  • hadoop集群启动关闭-手动逐个进程启停
    • shell脚本一键启停

hadoop集群简介

  • hadoop加群包括两个集群:hdfs集群,yarn集群
  • 两个集群逻辑上分离,通常物理上在一起
  • 两个集群都是标准的主从架构集群

在这里插入图片描述

  • 逻辑上分离:两个集群相互之间没有依赖,互不影响
  • 物理上在一起:某些角色今晚往往部署在同一台物理服务器上
  • MapReduce集群呢?
    • MapReduce是计算框架、代码层面的组件没有集群之说
      在这里插入图片描述

hadoop部署模式

在这里插入图片描述

Hadoop集群安装

1.集群角色规划

  • 角色规划的准则
    • 根据软件工作特性和服务器硬件资源情况合理分配
    • 比如依赖内存工作的namanode是不是不花在大内存机器上
  • 角色规划注意事项
    • 资源上有抢夺冲突的,尽量不要部署在一起
    • 共偶作上需要相互配合的,尽量部署在一起
      在这里插入图片描述

2.服务器基础环境准备

  • 防火墙关闭(三台机器)
    • systemctl stop firewalld. service #关闭防火墙
    • systemtl disable firewalld. service #禁止防火墙开启自启
  • ssh免密登录(node1执行—>node1|node2|node3)
    • ssh-keygen #四个回车 生成公钥、私钥
    • ssh-copy-id node1,ssh-cpoy-id node2,ssh-coppy-id node3
  • 集群时间同步(三台机器)
    • yum -y install ntpdata
    • ntpdate ntp2.aliyun.com
  • JDK 1.8安装(三台机器)

3.上传安装包

  • 创建同一工作目录(三台机器)
    • mkdir -p /export/server/ #软件安装路径
    • mkdir -p /export/data/ #数据安装路径
    • mkdir -p /export/softwarw/ #安装包存放路径
  • 上传、解压安装包
hadoop-3.1.4-bin-snappy-CentOS7.tar.gz
tar zvxf hadoop-3.1.4-bin-snappy-CentOS7.tar.gz -C /export/server

hadoop安装包目录结构

在这里插入图片描述

5.编辑hadoop配置文件

  • hadoop-env.sh
    • cd /esport/server/hadoop-3.1.4/etc/hadoop/
    • vim hadoop-env.sh

在这里插入图片描述

  • core-site.xml
    • cd /export/server/hadoop-3.1.4/etc/hadoop/
    • vim sore-site.xml

在这里插入图片描述

  • hafs-site.xml

    • cd /export/server/hadoop-3.1.4/etc/hadoop/
    • vim hdfs-site.xml

在这里插入图片描述

  • mapred-site.xml

    • cd /export/server/hadoop-3.1.4/etc/hadoop/
    • vim mared-site.xml

在这里插入图片描述

  • yarn-site.xml

    • cd /export/server/hadoop3.1.4/etc/hadoop
    • vim yarn-site.xml

在这里插入图片描述

  • workers

    • cd /export/server/hadoop-3.1.4/etc/hadoop
    • vim workers
      在这里插入图片描述

6.分发安装包

  • 在node1机器上奖hadoop安装包scp同步到其他机器
    • cd /export/server/
    • scp -r hadoop-3.1.4 root@node2: /export/server/
    • scp -r hadoop-3.1.4 root@node3: /export/server/

7.配置hadoop环境变量

  • 在node1上配置hadoop换件变量
    • vim /etc/profile
    • export HADOOP_HOME=/export/server/hadoop-3.1.4
    • export PATH= P A T H : PATH: PATH:HADOOP_HOME/bin:$HADOOP_HOME/bin
  • 将修改后的环境变量同步到其他机器
    • scp /etc/profile root@node2:/etc/
    • scp /etc/profile root@node3:/etc/
  • 重新加载环境变量,验证是否生效(三台机器)
    • sourece /etc/profile
    • hadoop #验证是否生效
      在这里插入图片描述

8.NameNode format(格式化操作)

  • 首次启动hdfs时,必须对齐进行格式化操作
  • format本质上是初始化工作,进行hdfs清理和准备工作
  • 命令:hdfs namenode -format

在这里插入图片描述

  • 首次启动之前需要format操作
  • format只能进行一次,后续不在需要
  • 如果多次format除了造成数据丢失外,还会导致hdfs集群主从角色之间互不识别,通过删除所有机器hadoop.tmp.dir目录重新format解决

hadoop集群启动关闭-手动逐个进程启停

  • 每台机器上每次手动启动关闭一个角色进程
  • hdfs集群
    • hafs --daemon start namenode|datanode|decondarynamenoe
    • hafs --daemon stop namenode|datanode|decondarynamenoe
  • yarn集群
    • yarn --daemon start resourcemanager|nodemanager
    • yarn --daemon stop resourcemanager|nodemanager

shell脚本一键启停

  • 在node1上,使用软件自带的shell脚本一键启动
  • 前提:配置好机器之间的shh免密登录和workers文件
  • hdfs集群
    • start-dfs.sh
    • stop-dfs.sh
  • yarn集群
    • start-yarn.sh
    • stop-yarn.sh
  • hadoop集群
    • start-all.sh
    • stop-all.sh
      在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/777876.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数字孪生in电力终端:高效虚拟环境实现测试“左移”

电力资源是现代社会发展必不可少的清洁型可再生资源,在清洁性、高效性、便捷性和适用性等方面优于传统化石能源,是如期实现2030年前碳达峰、2060年前碳中和的“双碳”目标的关键。2006至2019年前,电力行业累计为全社会减少了约159.4亿吨的碳排…

VSCode_常用插件_最新推荐

本文介绍前端开发领域常用的一些VSCode插件,插件是VSCode最重要的组成部分之一,本文列出了个人觉得是有用或有趣的一些插件。 一、代码管理相关插件 1、GitLens — Git supercharged 该插件增强了 VS Code 中的 Git,通过丰富的可视化和强…

【大厂直通车】百度2024届测开提前批一面面经(烫).

📬📬哈喽,大家好,我是小浪。那么最近24届提前批的公司陆续开了大大小小有好几十家了。有很多的同学已经制作好了简历,陆续开始投递了。但是结果,确实很不尽人意,在某论坛上面看到很多同学简历这…

5分钟,结合 LangChain 搭建自己的生成式智能问答系统

伴随大语言模型(LLM,Large Language Model)的涌现,人们发现生成式人工智能在非常多领域具有重要意义,如图像生成,书写文稿,信息搜索等。随着 LLM 场景的多样化,大家希望 LLM 能在垂直…

如何邀请明星和乐队演出你的音乐节?

组织一场音乐节是一个令人兴奋和具有挑战性的任务。邀请明星和乐队演出是吸引观众、增加活动吸引力的重要一环。以下是一些关键步骤和策略,媒介易帮助你成功邀请明星和乐队演出你的音乐节。 确定音乐节的定位和目标:首先,明确你的音乐节的定…

人工智能现在可以在没有人类的情况下学习!

一旦精灵离开灯,即使不是不可能,也很难将其放回去! 南加州大学的一项研究表明 ,相互共享知识的人工智能模型可以相互学习并快速掌握不同的任务。 这一发现具有在包括医学在内的各个领域应用的潜力。 一组研究人员开发了一种名…

shell脚本定时推送钉钉战报

一、目的与演示效果 解析服务端返回的如下字符串,获取今日数据、历史数据,实现钉钉定时推送战报效果。 {"code": "00000","msg": "","success": true,"data": {"2023-07-19": …

nacos适配达梦、瀚高、人大金仓数据库及部分源码探究

一.插件实现 1.插件目录结构 2.pom依赖 <dependency><groupId>com.alibaba.nacos</groupId><artifactId>nacos-datasource-plugin</artifactId><version>2.2.4</version></dependency><dependency><groupId>org.s…

自动化测试(二):安卓机初探与Python实现andriod截图实例

目录 1.安卓开发常用术语介绍2. 各种SDK的安装&#xff08;陆续补充ing&#xff09;2.1 JDK的安装2.2 单独安装Android SDK部分组件2.3 Android NDK的安装 3. pythonminicap实现andriod截图实例4. TODO 1.安卓开发常用术语介绍 IDE (Integrated Development Environment) : 集成…

索引的本质与数据结构

点击上方↑“追梦 Java”关注&#xff0c;一起追梦&#xff01; 正确合理的创建索引是提升数据库查询性能的基础&#xff0c;因此针对数据库来说&#xff0c;索引是必须要掌握的。 1 数据库索引的本质 我们一说到索引&#xff0c;如果大家想到是一个类似于字典的目录&#xff0…

Eclipse整合tomcat时要注意的几点

Eclipse整合tomcat时要注意的几点 1、安装目录及jdk 2、参数配置 注意&#xff1a;Arguments的配置&#xff0c;日志输出文件目录及java内存大小设置等&#xff0c;如下&#xff1a; -Dcatalina.base"E:\apache-tomcat-7.0.52" -Dcatalina.home"E:\apache-tomc…

【hadoop】Java API连接(操作)HDFS

Java API连接&#xff08;操作&#xff09;HDFS 直接连接遇到的问题设置执行的用户为root用户使用Java的-D参数来设置环境变量使用chmod的命令赋予权限修改参数配置 直接连接遇到的问题 直接运行下面的代码&#xff0c;会出现权限不够的问题 Test public void test1() throws…

Meta牵手Microsoft推出下一代Llama 2

官方消息 1、今天&#xff0c;我们将介绍 Llama 2 的可用性&#xff0c;这是我们的下一代开源大型语言模型。 2、Llama 2免费用于研究和商业用途。 3、Microsoft和 Meta 正在扩大他们的长期合作伙伴关系&#xff0c;Microsoft 是 Llama 2 的首选合作伙伴。 4、在技术、学术…

[SQL系列] 从头开始学PostgreSQL 自增 权限和时间

[SQL系列] 从头开始学PostgreSQL 事务 锁 子查询_Edward.W的博客-CSDN博客https://blog.csdn.net/u013379032/article/details/131841058上一篇介绍了事务&#xff0c;锁&#xff0c;子查询 事务有点像是原子操作&#xff0c;需要有完整性&#xff0c;要么全都完成了&#xff…

【目标跟踪】2、FairMOT | 平衡多目标跟踪中的目标检测和 Re-ID 任务 | IJCV2021

文章目录 一、背景二、方法2.1 Backbone2.2 检测分支2.3 Re-ID 分支2.4 训练 FairMOT2.5 Online Inference 三、效果3.1 数据集3.2 实现细节3.3 消融实验3.4 最终效果 论文&#xff1a;FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracki…

基于大模型的Text2SQL微调的实战教程

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

(转载)基于 BP_Adaboost 的强分类器设计(matlab实现)

本博客的完整代码获取&#xff1a; https://www.mathworks.com/academia/books/book106283.html 1案例背景 1.1 BP_Adaboost模型 Adaboost算法的思想是合并多个“弱”分类器的输出以产生有效分类。其主要步骤为:首先给出弱学习算法和样本空间(x,y),从样本空间中找出m组训练数…

Postman传递对象参数(包含有集合对象)

postman通常需要传递各式各样的参数&#xff0c;本文主要介绍了Postman传递对象参数(包含有集合对象)&#xff0c;具有一定的参考价值&#xff0c;感兴趣的小伙伴们可以参考一下 项目场景&#xff1a; postman通常需要传递各式各样的参数&#xff0c;这样的话&#xff0c;进行…

自然语言处理与词嵌入

1、词表特征 前面介绍过表征单词的方式是首先建立一个较大的词汇表&#xff08;例如10000&#xff09;&#xff0c;然后使用one-hot的方式对每个单词进行编码。例如单词Man&#xff0c;Woman&#xff0c;King&#xff0c;Queen&#xff0c;Apple&#xff0c;Orange分别出现在词…

Docker数据管理和网络通信 dockerfile

Docker数据管理和网络通信 dockerfile 一&#xff1a;Docker 的数据管理1&#xff0e;数据卷2&#xff0e;数据卷容器 二&#xff1a;端口映射三&#xff1a;容器互联&#xff08;使用centos镜像&#xff09;四&#xff1a;Docker 镜像的创建1&#xff0e;基于现有镜像创建2&am…