【大数据开发技术】实验01-Hadoop安装部署

news2025/1/17 6:15:05

文章目录

  • Hadoop安装部署
  • 一、实验目标
  • 二、实验要求
  • 三、实验内容
  • 四、实验步骤
  • 附:系列文章

Hadoop安装部署

虚拟机数量:3

系统版本:Centos 7.5

Hadoop版本: Apache Hadoop 2.7.3

主节点信息:

  1. 操作系统:CentOS7.5

  2. 软件包位置:/home/zkpk/tgz

  3. 数据包位置:/home/zkpk/experiment

从节点信息:

  1. 操作系统:CentOS7.5

  2. 软件包位置:/home/zkpk/tgz

  3. 数据包位置:/home/zkpk/experiment

从节点信息:

  1. 操作系统:CentOS7.5

  2. 软件包位置:/home/zkpk/tgz

  3. 数据包位置:/home/zkpk/experiment

一、实验目标

  1. 掌握VMware虚拟机的下载和安装。
  2. 掌握Linux操作系统Ubuntu或CentOS的下载和安装方法。
  3. 掌握Linux操作系统的基本命令。
  4. 掌握主机名和主机列表配置方法。
  5. 掌握时钟同步配置方法。
  6. 掌握JDK安装配置方法。
  7. 熟悉查看防火墙状态、关闭防火墙的命令。
  8. 掌握免密钥登录配置方法。
  9. 掌握配置部署hadoop集群方法,理解相关配置文件作用。
  10. 掌握启动hadoop集群方法。

二、实验要求

  1. 给出每步操作成功后的效果的截图,最终效果是检查集群启动成功截图。
  2. 对本次实验工作进行全面的总结。

三、实验内容

  1. 登录大数据实验室,ping一个外网网址,确保能够ping通。
  2. 配置主机名,配置hosts列表。(临时设置主机名,名字用自己的姓名拼音,最后设置回原有主机名)。
  3. 配置时钟同步。
  4. 防火墙设置:查看防火墙状态、关闭防火墙、开启防火墙、禁止开机启动防火墙。
    语句:systemctl status firewalld可以查询防火墙的状态(默认为关闭)
    语句:systemctl start firewalld.service开启防火墙(此时查询,防火墙已经开启)
    语句:systemctl stop firewalld.service 可以关闭防火墙(此时查询防火墙状况,为关闭)
    语句:systemctl disable firewalld.service禁止开机启动防火墙(此时查询,防火墙为关闭)
  5. 安装JDK,测试java是否配置成功(创建一个用自己名字拼音命名的Java类,类名和文件内容自拟)。
  6. 配置免密钥登录,在master机器上远程登录slave01或slave02。
  7. 安装部署Hadoop集群,通过实例验证集群配置成功。

四、实验步骤

备注:给出每一个操作步骤成功的效果截图,也可以自己设置实验步骤,完成集群配置,并通过实例验证集群配置成功,下面实验步骤供参考。

  1. 登录大数据实验室,进入实验,打开一个终端,ping一个外网网址,确保能够ping通。
    1

  2. 配置主机名,配置hosts列表。

  • 2.1 操作需要root权限,所以先切换成root用户,密码:zkpk
[zkpk@localhost ~]$ su root
  • 2.2 使用gedit编辑主机名文件
[root@localhost ~]# gedit /etc/hostname
  • 2.3 临时设置主机名,名字用自己的姓名拼音,检测主机名是否修改成功:bash命令让上一步操作生效,最后设置回原有主机名
[root@localhost ~]# hostname master
[root@localhost zkpk]# bash
[root@master zkpk]# hostname
master
  • 2.4 临时设置主机名为slave01,检测主机名是否修改成功:bash命令让上一步操作生效

  • 2.5 临时设置主机名为slave02,检测主机名是否修改成功:bash命令让上一步操作生效

  • 2.6 配置hosts列表
    2

  1. 配置时钟同步。
    3
    4
    5

  2. 查看防火墙状态、关闭防火墙。
    6

  3. 配置免密钥登录,在master机器上远程登录slave01或slave02。
    78
    9
    10
    11

  4. 安装JDK。

  • 6.1 切换root用户,移除系统自带的jdk
  • 6.2 创建存放jdk文件目录,将/home/zkpk/tgz下的JDK压缩包解压到/usr/java目录下
  • 6.3 配置zkpk用户环境变量
  • 6.4 使环境变量生效
  • 6.5 查看、测试java是否配置成功(创建一个用自己名字拼音命名的Java类,类名和文件内容自拟):
    1213
    14
  1. 安装部署Hadoop集群。
    说明:每个节点上的Hadoop配置基本相同,在master节点操作,然后复制到slave01、slave02两个节点。
  • 7.1 将/home/zkpk/tgz/hadoop目录下的Hadoop压缩包解压到/home/zkpk目录下

  • 7.2 配置hadoop-env.sh文件使用gedit命令修改hadoop-env.sh文件修改JAVA_HOME环境变量

  • 7.3 配置yarn-env.sh文件,使用gedit命令修改yarn-env.sh文件,修改JAVA_HOME环境变量

  • 7.4 配置core-site.xml 文件,使用gedit命令修改core-site.xml文件

  • 7.5 配置hdfs-site.xml文件使用gedit命令修改hdfs-site.xml文件

  • 7.6 配置yarn-site.xml文件,使用gedit命令修改yarn-site.xml文件

  • 7.7 配置mapred-site.xml文件,复制mapred-site-template.xml文件,使用gedit编辑mapred-site.xml文件

  • 7.8 配置slaves文件,使用gedit编辑slaves文件
    15

  • 7.9 将配置好的hadoop文件夹复制到从节点,使用scp命令将文件夹复制到slave01、slave02上【说明:因为之前已经配置了免密钥登录,这里可以直接免密钥远程复制】
    16

  • 7.10 格式化hadoop环境变量,格式化hadoop文件目录
    17

  • 7.11 启动Hadoop集群(在master上执行)运行start-all.sh命令。【说明:格式化后首次执行此命令,提示输入yes/no时,输入yes】

  • 7.12 查看进程是否启动,分别在master,slave01和slave02终端执行jps命令
    18

  • 7.13 Web UI查看集群是否成功启动
    (1)在master上打开Firefox浏览器,在浏览器地址栏中输入http://master:50070/,检查namenode 和datanode 是否正常
    19
    (2)打开浏览器新标签页,地址栏中输入http://master:18088/,检查Yarn是否正常
    20

  • 7.14 运行PI实例检查集群是否成功,最后输出:Estimated value of Pi is 3.20000000000000000000
    21

附:系列文章

实验文章目录直达链接
实验01Hadoop安装部署https://want595.blog.csdn.net/article/details/132767284
实验02HDFS常用shell命令https://want595.blog.csdn.net/article/details/132863345
实验03Hadoop读取文件https://want595.blog.csdn.net/article/details/132912077
实验04HDFS文件创建与写入https://want595.blog.csdn.net/article/details/133168180
实验05HDFS目录与文件的创建删除与查询操作https://want595.blog.csdn.net/article/details/133168734

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1047243.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Tomcat 与 JDK 对应版本关系

对应关系 Tomcat版本 jdk版本11.0.x JDK 21及以后10.1.x JDK11及以后10.0.xJDK1.8及以后9.0.x JDK1.8及以后8.5.xJDK1.7及以后8.0.x JDK1.7及以后 查看对应关系方法: 登陆Tomcat官网:Apache Tomcat - Welcome! 结果:

Arthas:Java调试利器使用

Arthas:Java调试利器使用 1. Arthas是什么2. Arthas可以解决什么问题Arthas启动方式1. jar启动2. 在线安装 远程连接命令使用- 退出threadclassloaderscsm watchtrace修改日志级别 1. Arthas是什么 Arthas(阿尔萨斯)是阿里开源的一个Java在线分析诊断工具. 2. Arthas可以解决…

C#(CSharp)入门实践项目(简易回合制游戏)

项目名称 木木夕营救公主 项目介绍 这是一个小游戏,你将扮演一个英雄(木木夕),去打败恶龙,拯救出公主,该项目采用回合制战斗模式,由于角色的血量和攻击为随机数,所以需要靠运气才…

YOLOv7改进:CBAM注意力机制

目录 1.介绍 1.1、论文的出发点 1.2、论文的主要工作 1.3、CBAM模块的具体介绍 2.YOLOv7改进 2.1yaml 配置文件如下 2.2common.py配置 2.3yolo.py配置 1.介绍 1.1、论文的出发点 cnn基于其丰富的表征能力,极大地推动了视觉任务的完成,为了提高…

【MySql】3- 实践篇(一)

文章目录 1. 普通索引和唯一索引的选择1.1 查询过程1.2 更新过程1.2.1 change buffer1.2.2 change buffer 的使用场景 1.3 索引选择和实践1.4 change buffer 和 redo log2. MySQL为何有时会选错索引?2.1 优化器的逻辑2.1.1 扫描行数是怎么判断的?2.1.2 重新统计索引信息 2.2 …

一站式吃鸡利器,提升游戏战斗力,助您稳坐鸡王宝座!

各位吃鸡玩家们,听说过绝地求生作图工具吗?想知道如何提高游戏战斗力、分享顶级作战干货、查询装备皮肤库存?还在为游戏账号安全而担心吗?别急,今天就为您介绍一款一站式吃鸡利器,满足您的所有需求&#xf…

【使用工具】IDEA创建类及已有类添加注释-详细操作

1.背景 很多开发好多时候其实不太会给类添加注释,尤其是已经有的类,上网查询,好多文档错误百出,而且不全 2.正文 2.1新建类添加注释 idea给新建类创建注释有两种方式 先写一个简单的模板 /** * description: TODO * autho…

kotlin协程CoroutineScope Dispatchers.IO launch 线程Id

kotlin协程CoroutineScope Dispatchers.IO launch 线程Id import kotlinx.coroutines.*fun main(args: Array<String>) {println("main 线程id:${Thread.currentThread().threadId()}")CoroutineScope(Dispatchers.IO).launch {println("launch 线程id:$…

【JVM】第二篇 JVM内存模型深度剖析与优化

目录 一. JDK体系结构与跨平台特性介绍二. JVM内存模型深度剖析三. 从Jvisualvm来研究下对象内存流转模型四. GC Root与STW机制五. JVM参数设置通用模型一. JDK体系结构与跨平台特性介绍 二. JVM内存模型深度剖析 按照线程是否共享来划分 TLAB(Thread Local Allocation Buffer…

mybatis核心组件

title: “mybatis核心组件” createTime: 2021-12-08T12:19:5708:00 updateTime: 2021-12-08T12:19:5708:00 draft: false author: “ggball” tags: [“mybatis”] categories: [“java”] description: “mybatis核心组件” #mermaid-svg-AYu4pQutsPsK0P5T {font-family:&quo…

stm32 - 初识2

stm32 - 初识2 工程架构点灯程序寄存器方式点灯库函数的方式点灯 工程架构 启动文件 中断向量表&#xff0c;中断服务函数&#xff0c;其他中断等 中断服务函数中的&#xff0c;复位中断是整个程序的入口&#xff0c;调用systeminit&#xff0c;和main函数 点灯程序 寄存器方式…

自适应阈值分割-OTSU

OTSU 在前面固定阈值中选取了一个阈值为127进行阈值分割&#xff0c;那如何知道选的这个阈值效果好不好呢&#xff1f;答案是&#xff1a;不断尝试&#xff0c;所以这种方法在很多文献中都被称为经验阈值。 Otsu阈值法就提供了一种自动高效的二值化方法。Otsu算法也称最大类间…

C++之std::atomic类模板原子操作应用总结(二百三十九)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 人生格言&#xff1a; 人生…

JAVA+SpringBoot+VUE工厂车间管理系统(含论文)源码

springboot169基于vue的工厂车间管理系统的设计录像(毕业设计jdz2023) 一、源码描述 JAVASpringBootVUE工厂车间管理系统,包含源码数据库论文等,含MySQL脚本&#xff0c;基于B/S和Web开发的&#xff0c;感兴趣的朋友可以下载看看 二、功能介绍 1、个人中心 2、人员管理 3、设备…

计算机图像处理:图像轮廓

图像轮廓 图像阈值分割主要是针对图片的背景和前景进行分离&#xff0c;而图像轮廓也是图像中非常重要的一个特征信息&#xff0c;通过对图像轮廓的操作&#xff0c;就能获取目标图像的大小、位置、方向等信息。画出图像轮廓的基本思路是&#xff1a;先用阈值分割划分为两类图…

Textpad 缺少Java编译和运行功能

一、问题 缺少Java编译和运行功能 二、处理方法 1、点击菜单Configure->Preferences 2、点击 Tools -> Add -> Java SDK Commands 3、点击应用和确认 三、结果

现代 GPU 容易受到新 GPU.zip 侧通道攻击

来自四所美国大学的研究人员开发了一种新的 GPU 侧通道攻击&#xff0c;该攻击利用数据压缩在访问网页时泄露现代显卡中的敏感视觉数据。 研究人员通过 Chrome 浏览器执行跨源 SVG 过滤器像素窃取攻击&#xff0c;证明了这种“ GPU.zip ”攻击的有效性。 研究人员于 2023 年 …

【JVM】第五篇 垃圾收集器G1和ZGC详解

导航 一. G1垃圾收集算法详解1. 大对象Humongous说明2. G1收集器执行一次GC运行的过程步骤3. G1垃圾收集分类4. G1垃圾收集器参数设置5. G1垃圾收集器的优化建议6. 适合使用G1垃圾收集器的场景?二. ZGC垃圾收集器详解1. NUMA与UMA2. 颜色指针3. ZGC的运作过程4. ZGC垃圾收集器…

mysql面试题2:说一说MySQL的架构设计?一条 MySQL 语句执行的步骤?

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:说一说MySQL的架构设计? MySQL的架构设计主要包括以下几个组件: 连接器(Connector):负责与客户端建立连接,并进行身份验证和授权。 查询缓存…

文件的随机读写函数:fseek

目录 函数介绍&#xff1a; fseek&#xff1a; 原型&#xff1a; 参数说明&#xff1a; int origin&#xff1a; 举例&#xff1a; 文件内容展示&#xff1a; 正常的使用fgetc函数&#xff1a; 结果&#xff1a; 使用了fseek之后&#xff1a; SEEK_SET :从开始位置进行…