【Linux】Hadoop-3.4.1的伪分布式集群的初步配置

news2025/3/24 12:39:54

配置步骤

一、检查环境

  • JDK
# 目前还是 JDK8 最适合 Hadoop
java -version
echo $JAVA_HOME
  • Hadoop
hadoop version
echo $HADOOP_HOME

    二、配置SSH免密登录

    Hadoop需要通过SSH管理节点(即使在伪分布式模式下)

    sudo apt install openssh-server    # 安装SSH服务(如未安装)
    
    cd ~/.ssh/
    
    ssh-keygen -t rsa    # 生成密钥对
    
    cat ./id_rsa.pub >> ./authorized_keys    # 添加公钥到授权列表
    
    ssh localhost    # 测试免密登录(首次可能需输入yes)
    
    ssh-copy-id xxx
    ssh xxx

    三、修改Hadoop核心配置文件

    进入配置文件目录:

    cd $HADOOP_HOME/etc/hadoop
    # 手动创建文件夹
    mkdir -p /opt/software/hadoop/data/tmp
    mkdir -p /opt/software/hadoop/data/logs
    mkdir -p /opt/software/hadoop/data/namenode
    mkdir -p /opt/software/hadoop/data/datanode
    • hadoop-env.sh
    vim hadoop-env.sh
    
    # 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"
    export HADOOP_CONF_DIR=/opt/software/hadoop/etc/hadoop
    export HADOOP_LOG_DIR=/opt/software/hadoop/data/logs
    export HADOOP_PID_DIR=/opt/software/hadoop/data/tmp
    • yarn-env.sh
    vim hadoop-env.sh
    
    # 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"
    • mapred-env.sh

    vim mapred-env.sh
    
    # 在文件最后一行加上
    export JAVA_HOME="/usr/lib/jvm/java-8-openjdk-amd64"

    把环境刷新一下

    source hadoop-env.sh
    source yarn-env.sh
    source mapred-env.sh
    • core-site.xml

    <configuration>
        <!-- 指定 NameNode 通信的地址 -->
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hadoop01:8020</value>
        </property>
        <!-- 指定 hadoop 运行过程中临时数据的存储目录 -->
        <property>
            <name>hadoop.tmp.dir</name>
            <value>/opt/software/hadoop/data/tmp</value>
        </property>
    </configuration>
    • hdfs-site.xml

    <configuration>
        <!-- NameNode 存放元数据的本地目录-->
        <property>
            <name>dfs.namenode.name.dir</name>
            <value>/opt/software/hadoop/data/namenode</value>
        </property>
        <!-- NameNode web 端访问地址-->
        <property>
            <name>dfs.namenode.http-address</name>
            <value>hadoop01:9870</value>
        </property>
        <!-- Datanode 在本地存储 block 块的目录 -->
        <property>
            <name>dfs.datanode.data.dir</name>
            <value>/opt/software/hadoop/data/datanode</value>
        </property>
        <!-- HDFS blocksize block 块大小 -->
        <property>
            <name>dfs.blocksize</name>
            <value>134217728</value>
        </property>
        <!-- HDFS blocksize 也就是 block 的副本数-->
        <property>
            <name>dfs.replication</name>
            <value>2</value>
        </property>
    </configuration>
    • mapred-site.xml

    <configuration>
        <!-- 指定 MapReduce 程序运行在 Yarn 上 -->
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        </property>
    </configuration>
    • yarn-site.xml

    <configuration>
        <!-- 指定 MR 走 shuffle -->
        <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
        </property>
        <!-- 环境变量的继承 -->
        <property>
            <name>yarn.nodemanager.env-whitelist</name>
            <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HA
            DOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_H
            OME,HADOOP_MAPRED_HOME</value>
        </property>
    </configuration>

    四、初始化与启动Hadoop

    • 格式化HDFS
    hdfs namenode -format
    
    # 成功标志:Storage directory ... has been successfully formatted
    • 启动HDFS和YARN
    start-dfs.sh   # 启动NameNode和DataNode
    start-yarn.sh  # 启动ResourceManager和NodeManager
    • jps 验证进程
    jps

    结束

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2320032.html

    如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

    相关文章

    楼宇自控系统的结构密码:总线与分布式结构方式的差异与应用

    在现代建筑中&#xff0c;为了实现高效、智能的管理&#xff0c;楼宇自控系统变得越来越重要。它就像建筑的 智能管家&#xff0c;可自动控制照明、空调、通风等各种机电设备&#xff0c;让建筑运行更顺畅&#xff0c;还能节省能源成本。而在楼宇自控系统里&#xff0c;有两种关…

    Fourier-Lerobot——把斯坦福人形动作策略iDP3封装进了Lerobot(含我司七月人形研发落地实践)

    前言 近期在抠lerobot源码时&#xff0c;看到其封装了ALOHA ACT、diffusion policy、π0时&#xff0c;我就在想&#xff0c;lerobot其实可以再封装下idp3 我甚至考虑是否从我联合带的那十几个具身研究生中选几个同学做下这事&#xff0c;对他们也是很好的历练然当25年3.18日…

    系统架构设计知识体系总结

    1.技术选型 1.什么是技术选型&#xff1f; 技术选型是指评估和选择在项目或系统开发中使用的最合适的技术和工具的过程。这涉及考虑基于其能力、特性、与项目需求的兼容性、可扩展性、性能、维护和其他因素的各种可用选项。技术选型的目标是确定与项目目标相符合、能够有效解…

    计划管理工具应该具备的能(甘特图)

    在当今快节奏的项目管理环境中&#xff0c;高效地规划和跟踪项目进度是至关重要的。甘特图&#xff0c;作为项目管理领域的经典工具&#xff0c;以其直观的时间轴和任务分配方式&#xff0c;深受项目管理者的青睐。 随着数字化时代的到来&#xff0c;甘特图线上编辑器应运而生&…

    简单实用!百度AI + Raphael AI = 免费生图

    简单实用&#xff01;百度AI Raphael AI 免费生图 -- ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/b55eda9141d34697b05db0cd60f62b75.png#pic_center) 第一步&#xff1a;下载或截取一些好看的图片当参考图片 第二步&#xff1a;用百度AI描述你想要的图片&…

    2025-03-22 学习记录--C/C++-C 库函数 - getchar()

    C 库函数 - getchar() ⭐️ C 标准库 - <stdio.h> &#xff08;一&#xff09;、函数声明 &#x1f36d; int getchar(void)从标准输入 stdin 获取一个字符&#xff08;一个无符号字符&#xff09;。 参数&#xff1a;&#x1f380; NA 返回值&#xff1a;&#x1f38…

    APM 仿真遥控指南

    地面站开发了一段时间了&#xff0c;由于没有硬件&#xff0c;所以一直在 APM 模拟器中验证。我们已经实现了 MAVLink 消息接收和解析&#xff0c;显示无人机状态&#xff0c;给无人机发送消息&#xff0c;实现一键起飞&#xff0c;飞往指定地点&#xff0c;降落&#xff0c;返…

    BBR 和 CUBIC 对长肥管道的不同反应

    有个关于 CUBIC(等一众 AIMD-based cc) 和 BBR 在长肥管道中的行为比较挺有趣&#xff0c;它们的表现竟然截然相反&#xff1a; CUBIC 流共存&#xff0c;RTT 越大&#xff0c;Goodput 越低&#xff1b;BBR 流共存&#xff0c;RTT 越大&#xff0c;Goodput 越高。 前一个被看…

    架构师面试(十九):IM 架构

    问题 IM 系统从架构模式上包括 【介绍人模式】和 【代理人模式】。介绍人模式也叫直连模式&#xff0c;消息收发不需要服务端的参与&#xff0c;即客户端之间直连的方式&#xff1b;代理人模式也叫中转模式&#xff0c;消息收发需要服务端进行中转。 下面关于这两类模式描述的…

    Spring框架入门指南:从Hello World到IOC容器

    第一章&#xff1a;Spring框架的介绍 1. Spring框架的概述 Spring是一个开放源代码的设计层面框架&#xff0c;它解决的是业务逻辑层和其他各层的松耦合问题&#xff0c;因此它将面向接口的编程思想贯穿整个系统应用。 Spring是于2003 年兴起的一个轻量级的Java开发框架&…

    嵌入式电路设计软件个人安装步骤分享

    各位小伙伴大家好,今天给大家分享一个,电路设计软件的安装方法,希望对大家有所帮助。 一、下载【Multisim14.0安装包】: 链接:夸克网盘分享 提取码:kHSP 电脑安装Multisim14.0并且汉化 准备安装包以及汉化包双击“NI_Circuit_Design_Suite_14_0【海量免费资源:kebaiwan…

    git | 回退版本 并保存当前修改到stash,在进行整合。[git checkout | git stash 等方法 ]

    目录 一些常见命令&#xff1a; git 回退版本 一、临时回退&#xff08;不会修改历史&#xff0c;可随时回到当前版本&#xff09; 方法1&#xff1a;git checkout HEAD~1 二、永久回退&#xff08;改变分支指向&#xff09; 方法2&#xff1a;git reset 1. 保留修改&am…

    【Java SE】单例设计模式

    参考笔记&#xff1a;深入理解Java设计模式&#xff1a;单例模式及其饿汉式与懒汉式的对比,-CSDN博客 目录 1.什么是设计模式 2.经典设计模式 3.单例设计模式&#xff08;static属性/方法经典使用场景 &#xff09; 3.1 饿汉式单例模式 3.2 懒汉式单例模式 4.补充 1.什么…

    安全守护:反光衣检测技术的革新之路

    视觉分析助力船上工人反光衣检测 在现代工业生产与作业环境中&#xff0c;安全始终是首要考虑的因素。对于水上作业&#xff0c;如船舶维护、海上施工等场景&#xff0c;工人穿戴反光衣是预防事故、提高可见性的重要措施。然而&#xff0c;传统的人工检查方式不仅效率低下&…

    OSCP准备靶场联系-Kioptrix 1

    oscp 准备 Kioptrix 1 信息收集 ifconfig 确认自己的电脑ip&#xff0c;nmap收集通往段ip&#xff0c;确认靶机IP nmap 重点关注服务版本 nmap -sn 192.168.1.0/24 # 扫描网段内存活主机&#xff0c;不进行端口扫描[1,10](ref) nmap -sP 192.168.1.1 # 传统Ping扫描…

    【工具变量】中国各地级市是否属于“信息惠民国家试点城市”匹配数据(2010-2024年)

    数据来源&#xff1a;国家等12部门联合发布的《关于加快实施信息惠民工程有关工作的通知》 数据说明&#xff1a;内含原始文件和匹配结果&#xff0c;当试点城市在2014年及以后&#xff0c;赋值为1&#xff1b;试点城市在2014年之前或该城市从未实施信息惠民试点工程&#x…

    深度学习 Deep Learning 第7章 深度学习的正则化

    深度学习 第7章 深度学习的正则化 章节概述 正则化技术是深度学习中防止过拟合、提升模型泛化能力的核心手段。本章深入探讨了深度学习中的正则化技术&#xff0c;旨在解决模型在新数据上的泛化能力问题。正则化是通过在学习算法中引入额外的约束或惩罚项&#xff0c;来减少模…

    使用DeepSeek翻译英文科技论文,以MarkDown格式输出,使用Writage 3.3.1插件转换为Word文件

    一、使用DeepSeek翻译英文科技论文&#xff0c;以MarkDown格式输出 以科技论文“Electrical Power System Sizing within the Numerical Propulsion System Simulation”为例。 关于Writage 3.3.1的进一步了解&#xff0c;可发送邮件至邮箱pyengine163.com. 首先&#xff0c;打…

    一文了解ThreadLocal

    什么是ThreadLocal&#xff1f; ThreadLocal是每个线程私有的&#xff0c;线程可以把自己的私有数据放到ThreadLocal里面&#xff0c;不用担心其他线程访问到自己ThreadLocal。 通过set()方法将值存入ThreadLocal或者修改值&#xff0c;get()方法取出值&#xff0c;remove()方…

    【免费】2000-2019年各省地方财政印花税数据

    2000-2019年各省地方财政印花税数据 1、时间&#xff1a;2000-2019年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;行政区划代码、地区、年份、地方财政印花税 4、范围&#xff1a;31省 5、指标说明&#xff1a;印花税是对特定经济活动和法律行为所征收的…