文章目录

Hadoop高手之路3-Hadoop集群搭建
- 一、集群的规划
- 二、再准备两台虚拟机作为服务器
- - 1. 根据hadoop001克隆出hadoop002和hadoop003
  - 2. 配置hadoop002和hadoop003
  - - 1) 启动hadoop002虚拟机并登录
    - 2) 配置ip地址
    - 3) 重启网络服务器，查看ip
    - 4) 远程连接hadoop002
    - 5) 修改主机名为hadoop002
    - 6) 用同样的方法操作一遍hadoop003
- 三、建立主机名和ip地址的映射关系
- - 1. 修改hadoop001的hosts文件
  - 2. 复制hadoop001的/etc/hosts到hadoop002和hadoop003
  - 3. 测试各主机之间的连通性
  - 4. 本地windows主机和各虚拟机的映射关系
  - 5. 测试各虚拟机跟外网的连通性
- 四、各主机之间的SSH免密登录
- - 1. 查看hadoop的密钥存放文件夹
  - 2. 生成密钥
  - 3. 复制生成的密钥文件到其他主机（包括hadoop001自己）
  - - 1) hadoop001免密登录hadoop001
    - 2)hadoop001免密登录hadoop002
    - 3)hadoop001免密登录hadoop003
    - 4) hadoop002免密登录hadoop001
    - 5) hadoop002免密登录hadoop002
    - 6) hadoop002免密登录hadoop003
    - 7) hadoop003免密登录hadoop001
    - 8) hadoop003免密登录hadoop002
    - 9) hadoop003免密登录hadoop003
- 五、安装上传下载的小工具
- 六、JDK的安装
- - 1. 下载JDK
  - 2. 上传到服务器
  - 3.解压
  - 4.配置环境变量
  - 5.使环境变量起作用
  - 6. 分发hadoop001上的jdk到hadoop002和hadoop003上
  - 7. 分发hadoop001的/etc/profile到hadoop002和hadoop003上
  - 8. 使hadoop002和hadoop003的环境变量起作用
- 七、安装notepad++的插件
- 八、Hadoop的安装
- - 1. hadoop集群的安装模式
  - - 1) 独立模式standalone
    - 2) 伪分布模式 pseudodistributed
    - 3) 完全分布模式 fulldistributed
  - 2. 下载hadoop
  - 3. 上传到服务器
  - 4. 也可以通过centos的wget命令直接下载到服务器
  - 5.解压
  - 6. 配置环境变量
  - 7. 使配置起作用
  - 8. 测试
  - 9. hadoop的命令说明
- 九、hadoop的独立模式启动
- - 1. 启动集群命令sbin目录下，start-all.sh
  - 2. 配置hadoop
  - 3. 配置hadoop的环境变量
  - 4. 在启动hadoop独立模式之前用jps查看java进程
  - 5. 再次启动hadoop独立模式
- 十、Hadoop集群配置
- - 1. hadoop的配置文件
  - 2. 修改hadoop-env.sh文件
  - 3. 修改core-site.xml文件
  - 4. 修改hdfs-site.xml文件
  - 5. 修改mapred-site.xml文件
  - 6. 修改yarn-site.xml文件
  - 7. 修改workers文件
  - 8. 分发hadoop目录到hadoop002和hadoop003上
  - 9. 分发环境变量配置文件到hadoop002和hadoop003上
  - 10. 使hadoop002和hadoop003上的环境变量起作用
  - 11. 测试hadoop是否安装正确
- 十一、hadoop集群的文件系统格式化
- 十二、启动和关闭hadoop集群
- - 1. 关闭防火墙
  - 2. jps查看java进程
  - 3. 启动hadoop集群
  - - 1) 启动hfds
    - 2)启动yarn
    - 3) 一键启动
- 十三、关闭集群
- - 1. 关闭yarn集群
  - 2. 关闭hdfs
  - 3. 一键关闭
- 十四、Hadoop集群测试
- - 1. 通过WebUI（图形界面）查看Hadoop的运行状态
  - - 1) 查看hdfs的webui
    - 2) 查看yarn的web UI
  - 2. hdfs的shell命令的使用
  - 3. mapreduce的体验测试
  - - 1) 首先创建多个包含单词的文件
    - 2) 在hdfs上创建一个input文件夹，并把上述两个文本文件上传到该文件夹
    - 3) 执行单词计数的mapreduce程序
    - 4) 解决配置错误，修改mapred-site.xml配置文件
    - 5) 关闭hadoop，再重启
    - 6) 重新执行单词计数的mapreduce程序
    - 7) 查看结果
  - 4. mapreduce的计数圆周率的测试
  - 5.问题解决