一、hadoop有三种运行模式
1、本地模式
数据存储在linux本地,不用
2、伪分布式集群
数据存储在HDFS,测试用
3、完全分布式集群
数据存储在HDFS,同时多台服务器工作。企业大量使用
二、单机运行
单机运行就是直接执行hadoop命令
1、例子-统计单词数量
cd /appserver/hadoop/hadoop-3.3.4
mkdir wcinput
mkdir outinput
在wcinput下建立一个word.txt,输入一些单词
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount wcinput/ wcoutput/
三、ssh免密登录
ssh-keygen生成本机的公私钥对。ssh-copy-id将本机公钥安装到远程主机上,实现免密登录远程主机