获取虚拟机的ip
虚拟机终端输入
ip a
关闭虚拟机防火墙
sudo ufw disable
修改Hadoop的core-site.xml
文件
将localhost
修改为虚拟机局域网IP
# 位置可能不一样,和Hadoop安装位置有关
cd /usr/local/hadoop/etc/hadoop
vim core-site.xml
IDEA 连接
创建Maven项目
IDEA自带Maven,如果需要自己安装Maven可以参考安装Maven
创建项目,选择Maven,模板选择第一个maven-archetype-archetype
添加依赖(pom.xml)
记得修改自己hadoop
的版本,我的是3.3.5
设置好后Reload
一下
<properties>
<hadoop.version>3.3.5</hadoop.version>
</properties>
<dependencies>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-common</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-hdfs</artifactId>
<version>${hadoop.version}</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>${hadoop.version}</version>
</dependency>
</dependencies>
设置好后Reload
一下
创建Java文件并运行
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import java.io.IOException;
public class Test01 {
public static void main(String[] args) throws IOException {
Configuration conf = new Configuration();
// 设置用户名(一定要,不然默认用户名是win的用户名)
System.setProperty("HADOOP_USER_NAME","hadoop");
conf.set("fs.defaultFS","hdfs://192.168.111.131:9000");
conf.set("fs.hdfs.impl","org.apache.hadoop.hdfs.DistributedFileSystem");
FileSystem fs = FileSystem.get(conf);
RemoteIterator<LocatedFileStatus> files = fs.listFiles(new Path("/"), true);
while (files.hasNext()) {
FileStatus fileStatus = files.next();
System.out.println(fileStatus.getPath().toString());
}
fs.close(); //关闭hdfs
}
}
端口转发
完成到这里已经可以用啦,不过可能不太方便
可以设置将win10的端口转发
实现在代码中直接访问localhost
创建test.bat
文件后输入以下代码
将IP
修改成虚拟机的IP
双击运行
@REM 设置IP
SET BigDataLANIP=192.168.111.131
@REM 设置命令以管理员身份运行
%1 start "" mshta vbscript:CreateObject("Shell.Application").ShellExecute("cmd.exe","/c %~s0 ::","","runas",1)(window.close)&&exit
@REM 清空所有转发规则
netsh interface portproxy reset
@REM 转发9000
netsh interface portproxy add v4tov4 listenport=9000 connectport=9000 connectaddress=%BigDataLANIP%
@REM 转发9870(HDFS的web管理界面)
netsh interface portproxy add v4tov4 listenport=9870 connectport=9870 connectaddress=%BigDataLANIP%
echo "succeed"
timeout /t 5 /nobreak >nul
简单使用
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.*;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
public class Test02 {
public static void main(String[] args) throws IOException {
Configuration conf = new Configuration();
// 设置用户名(一定要,不然默认用户名是win的用户名)
System.setProperty("HADOOP_USER_NAME","hadoop");
conf.set("fs.defaultFS","hdfs://localhost:9000");
conf.set("fs.hdfs.impl","org.apache.hadoop.hdfs.DistributedFileSystem");
// 列出根目录下的所有文件和文件夹
FileSystem fs = FileSystem.get(conf);
Path file = new Path("/");
FileStatus[] fileStatuses = fs.listStatus(file);
for (FileStatus fileStatus : fileStatuses){
System.out.println(fileStatus.getPath());
}
// 创建一个新的文件 test.txt 在HDFS的 /user/hadoop/test 目录下(如果目录不存在,则先创建目录)。
Path dirPath = new Path("/user/hadoop/test");
if(!fs.exists(dirPath)){
fs.mkdirs(dirPath);
}
Path remotePath = new Path("/user/hadoop/test/test.txt");
FSDataOutputStream outputStream = fs.create(remotePath);
outputStream.close();
// 向 test.txt 文件中写入一段指定的文本内容(如“Hello, HDFS!”)。
FSDataOutputStream outputStream2 = fs.create(remotePath);
String s = "Hello, HDFS!";
outputStream2.write(s.getBytes());
outputStream2.close();
// 读取 test.txt 文件的内容,并打印到控制台。
FSDataInputStream inputStream = fs.open(remotePath);
BufferedReader d = new BufferedReader(new InputStreamReader(inputStream));
String line = null;
while ((line = d.readLine()) != null)
System.out.println(line);
// 关闭与HDFS的连接。
fs.close();
}
}