Hadoop集群运行Spark应用程序

news2026/3/27 22:05:28

启动Spark集群

先启动hadoop,再启动Spark,具体参考链接

对Linux系统对Spark开发环境配置_Matrix70的博客-CSDN博客

运行Spark安装好以后自带的样例程序SparkPi

spark-submit --class org.apache.spark.examples.SparkPi 
--master spark://master:7077 examples/jars/spark-examples_2.12-3.2.0.jar 
100 2>&1 | grep "Pi is roughly"

运行结果：

在独立集群中运行spark-shell

创建测试文件testspark

#在/opt下新建一个文件testspark,滚键盘
vi testspark
#上传此文件至hadoop文件系统根目录
hadoop fs -put /opt/testspark /
#查看文件
hadoop fs -ls /

启动spark-shell

#进入bin
cd /usr/local/spark/bin/
#bin目录下启动spark-shell
spark-shell --master spark://master:7077

输入代码进行测试

#读文件
val textFile = sc.textFile("hdfs://master:9000/README.md")
#统计一下
textFile.count()
#查看
textFile.first()

独立集群管理Web界面查看应用的运行情况

浏览器进入下述链接

http://192.168.20.128:8080/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/746145.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Hadoop集群运行Spark应用程序

启动Spark集群

运行Spark安装好以后自带的样例程序SparkPi

在独立集群中运行spark-shell

创建测试文件testspark

启动spark-shell

输入代码进行测试

独立集群管理Web界面查看应用的运行情况

浏览器进入下述链接

相关文章

路径规划算法：基于蛇优化优化的路径规划算法- 附代码

嵌入式软件测试笔记10 | 嵌入式软件测试中如何进行安全性分析？

Prompt本质解密及Evaluation实战与源码解析（三）

跨端技术栈综合考察：深入剖析 UniApp、Flutter、Taro 和 React Native 的优势与限制

强化学习快速复习笔记--待更新

25-分布式事务----Seate

mysql 执行sql开启事务

python 面向对象之继承

怎么使用文件高速传输，推荐镭速高速文件传输解决方案

全网最新项目：会说话的汤姆猫直播搭建教程（附教学流程）

RabbitMQ【笔记整理+代码案例】

Python应用：什么是爬虫？

装饰器模式：灵活扩展功能的设计利器

Python: 如何批量预处理FY4A L1 DISK和REGC产品?(辐射定标/裁剪/GLT校正/HDF5转TIFF文件等)

C++primer(第五版)第十八章(用于大型程序的工具)

（工具记录）Log4j2_RCE

获取DNF人物坐标值

Go语言IO模式

《MySQL》复合查询和连接

Python多线程使用详解