伪分布式Spark3.4.4安装

伪分布式Spark3.4.4安装

news2025/3/17 7:16:05

参考：Spark2.1.0入门：Spark的安装和使用_厦大数据库实验室博客

我的版本：

hadoop 3.1.3

hbase 2.2.2

java openjdk version "1.8.0_432"

问了chatgpt,建议下载Spark3.4.4，不适合下载Spark 2.1.0:

step1

Spark下载网址：Downloads | Apache Spark

下载spark-3.4.4-bin-hadoop3.tgz，下载的文件，默认会被浏览器保存在“/home/hadoop/下载”目录下。

按照教程来，注意文件名的不同，我在输入指令的时候有些是错误的，注意甄别：

编辑spark-env.sh文件(vim ./conf/spark-env.sh)，在第一行添加以下配置信息:

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

vim中编辑后：

有了上面的配置信息以后，Spark就可以把数据存储到Hadoop分布式文件系统HDFS中，也可以从HDFS中读取数据。如果没有配置上面信息，Spark就只能读写本地数据，无法读写HDFS数据。
配置完成后就可以直接使用，不需要像Hadoop运行启动命令。
通过运行Spark自带的示例，验证Spark是否安装成功。

cd /usr/local/spark
bin/run-example SparkPi

执行时会输出非常多的运行信息，输出结果不容易找到，可以通过 grep 命令进行过滤（命令中的 2>&1 可以将所有的信息都输出到 stdout 中，否则由于输出日志的性质，还是会输出到屏幕中）:

bin/run-example SparkPi 2>&1 | grep "Pi is"

这里涉及到Linux Shell中管道的知识，详情可以参考Linux Shell中的管道命令
过滤后的运行结果如下图示，可以得到π 的 5 位小数近似值：

启动spark-shell环境：

bin/spark-shell

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2295508.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

kafka服务端之控制器

kafka服务端之控制器

文章目录概述控制器的选举与故障恢复控制器的选举故障恢复优雅关闭分区leader的选举概述在Kafka集群中会有一个或多个broker，其中有一个broker会被选举为控制器（Kafka Controler），它负责管理整个集群中所有分区和副本的状态。…

阅读更多...

【R语言】数据分析

【R语言】数据分析

一、描述性统计量借助R语言内置的airquality数据集进行简单地演示： 1、集中趋势：均值和中位数 head(airquality) # 求集中趋势 mean(airquality$Ozone, na.rmT) # 求均值 median(airquality$Ozone, na.rmT) # 求中位数 2、众数众数（mod…

阅读更多...

传输层协议 UDP 与 TCP

传输层协议 UDP 与 TCP

🌈 个人主页：Zfox_ 🔥 系列专栏：Linux 目录一：🔥 前置复盘🦋 传输层🦋 再谈端口号🦋 端口号范围划分🦋 认识知名端口号 (Well-Know Port Number) 二&#xf…

阅读更多...

Java/Kotlin双语革命性ORM框架Jimmer（一）——介绍与简单使用

Java/Kotlin双语革命性ORM框架Jimmer（一）——介绍与简单使用

概览 Jimmer是一个Java/Kotlin双语框架包含一个革命性的ORM 以此ORM为基础打造了一套综合性方案解决方案，包括 DTO语言更全面更强大的缓存机制，以及高度自动化的缓存一致性更强大客户端文档和代码生成能力，包括Jimmer独创的远程异常 …

阅读更多...

剪辑学习整理

剪辑学习整理

文章目录 1. 剪辑介绍 1. 剪辑介绍剪辑可以干什么？剪辑分为哪些种类？ https://www.bilibili.com/video/BV15r421p7aF/?spm_id_from333.337.search-card.all.click&vd_source5534adbd427e3b01c725714cd93961af 学完剪辑之后如何找工作or兼职&#…

阅读更多...

IDEA查看项目依赖包及其版本

IDEA查看项目依赖包及其版本

一.IDEA将现有项目转换为Maven项目在IntelliJ IDEA中，将现有项目转换为Maven项目是一个常见的需求，可以通过几种不同的方法来实现。Maven是一个强大的构建工具，它可以帮助自动化项目的构建过程，管理依赖关系，以及其他许多方面。添加Maven支持如果你的项目还没有pom.xm…

阅读更多...

centos虚拟机迁移没有ip的问题

centos虚拟机迁移没有ip的问题

故事背景，我们的centos虚拟机本来是好好的，但是拷贝到其他电脑上就不能分配ip，我个人觉得这个vmware他们软件应该搞定这个啊，因为这个问题是每次都会出现的。网络选桥接网络启动失败 service network restart Restarting netw…

阅读更多...

Java 大视界 -- Java 大数据在智能供应链中的应用与优化（76）

Java 大视界 -- Java 大数据在智能供应链中的应用与优化（76）

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…

阅读更多...

赛博算命之 ”梅花易数“ 的 “JAVA“ 实现 ——从玄学到科学的探索

赛博算命之 ”梅花易数“ 的 “JAVA“ 实现 ——从玄学到科学的探索

hello~朋友们！好久不见！ 今天给大家带来赛博算命第三期——梅花易数的java实现赛博算命系列文章： 周易六十四卦掐指一算——小六壬更多优质文章：个人主页 JAVA系列：JAVA 大佬们互三哦~互三必回！&#xf…

阅读更多...

$即梦（Dreamina）技术浅析（六）：多模态生成模型$

即梦（Dreamina）技术浅析（六）：多模态生成模型

多模态生成模型是即梦（Dreamina）的核心技术之一，旨在结合文本和图像信息，生成更符合用户需求的视觉内容。多模态生成模型通过整合不同类型的数据（如文本和图像），能够实现更丰富、更精准的生成效果。 1. 基本原理 1.1 多模态生成模型概述多模态生成模型的目标是结合不…

阅读更多...

递增三元组（蓝桥杯18F）

递增三元组（蓝桥杯18F）

暴力求解： #include<iostream> using namespace std; int main() {int N;cin >> N;int* A new int[N];int* B new int[N];int* C new int[N];for (int i 0; i < N;i) {cin >> A[i];}for (int i 0; i < N; i) {cin >> B[i];}for…

阅读更多...

计算机毕业设计SparkStreaming+Kafka广告推荐系统广告预测广告数据分析可视化广告爬虫大数据毕业设计深度学习机器学习

计算机毕业设计SparkStreaming+Kafka广告推荐系统广告预测广告数据分析可视化广告爬虫大数据毕业设计深度学习机器学习

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 作者简介：Java领…

阅读更多...

FreeCAD创建零件(系列1）

FreeCAD创建零件(系列1）

1、新建草图绘制1个矩形 2、画1个半圆弧 3、增加一个约束点 4、标注距离 5、将线段转为辅助线将图中的线段切换为辅助线，线条颜色之后转为蓝色线。 6、离开草图

阅读更多...

韶音科技：消费电子行业售后服务实现数字化转型，重塑客户服务体系

韶音科技：消费电子行业售后服务实现数字化转型，重塑客户服务体系

韶音科技：消费电子行业售后服务实现数字化转型，重塑客户服务体系在当今这个科技日新月异的时代，企业之间的竞争早已超越了单纯的产品质量比拼，**售后服务成为了衡量消费电子行业各品牌实力与客户满意度的关键一环。**深圳市韶音…

阅读更多...

mes系统对工业数字化转型起到重要作用，它的实际应用有哪些

mes系统对工业数字化转型起到重要作用，它的实际应用有哪些

一、生产计划与调度在工业数字化转型中，MES 系统能够对生产计划进行高效的管理和调度。通过与企业资源计划（ERP）系统的集成，MES 可以获取生产订单信息，并根据生产设备的状态、人员安排以及物料供应情况等因素&#x…

阅读更多...

网络安全：挑战、技术与未来发展

网络安全：挑战、技术与未来发展

📝个人主页🌹：一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言在数字化时代，网络安全已成为全球关注的焦点。随着互联网的普及和信息技术的高速发展，网络攻击的…

阅读更多...

从零开始玩转Docker：轻松开启容器化之旅

从零开始玩转Docker：轻松开启容器化之旅

一、什么是 Docker Docker 是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中，然后发布到任何流行的 Linux 机器上，也可以实现虚拟化。简单来说，Docker 就像是一个超级 “快递箱”&#xff0c…

阅读更多...

Python Pandas（5）：Pandas Excel 文件操作

Python Pandas（5）：Pandas Excel 文件操作

Pandas 提供了丰富的 Excel 文件操作功能，帮助我们方便地读取和写入 .xls 和 .xlsx 文件，支持多表单、索引、列选择等复杂操作，是数据分析中必备的工具。操作方法说明读取 Excel 文件pd.read_excel()读取 Excel 文件，返回 DataF…

阅读更多...

【计组】实验五 J型指令设计实验

【计组】实验五 J型指令设计实验

目录一、实验目的二、实验环境三、实验原理四、实验任务代码一、实验目的 1. 理解MIPS处理器指令格式及功能。 2. 掌握lw, sw, beq, bne, lui, j, jal指令格式与功能。 3. 掌握ModelSim和ISE\Vivado工具软件。 4. 掌握基本的测试代码编写和FPGA开发板使用方法。 …

阅读更多...

Redis03 - 高可用

Redis03 - 高可用

Redis高可用文章目录 Redis高可用一：主从复制 & 读写分离1：主从复制的作用2：主从复制原理2.1：全量复制2.2：增量复制（环形缓冲区） 3：主从复制实际演示3.1：基本流程准…

阅读更多...

推荐文章

最新文章