Hive3第六章：更换引擎

news2026/2/12 3:44:00

系列文章目录

Hive3第一章：环境安装
Hive3第二章：简单交互
Hive3第三章：DML数据操作
Hive3第三章：DML数据操作(二)
Hive3第四章：分区表和分桶表
Hive3第五章：函数
Hive3第六章：更换引擎

文章目录

系列文章目录
前言
一、更换hive
二、安装hive
三、更换引擎
- 1.部署Spark纯净版
- 2.修改配置文件
- 3.HDFS创建目录
- 4.上传jar包
- 5.hive测试
总结

前言

这个博客主要是作为数仓项目的一次补充，主要是更换hive引擎，传统的MR引擎在hive2之后就不推荐了，我们这次更换spark引擎，使用hive on yarn。

一、更换hive

在这里插入图片描述
通过官方的版本依赖，现在的hive是不支持spark3的，所以我们需要重新编译，可以使用idea打开源码，然后修改pom.xml中的spark和scala版本，考虑到各种问题，这里就不专门演示了。博主能力有限，没成功。具体文件可以去尚硅谷的线上问诊的离线数仓的项目里下载一个。

二、安装hive

先正常安装hive
hive安装

三、更换引擎

1.部署Spark纯净版

下载地址spark-3.3.1-bin-without-hadoop.tgz
上传并解压
在这里插入图片描述

2.修改配置文件

mv spark-env.sh.template spark-env.sh
vim /opt/module/spark/conf/spark-env.sh
在这里插入图片描述
最底下加一行。

export SPARK_DIST_CLASSPATH=$(hadoop classpath)

sudo vim /etc/profile.d/my_env.sh

# SPARK_HOME
export SPARK_HOME=/opt/module/spark
export PATH=$PATH:$SPARK_HOME/bin

source 一下

source /etc/profile.d/my_env.sh

vim /opt/module/hive/conf/spark-defaults.conf

spark.master                               yarn
spark.eventLog.enabled                   true
spark.eventLog.dir                        hdfs://hadoop102:8020/spark-history
spark.executor.memory                    1g
spark.driver.memory					     1g

vim /opt/module/hive/conf/hive-site.xml

<!--Spark依赖位置（注意：端口号8020必须和namenode的端口号一致）-->
<property>
    <name>spark.yarn.jars</name>
    <value>hdfs://hadoop102:8020/spark-jars/*</value>
</property>
  
<!--Hive执行引擎-->
<property>
    <name>hive.execution.engine</name>
    <value>spark</value>
</property>

3.HDFS创建目录

hadoop fs -mkdir /spark-jars
hadoop fs -mkdir /spark-history

4.上传jar包

hadoop fs -put /opt/module/spark/jars/* /spark-jars

5.hive测试

create table student(id int, name string);
insert into table student values(1,'abc');

由于第一次调用会调用spark的jar包，所以第一次时间会长一点。
在这里插入图片描述
再插入一条
insert into table student values(2,‘abcd’);

到此引擎更换完成。

总结

hive更换引擎是数仓学习中很通用的，所以这里单拎出来简单说一下。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/946685.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Hive3第六章：更换引擎

系列文章目录

文章目录

前言

一、更换hive

二、安装hive

三、更换引擎

1.部署Spark纯净版

2.修改配置文件

3.HDFS创建目录

4.上传jar包

5.hive测试

总结

相关文章

网络安全—0基础学习笔记（黑客）

2023年智慧政务一网通办云平台顶层设计与建设方案PPT

Spring——RESTful Web服务

Go操作各大消息队列教程（RabbitMQ、Kafka）

感觉车载测试的这一波敏捷风快过去了

用idea查看sqlite数据库idea sqlite

VUE环境下 CSS3+JS 实现发牌翻牌

python+TensorFlow实现人脸识别智能小程序的项目（包含TensorFlow版本与Pytorch版本）（一）

react17：生命周期函数

mac电脑屏幕录制Berrycast Mac屏幕录制软件

电商系统架构设计系列（十）：怎么能避免写出慢SQL？

软件面试题：文件上传下载测试点

基于OV2640/ OV5640 的图像采集显示系统

Mac软件删除方法？如何删除不会有残留

Python Qt（七）Listview

2024王道408数据结构P144 T18

基于Axios完成前后端分离项目数据交互

全网首发，人体姿态估计算法在OK3588上部署应用（十三）

【AGC】集成APMS SDK后台无数据问题

【Linux】系统启动过程